Apache PySpark示例 中文字幕

课程信息
英文名Apache PySpark by Example
课程来源Lynda.com
讲师Jonathan Fernandes
课程ID802868
课程时长2.0小时
下载所需积分50
解压密码课程压缩文件如果需要解压密码,则密码一律为 www.zwsub.com
所属类别全部 网络管理

想尽快启动并运行Apache Spark吗? 如果您精通Python,那么Spark Python API(PySpark)就是您获取这个极受欢迎的大数据平台功能的门票

这个实用的实践课程可以帮助您熟悉PySpark,解释它提供的内容以及它如何增强您的数据科学工作

首先,讲师Jonathan Fernandes深入研究Spark生态系统,详细介绍了其优于其他数据科学平台,API和工具集的优势

接下来,他介绍了DataFrame API以及它是如何解决许多大数据挑战的平台

最后,他介绍了Resilient Distributed Datasets(RDD),它是Spark的构建模块

主题包括:

Apache Spark生态系统的优点

使用DataFrame API

使用列和行

利用内置的Spark功能

在Spark中创建自己的函数

使用弹性分布式数据集(RDD)

- [Jonathan]在过去的几年里,Apache Spark已经发展成为首选的大数据平台。

它在初创公司中一直用于家喻户晓的名字,如亚马逊,eBay和TripAdvisor。

它有如此受欢迎的原因有几个很好的理由。

它很简单,速度很快,并且支持一系列编程语言。

如果您了解Python,那么PySpark允许您访问Apache Spark的强大功能。

如果你是初学者,不要担心。

在我关于PySpark的课程中,我们将使用芝加哥市的实际数据作为我们的主要数据集。

我们学习了拉入数据,转换数据并将其与其他数据相结合的基础知识。

我的目标是,在本课程结束时,您应该熟悉使用PySpark并准备探索该技术的其他领域。

嗨,我是Jonathan Fernandes,我在大数据和人工智能方面从事咨询工作。

我每天都会为几个客户使用我在本课程中教授的概念。

我创建了这门课程,以帮助您尽快学习和使用Apache Spark。

中文课程网 提供全网最全,中文翻译质量最高的国外课程视频资源(Lynda / Pluralsight)

请先登陆 如果还没有账号,请先注册