Apache Spark基础培训 中文字幕

课程信息
英文名Apache Spark Essential Training
课程来源Lynda.com
讲师Ben Sullins
课程ID550568
课程时长1.4小时
下载所需积分50
解压密码课程压缩文件如果需要解压密码,则密码一律为 www.zwsub.com
所属类别全部 网络管理

Apache Spark是一个功能强大的平台,为用户提供了存储和利用大数据的新方法

在本课程中,快速了解Spark,并了解如何利用这一流行的处理引擎为您的数据提供有效和全面的洞察

讲师Ben Sullins提供了该平台的概述,涉及组成Apache Spark的不同组件

他演示了如何使用PySpark和Spark SQL分析Spark中的数据,探讨使用MLib运行机器学习算法,演示如何使用Spark Streaming创建流式分析应用程序等等

主题包括:

了解Spark

查看Spark组件

Spark闪耀的地方

了解数据接口

使用文本文件

将CSV数据加载到DataFrame中

使用Spark SQL分析数据

使用MLib运行机器学习算法

查询流式数据

将BI工具连接到Spark

- 自从我们开始使用大数据,并试图理解如何存储大量信息,然后利用它,我们已经反复开发了许多平台,并重新设计了他们的终极解决方案,终极平台 实际上使用大数据。

Apache Spark是这个的最新版本。

这是一个平台的最新体现,它使新的方式来处理大数据。

嗨,我是Ben Sullins,自从90年代末以来,我一直是一个数据极客,专注于帮助组织充分利用他们的数据。

在本课程中,我们将介绍如何使用Apache Spark平台进行数据科学研究。

我将首先向您展示平台的概述,并介绍每个组件,以便我们对其工作原理有基本的了解。

然后,我们来看看如何使用Spark使用PySpark分析数据,然后使用Spark SQL。

我们将探索机器学习技术,我们将通过使用Spark Streaming创建一个流式分析应用程序来完成。

我们将涵盖所有这些主题,以帮助您快速了解Spark,并帮助您开始提供有效和更全面的洞察力。

让我们潜入

练习文件列表
Ex_Files_Apache_Spark_EssT.zip2.1M

中文课程网 提供全网最全,中文翻译质量最高的国外课程视频资源(Lynda / Pluralsight)

请先登陆 如果还没有账号,请先注册