使用Apache Spark开始数据探索和分析 中文字幕

课程信息
英文名Beginning Data Exploration and Analysis with Apache Spark
课程来源Pluralsight.com
讲师Swetha Kolalapudi
课程ID9004344
课程时长1.9小时
下载所需积分50
所属类别全部

无论您是想要探索数据还是开发复杂的机器学习模型,数据准备都是任何数据专业人士的主要任务

Spark是一种引擎,它以非常直观的方式帮助实现这一目标,使用功能结构将用户从使用大型数据集的所有混乱中抽象出来

在本课程中,使用Apache Spark开始数据探索和分析,您将逐步完成探索性数据分析和Spark数据整理

首先,您将探索RDD和功能构造,使Spark中的处理非常直观

接下来,您将了解如何转换和清理非结构化数据

最后,您将学习如何沿着维度汇总数据以及如何建立关系以建立共现网络

在本课程结束时,您将能够使用Spark以您想要的任何方式转换数据

嗨,大家好。

我的名字是Swetha Kolalapudi,欢迎来到我的课程,使用Apache Spark开始数据探索和分析。

我是一家名为Loonycorn的创业公司的联合创始人。

清理,转换和准备数据是任何数据专业人员的主要任务,无论他们只是想探索数据并使用它,还是开发复杂的机器学习模型。

Spark是一种引擎,可以帮助我们以非常直观的方式执行此操作,使用功能构造将用户从使用大型数据集的所有混乱中抽象出来。

本课程的主要内容是使用Spark和弹性分布式数据集来处理复杂的数据。

当你完成时,你会习惯使用像filter,map和reduce这样的函数结构来转换数据,并使用RDD和Pair RDD来汇总和合并数据集。

我们将讨论的一些主要议题包括转换和清理非结构化数据,沿维度汇总数据以及建立关系以建立共现网络。

在本课程结束时,您将能够使用Spark以您喜欢的任何方式转换数据。

在开始本课程之前,您应该熟悉基础级别的Python。

我希望你能和我一起在Pluralsight上用Apache Spark学习开始数据探索和分析。

中文课程网 提供全网最全,中文翻译质量最高的国外课程视频资源(Lynda / Pluralsight)

请先登陆 如果还没有账号,请先注册