英文名 | Handling Fast Data with Apache Spark SQL and Streaming |
课程来源 | Pluralsight.com |
讲师 | Justin Pihony |
课程ID | 9003656 |
课程时长 | 4.6小时 |
下载所需积分 | 50 |
所属类别 | 全部 |
分析数据曾经是你每晚做一次的事情
现在您需要能够即时处理数据,以便您可以提供最新的洞察力
但是,您如何实时完成过去几个小时没有复杂代码库的问题? 在本课程中,使用Apache Spark SQL和Streaming处理快速数据,您将学习如何使用Apache Spark Streaming和SQL库作为处理这一实时,快速数据处理新世界的好方法
首先,你将潜入SparkSQL
接下来,您将探讨如何通过使用Spark Streaming分析流来捕捉潜在的欺诈行为
最后,你会发现更新的结构化流媒体API
到本课程结束时,您将对这些API有更深入的了解,以及一些推动API设计的流式概念
嗨,我的名字是Justin Pihony,欢迎来到我的课程,使用Apache Spark SQL和Streaming进行快速数据处理。
作为Stack Overflow上Apache Spark答案的主要贡献者,以及Lightbend的开发人员支持经理给了我很多洞察力,如何最大化Spark的功能,同时避免可能的陷阱。
快速数据是数据世界的下一个重要事项。
如今,我们现在需要有价值的业务见解,而不是等待批量工作完成后,我们现在正处于这样一个阶段,我们可以构建这些系统,以便能够大规模地响应我们的需求。
在本课程中,我们将了解如何在其SQL和流功能中使用Spark来构建这些快速数据应用程序,而不会让人痛苦不堪。
我们将介绍的一些主要主题包括深入了解Spark的SQL库,通过DataFrames学习无类型的一面,通过数据集学习类型安全的一面,以及通过更老的,更多的方式覆盖Spark的流式传输。 稳定的Spark Streaming库及其现代化,崭露头角的结构化流媒体库。
在本课程结束时,您将拥有Spark的SQL和流API的丰富知识,了解如何利用它们创建快速数据应用程序,能够立即提取业务洞察力。
在开始本课程之前,您应该对Apache Spark有一个基本的了解,您可以从我的其他课程Apache Spark Fundamentals中获得。
我希望你能和我一起学习Spark的SQL和流媒体库,以及如何通过使用Apache Spark SQL和Pluamingight的Streaming快速数据处理来超越大数据世界。