数据科学中的R编程:高容量数据 中文字幕

课程信息
英文名R Programming in Data Science: High Volume Data
课程来源Lynda.com
讲师Mark Niemann-Ross
课程ID672262
课程时长1.4小时
下载所需积分50
所属类别R语言 全部 网络管理

数据填满了所有可用空间,现在存储空间便宜,数据量已经爆炸

但是,如果没有分析和背景,所有这些信息都是无用的

R编程语言旨在使分析和可视化大量数据变得更加容易

例如,R提供了将一个变量块乘以另一个变量的能力 - 这一假设提供了超过其他语言的固有优势

本课程说明了为什么R是大量数据的理想选择,引入了更有效的语言使用方法,并解释了如何避免问题并利用大数据的机会

了解如何确定您是否具有足够的内存和处理能力,生成大数据的可视化,优化R代码,以及使用并行处理等高级技术来加速计算

另外,了解如何将R与SQL数据库和Apache Spark等大数据解决方案集成

主题包括:

访问内存和处理能力

可视化大量数据

分析和优化R代码

编译R函数

与R并行处理

将R与其他大数据解决方案结合使用

- [Mark]你的研究使用大数据,数据如此之大,无法加载到计算机上,数据如此之大,我们的代码需要花费数小时来分析它,数据如此之大,以及巨大的灰色阴影斑点。

这个大数据被称为高容量数据,其庞大的规模将阻碍您的研究。

嗨,我是Mark Niemann-Ross,在本课程中,数据科学R编程:大批量数据,我们将探索大数据。

我们将讨论使大量数据难以使用的原因,并探索解决这些问题的策略和代码。

我们将看一下图表和图表,以及如何对压倒性数据进行视觉感知。

我们将学习使用R编程语言编写快速代码,特别注意小心使用内存和大型数据集。

我们将研究并行处理并将R与多个CPU配合使用。

最后,我们将研究如何将R与其他大批量解决方案集成,例如云计算,数据库和Apache Spark。

大批量数据是您研究的重要组成部分,但前提是您可以使用这些工具来操作和分析大型数据集。

让我们开始使用数据科学中的R编程:大批量数据。

中文课程网 提供全网最全,中文翻译质量最高的国外课程视频资源(Lynda / Pluralsight)

请先登陆 如果还没有账号,请先注册