使用Python基本训练处理文本 中文字幕

课程信息
英文名Processing Text with Python Essential Training
课程来源Lynda.com
讲师Kumaran Ponnambalam
课程ID786424
课程时长0.6小时
下载所需积分50
解压密码课程压缩文件如果需要解压密码,则密码一律为 www.zwsub.com
所属类别Python 全部 网络管理

在大数据的世界中,越来越多的信息以文本形式被消费和分析

网站,社交媒体,电子邮件和聊天已成为数据和见解的主要来源

如果您使用数据,那么了解如何处理非结构化文本数据至关重要

在本课程中,讲师Kumaran Ponnambalam帮助您构建文本挖掘技能集,涵盖了在Python中提取,清理和处理文本的关键技术

Kumaran回顾了标记化和词干化等关键文本处理概念

他还研究了将文本转换为分析准备形式的技术,包括n-gram和TF-IDF

在此过程中,他使用Python和NLTK库提供了这些技术的示例

主题包括:

今天的文本挖掘

使用Python读取文本文件

清理文本数据

构建用于文本预测的n-gram数据库

准备TF-IDF矩阵用于机器学习

缩放文本处理以提高性能

- [Kumaran P]假设您有大量需要分析的文本。

考虑到今天生成越来越多的文本,这是一个相当可能的情况。

它采用社交媒体上的消息,电子邮件,博客和评论的形式。

携手合作,对这些数据的理解,分析和行动的需求也在增长。

因此,文本处理和分析是任何数据专业人员的关键技能。

我的名字是Kumaran Ponnambalam。

在本课程中,我将向您展示Python中可用于文本处理的工具和技术。

我们将使用NLTK库在Jupyter笔记本中构建用例。

您需要事先熟悉Python 3.7和Jupyter笔记本。

话虽这么说,让我们探讨如何使用Python处理和转换文本。

中文课程网 提供全网最全,中文翻译质量最高的国外课程视频资源(Lynda / Pluralsight)

请先登陆 如果还没有账号,请先注册