自然语言文本分析实例:深度学习、分类和回归丨数析学院

2016-09-18 02:15 阅读(302)    评论(0)   

TA_Key phrases_R2

课程简介:

本节提供了自然语言文本分析的实用方法,通过深度学习、分类、回归简单的组合,利用博客文章准确地预测博主的性别、年龄。具体来讲,就是利用 Gensim库中的Word2Vec深度学习模型创建文本特征,进而用 GraphLab Create中的机器学习工具进行分类和回归分析。

本节分为以下几个部分:

  • 设置
  • 准备数据集
  • 训练Word2Vec模型
  • 创建&评估分类器

每一部分都可以独立执行,所以可以按兴趣挑选并执行操作。

课程目标

  • 了解 Word2Vec 并学会使用 Gensim 相关包训练 Word2Vec 模型
  • 利用 Word2Vec 实现文本分类及相关回归预测分析

相关准备

所需要的Python包:

  • BeautifulSoup – 用于解析原始博客文章。
  • NLTK (包括下载stopwords and punkt ) – 用于文本预处理。
  • Gensim – 用于 Word2Vec 深度学习。
  • GraphLab Create – 用于分类、回归、数据工程和评估。

数析学院:http://datacademy.io/ 我们致力于打造更加精要的课程,如果小伙伴们在工作和学习中遇到什么问题,可以给我们留言。

公司二维码

分享到:

相关推荐

  • a7dfc3893b9c21680d5fa4c6d60957de_r

    浑身鳞片,面目狰狞?你对恐龙的印象可能全是错的

    20多年前,一部伟大的科幻电影《侏罗纪公园》在美国上映。 虽然电影没有取得什么特别高的成就,但其中的恐龙形象却深入人心。 尤其是反派霸王龙更是掀起了一阵恐龙崇拜热潮。 出于对武力的渴望,哪个男孩子小时候不崇拜几种威猛的恐龙? 侏罗纪系列的新作《侏罗纪世界》 “我有知识我自豪”的超威...

  • 6603_25978

    农药滥用,害虫成灾,他以虫治虫守护了南中国的田地,被誉为生物防治之父

    近两百年来,人类的科学技术高速发展,对自然的控制和利用也愈演愈烈。 某种程度上来说,我们并不了解自然,但却觊觎它强大的力量。 人类的所作所为在剧烈地改变环境,气候变化,生物入侵,生态破坏…… 气候变化凭借媒体的力量已经引起了全人类的关注。 物种入侵也因为中国吃货叫嚷着“...

  • 活动行封面1080

    广州首届国际创客节开幕,大众直呼“过瘾”!

    5月20日,广州首届国际创客节——2017天英汇•IEF国际创客节在广州开幕。IEF国际创客节是每年一度针对国际创客圈展开的大型盛会,本届创客节是由SME、INNOTalk、中大创新谷、云珠沙龙和G-SICE校园直通车联合主办,吸引了来自国内外的科技爱好者、国际创客、重点科技企业代表等数千人集聚广州,共同见证了广州...

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

SME 发掘你不知道的科技故事