自然语言处理关键词提取文本摘要,充电了么,陈敬雷,一、课程优势
本课程有陈敬雷老师的清华大学出版社配套书籍教材
【自然语言处理原理与实战(人工智能科学与技术丛书)】
https://item.jd.com/13951851.html
和【分布式机器学习实战(人工智能科学与技术丛书)】,对应京东自营链接地址:
https://item.jd.com/12743009.html
购买后加老师微信chenjinglei66领取课件代码资料!
二、课程简介
TextRank算法是基于词图模型的关键词抽取算法,来源自PageRank的矩阵迭代收敛思想,把关键词抽取问题看作是构成文档词语的重要性排序问题,这里应用于文本提取关键字以及生成文章摘要。
关键词是表达一个文档核心意义的最小单元,人工抽取关键词耗时费力,结果因人而异,因此,实现自动抽取具有意义。
句子的信息量用"关键词"来衡量。如果包含的关键词越多,就说明这个句子越重要。
文本摘要任务就是从一段给定文本中自动抽取出若干有意义词语或词组,抽取方法既可以通过训练语料构建模型实现。TextRank算法无需学习训练过程,实例应用更为准确方便。
下面深度讲解TextRank算法原理以及对应源码实现,和TFIDF算法实现的关键词提取和文本摘要算法。 适用人群:适合技术开发、大学生、职业晋升;
文本挖掘、机器学习、自然语言处理开发者;
转行人工智能、NLP。