APP下载

公开课|智慧文字资讯抽取演算法的进阶与应用_资料

消息来源:baojiabao.com 作者: 发布时间:2024-05-02

报价宝综合消息公开课|智慧文字资讯抽取演算法的进阶与应用_资料

讨论文字挖掘之前,我们要先说一下资料探勘的概念,因为文字挖掘是资料探勘的一个分支。资料探勘(Data Mining)指从大量的资料中通过演算法搜寻隐藏在其中资讯的过程。而文字挖掘就是从文字资料中获取有价值的资讯和知识的过程,最基本的应用就是实现文字的分类和聚类。

它和 NLP 有关系吗?

也许有人会疑惑,文字挖掘和 NLP 领域有关系吗?这是必然的!

文字挖掘最基本的应用是文字(档案)的分类、聚类与相似度、资讯检索与资讯抽取;同时,文字挖掘在文字摘要生成、自动问答等任务中也有所应用,而这些任务也是 NLP 的主要任务。可见,文字挖掘虽然和 NLP、知识图谱等属于不同的研究方向,但是在技术应用中,很多借鉴与融合之处。文字挖掘涉及很多自然语言处理的模组,同时它也应用于 NLP 领域中多个任务中,利用自然语言处理技术,自动化处理海量文字资料,提升文书处理效率与挖掘深度。

(扫码回复“文字挖掘”,获取更多课程资讯)

或许有些方法大家有所接触,比如:关键词提取的方法,词频统计与 TF-IDF;用于潜在关系、主题的 LDA 主题建模;上面提到的文字分类工作就可以用统计学习和机器学习的演算法实现;文字聚类则是一种无监督机器学习方法;到深度学习时代,深度学习方法自然被运用在文字挖掘中。

不过,从早期的方法、传统机器学习方法到深度学习方法,这么多方法,我们要怎么梳理清他们彼此之间的逻辑?在实际工程中,又是如何运用这些方法的?传统方法和深度学习方法独立执行时发挥哪些作用?什么情况需要把两种方法结合提升效果?

刚入门或者想学习这方面的小伙伴们来说,要如何学习文字挖掘?

正在在这个领域中学习,以后要从事相关工作时,企业需要哪方面的技能?

我们为你准备了... ...

《文字挖掘——智慧文字资讯抽取演算法的进阶与应用》主题公开课,这次为大家邀请到达观资料的高翔老师,带领大家深入工程中的文字挖掘的资讯抽取演算法,他还将带领团队中专门负责传统机器学习、深度学习的小伙伴们为大家逐一攻破你们关心的演算法与技术!

主题介绍:

资讯抽取(information extraction),即从自然语言文字中,抽取出特定的事件或事实资讯,帮助我们将海量内容自动分类、提取和重构。文字资讯抽取是资讯检索、智慧问答、智慧对话等人工智能应用的重要基础,它可以克服自然语言非形式化、不确定性等问题,发掘并捕获其中蕴含的有价值资讯,进而用于档案智慧稽核、知识库及知识图谱构建、流程自动化等方面,对产业界有着重要的实用意义。

课程大纲:

1.文字挖掘简介和抽取演算法概况

2.传统抽取演算法原理及案例:HMM、CRF(重点)

3.基于深度学习的抽取演算法原理及案例:双向LSTM、预训练模型(重点)

4.抽取演算法在达观资料的应用实践

5.进阶资源推荐

适合人群:

1、任何对 AI 感兴趣的小伙伴们;

2、任何对 NLP 感兴趣,学习或从业于 NLP 领域

3、对文字挖掘技术有兴趣,想了解其在工业界的应用

高翔,达观资料联合创始人,自然语言处理技术专家,上海交通大学通讯专业硕士,上海交通大学校友会AI分会副秘书长,复旦大学校外研究生导师。曾代表达观资料赢得2016青年互联网创业大赛全国总冠军、2018阿里巴巴诸神之战创客大赛全球总决赛三等奖,2019年度入选上海市青年科技启明星人才计划。曾就职于腾讯文学,盛大文学,盛大创新院,负责搜索引擎、文字挖掘及大资料排程系统的开发工作,在自然语言处理和机器学习等技术方向有着丰富的理论与工程经验。

2019 年已经进入下半年,AI科技大本营特此为大家准备一系列专业、深度的 AI公开课。我们策划了技术主题涵盖机器学习、深度学习与前沿、计算机视觉、语音与NLP、知识图谱等 AI 的各方向,此外还会开设求职面试、经验分享等主题,你想听的内容也可以告诉我们!几十节公开课大礼包,等你来学习,还有学习奖品等你来领~

更多课程学习资讯,可扫描下方小助手二维码,回复:文字挖掘,加入公开课交流群,领取福利~

2019-07-12 02:49:00

相关文章