APP下载

国内顶尖专家齐聚百度 纵论大规模知识挖掘与应用

消息来源:baojiabao.com 作者: 发布时间:2024-05-09

报价宝综合消息国内顶尖专家齐聚百度 纵论大规模知识挖掘与应用

  4月23日,由百度公司主办的大规模知识挖掘与应用技术研讨会在北京召开,来自学术界的多位顶尖专家带来了各自研究领域的专题演讲,并与百度相关技术负责人一起探讨大数据时代下的大规模知识挖掘与应用。

  知识挖掘是指从数据中集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。从海量数据中提取结构化知识,并将其应用于医疗、教育、游戏、金融等生活中各个领域,是当前人工智能和数据库领域最热门的话题之一。

  专家纵论 大规模知识挖掘与知识图谱如何构建

  百度技术副总裁王海峰:

  “百度组织召开这次会议主要是为了提高计算机对人类语言的理解能力,优化互联网的智能服务,藉此搭建与学界的沟通平台”,百度技术副总裁王海峰在研讨会开始时表示,“随着数据规模越来越大,知识工程对互联网的影响越发明显,在搜索引擎中我们已经在用知识图谱,其中涉及到了知识的挖掘,在此之上做计算和管理,以及知识库的在线架构,这些都是我们研究的重点。”

  在生活中,如果我们牙疼又不想去医院,而是想通过搜索引擎找到科学权威的建议和处理办法,这在过去是非常困难的。如今,百度将大规模知识挖掘形成的知识图谱应用在了用户搜索中,便能帮助用户精准的找到牙龈止痛的方法,能根据牙龈肿痛的症状进一步找出病因。还能根据各异的病因帮助用户找到与之相对应的药品。最后,如果用户需要就医,搜索结果中还会推荐相关的医院、医生以供用户筛选。

  中国科学院计算技术研究所研究员史忠植:

  搜索引擎智能化是建立在大规模知识挖掘的基础之上。中国科学院计算技术研究所研究员史忠植提出,互联网企业要抓住在认知计算时代的创新和汉语语言认知的机遇。在他看来,大数据挖掘是智能的源泉,大规模知识管理是效率的关键。其中,知识图谱的管理将对中国互联网的发展起到非常重要的影响。

  国内各高校专家先后发表演讲

  百度自然语言处理部吴华博士:

  百度自然语言处理部吴华博士向在场专家介绍了百度大规模知识库的构建和语义分析,“真正要想获取一个大规模的知识库,我们实际是要从网页数据里面、从无结构化数据中挖掘”,吴博士还提出知识库的服务需要精确对接用户的需求。

  百度互联网数据研发部资深研发工程师牛正雨:

  在研讨会中,百度互联网数据研发部资深研发工程师牛正雨主要从技术方面介绍了图片知识挖掘的现状和机遇,并对图片挖掘技术进行了详细解说。同时也提出百度目前面临的技术难题,“图片知识跟实体知识存在一些天然上的差别,互联网上针对图片的数据非常匮乏,因此自动挖掘图片知识是一个非常重要的任务。”

  清华大学信息科学技术学院李涓子教授:

  清华大学信息科学技术学院计算机软件研究所教授李涓子则提出互联网的未来需建立跨语言知识图谱,从大规模的数据中获取知识,形成知识的共享平台,将跨语言的知识库进行关联,进而对生活中的实体提供结构化的知识。

  李涓子教授进一步阐述了如何建立跨语言知识图谱,“将文字和图片等信息进行组织后,借助四个百科:百度百科、维基中文和英文百科、互动百科,建立跨语言的链接和属性之间的链接,进而构建出大规模的跨语言知识图谱,提供文化的相关支持。”

  东南大学计算机科学与工程学院漆桂林教授:

  东南大学计算机科学与工程学院教授漆桂林则从大规模知识库推理的角度,讲述了推理对发展知识图谱的作用。漆教授在2014年的百度主题研究项目中与百度复合搜索部就医疗知识库相关技术挑战开展了深入的合作。

  专家展望 大规模知识库应用范围

  百度自然语言处理部吴华博士、华东理工大学王昊奋:

  大规模知识库的构建能将互联网大量杂乱无序的信息整理成有规律、结构化的知识,给用户在搜索时带来更好、更方便的体验。“例如在百度搜索‘北海普安殿前的许愿树是什么?’百度通过对无结构化数据的分析,将普安殿、许愿树等相关数据进行结构化,找到普安殿和海棠树的关系,从而得出答案。”

  华东理工大学王昊奋老师从文本和图像的知识链接角度阐述了他对大规模知识库构建的看法。

  百度技术专家共探大规模知识挖掘与应用

  清华大学信息科学技术学院朱小燕教授:

  “随着三网合一,信息获取转变为信息服务,知识就是实体和规则。通过将大规模知识结构化,构建成通用的知识库,保留住语义结构信息,再应用到搜索、推荐等实际工作中”,清华大学信息科学技术学院智能技术与系统国家重点实验室教授朱小燕从社会媒体内容的角度讲述了知识图谱构建与应用。

  中国人民大学信息学院陈跃国副教授:

  中国人民大学信息学院陈跃国副教授则从实体搜索的发展现状进行分析,阐述了大规模知识库的构建对于优化搜索结果所具有的重要作用。

  同济大学信息工程学院研究员李国正:

  知识库的应用范围十分广泛,涵盖医疗、教育、游戏、金融等领域。同济大学电子与信息工程学院研究员李国正从中医数据资源的方面做了分享,他提出在大数据时代知识库在中医上的应用主要包括以下四点:设备穿戴化、病历结构化、数据知识化和医疗智慧化。

  百度复合搜索部的伊凯和毕然:

  而百度复合搜索部的伊凯和毕然从百度商业知识库的构建谈起,介绍了百度在医疗领域搜索作出的尝试,“我们通过整合内部技术资源和高校、医院医生的理论知识,来优化相关医疗搜索内容,提高用户的满意度。”同时,他们也提出在知识库中自动挖掘的实现还需进一步探索。

  同时,中国人民大学陈跃国、东南大学漆桂林、北京工商大学金学波等老师就各自研究领域进行了展望,金老师从多元数据融合以及时序大数据的角度解读了知识库的作用,天津大学王鑫老师则介绍了大规模RDF图数据的分布式储存与知识服务平台。为促进科学研究成果的应用,各位老师与百度进行了相关主题研究项目的合作,以期在合作中检验科研成果,在应用中挖掘有价值的科研问题,并将其回馈到自己的科学研究中,让科学研究更接地气。

 

  研讨会结束前,百度和专家们达成共识,希望能加强在大规模知识挖掘与应用方面的合作,百度提供平台和数据资源供学者进行研究,学者们也能为百度的技术难题提供解决建议。双方合力推进中国互联网的发展。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

2019-02-26 03:39:00

相关文章