APP下载

容联云知识图谱 Demo 论文被数据挖掘顶级国际会议 CIKM 2022 录用

消息来源:baojiabao.com 作者: 发布时间:2024-05-17

报价宝综合消息容联云知识图谱 Demo 论文被数据挖掘顶级国际会议 CIKM 2022 录用

近日,信息检索和数据挖掘领域的国际顶级学术会议 CIKM 公布了 2022 年 Demo 论文的录用结果,容联云人工智能实验室(Cloopen Research)与南开大学合作的论文《DASH: An Agile Knowledge Graph System Disentangling Demands, Algorithms, Data Sources, and Humans》已被 CIKM 2022 录用。

CIKM 起始于 1992 年,是信息检索和数据挖掘领域的国际顶级学术会议。

随着人工智能的发展,知识图谱已成为理解与利用多源异构数据的有效方法。通过实现"数据 → 知识 → 知识图谱"的转化,可有效支撑多样化的下游应用,包括智能问答、信息检索、内容推荐、金融风控、精准营销获客等。

近年来,以谷歌、百度、微软为代表的头部互联网企业依托其"数据 - 业务 - 技术"的成熟闭环,已经成功实现了通用知识图谱(General-purpose Knowledge Graphs)的构建与落地应用。

与头部互联网企业不同,多数企业需要构建并利用领域知识图谱(Domain-specific Knowledge Graphs)来支撑不同的业务需求。与通用知识图谱相比,领域知识图谱更强调知识深度,是支持 Al 大脑深度思考的基础,同时也是未来主要的增长点。通过知识图谱技术来量化和刻画企业在物理世界里的生产要素、经营活动、业务知识、业务规则等,是企业的数字孪生智能体。

然而,受技术和成本双重约束,大多数中小型互联网企业、非互联网企业在构建并使用领域知识图谱时仍然面临许多挑战:

挑战 1: 在知识图谱构建阶段,如何适应动态变化的知识类型(例如关系、事件、意见要素等)和知识模式(schema)?

挑战 2: 在知识图谱应用阶段,复杂的业务场景通常涉及多跳推理、数值计算等复杂查询,如何准确应答?

挑战 3: 如何降低算法对人工标注的依赖,实现对新业务、新场景的快速响应?

面对上述挑战,通用知识图谱的成功经验难以直接迁移到大多数企业。因此,构建一套低成本、可迁移的知识图谱解决方案具有重要意义。

为了实现这一目标,论文提出了 DASH 设计理念(Disentangle Demands, Algorithms, data Sources, and Humans),即在知识图谱构建与应用过程中将"业务、算法、数据、人力"解耦合,最大程度保证算法的标准化,降低企业接入知识图谱的技术门槛。基于该设计理念,容联云开发了一个低成本、可迁移的敏捷知识图谱系统,该系统的整体架构如下图所示。

容联云知识图谱系统整体架构

具体地,该系统配备了基于多轮机器阅读理解的知识抽取方法 (MRC- KE)、分层知识图谱问答方法 (Hi-KBQA) 和半自动化数据积累方法等先进技术。这些算法具有出色的可迁移性和准确性,在面对新业务、新场景、新数据时,可快速适应少样本、零样本的情况,有效降低系统对人工标注的依赖,实现更快捷的部署实施。此外,平台也允许用户根据业务需求灵活提供"行业知识、业务知识",进而实现便捷的"人机配合"。

该知识图谱系统是容联云在"通讯 + AI"技术的双轮驱动下的新突破,有效推动容联云在自然语言理解、认知智能等方向的技术提升。未来,容联云还将继续深耕 AI 算法的深度研发,持续投入 AI 技术与智能化的场景应用挖掘,以领先的技术为企业的数智化升级赋能助力。

2022-09-13 19:54:20

相关文章