持续创新金融科技应用度小满两篇论文入选国际顶级会议

消息来源:baojiabao.com 作者: 发布时间：2024-05-26

报价宝综合消息持续创新金融科技应用度小满两篇论文入选国际顶级会议

随着金融科技的快速发展，区块链、人工智能、多模态和预训练排序等新兴技术领域已成为全球科技巨头"必争之地"。作为以科技创新为核心驱动力的金融科技企业，度小满在科技研发、自主创新等方面进行了大量投入，在新兴技术领域不断取得新突破。近日，度小满金融数据智能应用部 AI-Lab 的两篇论文分别入选 ACM MM 和 CIKM 国际顶级会议。

据了解，度小满两篇论文分别就多模态和预训练排序等多个热门话题提出了新颖的算法，并在相关任务上达到了国际顶尖水平，获得了审稿人的一致好评并最终录用。这标志着度小满在自然语言处理和计算机视觉等人工智能前沿领域的研究得到了国际同行的认可。

度小满新模型可满足多业务场景需求

度小满 AI-Lab 团队撰写的"具有实体对齐网格的位置增强 Transformer"论文被 ACM MM 录用，以下为该论文简介：

许多图像除了实际的物体和背景等信息外，通常还包含着很有价值的文本信息，这对于理解图像场景是十分重要的。因此本文主要研究基于文本的视觉问答任务，这项任务要求机器可以理解图像场景并阅读图像中的文本来回答相应的问题。然而之前的大多数工作往往需要设计复杂的图结构和利用人工指定的特征来构建图像中视觉实体和文本之间的位置关系。

为了直观有效地解决这些问题，我们提出了具有实体对齐网格的位置增强 Transformer。与之前的模型相比，我们在不需要复杂规则的情况下，显式地引入了目标检测和 OCR 识别的视觉实体的连续相对位置信息。同时我们根据物体与 OCR 实体映射关系，用直观的实体对齐网格代替复杂的图形结构。在该网格中，不同位置的离散实体和图像的区块信息可以充分交互。

该模型能够整合目标检测、OCR 以及基于 Transformer 的文本表示等多种方法的优势，增强算法对于图像中场景信息的理解，更精准地融合图像与文本多模态的信息，进一步助力证件识别、人脸与活体检测等业务场景，提升度小满在视觉风控方面的技术能力。

度小满论文开创性提出动态多粒度学习方法

度小满另一篇"基于 BERT 的动态多粒度排序模型"的论文被 CIKM 录用，以下为该论文简介：

近年来，预训练的语言模型广泛应用于文本的检索排序任务中。然而，在真实场景中，用户的行为往往受到选择或曝光偏差的影响，这可能会导致错误的标签进而引入额外噪声。而对于不同候选文档，以往的训练优化目标通常使用单一粒度和静态权重。这使得排序模型的性能更容易受到上述问题的影响。

因此，在本文中我们重点研究了基于 BERT 的文档重排序任务，开创性地提出了动态多粒度学习方法。该种方法能够让不同文档的权重根据预测概率动态变化，从而减弱不正确的文档标签带来的负面影响。此外，该方法还同时考虑了文档粒度和实例粒度来平衡候选文档的相对关系和绝对分数。在相关基准数据集上的实验进一步验证了我们模型的有效性。

如今，度小满在区块链、多模态和预训练排序、隐私计算等诸多前沿技术领域皆有布局，且取得了众多成果。当下，加强对创新技术的运用与推广，将在助推金融行业创新发展过程中起到重要作用。接下来，度小满将继续加快推动前沿技术在金融各领域的落地应用，让金融科技成为金融创新发展的助推器。

2023-02-12 19:16:12