APP下载

整并商用与消费AI产品线,Line首度揭4大AI研发趋势

消息来源:baojiabao.com 作者: 发布时间:2026-05-27

报价宝综合消息整并商用与消费AI产品线,Line首度揭4大AI研发趋势

Line旗下AI公司首席执行官砂金信一郎展示一项开发中的新功能Clova Dubbing(配音功能)编辑画面,不只能将输入文字转成语音,还可以搭配虚拟人像表情变化,仿佛由虚拟人像念出这段文字。(图片来源/Line)

在商用AI竞争上,和国外科技巨头如Google、脸书相比,Line仍旧是新进的挑战者。Line在2017年开始跨入AI市场,去年才正式定位自己是一家AI公司,推出商用AI计划LINE Brain,将AI视为下一阶段的发展重心。在去年开发日也揭露了更详细的AI战略蓝图,包括了8大发展方向,但细数这些技术方向,自然语言处理、语音辨识、电脑视觉、OCR、脸部识别、影音处理、资料分析到语音合成,大多是核心、基础的AI技术领域,而非更应用面的前瞻AI发展趋势。

今年中,Line旗下AI公司首席执行官砂金信一郎在一场AI日线上研讨会中,透露进军商用AI市场一年来的成果,过去1年已有280家企业采用了Line商用AI产品,也再度精简发展重心,将优先聚焦语音辨识合成、自然语言处理以及OCR三项技术的产品研发。

年中他也揭露了13项开发中的AI新功能,第一类新AI功能是与聊天机器人和语音订位助手AiCall有关的功能,包括了通用对话管理机制(Unified Dialog Manager)、AiCall Console、扩充式语义条件(Slot Extension)、插播支援(Barge-in Support)、Line官方账号VoIP支援、对话分析,以及细节不明的Streaming NEST。另有2项则是与eKYC服务有关的新功能,包括账号开设自动审查,以及伪造身份的检查机制(Fake-check),以及4项OCR第二版的新功能,包括了特定收据形式的辨识、特定发票形式的辨识、表格辨识(Table Recognition)和地址校正。

商用AI策略先聚焦3项技术的企业级服务

在今年年底这场2020开发者大会上,Line进一步宣布,将去年发表的商用AI产品线Line Brain,并入Clova品牌中,但会继续提供企业级商用AI服务,也就是NLP、OCR、语音辨识这三项的企业级服务。换句话说,Clova品牌下将包括了AI产品(Chatbot、OCR、语音、影音、文字分析、脸部辨识等),AI解决方案(智慧助理OCR、AiCall、eKYC)和AI装置(Clova智慧喇叭、Clova桌面装置和Wave装置)。Line资料实验室和资料平台负责人池边智洋强调:“Line的AI发展目标是让AI成为日常生活中到处可用的技术。”

砂金信一郎预告,将会逐渐释出更多AI产品让Line开发者社群先试用。他在开发者大会中,展示了一项正在开发中的新功能Clova Dubbing(配音功能)编辑画面,将文字语音生成结合虚拟人像(Avatar)的表情动作,可以针对一段动画来进行配音,只要需要输入文字,就会自动产生这段文字的声音,而且还可以搭配虚拟人像表情自动生成功能,在动画中,仿佛由虚拟人像念出这段文字的动画。不过,他没有透露,何时会推出这项功能。

Line更首度揭露4大AI研发趋势和潜在应用场景

Line旗下AI公司资料实验室技术顾问Minoru Etoh揭露Line未来四大AI研发趋势,更可以一窥,Line未来数年在AI产品的发展方向。图片来源/Line

在这次开发者大会上,除了产品发展新策略之外,Line更首度在今年开发者大会中,公布了长期AI研发愿景和方向。Line旗下AI公司资料实验室技术顾问Minoru Etoh表示,Line未来将聚焦四大AI研发趋势,包括了数位我(Digital Me)、生成式AI(Generative Intelligence)、值得信任的AI(Trustworthy AI)和暗资料(Dark Data)。从Minoru Etoh对这四大趋势的潜在发展特色,更可以一窥,Line未来数年在AI产品的发展方向。

数位我就是利用各种数位世界的个人化资料,来打造出个人在线上的数位分身,可强化各种个人化服务。Minoru Etoh指出,数位我发展架构上,最底层是一个分散式的信任平台,再用来发展出一个线上的数位身份平台(KYC),可以用于健康照护、智慧程式、旅游、e-、金融服务和电商服务上。这个架构也点出为何Line同时力推eKYC平台和区块链平台的背后思考。以健康照护应用为例,有了数位我的机制,就可以用来结合更多个人资料,打造更贴近个人需求的预先照护,个人化的治疗等。

第二项生成式AI是则是当前热门AI研发话题之一,Line希望研发各种类型内容的自动生成,不只是影音、声音、影像、文字、音乐,甚至还包括程式码自动生成。Minoru Etoh补充,应用场景上,生成式AI可以用来打造更多靠AI自动化的工作场所(Autonomous AI Workforce),例如提供多功能AI、复杂任务的简化、垂直产业AI等。也可以用于发展可理解相依脉络的语音辨识,来辨识出噪音或未知的用词。在数位学习上,也能用来自动产生符合不同学习者能力的适性学习内容。而用于即时通讯情境下,也能用来自动生成强化双向沟通的内容,来提供更高互动的虚拟经验。从Line在另一场演讲中透露,准备将贴图功能、有表情的虚拟角色图像等整合到视讯通话功能,就可一窥这个研发趋势的影响。

另一项也是当红AI议题的研发趋势是值得信任的AI。Minoru Etoh强调,这是必须做的事,而不是选项。其下有3项重点目标,使用的自由、公共安全、隐私保护。在隐私保护上,可以透过联合学习、加密式AI服务来将隐私资讯保留在用户端,而不用上传给服务提供者。另外在资料、模型和评估上都要考量AI公平性,避免造成偏差。

促进庞大暗资料利用,可发展非标记资料交换市集

最后一项暗资料,则是指目前仍有大量AI技术还没有运用到的资料,如何建立一套工具或技术,可以用来处理大量非结构化、无标记或隐藏的资料,例如Open AI的语言模型GPT-3就是一个暗资料可用的技术。Line也计划和母公司Naver联手打造一个用了100亿页日文语料训练的超大型语言生成模型。

另外,暗资料研发趋势上,Minoru Etoh认为,需要发展一个非标记资料的资料交换市集,这个市集可以提供隐私法遵规范,或将使用者行为资料碎片化来达到去识别化的作用等。尽管没有透露更多研发重点,但Line强调,Line的AI产品将持续投入与这四大类趋势相关的研发专案。

2020-12-09 10:53:00

相关文章