整并商用与消费AI产品线，Line首度揭4大AI研发趋势最新消息

Line旗下AI公司首席执行官砂金信一郎展示一项开发中的新功能Clova Dubbing（配音功能）编辑画面，不只能将输入文字转成语音，还可以搭配虚拟人像表情变化，仿佛由虚拟人像念出这段文字。（图片来源／Line）

在商用AI竞争上，和国外科技巨头如Google、脸书相比，Line仍旧是新进的挑战者。Line在2017年开始跨入AI市场，去年才正式定位自己是一家AI公司，推出商用AI计划LINE Brain，将AI视为下一阶段的发展重心。在去年开发日也揭露了更详细的AI战略蓝图，包括了8大发展方向，但细数这些技术方向，自然语言处理、语音辨识、电脑视觉、OCR、脸部识别、影音处理、资料分析到语音合成，大多是核心、基础的AI技术领域，而非更应用面的前瞻AI发展趋势。

今年中，Line旗下AI公司首席执行官砂金信一郎在一场AI日线上研讨会中，透露进军商用AI市场一年来的成果，过去1年已有280家企业采用了Line商用AI产品，也再度精简发展重心，将优先聚焦语音辨识合成、自然语言处理以及OCR三项技术的产品研发。

年中他也揭露了13项开发中的AI新功能，第一类新AI功能是与聊天机器人和语音订位助手AiCall有关的功能，包括了通用对话管理机制（Unified Dialog Manager）、AiCall Console、扩充式语义条件（Slot Extension）、插播支援（Barge-in Support）、Line官方账号VoIP支援、对话分析，以及细节不明的Streaming NEST。另有2项则是与eKYC服务有关的新功能，包括账号开设自动审查，以及伪造身份的检查机制（Fake-check），以及4项OCR第二版的新功能，包括了特定收据形式的辨识、特定发票形式的辨识、表格辨识（Table Recognition）和地址校正。

商用AI策略先聚焦3项技术的企业级服务

在今年年底这场2020开发者大会上，Line进一步宣布，将去年发表的商用AI产品线Line Brain，并入Clova品牌中，但会继续提供企业级商用AI服务，也就是NLP、OCR、语音辨识这三项的企业级服务。换句话说，Clova品牌下将包括了AI产品（Chatbot、OCR、语音、影音、文字分析、脸部辨识等），AI解决方案（智慧助理OCR、AiCall、eKYC）和AI装置（Clova智慧喇叭、Clova桌面装置和Wave装置）。Line资料实验室和资料平台负责人池边智洋强调：“Line的AI发展目标是让AI成为日常生活中到处可用的技术。”

砂金信一郎预告，将会逐渐释出更多AI产品让Line开发者社群先试用。他在开发者大会中，展示了一项正在开发中的新功能Clova Dubbing（配音功能）编辑画面，将文字语音生成结合虚拟人像（Avatar）的表情动作，可以针对一段动画来进行配音，只要需要输入文字，就会自动产生这段文字的声音，而且还可以搭配虚拟人像表情自动生成功能，在动画中，仿佛由虚拟人像念出这段文字的动画。不过，他没有透露，何时会推出这项功能。

Line更首度揭露4大AI研发趋势和潜在应用场景

Line旗下AI公司资料实验室技术顾问Minoru Etoh揭露Line未来四大AI研发趋势，更可以一窥，Line未来数年在AI产品的发展方向。图片来源／Line

在这次开发者大会上，除了产品发展新策略之外，Line更首度在今年开发者大会中，公布了长期AI研发愿景和方向。Line旗下AI公司资料实验室技术顾问Minoru Etoh表示，Line未来将聚焦四大AI研发趋势，包括了数位我（Digital Me）、生成式AI（Generative Intelligence）、值得信任的AI（Trustworthy AI）和暗资料（Dark Data）。从Minoru Etoh对这四大趋势的潜在发展特色，更可以一窥，Line未来数年在AI产品的发展方向。

数位我就是利用各种数位世界的个人化资料，来打造出个人在线上的数位分身，可强化各种个人化服务。Minoru Etoh指出，数位我发展架构上，最底层是一个分散式的信任平台，再用来发展出一个线上的数位身份平台（KYC），可以用于健康照护、智慧程式、旅游、e-、金融服务和电商服务上。这个架构也点出为何Line同时力推eKYC平台和区块链平台的背后思考。以健康照护应用为例，有了数位我的机制，就可以用来结合更多个人资料，打造更贴近个人需求的预先照护，个人化的治疗等。

第二项生成式AI是则是当前热门AI研发话题之一，Line希望研发各种类型内容的自动生成，不只是影音、声音、影像、文字、音乐，甚至还包括程式码自动生成。Minoru Etoh补充，应用场景上，生成式AI可以用来打造更多靠AI自动化的工作场所（Autonomous AI Workforce），例如提供多功能AI、复杂任务的简化、垂直产业AI等。也可以用于发展可理解相依脉络的语音辨识，来辨识出噪音或未知的用词。在数位学习上，也能用来自动产生符合不同学习者能力的适性学习内容。而用于即时通讯情境下，也能用来自动生成强化双向沟通的内容，来提供更高互动的虚拟经验。从Line在另一场演讲中透露，准备将贴图功能、有表情的虚拟角色图像等整合到视讯通话功能，就可一窥这个研发趋势的影响。

另一项也是当红AI议题的研发趋势是值得信任的AI。Minoru Etoh强调，这是必须做的事，而不是选项。其下有3项重点目标，使用的自由、公共安全、隐私保护。在隐私保护上，可以透过联合学习、加密式AI服务来将隐私资讯保留在用户端，而不用上传给服务提供者。另外在资料、模型和评估上都要考量AI公平性，避免造成偏差。

促进庞大暗资料利用，可发展非标记资料交换市集

最后一项暗资料，则是指目前仍有大量AI技术还没有运用到的资料，如何建立一套工具或技术，可以用来处理大量非结构化、无标记或隐藏的资料，例如Open AI的语言模型GPT-3就是一个暗资料可用的技术。Line也计划和母公司Naver联手打造一个用了100亿页日文语料训练的超大型语言生成模型。

另外，暗资料研发趋势上，Minoru Etoh认为，需要发展一个非标记资料的资料交换市集，这个市集可以提供隐私法遵规范，或将使用者行为资料碎片化来达到去识别化的作用等。尽管没有透露更多研发重点，但Line强调，Line的AI产品将持续投入与这四大类趋势相关的研发专案。