APP下载

AI趋势周报第171期:TPU v4已比超级电脑快,Google如何用AI自动设计下一代TPU?

消息来源:baojiabao.com 作者: 发布时间:2026-02-16

报价宝综合消息AI趋势周报第171期:TPU v4已比超级电脑快,Google如何用AI自动设计下一代TPU?
图片来源: 

Google

重点新闻(0604~0610)

TPU v4     Google     强化学习  

TPU v4已比超级电脑快,Google如何用AI自动设计下一代TPU?

去年,由AI大神Jeff Dean领军的Google研究团队发表一篇论文,描述一套AI芯片设计方法,可从过去经验中学习改进,来为未知的元件设计架构,而且不到6小时就能完成,比人类的数周还要快。今年,Google新论文揭露技术进展,同班人马已微调这套AI,并用来设计尚未问世的TPU v5。这篇技术论文,最近还登上《自然》期刊。

Google解释,芯片的设计有赖于芯片布局规划(Chip floorplanning),也就是电脑芯片的实体设计图。尽管经过50年研究,这个工程还是无法自动化,需要工程师几个月尝试才行。

为解决问题,Google团队用深度强化学习,来自动进行芯片布局规划,产生芯片平面图。他们将芯片布局规划视为一个强化学习问题,并开发一个边缘AI,也就是图卷积网络架构,来学习芯片上复杂且可转移的特征。也因此,Google的方法可从过去经验中学习,并能越快解决问题,意思是,AI代理比人类工程师还要有经验,来设计芯片。

Google也用这个方法,来设计下一代AI加速芯片TPU v5。而且,AI代理可在6小时内完成设计,且所有关键指标如功耗、性能、芯片面积等,都能媲美人类的芯片布局规划,还可省下每一代数千小时的人工开发时间。

最近,Google才在自家I/O大会上揭露TPU v4。以一个具4,096个TPU v4的TPU v4 Pod来说,就能达到1 exaFLOP等级的算力,实现每秒10的18次方浮点运算。Google CEO Sundar Pichai指出,这相当于1千万台笔电的算力,也等于1台超级电脑。(详全文)

  制造业     Google云端    COVID-19  

Google云端调查:制造业将三分之一IT支出花在AI上

Google云端最近公开一份全球制造业调查,发现制造业者将36%的IT支出花在AI上,更有四分之一的制造业者将一半或以上IT支出花在AI。这份调查是Google云端委托The Harris Poll执行,在去年10月底针对全球1,154位制造业资深主管来调查,他们发现,受到COVID-19疫情影响,高达76%的制造业拥抱资料分析、AI、云端来因应疫情危机。

Google云端指出,制造业仰赖AI的原因,在于它简化了部署和使用。而最常用AI来协助每日作业的制造业为汽车/OEM厂商(76%),再来是汽车供应商(68%),第三名则是重型机械业者,67%正部署AI。调查显示,虽然意大利和德国分别有80%和79%的制造业者使用AI协助每日工作,但在美国只有64%,日本和韩国只有50%。

而使用AI的Top 3目标则是协助业务连续性(38%)、让员工工作更有效率(38%)、总体上整体员工(34%),制造业部署AI的具体领域则有品质检验(39%)、供应链管理(36%)、风险管理(36%)、生产/生产线管理(35%),以及库存管理(34%)。(详全文)

 IBM     AI不确定性     UQ360  

如何量化不确定性?IBM开源专属AI工具包来计算

IBM日前在Data & AI 2021开发者大会上宣布开源不确定性量化AI工具包(UQ360),要来算出AI没把握的程度。进一步来说,AI不确定性可分为两种,一是认知不确定性,也就是因训练资料不恰当,造成模型对特定领域无知,另一种是任意不确定性,也就是从观察中自然产生的随机不确定性。增加训练资料可降低认知不确定性,但却不会改变任意不确定性。

因此,IBM开发UQ360,能根据使用者底层模型、ML任务类型、资料特性和目标等因素,以多种算法和分类法来计算AI不确定性。使用者可从UQ360中的Python工具包选择算法,并选择UQ360评估结果的呈现方式,像是文字说明或视觉化图表等。IBM希望开源这个工具,来促进AI社群探讨AI算法决策的局限。(详全文)

  苹果    声音辨识     开发框架  

苹果释出具声音辨识能力的开发框架ShazamKit,Android平台也可用

苹果日前在技术发表会WWDC 2021上,宣布开源声音辨识开发框架ShazamKit,连Android开发商也可使用。这个开发框架源自苹果2017年收购的知名音乐辨识服务商Shazam,Shazam的音乐辨识能让使用者上传一段音乐,透过数据库比对后,告知使用者音乐曲名、歌手介绍等讯息。

苹果后来将这个技术打包成ShazamKit并开源,同时释出声音辨识及歌曲数据库资源。开发者可将自有App连结Shazam,来提供用户相同的歌曲辨识比对服务,ShazamKit也允许客制化,让开发者集结影片、podcast等声音档来源制作预录声音数据库,为自己的App制作第二屏幕应用,像是声音播放时可在另一台装置同步播放其他音源,助于远距互动学习或线上线下整合的商务应用开发。ShazamKit整合于iOS/ipadOS 15.0、macOS 12.0、tvOS 15.0+和watchOS 8.0+中,目前为开发人员Beta版,Android App开发商也可下载ShazamKit SDK档。(详全文)

  脸书     多对多翻译     资料集  

脸书新资料集可精确评估多对多翻译模型

脸书开源FLORES-101资料集,是一套涵盖101种语言的多对多评估资料集,可用来测试、改善多语言翻译模型。这个资料集锁定低资源语言,投入许多人力完成,每个文件都由专业翻译人员翻译,再人工编辑来验证,另外还有人检查拼写、语法、标点和格式,并用商业引擎的翻译来比较。最后还会由另一组翻译人员来评估,找出不自然的翻译和语法等错误再重新翻译。

FLORES-101的翻译文字以文件为单位,这种包括上下文情境,能让翻译效果更好,而且资料集中的翻译文件有多个相邻句子,也可用来评估加入上下文考量的翻译品质。另外,FLORES-101还提供了翻译的后设资料,包括超链接、URL、图像和文章标题等资讯。(详全文)

微软    ONNX Runtime    脸书推理  

ML推理引擎ONNX Runtime 1.8支援网页AI推理了!

微软ML推理引擎ONNX Runtime释出1.8版本,不只加速Android和iOS行动装置上的模型推理和训练速度,也推出ONNX Runtime Web来支援网页ML推理,最后还推出加速PyTorch工作负载的官方套件。

进一步来说,在网页上推理模型一直是热门话题,因为网页推理可降低Server-client沟通成本,也能保护用户隐私、提供免安装的跨平台ML体验。而1.8版的新功能ONNX Runtime Web,可让AI开发者用CPU或GPU加速打造网页版ML体验。在CPU部分,这个功能将原生ONNX Runtime CPU引擎汇整至Webassembly后端,可执行任何ONNX模型和ONNX Runtime支援。GPU部分,则借助WebGL标准来加速。

在行动装置部分,ONNX Runtime新提供C/C++函式库Pod预览版,用来整合ONNX Runtime Mobile和iOS应用程序,而Andriod和iOS工具包也分别是Maven Central和CocoaPods的安装内建工具包了(iOS仍为预览版)。(详全文)

图片来源/Google、IBM、脸书

 AI趋势近期新闻 

1.阳明交大联手中华电信推COVID-19血氧监测云平台

2. 脸书新AI工具可从照片中的1个字,产生同风格文字

3. OpenAI:已改善GPT-3中的偏差和

资料来源:iThome整理,2021年6月

 
2021-06-14 12:54:00

相关文章