
历经7年的发展,AWS已自行研发IT基础架构必备的多种运算芯片,供自家使用,这当中包含了:提升效能与安全性的Nitro,提供成本更低执行个体服务的Graviton,加速机器学习处理的Inferentia、Trainium。
关于运算型态的公有云服务提供,AWS的EC2发展至今已长达14年之久,每年新推出的执行个体(instance)服务,往往反映了当时的运算技术发展重点,而在今年的全球用户大会上,AWS基于他们自行设计的硅芯片,以及其他厂商最新发表的中央处理器(CPU)、图形处理器(GPU),也发表新的执行个体服务。
举例来说,AWS去年发表他们设计的Arm架构处理器Graviton2,以及采用这个运算技术的多个执行个体,像是一般用途类型的M6g与M6gd,运算密集型C6g与C6gd,内存密集型R6g与R6gd,而在今年年中,这些服务都已陆续上线提供。而在12月,AWS宣布推出新的执行个体C6gn,搭配100 Gbps网络连线效能。
在x86架构处理器的部分,AWS在今年12月,基于英特尔第二代Xeon Scalable处理器,发表M5zn、D3/D3en、R5b等3套执行个体服务。其中的M5zn,属于一般用途的执行个体,主要特色是可针对单绪执行提供最高效能,处理核心运作时脉可达到4.5GHz;针对储存应用的D3/D3en,可搭配相当巨大的硬盘储存容量,单台执行个体最大可配置336TB;R5b属于可搭配大量内存的执行个体服务系列,与区块储存EBS之间的存取带宽,最大可达到60Gbps,并且提供26万IOPS的储存效能,以此支援超大型数据库工作负载。
关于搭配图形处理器的执行个体服务,AWS基于AMD Radeon Pro V520的图形处理器,以及AMD第二代EPYC处理器,在12月推出G4ad,可针对图形处理密集型应用,提供更理想的性价比。
推出多款自行设计的芯片,支援高效能与低成本的应用需求
在2013年,AWS开始研发第一代Nitro芯片,到了2015年,他们并购芯片制造商Annapurna Labs,于是,AWS除了持续发展Nitro硬件系统架构,也开始研发Arm架构芯片Graviton。2017年AWS正式公开Nitro系统架构,2018年11月发表基于Graviton的执行个体服务A1,以及机器学习推论芯片Inferentia。
Graviton提供性价比更高的通用运算
在2019年底,AWS基于第二代Graviton芯片,推出支援Arm架构的执行个体服务,像是:M6g、C6g、R6g,以及搭配NVMe SSD的C6gd、M6gd、R6gd,强调相较于x86架构的执行个体服务,性价比更好(提升40%)。
今年AWS在自研芯片的应用上,又有哪些进展?5月M6g正式推出,6月C6g与R6g上市,7月M6gd、C6gd、R6gd也开始提供。9月,AWS宣布推出另一个Arm执行个体服务T4g,支援效能需求爆涨型(Burstable Performance)负载,可在短时间内迅速提供大量运算能力。
在12月初的全球用户大会期间,AWS又发表可搭配100Gbps超大网络带宽的C6gn,预计将于稍后正式推出。而且,C6gn沿袭了AWS现有Arm架构执行个体服务的特色,以及效能成本效益,但拥有更大的网络带宽(M6g、C6g、R6g最大可配置25Gbps)。
在此之前,他们原本就有强调网络最佳化用途的执行个体服务,如M5n、C5n、R5n,可支援网络密集型工作负载,例如,防火墙、路由器、负载平衡、视讯转码、资料分析等应用需求,让用户可运用超大型的带宽吞吐量,以及封包传输效能,执行这些网络处理。但这些执行个体的最大封包传输率都面临局限,用户甚至需启动多个执行个体,才能得到更大封包传输效能。
而即将问世的C6gn,不仅与M5n、C5n、R5n一样,用户可选择配置100 Gbps的执行个体,与区块储存服务EBS之间的带宽,可提供到38 Gbps(M5n、C5n、R5n最高可提供19,000 Mbps)。另外,在封包传输效能上,相较于上述执行个体服务,C6gn可再提升40%。
AWS设计了基于Arm架构的处理器Graviton,目前他们运用第二代芯片,也就是Graviton 2,推出了多个执行个体服务,可分别针对一般用途、内存密集型、运算密集型、超大型网络带宽,以及效能暴涨等使用情境。
Inferentia提供低成本推论加速应用
在2018年11月,AWS发表自行设计的Inferentia硬件运算芯片,每颗芯片可提供数百TFLOPS的运算效能,搭配这款芯片的单个执行个体,可提供数千TFLOPS的运算效能。
隔年12月,他们基于这颗芯片,推出用于机器学习推论的执行个体服务Inf1,可提供2000 TOPS的运算效能,并强调这是市面上最便宜的机器学习推论执行个体。相较于搭配GPU的G4执行个体,Inf1可提供3倍的推论处理吞吐量,以及减少4成的单位推论成本,至于单颗Inferentia芯片的运算效能,他们则表明是128 TOPS(INT8),以及64TOPS(FP16、BF16混合精度)。
而在组态配置与部署方式上,用户可选择搭配1个、4个或16个Inferentia芯片的Inf1执行个体,而且可搭配AWS专为深度学习所整合的AMI软件映像使用。这些映像内含当时刚推出的AWS Neuron SDK,这套软件开发套件提供多种指令,IT人员可借此在Inferentia编译、调校、执行机器学习模型
AWS也预告,可在多种代管服务里面搭配使用Inf1,像是专攻机器学习应用的SageMaker,以及Kubernetes代管服务、EKS容器调度服务ECS。
到了今年,上述三个代管服务陆续支援Inf1。9月AWS宣布两个自家案例。
首先,就是母公司Amazon的Alexa语音助理应用服务团队,已将大量基于GPU的机器学习推论工作负载(80%的语音回应处理作业),迁移到Inf1。
他们得到了哪些成效?AWS表示,各层面的延迟度降低25%,若单就文字转语音的工作负载而言,以GPU执行个体为基准,改用Inf1后,成本降低30%。
另一个采用Inf1的案例,是AWS的图片与影片辨识服务Rekognition。执行物体分类这种机器学习模型时,若以交由GPU执行个体来处理为基准,改用Inf1后,延迟度降至1/8,吞吐量提升1倍
关于Inferentia的硬件设计架构,AWS今年也首度透露更多细节。他们表示,每颗Inferentia芯片包含4个名为NeuronCore的核心,而每个核心实作脉动阵列(systolic array)矩阵乘法引擎,可大幅提升卷积、变形这类典型深度学习处理的速度。
Trainium锁定机器学习训练应用需求
今年AWS全球用户大会期间,该公司首席执行官Andy Jassy宣布,他们将在2021年推出另一款硬件芯片,名为Trainium,专门用于机器学习的训练,他们希望在云端服务环境当中,提供更具成本效益的训练应用,可针对任何机器学习执行个体,提供TFLOPS等级的处理效能。
而在软件搭配的部分,Trainium能支援TensorFlow、PyTorch、MXNet等深度学习框架,并可继续采行原本专用于Inferentia的软件开发套件Neuron。
至于结合云端服务供应的形式上,AWS预计将在EC2提供搭配这套机器学习训练芯片的执行个体,或是在SageMaker里面提供。
针对机器学习的应用需求,AWS提供多种执行个体服务,除了搭配英特尔的中央处理器,以及Nvidia的图形处理器,他们也采用自行研发的加速芯片Inferentia,以及明年即将推出的Trainium。
相关文章
YouTube更新违反规定政策,提升惩处透明度和一致性2023-12-31 14:00:52
传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作2023-12-27 18:34:43
刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人2023-09-26 21:55:08
WebOS新系统:Palm Pre手机最新款高价登港2023-06-23 15:39:14
帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应2023-06-22 09:36:10
蔚来全系产品降价3万 取消免费换电 换一次电池180元2023-06-12 17:27:49
电商平台三巨头开打最大规模折扣 价格战再次打响2023-03-05 18:58:40
爱立信节省成本裁员四千人 爱立信全球员工总数五分之一2023-02-24 22:27:29
蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭2023-02-23 16:18:14
联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出2023-02-18 12:45:25
蓝色光标2022营收亏损18亿 客户预算减少明显2023-02-18 12:40:08
三星工厂或将80%生产转至越南 因本地劳动力成本上升2023-02-17 23:09:16
香港八达通卡如何激活?没用失效过期余额怎么办2023-02-17 18:34:51
中兴通讯被曝将裁员20% 称只裁国外的2023-02-17 18:33:26
苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出2023-02-17 16:57:22
突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌2023-02-16 14:31:19
三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?2023-02-14 00:53:17
Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要2023-02-14 00:32:08
谷歌google计划重返进入中国市场?但结果可能令你失望2023-02-13 16:57:15
Zoom紧急裁员1300人 佔员工总数15%2023-02-08 14:59:11
最新资讯
炒港股要补交多少税?我也接到催交补税特别行动的电话了2025-07-23 17:36:43
淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款2024-10-01 13:01:28
哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰2024-10-01 11:22:38
白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时2024-09-27 09:10:44
北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑2024-06-28 10:07:40
手机
中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15