加速分散式计算的传输 星云Clustar获红杉中国天使轮投资
消息来源:baojiabao.com 作者: 发布时间:2024-05-29
日前,“星云Clustar”已获得数千万元天使轮融资,由红杉中国投资。
“无论是传统CPU的多核迭代,还是如今的FPGA、ASIC芯片,都是在单点/单服务器上提升算力。随着数据量增多,模型增多,大规模分散式处理成为必须途径。与此同时产生的问题是,很多资源在服务器传输间时被消耗。所以,提升单点算力固然重要,服务器之间的互联、参数在各个节点之间如何高效传输也是研究方向。”创始人陈凯说到,星云Clustar更偏向于后者,将超算的科研和技术成果应用到商用领域,为企业AI提供高效的分散式机器学习系统。核心团队由科学家陈凯和杨强组成。
在星云AI的方案中,首先是基于RDMA的新型数据中心网络技术。
RDMA可以理解为一种传输协议,对标革新的是传统TCP/IP技术。
传统的TCP/IP技术在数据包处理过程中,要经过操作系统及其他软件层,占用大量的服务器资源和内存总线带宽,数据在系统内存、处理器缓存和网络控制器缓存之间来回进行复制移动,给服务器的CPU和内存造成了沉重负担,耗时且浪费资源,100G的带宽算下来可能只有20G用于传输。
RDMA(Remote Direct Memory Access)即远程直接内存访问,可以让计算机直接存取其他计算机的内存,而不需要经过处理器。这样一来,一台服务器的网卡可以直接读取对方应用数据,而不对操作系统造成影响,计算在可编程的网络交换机进行,理论上可以做到100%的带宽利用以及微秒(us)级端对端传输时延 (pan>。
星云RDMA技术的原理及其与TCP/IP架构的对比如下图所示:
同时,星云还利用了智能网络计算平台(smart in-network computing)技术 。
此前计算是在CPU上进行,网络只是负责传输数据。现在网络也能用于计算,星云通过可编程的交换机和智能网卡,分担了CPU?部分甚?至全部的计算任务。数据在边传输边计算的情况下,一来降低了CPU的负荷,二是边计算可以边消耗传输的数据量(比如对数据进行聚合以及整合),有利于提高传输效率。
再者,在应用感知的路由和调度的算法上,星云也做了优化。
通过分析数据流所对应的应用层的语义,来确定数据流之间的相关性和优先级,用于制定路由路径和调度顺序,进而用同样的网络带宽极大化应用程序的执行速度。陈凯举例,假设一堆分布在不同节点的数据要算最大值,则需要完全传输到一个目标点才能计算,传输完成99%都不能执行后续的流程,星云的算法就是为了确定数据流之间的相关性,制定整体最优的传输策略,保证目标进程不会因为某些流的迟到而被拖延。
诸如此类,星云所有技术的目的就为了提高AI环境下的高效运算。那么具体到应用上,微信的Amber深度学习平台就是由微信跟陈凯团队联合研发。Amber与TensorFlow、相同,也是一种深度学习计算框架。其中,陈凯团队负责将RDMA等技术应用到其数据传输环节,最终实现了平均提速3倍的计算效果。
此外,星云还在钢铁、制造业、保险风控领域有正在实施的案例。陈凯概括下来,星云AI的目标客户可以分两类:一类是有大量数据的传统行业,希望做企业转型,所以会涉及到大规模数据计算;另一类是AI的应用公司,他们需要高效的底层设施,来实现上层算法、应用。
目前,星云Clustar是项目制的方式帮企业落地,客单价在百万元级别。对于一些信息化、智能化较弱的企业,星云也提供软硬件一体化解决方案,包括以太网RDMA+智能网卡/自研交换机(最大网络带宽利用率提高AI效率),等等。
据悉,星云公司在2017年注册,2018年境内重组,现在是人民币架构。目前团队共20多人,分布在北京、香港。 本轮融资将用于团队建设和产品研发。(若你也希望加入该团队,简历请戳talent@clustar.ai)
附创始团队背景:
陈凯,星云AI创始人兼首席科学家。现任香港科技大学副教授、博导,网络系统实验室主任,港科大-微信人工智能联合实验室主任。主要研究方向包括数据中心网络,云计算系统,大数据和分散式机器学习的底层架构,专注于网络系统的设计和实现,曾多次在ACM SIGCOMM, USENIX NSDI,IEEE/ACM TON等国际顶尖学术会议和期刊上发表论文,其中SIGCOMM/NSDI论文近三年居亚洲第一,是全球网络通信业界首个基于机器学习的网络大脑核心设计者。
杨强,星云AI联合创始人。港科大教授、博导,ACM/IEEE Fellow,首位AAAI华人院士,在数据挖掘、人工智能、终身学习和智能规划等研究领域都有着卓越贡献。
相关文章
- 中兴受美国制裁事件 被罚了20亿美元过程事件始末 中兴被制裁后公司现状
2023-11-02 22:12:46
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因
2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓
2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?
2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09
- 科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯
2023-02-17 18:46:15
- 华为mate20pro系列手机首发上市日期价格,屏幕和电池参数配置对比
2023-02-17 18:42:49
- 小米MAX4手机上市日期首发价格 骁龙720打造大屏标准
2023-02-17 18:37:22
- 武汉弘芯遣散!结局是总投资1280亿项目烂尾 光刻机抵押换钱
2023-02-16 15:53:18
- 谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠
2023-02-16 13:34:45
- 巴斯夫将裁员6000人 众化工巨头裁员潮再度引发关注
2023-02-13 16:49:06
- 人手不足 韵达快递客服回应大量包裹派送异常没有收到
2023-02-07 15:25:20
- 资本微念与李子柒销声匿迹谁赢? 微念公司退出子柒文化股东
2023-02-02 09:24:38
- 三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办
2023-01-24 10:10:02
- 华为Mate50 RS保时捷最新款顶级手机2022多少钱?1.2万元售价外观图片吊打iPhone14
2023-01-06 20:27:09
- 芯片常见的CPU芯片封装方式 QFP和QFN封装的区别?
2022-12-02 17:25:17
- 华为暂缓招聘停止社招了吗?官方回应来了
2022-11-19 11:53:50
- 热血江湖手游:长枪铁甲 刚猛热血 正派枪客全攻略技能介绍大全
2022-11-16 16:59:09
- 东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?
2022-10-22 15:21:55
- 苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次
2022-10-03 22:13:45