Serverless Kubernetes和ACK虚拟节点都已基于ECI提供GPU容器例项功能,让使用者在云上低成本快速搭建serverless AI实验室,使用者无需维护服务器和GPU基础执行环境,极大降低AI平台运维的负担,显著提升整体计算效率。
在pod的annotation中指定所需GPU的型别(P4/P100/V100等),同时在resource.limits中指定GPU的个数即可建立GPU容器例项。每个pod独占GPU,暂不支援vGPU,GPU例项的收费与ECS GPU型别收费一致,不产生额外费用,目前ECI提供多种规格的GPU型别。(请参考https://help.aliyun.com/document_detail/114581.html)
选择深圳区域,可用区D。



我们使用tensorflow模型对如下图片进行识别:

使用模版建立pod,其中选择P100 GPU规格。在pod中的指令码会下载上述图片档案,并根据模型进行识别计算。



部署后pod会处于pending状态:

等待几十秒后pod状态变成Running,待计算完成后会变成Terminated状态。

从pod的日志我们可以看到pod能够识别P100 GPU硬件,而且可以正确识别图片为Panda。

通过以上示例可以看出,从环境搭建到计算结束,整个过程使用者无需购买和管理服务器,无需安装GPU执行环境,serverless的方式可以让使用者更加关注在AI模型构建,而不是底层基础设施的管理和维护。
-------------------------------------------
本文作者:贤维
原文连结 :https://yq.aliyun.com/articles/705664?utm_content=g_1000063034
本文为云栖社群原创内容,未经允许不得转载。





























