最前线自研路越走越远,阿里云发布云数据中心处理器CIPU
作者 | 邓咏仪
编辑 | 苏建勋
6月13日,2022年阿里云峰会正式举行。会上,阿里云智能总裁张建锋在峰会上正式发布CIPU(Cloud infrastructure Processing Units)。这是为新型云数据中心设计的专用处理器,未来将替代CPU成为云计算的管控和加速中心。
张建锋也在会上提及,阿里云今年最重要的策略是“B2B”,也就是“Back to Basic”,重新回归云计算的基础技术研发。
软件和硬件重新走向融合,这是当下云市场不可逆的大趋势,近年来越来越多的云厂商推出专有芯片等等硬件,与自家产品形成紧耦合。阿里云新处理器的发布,也证明了一点。
为什么要有CIPU?
传统的云计算架构里,包括三大件——存储、计算、网络,这部分是基于CPU为中心运转的,有arm、x86或者Risc-V等等不同架构;上层是操作系统、软件等。云厂商做的事情,其实是在底层的计算资源之上做虚拟化,进行统一调度。
但如今用户侧需求发生巨变,云厂商即使在上层做专有应用,也很难迅速满足算力需求——比如直播、游戏、影视剪辑/渲染等等场景,对数据量、算力规模、对时延的要求都非常高。
这背后的主要原因是,半导体的摩尔定律失效。
“摩尔定律失效,这也是云市场遇到的挑战——算力需求提升,我们基于CPU架构只能不断扩充计算核数。但如果一台服务器核数密度过高,一旦出问题,影响的业务会非常大,这也是云厂商要做底层架构改革的原因。”阿里云技术产品负责人蒋江伟在会后采访中介绍。
阿里云的自研之路也是自上而下——在成立之初,阿里云自研了云计算操作系统“飞天”,去年推出“倚天”芯片,再到如今CIPU推出。这意味着,阿里云已经从以CPU为中心的体系架构,演变至飞天操作系统+CIPU为中心的体系架构。
从定位上看,新推出的CIPU,向下会对数据中心的计算、存储、网络资源快速云化并进行硬件加速,向上泽接入飞天云操作系统,管控阿里云全球上百万台服务器。
阿里云也披露了新架构能够带来的实际效果。CIPU上线后,底层技术架构的表现都有明显提升。比如在存储上,存储时延最低可至30us(PLX),云端能提供比本地更安全可靠且高性能的存储能力。而在网络层,应用上云之后,比自建物理机的集群吞吐量提升了30%,业务高峰期延迟下降了90%。
如今,阿里云自研的产品,也已经囊括了云计算的大部分架构,如飞天操作系统、洛神网络、神龙计算、盘古存储、磐久服务器、芯片、数据库、安全内核等等。
技术革新带来计算效率提升,另一方面也减少了对能源的使用。本次峰会上,阿里云也重点提及了一些减碳实践。
目前,阿里云自建的数据中心都已达到国家绿色数据中心标准,全年平均PUE小于1.3。在2020年9月,阿里仁和数据中心落地杭州,是国内首座绿色5A级液冷数据中心,其PUE最低可以达到1.09,每年可省电7000万度。而位于张北的阿里巴巴数据中心,则成为行业首个碳普惠试点项目。