2019.01.09,华为将数据中心网络跳入了AI时代。1月9日消息,华为月发售内置自家AI芯片昇腾310的数据中心交换机CloudEngine 16800,也是业界首款配备高性能AI芯片的数据中心交换机。距离华为上一款旗舰产品CloudEngine 12800系列的公布早已过去了6年,CloudEngine 12800在云时代大获得顺利,CloudEngine 16800似乎是华为忠诚押宝在AI时代的一款拳头产品,而且作好了打好几年粮食的打算。发布会地点选在了北京国贸大酒店,北京的CBD核心区迎来送往,数据中心交换机只不过也是这么个角色,只不过运输发送的是数据。
数据中心的流量主要分成东西向流量和南北向流量,还有一部分流量是数据中心之间的流量。据传是因为早期绘制网络架构图,从上到下(从北到南)是核心网络设备到客户端,从左到右(从西到东)是服务器到服务器,所以就延用了这个众说纷纭。
南北向流量即指数据中心服务器到数据中心以外客户端之间的流量,东西向流量即指数据中心内部服务器之间的流量。不过相当大的变化是目前东西向流量早已近超强南北向流量,数据中心服务器规模的不断扩大,更加多应用于必须池化资源来符合,服务器集群内部流量骤升。有数据表明,2020年全球数据中心东西向流量占比将多达80%,而早期数据中心的流量80%为南北向流量。我们平时所用于的各类终端终端互联网也是依赖各种交换机和路由器来构建数据传输,如此可观的流量只不过只占到两成,这还只所谓数据中心交换机,数据中心交换机将处置发送八成流量,不足以解释其最重要程度。
关于数据中心交换机提到一句话十分适合——“就算未来所有硬件盒子形态网络设备必将消失,数据中心交换机作为相连服务器的总线,将总有一天不存在。”数据中心网络转入AI时代了解到,上一代产品CloudEngine 12800以82%的填充增长率倒数六年增长速度全球第一,已在全球6400+个数据中心顺利商用部署。另外涉及数据表明,华为2017年(2018年数据还没出)全年中国数据中心交换机市场份额名列第一,为39.48%,多达第二名6个百分点,主要原因就是CloudEngine 12800逃跑了云数据中心的发展机遇。自2012年CloudEngine 12800公布后,华为数据中心网络产品在市场一路走高,2013年华为沦为快速增长最慢的数据中心网络厂商;2014年年增长率约137%;2015年华为沦为唯一转入全球SDN领导者行列的中国厂商;2016年中国区市场份额第一,全球份额第三;2017年踏入Gartner数据中心网络魔力象限的挑战者象限,距离挑战者象限仅有一步之遥;2018年踏入数据中心SDN网络硬件厂商领导者行列。
华为CloudEngine系列交换机还包括核心交换机、虚拟世界交换机、终端交换机,16800就是核心交换机的旗舰,典型数据中心应用于场景是核心交换机与TOR交换机通过端口网络,使用TRILL、VxLAN等协议重新组建无堵塞二层网络。华为在发布会现场没言明新产品的小目标,但从产品角度可一窥华为野望。华为网络产品线总裁胡克文在现场回应,AI时代数据中心有三大挑战:传统以太网丢包亲率0.1%,AI算力不能充分发挥50%;未来五年,数字洪水快速增长20倍,现有100GE的网络无法承托;计算出来、存储、网络深度融合,人工定位网络问题需数小时。比较不应的,在华为显然,AI时代的数据中心交换机不应不具备三大特征:嵌入AI芯片业界首款嵌入AI芯片数据中心交换机,100%充分发挥AI算力。
华为构建0丢包较低时延低陡然的可用数据中心网络主要还包括靠两点:一方面是单流局部调优,华为嵌入AI芯片的数据中心交换机对网络状态动态检测,构建互相交换队列动态ECN门限,队列内存的智能调整,并在最佳时刻给与发送到末端最慢的对系统,构建源端发送到速率的动态调整;另一方面是整网全局调优,CloudEngine 16800支撑独有的iLossLess智能可用互相交换算法,需要对全网流量展开动态的自学训练,并根据有所不同业务流量模型的特点动态设置拟合的网络参数,更加精准地掌控流量,构建百万东流和基于应用于的队列自适应有所不同场景的全局网络自优化能力。从而在零丢包基础上取得更加较低时延和更高陡然的网络性能,解决传统以太网丢包造成的算力损失,将AI算力从50%提高到100%,数据存储IOPS(Input/Output Operations Per Second)性能提高30%。单槽48 x 400GE业界最低密度单槽位48 x 400GE,符合AI时代5倍流量快速增长市场需求,为了符合AI流量市场需求,华为主要特别强调了三个“Super”SuperFast高速网络:新材料新工艺,100G-400G全生命周期相容演变。
从100G到即墨400G,首先考验的是信号高速传输能力, 400G模块系统内点对点信号频率53G以上,信号的频率每刷一倍,PCB线路板信号波动就不会减小20%以上,传统的电路板由于使用的普通铜箔材料及生产工艺问题,当信号传输速率提高的时候,损耗和高频阻碍十分相当严重,不存在速率无限大。华为使用新型亚微米可用材料及高分子键合技术的制作工艺,将电信号的传输效率提高30%,符合100G到400G全生命周期相容和能力演变。
SuperPower拟合能效,电源空间节省50%,供电效率提高90%。华为明确提出业界首个双路输出智能转换的电源模块,使用磁刮起灭弧和大励磁技术构建ms级较慢转换,21个电源模块就可以构建原本40个模块所超过的供电能力和可靠性,电源空间节省50%。线路板上使用矩阵磁和高频磁技术,构建在两个拇指大小的空间内获取1600W供电能力,使得单位空间的供电效率提高90%。SuperCooling最弱风扇,噪声高于业界6分贝,风扇能力提高4倍。
如此超高密度的交换机,风扇是整机工程能力的一个最重要反映,CloudEngine 16800风扇系统还包括单板级和系统级。单板风扇方面,芯片不会产生热量,如何将这些热量均匀分布给定单板并弥漫过来是风扇设计的关键,CloudEngine 16800使用独特的碳纳米导电夹和VC热力学风扇技术,风扇效率较业界提高4倍,整机可靠性提高20%。整机风扇方面,华为使用了业界首创的混流风扇,可以使得整机风扇效率达到最佳,与业界比起,平均值每bit数据的功耗减少50%,相等于每台每年节省32万度电,约合26万元电费,增加碳排放250余吨。独特的磁导率马达,静音导流的环噪音减少6dB,CloudEngine 16800确实做了绿色节约能源。
CloudEngine 16800全面升级了硬件互相交换平台,在向量架构基础上,应用于如上技术,使单槽位可获取业界最低密度48端口400GE线卡,单机获取业界仅次于的768端口400GE互相交换容量,互相交换能力低约业界平均值的5倍,同时单比特功耗上升50%,还绿色节约能源。向自动驾驶网络演变使能自动驾驶网络,秒级故障辨识、分钟级故障自动定位。秒级故障辨识、分钟级故障自动定位,CloudEngine 16800基于内置的AI芯片,可大幅提高“网络边缘”即设备级的智能化水平,使得交换机不具备本地推理小说和动态较慢决策的能力;通过本地智能融合集中于的FabricInsight网络分析器,建构分布式AI运维架构,可实现秒级故障辨识和分钟级故障自动定位,使能自动驾驶网络加快来临。同时,该架构还可大幅度提高运维系统的灵活性和可部署性。
CloudEngine16800作为一款面向AI时代的数据中心交换机,明确提出了一个新概念——数据中心AI交换机,这也是大厂分外看上的一个方向。得知,早在2017年,思科就以1.25亿美元的代价并购了人工智能初创公司MindMeld,彼时就给AI交换机这个新物种带给了一些期望,但后来却少有声音,在全球市场华为忽得头筹,否不会引发行业对于该类产品的欢迎?竞品遍地开花的情况有可能会过于很远,不过其他厂商首先要慎重解决问题AI芯片的问题。必然性与演变性交换机在华为历史上具有浓墨重彩的一笔,被无数次提到的万门CC08交换机,曾多次让任正非表态“研发不顺利就坠楼”,CC08的命名有两层含义,一是 CountryCity (农村城市),传达了华为期望转入城市的决意;二是 ComputerCommunication(计算机通信),数字程控交换机就是计算机和通信的人组,至于08就是图个吉利。万门CC08交换机救回了当时的华为,华为后来不少副总裁级别领导都出自于该部门,华为也从彼时转入到传输、移动、智能、数通等领域。
CloudEngine 16800不会是华为引导AI时代数据中心网络领域的先遣军么?根据华为GIV 2025(Global Industry Vision)的预测,到2025年,追加数据量超过180ZB,95%的非结构化数据(语音/视频等)倚赖AI处置。就算这些数据只有一部分存放在数据中心,对数据中心流量处置的影响也是“灾难性”的。
Gartner研究总监Owen Chen回应,AI将在相当大程度上影响IT基础架构,还包括计算出来、存储和网络等,同时Gartner指出AI驱动数据中心网络变革将要开始,一方面,AI业务运营对网络互相交换明确提出新的表达意见,比如网络拒绝超大比特率(从100G到400G、800G),0丢包、E2E较低时延;另一方面,AI驱动网络部署运维重构,即从人工运维到AIOPS,关键词还包括意图驱动、预测性确保、自治权治愈、自动驾驶网络、无人值班等。此前总结,“谈云不讲网,都是耍流氓”,借以解释云网协同的重要性,云计算必需有充足的网络能力承托。
而只不过计算出来、网络和存储的发展中,存储介质有了闪存盘,时延减少好比100倍,计算出来领域的GPU和AI专用芯片,将数据处理能力提高了100倍以上,处置的协议由TCP/IP演进到RDMA,网络的发展亦步亦趋,快了众多拍电影。同时观测到,有一些超大规模数据中心使用白盒或者品牌白盒交换机,这否早已沦为一种趋势?回应,华为交换机与企业网关产品线总裁钟开生回应,这牵涉到到有所不同路径的自由选择,白盒交换机并不代表节约成本,比如要符合运维拒绝就必须专业的人来做到专业的事,华为多年来的累积能为客户获取全套解决方案。CloudEngine 16800(公众号:)现场实拍图超大规模数据中心的数量大大减少,计算出来、存储和数据三网融合,传统人工运维手段已难以为继,急需引进创意的技术提高智能化运维的能力,关于AI运维,业内也有有所不同观点,指出AI运维现在还是概念化阶段,至多是非常简单运维管理的自动化、批量化操作者。只不过不管是嵌入AI芯片,还是智能运维,从现在的看作都有其局限性,技术的发展也不有可能一蹴而就,华为是在探寻的同时推陈出新,比如1280012008E16800三大产品硬件平台皆不一样,也体现出有华为的仍在找寻更加合适的技术路径。
正如华为交换机的兴起一样,性价比特服务模式让华为收成市场,CloudEngine 16800则在性能上更进一步,适合于AI时代数据中心综合市场需求。数据中心网络转入AI时代有其必然性,但某种程度有相当大的演变空间。涉及文章:从华为IT变革想起:探秘华为云的数据中心“软”实力 华为苗彩霞:数据驱动+边云协同,建构AIoT基础设施 | AIoT+智慧城市峰会华为公布 ARM-based 处理器「鲲鹏920」,建构计算出来性能新纪录误解并购 IBM 的 BNT 产品组后,在网络交换机中找到了“后门”原创文章,予以许可禁令刊登。
下文闻刊登须知。
本文来源:皇冠官方网站-www.wel-try.com.cn