Iccsz讯 在近日召开的“GNTC全球网络技术大会”上,阿里技术保障部高级网络专家曹捷表示,阿里网络从最开始千兆、万兆,到现在25G,以及到明年的100G,花了近五年的时间,这个过程当中经历了很多次的技术迭代和很多次的试错,最终阿里决定要把网络做到最简单,简单到一个网络里面只有一个路由协议,而且这个BCP路由协议没有任何扩展的协议组。网络在接入交换机就在最后的端口上,提供给服务器接入。
据曹捷介绍,在2013年和2014年,阿里第一次做网络架构的标准化, 13年底实现了整个阿里数据中心的标准化建设,不管北京、上海、深圳,还是在云南、成都,机房里数据中心的网络hope图完全一样,设备型号完全一样,设备配置也完全一样。之后,阿里做超大规模的网络部署,解决了服务器分散,运维团队忙不过来的问题。
2016年,为适应阿里云的迅猛发展,阿里网络再次进行改造,第一次尝试自己做网管,虽然成功的实现了网络的正常运转,但由于业务与网络间过于耦合导致业务线对产品进行调整就需要网络部门配合对网络进行修改。为此,阿里开始将网络与业务进行分离,从而实现网络与业务的解耦。
曹捷认为,通过一次次迭代,让阿里网络的架构设计原则,变为越简单越好。简单才能稳定可靠,稳定可靠才可以活下来。
此外,曹捷认为,对于整个数据中心网络流量监控也至关重要,要做流量可视化。流量可视化解决三个问题:第一个问题解决看不见问题,比如延时、转发路径等;第二个问题解决找不到问题,通过随包的检测和拓扑的维护,快速定位问题所在的位置;第三个是摸不准问题,通过可视化看网络真实的转发数据,把数据整合起来做分析,会找到整个网络设计架构的盲点,解决收敛比、规模等设计难点。
曹捷表示,可视化将会在未来3-5年之内是阿里全力投入的数据中心网络技术,其会帮助阿里在没有办法实现完全自研支持最大可能的掌握数据交配。