飞象网讯 (计育青/文)工业和信息化部近日印发见知,为夯实算力网络发展底座,加速创新时间和居品应用,决定精采开展算力强基揭榜行为(简称“揭榜行为”)。这次揭榜行为面向算力网络的臆测、存储、网络、应用、绿色、安全等六大重心标的建议了二十一项任务,基本上涵盖了算力全产业链的要害时间及发展标的黑丝 少妇,并对每一个神情皆作念了夺观念任务、方针阐明。
在网络门径,揭榜行为重心支执高性能数据处理器(DPU)、基于RoCE的智算网络、光交换智算网络时间询查与考证、面向散布式智算中心的网络要害时间询查与考证等。预期方针上揭榜行为条目到2026年,竣事支执智算集群的易操作、高可靠、可平滑过渡升级的光网络,支执东说念主工智能等要害业务承载;光交换招引单端口速度支执100GE/400GE/800GE,交换容量弹性可扩展等。同期,潦倒智算中心间超大容量、超高可靠网络传输要害时间,研制面向智算中心间网络的传输招引,撑执散布式智算中心间业务的高可靠传输。
算力开发高潮涌动,网络需为止超前
比年来全国东说念主工智能时间发展迅猛,列国皆十分深爱基础大模子、AI应用的开发与开发,视之为决定产业经济升级、国度竞争力普及的要害要素。中国也十分深爱AI时间过头应用的发展,先后发布了一系列计谋给以鼓动和饱读舞,使得国内大模子时间和应用长久位居全国源流地位。从千亿、万亿参数基础大模子的开发,到面向具体行业、本色场景的AI应用孵化,皆产生了刚劲的智能算力需求,极大鼓动了国内智算基础措施的开发。据统计,现时国内已投用了近百个智算中心,可用算力已接近万PFlops。
而DeepSeek突飞大进的发展,使其成为全国表象级大模子,从科技、医药、传媒到政务、金融、汽车等,DeepSeek的“圈子”仍在执续推广中。微信等头部APP接入DeepSeek后不错看到,国民级应用模子使用执续放大算力需求,进而带来推理等算力需求的广大增长,智算行业迎来紧要发展机遇。
国内通讯运营商也在足下加大对智算基础措施的干预。比如中国电信正在打造多线索智算形式,在京津冀、长三角地区开发了两个万卡智算集群,同期还在西部地区打造大畛域绿色智算池;中国移动的手脚也很快,已建成8.2EFLOPS通用算力、19.6EFLOPS智算本事,散布在京津冀、长三角、粤港澳大湾区、成渝等区域的首批13个智算中心节点仍是投用;中国联通盘算推算的算力中心体系袒护了国度8大关节节点和31个省市,数据中神思架的总体畛域将源流40万架,改日将建成主干云池城市230多个、MEC节点源流600个。
跟着智算基础措施的畛域开发和大畛域应用,传统的网络架构和招引渐渐难以欢乐条目,包括端口密度、功耗、天真扩展本事、故障冗余本事,以及带宽、时延、可靠性等等,皆挫折需要针对智算集群进行深度创新,这亦然这次揭榜行为中任务十、任务十一的主要方针。针对这些问题,通讯行业仍是有充分的时间和居品储备,何况在部分场景下进行了扩充考证。
全光交换OXC时间破解智算集群平滑演进贫窭
现时智算集群网络主要摄取纯电层交换机组网模式,算卡与算卡之间通过交换机来集合。一般数据中心摄取这种组网模式不会遭受什么问题,关联词智算教师不同样,跟着大模子足下纠正和更新,对算卡的需求会从几千、几万个飞快走向数十万、上百万个,每次智算畛域增多皆需要对数据中心网络进行重构,资本高且周期长。
另一方面,集群畛域的足下增多会引入更多的框式交换机,这些交换契机进一步加剧智算中心的能耗包袱。跟着算卡的增多,集划算卡所需的光模块也会更多,这些光模块一朝发生故障就会影响到总计这个词数据中心的数据处理和传输本事,进而平直影响到AI大模子教师的连气儿性和准确性。
终末,算卡也会更新换代,每次升级皆会大幅普及其数据狡赖本事,这意味着数据中心里面的交换机也必须随之升级,随之而来的是复杂的布线变更、网络树立诊疗,对数据中心的盘算推算和运维而言是一个刚劲的挑战。
全国智算产业一直在寻求更好的网络科罚决策,现在来看,全光交叉OXC被以为极具后劲的替代决策。OXC是一种十分天果真全光交换调理款式,摄取集成式互连构建全光交换资源池,具有集成度高、无跳纤全光交换等特质,不仅易扩展、可靠性高、能耗低,平方运维也十分方便。
现在全国主要通讯厂商仍是推出了面向数据中心的商用OXC招引(DC-OXC),何况在一些先进智算企业中干预了应用。比如打造了Gemini多模态大模子的谷歌,仍是在自有的数据中心中摄取了上万套OXC招引。英伟达首席科学家Bill Dally也屡次向业界建议在智算中心开发中摄取OXC时间,以为这项时间不错灵验普及网络的可料感性和天真性。在2024年9月举行的深圳海外光电展览会时候,多个大模子厂商默示准备引入OXC时间。
行业询查机构LightCounting以为,在智算产业的拉手脚用下,改日5年OXC招引市蚁集以28%的增速快速推广。而2024年9月洞开数据中心委员会(ODCC)发布《AI网络光交换机时间叙述》,对光交换机在 AI 教师等大畛域臆测中的应用进行了夺目洽商,通过对胖树网络架构和 OXC天真组网的Ring All-Reduce 性能的对比测试, 遣散标明在通讯数据量大于4MB后,应用OXC组网会有显著收益,普及了20-34%傍边的性能,All to All 性能普及30%傍边。
面向DC互联的全光传送网(DC-OTN)放荡打造散布式智算中心
为充分期骗不同地域的资源上风,兼顾就近工作客户,许多企业会在不同区域分别树立智算中心。关联词当客户需要调用卓著单个智算中心的算力时,何如竣事海量数据在多个智算中心之间的及时传送和调理就成了一个贫窭。对此国内电信运营商作念过广大探索,面向数据中心间互联的全光传送网(DC-OTN)被以为是现时理念念的科罚决策。
中国电信在2024年曾作念过基于现网的业内首例500公里的长距离DC-OTN时间考证,期骗江西永丰、北京大兴、天津武清三地数据中心的千卡智算集群,完成了1024卡千亿参数大模子的散布式合股教师,告捷将练性能普及至单数据中心着力的97%以上。这次检修标明,期骗高速全光传送网打造广域智算网络,十足不错将不同区域的智算资源聚集成一个智算集群,竣事跨地域、跨层级、跨主体的高效算力协同调理。
中国移动在2024年末也完成了百公里级DC-OTN现网检修,摄取800G OTN集合位于不同城市的两个智算集群,共同承担百亿级参数畛域的大型基础言语模子,性能达到单节点教师效率的98%以上。
中国联通在2024年也发布了《基于RDMA的长距无损数据搬少顷间白皮书》,建议的数据搬移科罚决策,通过DC间全光直达的组网架构、长距RDMA提速、端网协同和妥洽编排等时间,科罚海量数据长距传输时易拥塞、效率低的问题,为算力期间下海量数据高速转移提供了时间撑执。
单体为繁星点点,为一般用户提供就近工作;集结成群体,可为超大畛域臆测需求提供满盈的智算资源。上述检修诠释了DC-OTN的可行性和灵验性,也为散布式智算集群的演进指明了前进标的,作念好了时间决策储备。
反差 为不知如今东说念主工智能正在向五行八作快速渗入黑丝 少妇,这是一场势不行挡的产业翻新,因此市集对智算基础措施的需求只会越来越多。数据中心全光交换时间(DC-OXC)和面向DC互联的全光传送网(DC-OTN)时间不错大幅度普及智算集群部署的天真性,改善智算中心的性能、可扩展性、可靠性、能耗阐述等,有望成为智算产业的主流网络科罚决策,助力算力强基行为获得丰硕恶果,鼓动算力网络“点、链、网、面”体系化发展。