新闻动态

光合组织大会聚焦算力创新。曙光scaleX万卡超级

作者:365bet体育投注 时间:2025/12/20 点击:

荆楚网讯(记者 谢宇航)在光合组织2025人工智能创新大会上,曙光发布了scaleX 10,000-ka超级集群,并使用真机进行了演示。精准针对当前传统算力集群的三大“卡脖子”痛点,通过架构和技术创新提供针对性的解决方案,为人工智能在行业的大规模应用扫清障碍。 目前,传统算力集群的“卡脖子”问题已成为产业智能化升级的障碍。具体表现在三个方面。首先,规模越大,效率越低。性能瓶颈。随着大型模型训练规模的增大,传统的千卡、万卡集群通信延迟高、并行效率低,难以提高算力的有效利用。同时,网络与科技存储性能有限,导致节点间数据同步不及时,容易出现访问冲突。此外,异构节点性能差异明显,算力管理与协作难度不断加大。二是厂商壁垒高、选择空间少的生态困境。不同品牌的计算设备互不兼容,形成“算力孤岛”;软件堆栈也被构造成不同的系统。当业务迁移到不同集群时,需要重建平台并大幅改变应用程序。基础设施成本和管理负担急剧增加,计算资源难以灵活调度。三是稳定性差、运营支撑成本高的缺点。传统集群容错能力较差,单个节点故障很容易引发全局问题,导致训练失败ng 任务很容易被延迟。同时,单机柜功率持续增加,算力中心功耗居高不下,能耗优化难度加大。此外,进口高性能芯片渠道有限,替代产品适应周期长,增加了企业技术应用的风险和成本。 针对这些痛点,中科曙光的scaleX万卡超级集群通过多项创新,取得了精准化的成功。针对规模与效率的矛盾,搭载国内首款400G InfiniBand原生RDMA网卡和交换芯片,实现400Gb/s超高带宽和小于1微秒的端侧通信时延。采用正交架构设计,超级节点之间的通信性能达到业界领先水平,充分释放计算潜力万卡超级星团的力量。针对生态壁垒的困境,基于“AI计算开放架构”理念进行设计,可适配众多品牌AI加速卡及主流软件生态,打破算力孤岛。企业无需重复搭建平台,有效降低设施成本和应用限制。针对稳定性和成本的缺点,配备了智能容错机制。节点的单个故障不会影响全局,保证训练任务的持续运行。同时采用液冷等技术降低能耗,结合自主可控的硬件适配能力,不仅降低了总拥有成本,还避免了依赖进口芯片的风险。 曙光释放规模 随着人工智能从生产工具走向生产要素,中科曙光scaleX万卡超级集群的落地,将为科研、工业、金融等领域的智能化转型提供更加高效可靠的算力支撑。

17c黑料爆料视频在线看免费版在线看-吃瓜网-吃瓜爆料每日大赛

客服热线:400-123-4567

邮箱:[email protected]
地址:广东省广州市天河区88号

首页
电话
短信
联系