やまさきまちこ(やまさき満知子)网

Aurora有望成为天下第一超算: 搭载英特尔21248个CPU以及63744个GPU

来源: 时间:2024-11-16 23:52:21

阿贡国家试验室以及英特尔于克日宣告,有望Aurora超级合计机的天下特 10,624 个刀片的装置已经实现 ,该零星将于 2023 年晚些时候上线 。第超该机械运用数万个 Xeon Max“Sapphire Rapids”处置器 ,算搭装备 HBM2E 内存以及恒河沙数的载英数据中间 GPU Max“Ponte Vecchio”合计 GPU 可实现逾越 2 FP64 ExaFLOPS 的功能 。       这个由HPE 制作的有望 Aurora 超级合计机由 166 个机架组成,每一个机架有 64 个刀片,天下特总共 10,第超624 个刀片。每一个 Aurora 刀片均基于两个 Xeon Max CPU(具备 64 GB 封装 HBM2E 内存)以及六个 Intel Data Center Max“Ponte Vecchio”合计 GPU。算搭这些 CPU 以及 GPU 将经由定制的载英液体冷却零星妨碍冷却。

(图片源头:英特尔)(图片源头  :英特尔)

Aurora 超级合计机总共装备了 21,有望248 个通用 CPU,具备逾越 110 万个高功能中间、天下特19.9 PB 的第超 DDR5 内存 、衔接到 CPU 的算搭 1.36 PB HBM2E 内存以及 63,744 个专为大规模并行 AI 以及 HPC 使命负载而妄想的合计 GPU ,板载 8.16 PB HBM2E 内存。载英这些刀片运用专为超级合计机妄想的 HPE Slingshot 妄想妨碍互连。       英特尔公司副总裁兼超级合计事业部总司理 Jeff McVeigh 展现:“Aurora 是英特尔 Max 系列 GPU 的初次部署、最大的基于 Xeon Max CPU 的零星以及全天下最大的 GPU 集群 。” “咱们很孤高可能成为这个历史性零星的一部份 ,并对于 Aurora 将实现的突破性家养智能、迷信以及工程感应欢喜。”       Aurora超级合计机接管由1024个固态存储配置装备部署组成的存储节点阵列 ,提供220PB的容量以及31TB/s的总带宽 ,这将有助于处置波及海量数据集的使命负载 ,好比核聚变钻研、迷信工程、物理模拟、治疗钻研  、天气预告以及其余使命。 

(图片源头
:阿贡国家试验室)(图片源头 :阿贡国家试验室)

尽管 Aurora 刀片的装置已经实现 ,但超级合计机尚未经由验收测试。当它在往年晚些时候上线时,它有望抵达逾越 2 ExaFLOPS 的实际峰值功能,使其成为进入 Top500 列表时第一台抵达这一功能水平的超级合计机。       阿贡国家试验室副试验室主任 Rick Stevens 展现 :“在咱们自动妨碍验收测试的同时,咱们将运用 Aurora 来磨炼一些大规模的开源天生家养智能模子用于迷信。” “Aurora 具备逾越 60,000 个 Intel Max GPU  、颇为快的 I/O 零星以及全固态大容量存储零星 ,是磨炼这些模子的欠缺情景 。” 

(图片源头:阿贡国家试验室)(图片源头 :阿贡国家试验室)

尽管 Aurora 超级合计机尚未经由测试,ANL 尚未向 Top500.org 提交其功勤勉效,但英特尔借此机缘分享了其硬件相对于 AMD 以及 Nvidia 的相助处置妄想的功能优势。       据英特尔称 ,Max 系列 GPU 的开始测试表明,它们在“事实天下的迷信以及工程使命负载”方面展现卓越 ,在 OpenMC 上提供的功能是 AMD Instinct MI250X GPU 的两倍,而且简直可能欠缺地跨数百个节点妨碍扩展。此外,英特尔展现 ,其英特尔至强 Max 系列 CPU 在泛滥实际 HPC 运用中比相助对于手的功能优势逾越 40%,这些运用搜罗 HPCG、NEMO-GYRE、Anerlastic Wave Propagation 、BlackScholes 以及 OpenFOAM。