新聞資訊

品牌中心

電商展示

數(shù)字時(shí)尚

互動(dòng)交流

消費(fèi)電子實(shí)驗(yàn)室 - 大中華區(qū)最具商業(yè)價(jià)值的消費(fèi)電子專業(yè)網(wǎng)站 - The most valuable and professional Consumer electronics business website in Greater China › 消電電子實(shí)驗(yàn)室 ›新聞中心› 行業(yè)動(dòng)態(tài) › 查看內(nèi)容

全球首臺(tái)200億億次超算安裝完成：21248個(gè)CPU和63744個(gè)GPU！

2023-6-25 17:40| 發(fā)布者: cncelab| 查看: 1837| 評論: 0

摘要: 該系統(tǒng)配備了所有 10624 個(gè)刀片服務(wù)器，每個(gè)刀片由兩個(gè)英特爾Xeon Max 系列 CPU（至強(qiáng)Max 9480）和六個(gè)英特爾 Max 系列 GPU 組成，使得Aurora 超級計(jì)算機(jī)總共擁有 63744 個(gè)英特爾數(shù)據(jù)中心 Max 系列 GPU 和21248 個(gè)英 ...

【消費(fèi)電子實(shí)驗(yàn)室-2023/6/25】當(dāng)?shù)貢r(shí)間6月22日，英特爾（Intel）官方宣布，美國能源部阿拉貢國家實(shí)驗(yàn)室已經(jīng)完成基于英特爾CPU及GPU的新一代超算“Aurora”的安裝工作，今年晚些時(shí)候上線后將提供超過2 exaflops（2百億億次計(jì)算每秒）的FP64浮點(diǎn)性能，將超越隸屬于美國能源部橡樹嶺國家實(shí)驗(yàn)室的“Frontier”，有望成為全球第一臺(tái)理論峰值性能超過2 exaflops的超級計(jì)算機(jī)。

據(jù)介紹，Aurora 超級計(jì)算機(jī)由英特爾、惠普企業(yè) （HPE）和美國能源部（DOE）合作，旨在大規(guī)模釋放高性能計(jì)算（HPC）三大支柱的潛力：模擬、數(shù)據(jù)分析和人工智能（AI）。該系統(tǒng)配備了所有 10624 個(gè)刀片服務(wù)器，每個(gè)刀片由兩個(gè)英特爾Xeon Max 系列 CPU（至強(qiáng)Max 9480）和六個(gè)英特爾 Max 系列 GPU 組成，使得Aurora 超級計(jì)算機(jī)總共擁有 63744 個(gè)英特爾數(shù)據(jù)中心 Max 系列 GPU 和21248 個(gè)英特爾Xeon Max 系列CPU。

在性能方面，英特爾稱，Xeon Max配備的高帶寬內(nèi)存足以滿足最常見的HPC工作負(fù)載，與舊的英特爾至強(qiáng) 8380 系列處理器或 AMD EPYC 7773X 相比，可在某些工作負(fù)載中提供接近 5 倍的性能。

英特爾Xeon Max CPU中還包含 20 個(gè)加速引擎，主要是用于 AVX-512、AMX、DSA 和英特爾 DL Boost 工作負(fù)載。據(jù)稱，英特爾在 MLPerf DeepCAM 訓(xùn)練中的性能比 AMD 7763 提升了 3.6 倍，比 NVIDIA 的 A100 提升了 1.2 倍。

至于英特爾MAX GPU實(shí)際上就是之前的Ponte Vecchio芯片，使用了英特爾有史以來最先進(jìn)的封裝技術(shù)，擁有超過1000億個(gè)晶體管。其總共有63個(gè)模塊，包括了16個(gè)Xe-HPG架構(gòu)的計(jì)算芯片、8個(gè)Rambo cache芯片、2個(gè)Xe基礎(chǔ)芯片、11個(gè)EMIB連接芯片、2個(gè)Xe Link I/O芯片和8個(gè)HBM芯片、以及16個(gè)負(fù)責(zé)TDP輸出的模塊，通過EMIB與Foveros 3D封裝中整合在一起。其中最強(qiáng)的MAX 1550配備了英特爾性能最高的OAM模塊，擁有128個(gè)Xe核心和128GB的HBM2e內(nèi)存，TDP為600W。

此外，Aurora 系統(tǒng)還配備了10.9PB的傲騰持久內(nèi)存。同時(shí)正如前面所介紹的，每個(gè)Xeon Max CPU內(nèi)還封裝了64 GB 的 HBM2e 內(nèi)存，這也意味著21248 個(gè)英特爾Xeon Max 系列CPU內(nèi)的 HBM2e高帶寬內(nèi)存容量達(dá)到了1.36PB；每個(gè) Max GPU內(nèi)最高還封裝了128 GB 的 HBM2e 內(nèi)存， 63744個(gè)Max GPU內(nèi)的HBM2e內(nèi)存容量達(dá)到了8.16PB。三者合計(jì)達(dá)20.42PB內(nèi)存。存儲(chǔ)方面，Aurora 集成了超過 1024 個(gè)存儲(chǔ)節(jié)點(diǎn)（使用 DAOS，英特爾的分布式異步對象存儲(chǔ)技術(shù)），并利用HPE Slingshot高性能結(jié)構(gòu)，以每秒31TB的總帶寬提供220PB的總的存儲(chǔ)容量。

以上所有的CPU、GPU、內(nèi)存及存儲(chǔ)等組件都將通過英特爾的oneAPI軟件互相鏈接。借助 oneAPI，開發(fā)者對整個(gè)系統(tǒng)中的節(jié)點(diǎn)進(jìn)行編程，無需更改代碼，應(yīng)用程序可以有效在 CPU 和 GPU 上運(yùn)行，為開發(fā)人員提供無縫系統(tǒng)集成。

英特爾表示，Aurora將充分利用英特爾Max系列GPU和CPU產(chǎn)品系列的強(qiáng)大功能。Max系列GPU的早期結(jié)果旨在滿足動(dòng)態(tài)和新興HPC和AI工作負(fù)載的需求，在現(xiàn)實(shí)世界的科學(xué)和工程工作負(fù)載上顯示出領(lǐng)先的性能，在OpenMC上顯示出高達(dá)AMD MI250X GPU性能的2倍，以及接近線性擴(kuò)展到數(shù)百個(gè)節(jié)點(diǎn)。在許多現(xiàn)實(shí)世界的HPC工作負(fù)載（如地球系統(tǒng)建模、能源和制造）中，Intel Xeon Max系列CPU比競爭對手具有40%的性能優(yōu)勢。

目前世界第一的超級計(jì)算機(jī)是隸屬于美國能源部橡樹嶺國家實(shí)驗(yàn)室的“Frontier”，最大性能每秒1.19百億億次浮點(diǎn)計(jì)算，峰值性能可達(dá)1.68百億億次，其采用的是正是AMD EPYC 7A53 64核心處理器，以及Instinct MI250X GPU加速器。隨著“Aurora”的安裝工作完成，今年晚些時(shí)候上線后將可提供超過2 exaflops的性能，成為全球最強(qiáng)的超級計(jì)算機(jī)。

為了更好的發(fā)揮Aurora的性能，近期，英特爾還公布了一個(gè)主要面向于科學(xué)領(lǐng)域的生成式 AI 模型——Aurora genAI。

據(jù)介紹，Aurora genAI 模型以 Megatron 和 DeepSpeed 為基礎(chǔ)，其規(guī)模達(dá)到了 1 萬億個(gè)參數(shù)，相比之下基于GPT-3的ChatGPT 的規(guī)模僅為 1750 億參數(shù)，Aurora genAI 在參數(shù)規(guī)模上提升到了5.7倍。該模型將在通用文本、科學(xué)文本、科學(xué)數(shù)據(jù)和與該領(lǐng)域相關(guān)的代碼上進(jìn)行訓(xùn)練�？梢酝苿�(dòng)清潔能源聚變、催化劑、癌癥、航空航天、神經(jīng)科學(xué)研究、宇宙學(xué)等方面的研究。

英特爾公司副總裁兼超級計(jì)算集團(tuán)總經(jīng)理Jeff McVeigh表示：“Aurora是英特爾Max系列GPU的首次部署，這是世界上最大的基于Xeon Max CPU的系統(tǒng)，也是世界上最大的GPU集群。我們很自豪能成為這個(gè)系統(tǒng)的一部分，并為Aurora將實(shí)現(xiàn)的突破性AI，科學(xué)和工程感到興奮�！�

阿貢國家實(shí)驗(yàn)室副實(shí)驗(yàn)室主任Rick Stevens表示：“在我們努力進(jìn)行驗(yàn)收測試的同時(shí)，我們將使用Aurora來訓(xùn)練一些大規(guī)模的開源生成AI模型，Aurora 擁有超過 60000 個(gè) Intel Max GPU、非常快速的 I/O 系統(tǒng)和全固態(tài)大容量存儲(chǔ)系統(tǒng)，是訓(xùn)練這些模型的完美環(huán)境�！�