【消費(fèi)電子實(shí)驗(yàn)室-2023/6/25】當(dāng)?shù)貢r(shí)間6月22日,英特爾(Intel)官方宣布,美國能源部阿拉貢國家實(shí)驗(yàn)室已經(jīng)完成基于英特爾CPU及GPU的新一代超算“Aurora”的安裝工作,今年晚些時(shí)候上線后將提供超過2 exaflops(2百億億次計(jì)算每秒)的FP64浮點(diǎn)性能,將超越隸屬于美國能源部橡樹嶺國家實(shí)驗(yàn)室的“Frontier”,有望成為全球第一臺(tái)理論峰值性能超過2 exaflops的超級計(jì)算機(jī)。 據(jù)介紹,Aurora 超級計(jì)算機(jī)由英特爾、惠普企業(yè) (HPE) 和美國能源部 (DOE) 合作,旨在大規(guī)模釋放高性能計(jì)算 (HPC) 三大支柱的潛力:模擬、數(shù)據(jù)分析和人工智能 (AI)。該系統(tǒng)配備了所有 10624 個(gè)刀片服務(wù)器,每個(gè)刀片由兩個(gè)英特爾Xeon Max 系列 CPU(至強(qiáng)Max 9480) 和六個(gè)英特爾 Max 系列 GPU 組成,使得Aurora 超級計(jì)算機(jī)總共擁有 63744 個(gè)英特爾數(shù)據(jù)中心 Max 系列 GPU 和21248 個(gè)英特爾Xeon Max 系列CPU。 在性能方面,英特爾稱,Xeon Max配備的高帶寬內(nèi)存足以滿足最常見的HPC工作負(fù)載,與舊的英特爾至強(qiáng) 8380 系列處理器或 AMD EPYC 7773X 相比,可在某些工作負(fù)載中提供接近 5 倍的性能。 英特爾Xeon Max CPU中還包含 20 個(gè)加速引擎,主要是用于 AVX-512、AMX、DSA 和英特爾 DL Boost 工作負(fù)載。據(jù)稱,英特爾在 MLPerf DeepCAM 訓(xùn)練中的性能比 AMD 7763 提升了 3.6 倍,比 NVIDIA 的 A100 提升了 1.2 倍。 至于英特爾MAX GPU實(shí)際上就是之前的Ponte Vecchio芯片,使用了英特爾有史以來最先進(jìn)的封裝技術(shù),擁有超過1000億個(gè)晶體管。其總共有63個(gè)模塊,包括了16個(gè)Xe-HPG架構(gòu)的計(jì)算芯片、8個(gè)Rambo cache芯片、2個(gè)Xe基礎(chǔ)芯片、11個(gè)EMIB連接芯片、2個(gè)Xe Link I/O芯片和8個(gè)HBM芯片、以及16個(gè)負(fù)責(zé)TDP輸出的模塊,通過EMIB與Foveros 3D封裝中整合在一起。其中最強(qiáng)的MAX 1550配備了英特爾性能最高的OAM模塊,擁有128個(gè)Xe核心和128GB的HBM2e內(nèi)存,TDP為600W。 此外,Aurora 系統(tǒng)還配備了10.9PB的傲騰持久內(nèi)存。同時(shí)正如前面所介紹的,每個(gè)Xeon Max CPU內(nèi)還封裝了64 GB 的 HBM2e 內(nèi)存,這也意味著21248 個(gè)英特爾Xeon Max 系列CPU內(nèi)的 HBM2e高帶寬內(nèi)存容量達(dá)到了1.36PB;每個(gè) Max GPU內(nèi)最高還封裝了128 GB 的 HBM2e 內(nèi)存, 63744個(gè)Max GPU內(nèi)的HBM2e內(nèi)存容量達(dá)到了8.16PB。三者合計(jì)達(dá)20.42PB內(nèi)存。存儲(chǔ)方面,Aurora 集成了超過 1024 個(gè)存儲(chǔ)節(jié)點(diǎn)(使用 DAOS,英特爾的分布式異步對象存儲(chǔ)技術(shù)),并利用HPE Slingshot高性能結(jié)構(gòu),以每秒31TB的總帶寬提供220PB的總的存儲(chǔ)容量。 以上所有的CPU、GPU、內(nèi)存及存儲(chǔ)等組件都將通過英特爾的oneAPI軟件互相鏈接。借助 oneAPI,開發(fā)者對整個(gè)系統(tǒng)中的節(jié)點(diǎn)進(jìn)行編程,無需更改代碼,應(yīng)用程序可以有效在 CPU 和 GPU 上運(yùn)行,為開發(fā)人員提供無縫系統(tǒng)集成。 英特爾表示,Aurora將充分利用英特爾Max系列GPU和CPU產(chǎn)品系列的強(qiáng)大功能。Max系列GPU的早期結(jié)果旨在滿足動(dòng)態(tài)和新興HPC和AI工作負(fù)載的需求,在現(xiàn)實(shí)世界的科學(xué)和工程工作負(fù)載上顯示出領(lǐng)先的性能,在OpenMC上顯示出高達(dá)AMD MI250X GPU性能的2倍,以及接近線性擴(kuò)展到數(shù)百個(gè)節(jié)點(diǎn)。在許多現(xiàn)實(shí)世界的HPC工作負(fù)載(如地球系統(tǒng)建模、能源和制造)中,Intel Xeon Max系列CPU比競爭對手具有40%的性能優(yōu)勢。 目前世界第一的超級計(jì)算機(jī)是隸屬于美國能源部橡樹嶺國家實(shí)驗(yàn)室的“Frontier”,最大性能每秒1.19百億億次浮點(diǎn)計(jì)算,峰值性能可達(dá)1.68百億億次,其采用的是正是AMD EPYC 7A53 64核心處理器,以及Instinct MI250X GPU加速器。隨著“Aurora”的安裝工作完成,今年晚些時(shí)候上線后將可提供超過2 exaflops的性能,成為全球最強(qiáng)的超級計(jì)算機(jī)。 為了更好的發(fā)揮Aurora的性能,近期,英特爾還公布了一個(gè)主要面向于科學(xué)領(lǐng)域的生成式 AI 模型——Aurora genAI。 據(jù)介紹,Aurora genAI 模型以 Megatron 和 DeepSpeed 為基礎(chǔ),其規(guī)模達(dá)到了 1 萬億個(gè)參數(shù),相比之下基于GPT-3的ChatGPT 的規(guī)模僅為 1750 億參數(shù),Aurora genAI 在參數(shù)規(guī)模上提升到了5.7倍。該模型將在通用文本、科學(xué)文本、科學(xué)數(shù)據(jù)和與該領(lǐng)域相關(guān)的代碼上進(jìn)行訓(xùn)練?梢酝苿(dòng)清潔能源聚變、催化劑、癌癥、航空航天、神經(jīng)科學(xué)研究、宇宙學(xué)等方面的研究。 英特爾公司副總裁兼超級計(jì)算集團(tuán)總經(jīng)理Jeff McVeigh表示:“Aurora是英特爾Max系列GPU的首次部署,這是世界上最大的基于Xeon Max CPU的系統(tǒng),也是世界上最大的GPU集群。我們很自豪能成為這個(gè)系統(tǒng)的一部分,并為Aurora將實(shí)現(xiàn)的突破性AI,科學(xué)和工程感到興奮! 阿貢國家實(shí)驗(yàn)室副實(shí)驗(yàn)室主任Rick Stevens表示:“在我們努力進(jìn)行驗(yàn)收測試的同時(shí),我們將使用Aurora來訓(xùn)練一些大規(guī)模的開源生成AI模型,Aurora 擁有超過 60000 個(gè) Intel Max GPU、非常快速的 I/O 系統(tǒng)和全固態(tài)大容量存儲(chǔ)系統(tǒng),是訓(xùn)練這些模型的完美環(huán)境! |
合作伙伴
網(wǎng)站介紹 廣告業(yè)務(wù) 歡迎投稿 招聘信息 聯(lián)系我們 友情鏈接 法律顧問 網(wǎng)站地圖
CopyRight 2012消費(fèi)電子實(shí)驗(yàn)室 版權(quán)所有 京ICP備12048044號-4號
電話:13701384402 郵編:100040 郵箱:BICQ6688@QQ.COM