【消費電子實驗室-2019/6/24】最近這幾天,有許多美國媒體幸災樂禍,認為中國超算行業將受到致命打擊,離開了美國的CPU,中國將造不出超算。事實是這樣的嗎?這個禁令對我國的超算行業有什么影響? 據多家媒體報道,在當地時間6月21日,美國商務部以國家安全為由,再次將中國的5家實體列入進出口管制的實體清單,禁止它們從美國的供應商采購零部件,相關決定于6月24日生效。這五家實體與中國超算行業的“三巨頭”中的兩位相關,涉及到“曙光”和“神威”兩款超算。這五家實體中的江南計算技術研究所就是“神威”超算的研發制造單位。而其他四家實體,中科曙光,天津海光(Higon)、成都海光集成電路、成都海光微電子技術全都與“曙光”系列超算有關。 最近這幾天,有許多美國媒體幸災樂禍,認為中國超算行業將受到致命打擊,離開了美國的CPU,中國將造不出超算。事實是這樣的嗎?這個禁令對我國的超算行業有什么影響?本文將對這個問題進行詳細分析。 首先,美國為什么要再次對我國超算企業進行制裁? 實際上,早在2015年初,美國商務部就將中國的四大超算中心列入了禁運清單。這源于美國長久以來的焦慮:在大約40年中,中國的超算行業從完全進口美國產品,到購買美國的CPU自己制造超算,再到使用自己的CPU和加速器制造超算; 從只有幾臺超算,在全世界超算市場里不值一提,到擁有超算的數量全球第一,大大超越美國;從擁有的超算性能低下排不上號,到稱霸全球最快超算排行榜第一名多年;中國超算行業走出了一條完美的逆襲之路。 世界超算組織top500.org每半年推出一次全球最快的500臺超算排行榜。今年6月剛剛推出了最新的榜單。全球最快的500臺超算數量按國家的分布圖如下: ▲數據來源于top500.rog,由筆者整理 ▲數據來源于top500.rog,由筆者整理 TOP500榜單中,中國超算的數量達到了219臺,占全球的44%,世界第一;美國以116臺的數量占全球的23%,比中國落后甚多。 要知道,在僅僅一年前的2018年6月,中國在TOP500中的超算總數還是206臺,美國還是124臺。這一年中,中國又有了進步,美國又在退步。從趨勢來看,中國的優勢會越來越大。 由于超算在軍事,科研和經濟中的巨大作用,美國心里的焦慮是可以理解的。他們急于抑制住中國的發展勢頭,于是就把商業誠信和公平貿易原則仍進下水道,祭出了禁運大法。那么,這次的禁運措施對中國超算行業有什么影響? 對中國正在研制中的三臺E級超算影響不大 在2018年夏天,美國的超算SUMMIT終于排上了TOP500的第一名,把霸榜多年的中國“太湖之光”擠到了第二名,它比“太湖之光”快60%左右;接著,美國的另一臺超算Sierra投入使用,它以微弱的優勢把“太湖之光”擠到了第三位。 美國的媒體興奮起來,一改多年的沉默,開始吹噓下一代E級超算的威力。所謂E級超算,是指每秒鐘運算一百億億次的超級計算機,比SUMMIT還好快許多倍。美國的E級超算計劃在2021年左右投入使用,而中國為E級超算準備了三個方案,全部使用國產CPU和加速器,也計劃在2020到2021年期間陸續投入使用。 這里需要介紹一下加速器,超算的核心部件不止是CPU,由于超算做的是密集的科學計算工作,CPU執行這樣的計算任務并不是效率最高的,擁有眾多運算單元的加速器處理器的效率更高,比較典型的加速器芯片就是Nvidia公司的通用型GPU,以及英特爾公司的至強Xeon Phi處理器。 最近幾年出現的超算有一個趨勢,就是使用一顆CPU帶多顆加速器的架構,計算任務主要由加速器芯片完成,CPU主要做協調,通訊和分配任務的工作。 那么,美國的這次禁運對我們的E級超算有什么影響呢?讓我們來仔細看看。 我國為下一代E級超算準備的三套方案,全都使用國產CPU和加速器芯片: 天河三號E級超算: 2018年5月19日,國家超算天津中心展示了天河三號原型機,在2018年底投入使用。天河三號的全配置主機計劃在2020年投入使用,性能計劃為1EFlops。 天河三號將使用國產飛騰FT2000plus或者后續型號的CPU,以及國防科技大學的Matrix2000plus或者后續型號的加速器芯片。 飛騰CPU采用ARM架構。 Matrix2000加速芯片是國防科大的通用DSP芯片,GPDSP,就像英偉達公司通用GPU(GPGPU)那樣,DSP(數字信號處理器)也擁有大量的運算單元。 神威E級超算: 神威系列超算是由江南計算機研究所研制的。2018年7月神威E級原型機落戶于國家超算濟南中心,需要三年左右的研發時間,將在2021年正式投入使用。神威的CPU肯定是申威系列的最新型號,加速器可能也會采用Matrix2000plus或者其后續型號。 申威系列CPU脫胎于DEC Alpha處理器架構。 曙光E級超算: 中科曙光主要使用X86架構的CPU。在最新的TOP500榜單里,共有曙光公司制造的63臺超算。除了一臺以外,其它62臺全部使用英特爾的至強CPU,有些超算還使用了英偉達的Tesla加速器芯片。 猛的一看,似乎這次禁運對曙光公司是致命的打擊。因為英特爾和英偉達的芯片以后都買不到了。但是,曙光公司早就有了全國產化布局。秘密就在這62臺之外的那一臺超算上。 CPU: 這臺型號為TC8600的超算是2018年投入使用的,它的CPU采用的是天津海光公司的Hygon Dhyana處理器,32核,2Ghz頻率。天津海光公司在2016年初得到了美國AMD公司的第一代ZEN架構的永久授權,起點相當高,要知道AMD公司在2018年才推出第二代ZEN2的架構。海光3000系列CPU使用的是x86通用架構,完全支持Windows10 Pro, Windows Server2019, Linux Centos 7.x等主流操作系統,而且還有類似AMD EPYC的服務器版,最多32核64線程,基礎頻率2.0GHz,加速頻率可達3.0GHz,而且涵蓋了從4核到32核在內的多個產品線。 在這次禁運公布后,海光公司無法再得到AMD新的產品架構授權,但這并不影響已經得到的授權。海光公司已經組建了超過500人的研發團隊,有能力在已經得到的授權的基礎上,進一步開發新的產品,提升CPU的性能。這也意味著未來X86架構的CPU在中國可能會產生硬分叉,我們將從此與美國分道揚鑣,走出自己的路來。 加速器芯片: 而這臺曙光超算的加速器芯片更有意思:它的名稱為Deep Computing Processor。根據公開的新聞報道,曙光的加速器芯片是基于我國寒武紀公司的AI處理器架構研制的,全球獨一無二。曙光公司的通稿上說:“2017年11月,曙光基于寒武紀低功耗深度學習處理器,率先推出PHANERON,引起業界廣泛關注。時隔6個月,寒武紀發布性能更為強勁的MLU100,曙光同步升級PHANERON產品,并發布一系列搭載寒武紀MLU100的服務器產品,保持著在智能服務器領域的持續領先” 這意味著曙光TC8600超算應用于AI領域將擁有極大的優勢。 未來曙光公司的E級超算,應該就是基于海光公司的最新CPU和曙光自己設計的PHANERON AI加速芯片的最新版本。 由此也可以看出美國商務部的這次禁運,也根本影響不了曙光公司的E級超算產品。 禁運可能對曙光公司的商用超算產品線的影響巨大 我們還需要看到,由于曙光公司的主要產品線都是基于英特爾的CPU和英偉達的加速器芯片,在這次禁運之后,這些產品線都難以為繼了。從商業層面來說,對曙光公司的影響巨大。但是好在曙光有了全國產的CPU和加速器芯片替代產品。我們可以從排名第43的曙光TC8600和排名第88位的曙光TC4600LP/W740l這兩臺超算的測試數據看出一些細節來: 表格來源于top500.org,筆者進行整理分析 曙光TC4600LP超算是基于英特爾至強CPU和英偉達Tesla加速器的產品。從以上測試數據來看,使用國產CPU和加速器的TC8600超算,在使用了3倍多的CPU核心數量以及5倍左右的加速器核心數量的情況下,跑分只不過增加到了1.4倍到1.7倍。但是功耗下降了很多,功耗效率提升了3倍多。 筆者分析這主要是因為TC8600采用的AI加速器并不適合傳統的浮點運算,它只是在AI運算上具有巨大優勢。 這也意味著,曙光公司缺乏合適的加速器芯片,來提升系統的浮點運算能力。這可能會對曙光公司的商業發展產生不利影響。 也許曙光公司的未來銷售重點將轉向AI運算。但是,也不排除未來曙光公司開發基于國產Matrix2000加速芯片的產品。 在這里必須介紹一下,為何曙光公司不能放棄X86架構的CPU。 全球TOP500強的超算100%都使用Linux操作系統的不同發行版。這些版本都為各自的CPU和加速器芯片做了優化。而在超算上跑的應用軟件也會受到CPU架構的影響。 從目前來看,對X86架構優化的Linux系統最成熟,應用軟件最多,程序開發最容易,整個軟件生態系統最成熟,穩定。而國產申威和飛騰CPU的系統則有些不足,軟件工具為它們優化得少,編程也有些麻煩,系統bug也較多,整個軟件生態系統只是解決了可用,離X86系統那樣的好用仍然有一定距離。 所以,無論從國家的戰略方面,還是從曙光公司的商業前景而言,X86架構都是應該堅持做下去的。 中國半導體制造技術的進步將極大地推進國產超算CPU和加速器芯片的性能 中國的半導體制造業長期以來是我們最大的短板。在臺積電和三星電子已經量產7納米工藝,英特爾已經小規模量產10納米工藝的時候,我國目前最先進的半導體制造工藝還是中芯國際的28納米工藝。 而在上面提到的國產CPU,要么使用國產較落后的工藝,自主性能夠保證,但性能落后;要么在海外找半導體代工企業生產,性能可以提升,但自主性無法得到保證,說不定什么時候就會被掐脖子。 但這個狀態很快就要結束了。中芯國際在2018年8月的第二季度業界報告中宣布,其14納米生產工藝取得了重大進展,第一代FinFET技術研發已經進入了客戶導入階段。而正式量產則計劃在2019年中期。所以,很快,我們就會擁有自己的14納米半導體生產工藝了。 14納米有多厲害?要知道,現在英特爾所有的臺式機和服務器芯片都是14納米的。英特爾在剛剛過去的臺北電腦展上宣布會小規模量產10納米工藝的低電壓筆記本電腦處理器,并且預計未來幾年14納米仍然是它的主力工藝。只有AMD在臺積電的代工下,剛剛宣布實現了CPU的7納米工藝生產。 如果國產超算CPU和加速器芯片都使用中芯國際的14納米工藝生產,它們的性能將會得到一個飛躍。 美國終將搬起石頭砸自己的腳 實際上,美國在2015年對中國的四大超算中心的禁運,已經砸了它自己的腳:英特爾的至強Phi加速器芯片停產。 ▲圖為美國《個人計算機》雜志當年對美國封殺中國四大超算中心,禁止因特爾提供至強Phi加速器芯片給它們的報道 筆者在這里列一些事實: 中國的天河2號超算分別使用了3.2萬顆Xeon E5 CPU和4.8萬顆Xeon Phi加速器。 對于Xeon Phi的銷量,Intel CEO曾表示過2016年的目標是10萬顆出貨量。 可見,單單我國的天河2號就能達到Intel 2016年約一半的Xeon Phi銷量。 2015年4月9日,美國商務部宣布對中國的四家超算中心禁運英特爾的至強Xeon處理器和至強Phi加速器芯片。 2016年6月18日,至強Phi 7290/7250加速器價格直接腰斬。到2017年8月24日,英特爾宣布至強 Phi 7200系列協處理器加速卡進入停產退市進程。 ▲圖為美國《個人計算機》雜志在當年的報道中也提到美國禁令將給因特爾帶來沉重打擊 筆者毫不懷疑英特爾至強Phi加速器芯片的停產就是因為對中國的禁運。這甚至影響到了美國下一代E級超算的開發。美國的E級超算,CPU可選擇英特爾和AMD的X86處理器以及IBM的Power處理器,而加速器芯片目前只有一個選擇,就是英偉達的通用GPU。 那么美國商務部的這次禁運會有什么結果呢?筆者相信,在我們自力更生的努力之下,幾年之后,世界上會出現幾個新的超算CPU生態圈,徹底打破美國的壟斷。 實際上,美國《紐約時報》和《華爾街日報》也都不認為美國政府的這一打擊中國超算的舉動會阻礙中國的發展。這兩家媒體采訪幾位不同的美國超算專家就表示,美國政府的行為雖然短期內或給中國的超算發展帶來阻礙,卻也會更加堅定中國開發本土技術替換美國科技的決心。 而一件必然會要發生的事,就是在2020年和2021年,中國有三臺E級超算將會沖擊TOP500排行榜的冠軍位置,把美國超算踢下去。讓美國看看,誰才是超算領域的王者!(標題為消費電子實驗室修改,原標題為:《美國的最新禁運,會讓中國下代超算遭致命打擊?告訴你實情!》) |
網站介紹 廣告業務 歡迎投稿 招聘信息 聯系我們 友情鏈接 法律顧問 網站地圖
CopyRight 2012消費電子實驗室 版權所有 京ICP備12048044號-4號
電話:13701384402 郵編:100040 郵箱:BICQ6688@QQ.COM