國產(chǎn)超算芯片揭秘:自主研發(fā) 不依賴Intel和NV
- 來源:中關(guān)村在線
- 作者:liyunfei
- 編輯:liyunfei
超算,超級(jí)計(jì)算機(jī),是所有計(jì)算機(jī)中運(yùn)算速度最快、性能最強(qiáng)的一類,在科研和軍事等尖端領(lǐng)域擁有舉足輕重的地位,是綜合國力的體現(xiàn),堪稱國之重器?;蛟S這些高尖端的龐然大物距離我們尋常百姓的生活很遙遠(yuǎn),所以我們甚至無法感知到它們的存在。但近期一些事件和一些消息則刺痛了很多國人的神經(jīng):美國最新發(fā)布“Summit”超級(jí)計(jì)算機(jī)在時(shí)隔五年之后,終于從中國的“神威·太湖之光”手中奪回“世界第一超算”寶座。
what?我們居然在這么高尖端的領(lǐng)先過美國長達(dá)五年之久?一些小伙伴看到這則消息時(shí)或許會(huì)有這樣的感嘆。沒錯(cuò),答案是肯定的。出于好奇,筆者順著這條新聞線索在這個(gè)陌生的領(lǐng)域找到了很多有趣的數(shù)據(jù)和有意思的故事,不敢獨(dú)享決定梳理出來分享給大家。
借著Summit這個(gè)狠角色,我們先來進(jìn)行一些科普小知識(shí),超算究竟擁有如何驚世駭俗的計(jì)算能力呢?
Summit超級(jí)計(jì)算機(jī)由IBM主導(dǎo)完成,整個(gè)超級(jí)系統(tǒng)由4608臺(tái)計(jì)算節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)包含2個(gè)22核IBM Power9處理器(負(fù)責(zé)協(xié)調(diào))和6個(gè)NVIDIA Tesla V100圖形處理單元加速器(負(fù)責(zé)計(jì)算),并可提供每秒高達(dá)20億億次的浮點(diǎn)運(yùn)算速度峰值!
那么,該如何理解這個(gè)每秒20億億次浮點(diǎn)運(yùn)算呢?如果以我們常見的筆記本電腦為參照物的話,Summit超級(jí)計(jì)算機(jī)的運(yùn)算能力相當(dāng)于100萬臺(tái)筆記本;假如一個(gè)人每秒可進(jìn)行1次運(yùn)算,他需要活到63億年以上才能與Summit的每一秒運(yùn)算量相當(dāng)。
算力驚人Summit自然也是個(gè)大家伙,4608個(gè)節(jié)點(diǎn)每個(gè)都有如冰箱大小,總重量高達(dá)340噸,它被放置在將近900平米的一個(gè)超大房間內(nèi),據(jù)稱連接這些節(jié)點(diǎn)的線纜就有接近300公里的長度。
由于算力驚人自然,發(fā)熱量自然巨大,因此全部采用水冷的散熱方式。Summit每運(yùn)行1分鐘,就需要1.5萬升冷卻液的流量,而它消耗的電量足以為超過8000個(gè)美國家庭提供照明。
既然我們知道了美國Summit超算的實(shí)力不俗,那么中國的超算水平又在什么段位?
全球超算排排坐 中國實(shí)力并不弱
對(duì)于全球超級(jí)計(jì)算機(jī)的排名情況,全球有一個(gè)比較公認(rèn)的“TOP500”榜單,這是由國外權(quán)威的超算專家聯(lián)合編制,在全球具有較高的公信力。
在2018年度“超算TOP500榜”中,美國IBM最新發(fā)布的Summit和Sierra已經(jīng)分列榜單的冠第1和第3名,而此前蟬聯(lián)多年榜首的中國的“神威·太湖之光”和“天河2號(hào)”已經(jīng)下降至第2和第4名的位置。
而如果你仔細(xì)查看這個(gè)榜單的話,你會(huì)發(fā)現(xiàn)他們的排名是按照Rmax(實(shí)測峰值)和Rpeak(理論峰值)來進(jìn)行排序。而對(duì)于任何一臺(tái)計(jì)算機(jī)而言,Rpeak理論性能更多的是一種參考,Rmax實(shí)測性能則顯得更為關(guān)鍵,即使是超級(jí)計(jì)算機(jī)也是如此。接下來我們將范圍縮小至TOP5,看看這些世界頂級(jí)的超級(jí)計(jì)算機(jī)究竟在實(shí)力上有多大差距。
全球頂級(jí)超算TOP5實(shí)力排名
此前榜單的頭把交椅由中國的神威·太湖之光把持?jǐn)?shù)年,美國在五年之后發(fā)布Summit,重新奪回第一個(gè)寶座。
從數(shù)據(jù)來看,Summit的實(shí)測峰值比神威·太湖之光高出了31%左右。由于我們采用實(shí)測峰值數(shù)據(jù)來進(jìn)行比較,再考慮到兩者創(chuàng)建時(shí)間的差別,因此兩者的實(shí)際差距其實(shí)并非像有些媒體宣稱的那樣近乎倍數(shù)的懸殊差距。
中國超算實(shí)力規(guī)模依然全球最強(qiáng)
接下來這組數(shù)據(jù)將會(huì)更加有趣,此前有媒體把TOP500榜單中的所有超級(jí)計(jì)算機(jī)進(jìn)行了國別的歸類,發(fā)現(xiàn)來自中國的超算上榜206臺(tái),比例高達(dá)41%。
來自美國的超算上榜124臺(tái),比例是25%,中美兩個(gè)超級(jí)大國統(tǒng)治了全球超過65%的超級(jí)計(jì)算機(jī),雖然個(gè)體被美國超越,但中國超算的規(guī)模仍為全球當(dāng)之無愧的第一。
那么問題來了,中國如何再次超越美國Summit重奪全球超算性能第一的寶座?有的小伙伴說堆更多的處理器就好了,然而真實(shí)情況卻并非這么簡單!
技術(shù)封鎖下崛起的中國“芯”勢力
構(gòu)建一整套全球頂級(jí)的超算系統(tǒng)并非是單純的堆砌處理器這么簡單,首先要有足夠強(qiáng)悍的計(jì)算個(gè)體芯片、先進(jìn)的運(yùn)算管理技術(shù)、操作系統(tǒng)的支持,以及足夠的財(cái)力支持才能夠造的出。當(dāng)然這一切的背后,最核心的因素是還要有國家層面的政策扶持,以及足夠的尖端科技人才儲(chǔ)備。所以說,超算是一個(gè)國家綜合實(shí)力的體現(xiàn)一點(diǎn)也不為過。
中國的超算起步比較晚,但是進(jìn)步神速,這和我國高速發(fā)展需求和國家政策支持有著密不可分的關(guān)系。中國的天河二號(hào)超級(jí)計(jì)算機(jī)曾經(jīng)6次蟬聯(lián)世界超算TOP500冠軍,確立了中國在全球超算中的絕對(duì)地位。
但是由于天河二號(hào)早期使用的是intel Xeon的芯片方案,引來了一些質(zhì)疑和非議。中國超算的快速崛起也使得美國政府在2015年頒布了引發(fā)轟動(dòng)的“限售”事件:美國政府嚴(yán)禁intel等公司向中國四家超算中心出口高性能計(jì)算芯片。
國產(chǎn)Matrix-2000加速器替代intel Xeon
2015年美國“限售”事件爆發(fā),中國決定采用國產(chǎn)芯片替代。直至2017年9月份,廣州超算中心宣布年底前升級(jí)天河2號(hào)超算系統(tǒng),使用國產(chǎn)加速器Matrix-2000取代原本的Intel Xeon Phi加速器。通過國產(chǎn)芯片升級(jí)后的天河2A超級(jí)計(jì)算機(jī)取得了算力翻倍的驚人成績。
國產(chǎn)Matrix-2000賦予天河2A性能翻倍的
國產(chǎn)Matrix-2000的出現(xiàn)打破了美國的“技術(shù)封鎖”,升級(jí)后的天河2A超級(jí)計(jì)算機(jī)的浮點(diǎn)性能從之前的54.9PFLOPS提升到了94.97PFLOPS,互聯(lián)與I/O方面性能指標(biāo)也獲得了較大幅度的技術(shù)進(jìn)步。
網(wǎng)絡(luò)帶寬從原來的10Gbps升級(jí)到了14Gbps,延遲從1.57us降至1us,內(nèi)存容量從1.4PB升級(jí)到了3.4PB,存儲(chǔ)容量從12.4PB升級(jí)到了19PB,帶寬翻倍到1TB/s,而功耗則從17.8MW降至16.9MW,能效大幅提升。
略帶神秘色彩的Matrix-2000芯片是由國防科大自主研發(fā)設(shè)計(jì),網(wǎng)傳由天津邁創(chuàng)公司出品。在中國超算白手起家的內(nèi)憂,疊加美國“禁售”的外患的大背景下,中國超算憑借自主研發(fā)的Matrix-2000實(shí)現(xiàn)“絕地反殺”,此舉無疑可以載入史冊。
唯有堅(jiān)定完全自主研發(fā)才是出路
自中國863計(jì)劃實(shí)施以來,超級(jí)計(jì)算系統(tǒng)的研發(fā)受到了國家的高度重視,但由于基礎(chǔ)薄弱起步較晚,在國際舞臺(tái)中一直受制于人。
美國商務(wù)部2015年實(shí)施“禁售”高端芯片事件爆發(fā),更是堅(jiān)定了我國高端芯片自主研發(fā)的路線,并被提升到國家戰(zhàn)略高度。中國目前最強(qiáng)大的超級(jí)計(jì)算機(jī)——神威·太湖之光就是在這樣的背景下誕生的。
神威·太湖之光超級(jí)計(jì)算機(jī)安裝了40960個(gè)中國自主研發(fā)的“申威26010”眾核處理器,該眾核處理器采用64位自主申威指令系統(tǒng),峰值性能為12.5億億次/秒,持續(xù)性能為9.3億億次/秒。
2016年,國際TOP500組織發(fā)布的榜單顯示,“神威·太湖之光”超級(jí)計(jì)算機(jī)系統(tǒng)登頂榜單之首, 不僅速度比第二名“天河二號(hào)”快出近兩倍,其效率也提高3倍。
申威26010眾核處理器采用64位自主申威指令系統(tǒng),峰值性能3.168萬億次每秒,核心工作頻率1.5GHz。“神威太湖之光”里安裝有40960個(gè)這樣的處理器。使用中國自主芯片制造的“神威太湖之光”取代“天河二號(hào)”登上榜首,中國超算上榜總數(shù)量也有史以來首次超過美國名列第一。
申威26010眾核處理器的出現(xiàn)基本實(shí)現(xiàn)了對(duì)Intel Xeon Phi加速卡的替代。雖然在單片的性能上仍舊跟Intel Xeon存在性能上的差距,但是得益于體積和功耗上面的優(yōu)勢,可使得一個(gè)小小的機(jī)箱就可放置256個(gè)計(jì)算節(jié)點(diǎn),同體積計(jì)算性能反殺Intel Xeon Phi。
相比其他國產(chǎn)芯片,申威則要顯得更加低調(diào)和神秘一些,因?yàn)樯晖幚砥髯哉Q生之初就背負(fù)著軍工國防和國家信息安全的使命,其研發(fā)單位總參謀部第五十六研究所(無錫江南計(jì)算技術(shù)研究所)于2003年開始著手設(shè)計(jì)中國人自己的高性能芯片。在國家"核高基"重大專項(xiàng)支持下,申威處理采用自主指令集開發(fā),且具有完全自主知識(shí)產(chǎn)權(quán)。
雖然目前我國兩臺(tái)重量級(jí)超級(jí)計(jì)算機(jī)“神威·太湖之光”和“天河2A”被來自美國的“Summit”和“Sierra”所超越,但兩強(qiáng)交手互有勝負(fù)也在情理之中。
據(jù)最新的消息顯示,我國“天河三號(hào)”目前正在積極的研發(fā)大眾,并有望在2020年重新奪回第一寶座,并實(shí)現(xiàn)對(duì)“神威·太湖之光”高達(dá)八倍的性能超越。更加值得期待的是,“天河三號(hào)”有望采用全自主創(chuàng)新設(shè)計(jì),自主飛騰CPU、自主天河高速互聯(lián)通信,以及自主麒麟操作系統(tǒng)。
然而我們必須清醒意識(shí)到,在芯片領(lǐng)域我們所面臨的對(duì)手是如此強(qiáng)大,無論IBM、intel、nVIDIA任何一個(gè)芯片公司都具有足夠強(qiáng)大的實(shí)力。
同時(shí)需要特別注意的是,早在5年前,美國政府就已經(jīng)停止為超級(jí)計(jì)算機(jī)項(xiàng)目的贊助撥款。轉(zhuǎn)而開始大力投資量子計(jì)算機(jī)的研發(fā)工作。這也是此前美國超級(jí)計(jì)算機(jī)止步不前,最終被中國一舉超越的重要原因。
擺在國產(chǎn)芯片面前的挑戰(zhàn)和使命同樣重大,在當(dāng)前的國際局勢下,唯有鑒定的走自主研發(fā)的道路,徹底擺脫受制于人才是唯一出路。
無論是2020年即將投入使用的“天河三號(hào)”,還是“神威·太湖之光”后續(xù)的升級(jí),在關(guān)乎國家經(jīng)濟(jì)命脈和信息安全的超級(jí)計(jì)算機(jī)領(lǐng)域,國產(chǎn)芯片將會(huì)愈發(fā)壯大,讓我們拭目以待!
某專題片對(duì)申威26010的報(bào)道
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論