omniture

中南大學 建設高校算力最強的智算平臺

2020-09-23 09:19 9506
2020年9月4日,浪潮集團“智驅新時代-浪潮云數(shù)智中國行”長沙站活動現(xiàn)場,中南大學信息與網(wǎng)絡中心代表以“智算中南”為主題,介紹了中南大學高性能計算公共服務平臺建設有關情況。

北京2020年9月22日 /美通社/ -- 2020年9月4日,浪潮集團“智驅新時代-浪潮云數(shù)智中國行”長沙站活動現(xiàn)場,中南大學信息與網(wǎng)絡中心代表以“智算中南”為主題,介紹了中南大學高性能計算公共服務平臺建設有關情況。中南大學與浪潮攜手打造的國內首個高校智算平臺即將落成,不僅將有力地支持中南大學的學科建設和人才培養(yǎng),推動高校高性能計算的發(fā)展,更是智慧時代開展科學研究強有力的基礎設施,“智算中南”將著力推進以算力為基礎、以算法為核心、以模擬和仿真為手段的科學研究數(shù)字生態(tài)體系建設,賦能各行業(yè)的創(chuàng)新研究。

以下為演講現(xiàn)場實錄。

尊敬的各位領導,各位來賓、IT屆的朋友們,上午好!今天非常高興,借浪潮公司巡展的機會,分享中南大學高性能計算平臺建設的一點體會。我的匯報題目是“智算中南”,實際上是借“智算中南”建設案例,向大家匯報中南大學信息與網(wǎng)絡中心在高性能計算平臺建設方面的一些做法,以期拋磚引玉。

智算中南建設背景

首先,從國家高等教育的宏觀視角來觀察,那就是“雙一流”建設戰(zhàn)略的大背景。2017年9月21日,教育部、財政部、國家發(fā)改委聯(lián)合發(fā)布《關于公布世界一流大學和一流學科建設高校及建設學科名單的通知》,正式公布“雙一流”建設高校及建設學科名單?!半p一流”建設主要圍繞五個方面開展,包括一流師資團隊的建設、拔尖創(chuàng)新人才的培養(yǎng)、科學研究水平的提升、優(yōu)秀文化的傳承創(chuàng)新以及科研成果的轉化推進。“雙一流”建設和人們熟知的“211工程”、“985工程”比較,有一點顯著的不同,“雙一流”建設引入了優(yōu)勝劣汰的動態(tài)競爭機制,這種動態(tài)競爭的制度安排,使得各個高校面臨新的機遇和挑戰(zhàn)。


其次,從學校當前的需求來分析,中南大學是教育部直屬全國重點大學、國家“211工程”和“985工程”高校,是世界一流大學A類建設高校。“雙一流”建設的內容就包括科學研究、人才培養(yǎng)和創(chuàng)新驅動,在“雙一流”建設的大背景下,學校的科學研究水平、科研成果產(chǎn)出以及拔尖創(chuàng)新人才培養(yǎng)需要更上一層樓。我們都知道,科學研究包括理論研究和實驗研究兩個基本范式,自從計算機出現(xiàn)以后,我們又多了一種從事科學研究的手段,那就是計算,通過高性能計算系統(tǒng)的模擬和仿真,來開展科學研究。

《論語》中孔子說:“工欲善其事,必先利其器”。建設一個硬件先進、功能齊全、資源豐富,面向全校師生提供高性能計算公共服務的開放性基礎設施,不僅可以為學校的科學研究和工程計算提供優(yōu)質的服務,而且還是人才培養(yǎng)的重要基地,更是參與國內外高性能計算領域學術交流、科研合作和創(chuàng)新的重要平臺。因此,建設智算平臺提供公共計算服務的緊迫性就顯得尤為突出,我們的理念是時不我待,只爭朝夕。

再者,從學校高性能計算應用層面來剖析,智算平臺建設之前存在四個方面的問題:


第一是小規(guī)模計算集群,學校各科研團隊采購小規(guī)模集群,存在使用效率低、資源有限、運維困難、安全隱患大,缺乏高水平專業(yè)運維和用戶服務技術人員,以及存在分散重復建設等問題;第二是昂貴的社會計算資源,租用校外計算資源存在費用高、數(shù)據(jù)傳輸困難,難以滿足個性化需求等問題;第三是對計算資源的持續(xù)投入不足,學校2009年建設了校級高性能計算公共服務平臺,盡管在2013年和2018年分別進行過升級更新,但總體而言,缺乏持續(xù)的滾動投入,導致計算能力嚴重不足,而且,早年建設的高性能計算設施即將面臨淘汰;第四是調研表明學校公共計算資源不足,通過統(tǒng)計學校二級學院自建計算集群存量、梳理資產(chǎn)部門計算設備采購清單,以及調研用戶對高性能計算資源的需求,發(fā)現(xiàn)學校公共計算資源存在明顯的短板。

最后,調研國內外高水平大學高性能計算平臺建設表明,近年來清華大學、中國科學技術大學、上海交通大學分別投入數(shù)千萬資金開展高性能計算平臺的建設,滿足學??蒲袑λ懔Φ男枨?。從全球HPC TOP 500排行榜來觀察,國外高水平大學也不例外??傊?,國內外高水平大學在高性能計算領域的投入日趨增大,建設規(guī)模早已進入千萬億次級別(P級別),國家層面,E級別超算已提上議事日程。

基于上述背景,針對“智算中南”解決方案,我們提出滿足用戶需求,考慮前瞻性,重點服務學?!半p一流”建設的三個建設原則,精心設計、用心打造“智算中南”高性能計算平臺。

智算平臺四大優(yōu)勢

2020年上半年,中南大學攜手浪潮開始“智算中南”的建設,智算平臺共有上千臺設備,采用浪潮成熟穩(wěn)定的高性能計算和人工智能服務器以及浪潮AI微模塊數(shù)據(jù)中心解決方案,合計42個高密度IT機柜,設備布局科學合理、密度高、功耗分布均勻且無熱點。單IT機柜設計功率達到19千瓦,機房面積195平米,以前幾乎無法想象在195平米的空間內,計算集群可以達到五千多萬億次的超高算力。


中南大學智算平臺具有四大優(yōu)勢:

首先是超強算力,智算平臺由1058個浪潮高密度HPC計算節(jié)點和AI服務器節(jié)點組成,采用英特爾高性能CPU和英偉達Tesla系列GPU,合計50896個計算核心,CPU理論計算能力為4856萬億次,GPU理論計算能力為788萬億次,整個計算集群聚合計算能力達到5644萬億次,計算能力位于當前國內高校頂尖水平

第二是超強作業(yè)調度和管理能力,智算平臺采用浪潮自主研發(fā)的Cluster Engine集群作業(yè)調度管理軟件和AIStation人工智能資源平臺,實現(xiàn)整個平臺計算資源的統(tǒng)一調度和管理,科學分配高性能計算和深度學習等計算資源。

第三是超高性能的并行存儲系統(tǒng),智算平臺采用國際領先的DDN商業(yè)版Lustre并行文件系統(tǒng)和統(tǒng)一集中式存儲架構,可用存儲容量超過2PB,最大持續(xù)讀寫帶寬達到20GB/s。

第四是超大IB高速計算網(wǎng)絡,智算平臺采用Mellanox公司最新的HDR InfiniBand交換機,構建高帶寬、低時延的計算網(wǎng)絡,實現(xiàn)千余臺設備的100Gb完全無擁塞高速互聯(lián)。在成千上萬的計算機組成超大規(guī)模計算集群中,節(jié)點或服務器之間的吞吐和速度極為重要,這也是“智算中南”解決方案選擇InfiniBand實現(xiàn)集群高速互聯(lián)的原因。


“智算中南”高性能計算平臺將于今年9月底建成,目前正在按計劃開展系統(tǒng)加電測試、機房環(huán)境系統(tǒng)測試、網(wǎng)絡連通性測試、集群管理軟件測試、并行編譯環(huán)境測試、內存帶寬測試、IB高速計算網(wǎng)絡測試、存儲系統(tǒng)測試、動環(huán)監(jiān)控系統(tǒng)測試以及HP Linpack測試等。下一步將結合具體的專業(yè)領域應用,與學校不同學科的專家、教授一道,開展專業(yè)應用軟件測試,預計10月份投入試運行。我們相信,隨著平臺的投入使用,必將有力地推動學校科學研究水平的提升,進一步促進科研成果的產(chǎn)出和拔尖創(chuàng)新人才的培養(yǎng),為學校的“雙一流”建設做出貢獻。


結束語

各位來賓,科學技術是第一生產(chǎn)力,創(chuàng)新是引領發(fā)展的源泉,“智算中南”高性能計算平臺不僅僅定位于服務中南大學“雙一流”建設,同時,我們歡迎各高等院校、科研單位、大型企業(yè)的研發(fā)機構和中南大學攜手,基于中南大學智算平臺強大的算力,在學術研究、科研創(chuàng)新、成果轉化、人才培養(yǎng)、產(chǎn)品開發(fā)方面開展全方位的緊密合作,引領創(chuàng)新潮流,探索未知世界!

消息來源:浪潮
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection