北京2022年6月14日 /美通社/ -- 近日,浪潮信息攜手歐洲HPC方案提供商MEGWARE,為德國埃爾朗根-紐倫堡大學(Friedrich-Alexander-Universität Erlangen-Nürnberg,簡稱FAU)高性能計算中心提供GPU服務器,助力FAU科研能力提升。目前,由浪潮GPU服務器提供強大算力的Alex集群已經全面投入運行,在機器學習、分子動力學等科學研究方面提供了超出預期的性能表現。該集群是目前世界上最強大、最節(jié)能的集群系統(tǒng)之一,入圍TOP500和Green500榜單。
FAU是歐洲領先的研究型大學,位居路透社歐洲最具創(chuàng)新力大學榜單第二名,因其在材料科學、化學、生命科學、計算機科學和生物醫(yī)學工程等領域的成就而聞名于世。該校建校以來產生過4位諾貝爾獎得主,培養(yǎng)了眾多優(yōu)秀的科學家、工程師和醫(yī)學家等。近年來,FAU積極推動機器學習在各研究領域的廣泛應用,特別是在計算機科學,同時還通過分子動力學支持復雜的物理模型數值模擬,而這些研究項目帶來了算力需求的指數級增長。
為了滿足科研所需的大規(guī)模并行計算需求,FAU積極推進高性能計算中心建設,規(guī)劃了該校歷史上最大規(guī)模的計算集群,并命名為"Alex",為科研項目提供更充沛的高性能算力。同時作為"德國HPC基礎設施聯(lián)盟(NHR Alliance)"的一部分,新集群也將向德國其他大學的研究人員開放。浪潮信息和MEGWARE的聯(lián)合解決方案憑借強大的GPU服務器、系統(tǒng)集成、性能優(yōu)化等方面的突出表現,在全歐洲范圍的招標中脫穎而出,成功斬獲該項目。
"Alex"集群是FAU高性能計算中心的核心基礎設施,主要用于處理機器學習、分子動力學模擬等應用快速增長的算力需求。"Alex"是目前世界上最強大、最節(jié)能的集群之一,入選TOP500和Green500榜單,采用浪潮NF5488A5和NF5468A5 GPU服務器,共提供256顆NVIDIA A100 Tensor Core GPU和304顆NVIDIA A40 Tensor Core GPU,可實現極高的GPU計算性能。除了海量的GPU資源,"Alex"還搭載了140顆AMD EPYC 7713 CPU,總內存容量接近50TB。集群通過高速HDR InfiniBand網絡互連,實現頂級通用計算性能和出色AI性能,可滿足大量專業(yè)研究軟件的需求,支持海量機器學習數據、分子動力學模擬,提升訓練效率。
浪潮GPU服務器是Alex集群的基礎組件,提供強大的計算性能。面對機器學習和化學應用的挑戰(zhàn),浪潮NF5488A5服務器在4U空間內配置了8顆NVIDIA A100 GPU和2顆64核AMD EPYC 7713 CPU,使用NVSwitch GPU互聯(lián)。這種設計在提供強大計算性能的同時,降低了運維成本,并且便于安裝。在應對分子動力學應用需求方面,浪潮NF5468A5服務器在4U空間內支持8顆NVIDIA A40 GPU和2顆AMD EPYC 7713處理器,CPU和GPU采用PCIe 4.0高速接口直連,無需使用PCIe switch,降低了CPU和GPU之間的通信延遲,提高了計算性能。
浪潮信息與MEGWARE聯(lián)合打造的HPC方案大大提升了FAU的科研能力。浪潮信息為FAU提供了優(yōu)化的硬件,如浪潮旗艦服務器NF5488A5和NF5468A5,讓FAU的模型訓練和推理性能相比最初預期性能提升了115%。使用浪潮GPU服務器的Alex集群現已成功運行Tensorflow、PyTorch等機器學習應用,Quantum Espresso、VASP等化學應用,以及NAMD、LAMMPS、AMBER、GROMACS等科研軟件,讓FAU和其他德國大學的研究人員能夠在科學探索的最前沿開展研究。
浪潮信息是全球領先的AI服務器廠商,擁有豐富的AI計算產品陣列,并和AI客戶緊密合作,幫助其在語音、語義、圖像、視頻、搜索等各方面取得數量級的AI應用性能提升。據IDC報告顯示,浪潮信息在全球AI服務器市場份額位居第一。