omniture

浪潮獲15項MLPerf 推理V1.1 AI基準評測冠軍

2021-09-23 18:54 4156

北京2021年9月23日 /美通社/ -- 9月23日,全球權(quán)威AI基準評測MLPerf?公布最新榜單Inference(推理) V1.1,在最受關(guān)注的固定任務(wù)(Closed)測試中,浪潮獲得15項冠軍,占據(jù)冠軍榜單半壁江山,蟬聯(lián)四屆MLPerf? AI基準測試冠軍榜首。


MLPerf?是影響力極為廣泛的國際AI性能基準評測,由圖靈獎得主大衛(wèi)?帕特森(David Patterson)聯(lián)合頂尖學(xué)術(shù)機構(gòu)發(fā)起成立。2020年,非盈利性機器學(xué)習(xí)開放組織MLCommons基于MLPerf?基準測試成立,其成員包括谷歌、Facebook、英偉達、英特爾、浪潮、哈佛大學(xué)、斯坦福大學(xué)、加州大學(xué)伯克利分校等50余家全球AI領(lǐng)軍企業(yè)及頂尖學(xué)術(shù)機構(gòu),致力于推進機器學(xué)習(xí)和人工智能標(biāo)準及衡量指標(biāo)。目前,MLCommons每年組織2次MLPerf? AI訓(xùn)練性能測試和2次MLPerf? AI推理性能測試,為用戶衡量設(shè)備性能提供權(quán)威有效的數(shù)據(jù)指導(dǎo)。

MLPerf?推理V1.1 AI基準測試固定任務(wù)(Closed)包括數(shù)據(jù)中心(共16個項目)和邊緣(共14個項目)兩大場景。在數(shù)據(jù)中心場景下設(shè)置6個模型,分別是圖像識別(ResNet50)、醫(yī)學(xué)影像分割(3D-UNet)、目標(biāo)物體檢測(SSD-ResNet34)、語音識別(RNN-T)、自然語言理解(BERT)以及智能推薦(DLRM),其中Bert、DLRM和3D-Unet設(shè)有高精度(99.9%)模式。除3D-UNet模型任務(wù)只考察Offline離線推理場景性能外,其他模型任務(wù)按照Server在線推理和Offline離線推理兩種應(yīng)用場景分別進行性能測試。邊緣場景AI模型在數(shù)據(jù)中心場景的6個模型基礎(chǔ)上刪減了智能推薦(DLRM)模型,并增加目標(biāo)物體檢測(SSD-MobileNet)模型,所有模型均有Offline離線推理場景和SingleStream單流推理兩個場景。

固定任務(wù)(Closed)要求參賽各方使用相同模型和優(yōu)化器,這對于實際用戶評測AI計算系統(tǒng)性能具備很強的參考意義,也一直是MLPerf?中角逐最激烈及主流廠商最關(guān)注的領(lǐng)域。此次共有英偉達、英特爾、浪潮、高通、阿里巴巴、戴爾、HPE等19家廠商參與到固定任務(wù)(Closed)測試競賽中,其中數(shù)據(jù)中心場景收到了754項成績提交,邊緣場景收到了448項成績提交,共1199項成績提交。

浪潮全棧AI能力助推性能持續(xù)突破

浪潮取得此次MLPerf?競賽佳績的三款A(yù)I服務(wù)器,分別是NF5488A5、NF5688M6及NE5260M5。NF5488A5是全球首批上市的A100服務(wù)器,在4U空間支持8顆第三代NVlink互聯(lián)的A100 GPU和2顆AMD Milan CPU,同時支持液冷和風(fēng)冷散熱技術(shù)。NF5688M6是面向大規(guī)模數(shù)據(jù)中心優(yōu)化設(shè)計的具備極致擴展能力的AI服務(wù)器,支持8顆A100 GPU和兩顆Intel Icelake CPU,支持多達13張PCIe Gen4的IO擴展卡。NE5260M5通過極致優(yōu)化的信號和電源等系統(tǒng)設(shè)計,兼容高性能CPU和多種AI加速卡,通過減震降噪優(yōu)化和嚴苛的可靠性測試,機箱深度430mm較普通服務(wù)器縮短近二分之一,滿足空間受限的邊緣計算場景部署需求。

浪潮在本次MLPerf?競賽獲得15項全球第一,涵蓋醫(yī)學(xué)影像識別、自然語義理解、圖像識別、語音識別、智能推薦、目標(biāo)物體檢測(SSD-ResNet34)以及目標(biāo)物體檢測(SSD-MobileNet)全部7項AI模型任務(wù),從云到邊全面領(lǐng)先。浪潮持續(xù)提升數(shù)據(jù)中心場景下MLPerf?各項任務(wù)性能成績,即便在相同服務(wù)器配置下各項任務(wù)成績依然得到較大改善,如圖像識別(ResNet50)和語音識別(RNN-T)的模型性能分別較半年前的V1.0競賽成績提升了4.75%和3.83%。

浪潮AI服務(wù)器在MLPerf?基準評測中的出色表現(xiàn),得益于浪潮在AI計算系統(tǒng)卓越的系統(tǒng)設(shè)計能力和全棧優(yōu)化能力。在硬件層面,通過對CPU、GPU硬件性能的精細校準和全面優(yōu)化,使CPU性能、GPU性能、CPU與GPU之間的數(shù)據(jù)通路均處于對AI推理最優(yōu)狀態(tài);在軟件層面,結(jié)合GPU硬件拓撲對多GPU的輪詢調(diào)度優(yōu)化使單卡至多卡性能達到了近似線性擴展;在深度學(xué)習(xí)算法層面,結(jié)合GPU Tensor Core 單元的計算特征,通過自研通道壓縮算法成功實現(xiàn)了模型的極致性能優(yōu)化。

浪潮NF5488A5是本次MLPerf?競賽中唯一實現(xiàn)以液冷方式支持8顆500W A100 GPU的AI服務(wù)器,液冷散熱為AI計算性能提升注入了強勁動力。而在本次MLPerf?競賽所有配置8顆A100 SXM4芯片的主流高端AI服務(wù)器中,浪潮獲得了數(shù)據(jù)中心場景固定任務(wù)下全部16項任務(wù)的最佳成績。

浪潮是全球領(lǐng)先的AI計算領(lǐng)導(dǎo)廠商,AI服務(wù)器市場份額全球第一,連續(xù)四年以超50%的市場份額居中國AI服務(wù)器市場第一。浪潮致力于AI計算平臺、資源平臺和算法平臺的研發(fā)創(chuàng)新,并通過元腦生態(tài)與AI領(lǐng)先企業(yè)共同推進AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化進程。

消息來源:浪潮
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection