浪潮獲15項MLPerf 推理V1.1 AI基準(zhǔn)評測冠軍

浪潮

2021-09-23 18:54 5063

北京2021年9月23日 /美通社/ -- 9月23日，全球權(quán)威AI基準(zhǔn)評測MLPerf?公布最新榜單Inference(推理) V1.1，在最受關(guān)注的固定任務(wù)(Closed)測試中，浪潮獲得15項冠軍，占據(jù)冠軍榜單半壁江山，蟬聯(lián)四屆MLPerf? AI基準(zhǔn)測試冠軍榜首。

MLPerf?是影響力極為廣泛的國際AI性能基準(zhǔn)評測，由圖靈獎得主大衛(wèi)?帕特森（David Patterson）聯(lián)合頂尖學(xué)術(shù)機構(gòu)發(fā)起成立。2020年，非盈利性機器學(xué)習(xí)開放組織MLCommons基于MLPerf?基準(zhǔn)測試成立，其成員包括谷歌、Facebook、英偉達(dá)、英特爾、浪潮、哈佛大學(xué)、斯坦福大學(xué)、加州大學(xué)伯克利分校等50余家全球AI領(lǐng)軍企業(yè)及頂尖學(xué)術(shù)機構(gòu)，致力于推進(jìn)機器學(xué)習(xí)和人工智能標(biāo)準(zhǔn)及衡量指標(biāo)。目前，MLCommons每年組織2次MLPerf? AI訓(xùn)練性能測試和2次MLPerf? AI推理性能測試，為用戶衡量設(shè)備性能提供權(quán)威有效的數(shù)據(jù)指導(dǎo)。

MLPerf?推理V1.1 AI基準(zhǔn)測試固定任務(wù)(Closed)包括數(shù)據(jù)中心(共16個項目)和邊緣(共14個項目)兩大場景。在數(shù)據(jù)中心場景下設(shè)置6個模型，分別是圖像識別（ResNet50）、醫(yī)學(xué)影像分割（3D-UNet）、目標(biāo)物體檢測（SSD-ResNet34）、語音識別（RNN-T）、自然語言理解（BERT）以及智能推薦（DLRM），其中Bert、DLRM和3D-Unet設(shè)有高精度（99.9%）模式。除3D-UNet模型任務(wù)只考察Offline離線推理場景性能外，其他模型任務(wù)按照Server在線推理和Offline離線推理兩種應(yīng)用場景分別進(jìn)行性能測試。邊緣場景AI模型在數(shù)據(jù)中心場景的6個模型基礎(chǔ)上刪減了智能推薦（DLRM）模型，并增加目標(biāo)物體檢測（SSD-MobileNet）模型，所有模型均有Offline離線推理場景和SingleStream單流推理兩個場景。

固定任務(wù)(Closed)要求參賽各方使用相同模型和優(yōu)化器，這對于實際用戶評測AI計算系統(tǒng)性能具備很強的參考意義，也一直是MLPerf?中角逐最激烈及主流廠商最關(guān)注的領(lǐng)域。此次共有英偉達(dá)、英特爾、浪潮、高通、阿里巴巴、戴爾、HPE等19家廠商參與到固定任務(wù)(Closed)測試競賽中，其中數(shù)據(jù)中心場景收到了754項成績提交，邊緣場景收到了448項成績提交，共1199項成績提交。

浪潮全棧AI能力助推性能持續(xù)突破

浪潮取得此次MLPerf?競賽佳績的三款A(yù)I服務(wù)器，分別是NF5488A5、NF5688M6及NE5260M5。NF5488A5是全球首批上市的A100服務(wù)器，在4U空間支持8顆第三代NVlink互聯(lián)的A100 GPU和2顆AMD Milan CPU，同時支持液冷和風(fēng)冷散熱技術(shù)。NF5688M6是面向大規(guī)模數(shù)據(jù)中心優(yōu)化設(shè)計的具備極致擴展能力的AI服務(wù)器，支持8顆A100 GPU和兩顆Intel Icelake CPU，支持多達(dá)13張PCIe Gen4的IO擴展卡。NE5260M5通過極致優(yōu)化的信號和電源等系統(tǒng)設(shè)計，兼容高性能CPU和多種AI加速卡，通過減震降噪優(yōu)化和嚴(yán)苛的可靠性測試，機箱深度430mm較普通服務(wù)器縮短近二分之一，滿足空間受限的邊緣計算場景部署需求。

浪潮在本次MLPerf?競賽獲得15項全球第一，涵蓋醫(yī)學(xué)影像識別、自然語義理解、圖像識別、語音識別、智能推薦、目標(biāo)物體檢測（SSD-ResNet34）以及目標(biāo)物體檢測（SSD-MobileNet）全部7項AI模型任務(wù)，從云到邊全面領(lǐng)先。浪潮持續(xù)提升數(shù)據(jù)中心場景下MLPerf?各項任務(wù)性能成績，即便在相同服務(wù)器配置下各項任務(wù)成績依然得到較大改善，如圖像識別(ResNet50)和語音識別(RNN-T)的模型性能分別較半年前的V1.0競賽成績提升了4.75%和3.83%。

浪潮AI服務(wù)器在MLPerf?基準(zhǔn)評測中的出色表現(xiàn)，得益于浪潮在AI計算系統(tǒng)卓越的系統(tǒng)設(shè)計能力和全棧優(yōu)化能力。在硬件層面，通過對CPU、GPU硬件性能的精細(xì)校準(zhǔn)和全面優(yōu)化，使CPU性能、GPU性能、CPU與GPU之間的數(shù)據(jù)通路均處于對AI推理最優(yōu)狀態(tài)；在軟件層面，結(jié)合GPU硬件拓?fù)鋵Χ郍PU的輪詢調(diào)度優(yōu)化使單卡至多卡性能達(dá)到了近似線性擴展；在深度學(xué)習(xí)算法層面，結(jié)合GPU Tensor Core 單元的計算特征，通過自研通道壓縮算法成功實現(xiàn)了模型的極致性能優(yōu)化。

浪潮NF5488A5是本次MLPerf?競賽中唯一實現(xiàn)以液冷方式支持8顆500W A100 GPU的AI服務(wù)器，液冷散熱為AI計算性能提升注入了強勁動力。而在本次MLPerf?競賽所有配置8顆A100 SXM4芯片的主流高端AI服務(wù)器中，浪潮獲得了數(shù)據(jù)中心場景固定任務(wù)下全部16項任務(wù)的最佳成績。

浪潮是全球領(lǐng)先的AI計算領(lǐng)導(dǎo)廠商，AI服務(wù)器市場份額全球第一，連續(xù)四年以超50%的市場份額居中國AI服務(wù)器市場第一。浪潮致力于AI計算平臺、資源平臺和算法平臺的研發(fā)創(chuàng)新，并通過元腦生態(tài)與AI領(lǐng)先企業(yè)共同推進(jìn)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化進(jìn)程。

消息來源：浪潮