omniture

全球最快人工智能訓(xùn)練服務(wù)器浪潮NF5488A5發(fā)布 | 美通社

2020-08-19 11:52

浪潮AI服務(wù)器NF5488A5

8月15日,在蘇州舉行的2020全球人工智能產(chǎn)品應(yīng)用博覽會(huì)(AIExpo2020)上,浪潮發(fā)布人工智能服務(wù)器NF5488A5。在前不久公布的全球權(quán)威AI測(cè)試榜單MLPerf中,浪潮NF5488A5僅用時(shí)33.37分鐘,就在包含128萬(wàn)張圖片的ImageNet數(shù)據(jù)集上完成Resnet50模型的訓(xùn)練,相當(dāng)于每秒訓(xùn)練23000多張圖片,單機(jī)計(jì)算性能高居第一,可謂最快人工智能訓(xùn)練服務(wù)器。

MLPerf是國(guó)際權(quán)威的AI測(cè)試,2018年由圖靈獎(jiǎng)得主Patterson聯(lián)合谷歌、哈佛、斯坦福等發(fā)起,每年發(fā)布訓(xùn)練和推理兩次基準(zhǔn)測(cè)試榜單。今年的MLPerf訓(xùn)練測(cè)試包含8個(gè)主流人工智能模型,涉及計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解、推薦模型和強(qiáng)化學(xué)習(xí)4個(gè)領(lǐng)域。浪潮NF5488A5人工智能服務(wù)器除了在Resenet50中取得榜首外,還在人工智能自然語(yǔ)言理解Transformer、神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)GNMT、深度學(xué)習(xí)推薦模型DLRM、目標(biāo)監(jiān)測(cè)算法SSD等MLPerf的模型訓(xùn)練評(píng)估中均取得不俗成績(jī)。

NF5488A5是浪潮自研的新一代AI服務(wù)器,單機(jī)訓(xùn)練性能可達(dá)5 PetaOPS,相比上一代服務(wù)器計(jì)算性能提升234%。兩年前Facebook的科學(xué)家用32臺(tái)GPU服務(wù)器、256塊GPU花了1個(gè)小時(shí)完成了ImageNet上的Resnet50訓(xùn)練,而現(xiàn)在僅需一臺(tái)NF5488A5,即可在33分鐘完成同樣的訓(xùn)練,單臺(tái)設(shè)備訓(xùn)練效率提升近60倍。同時(shí),浪潮優(yōu)化了NF5488A5的拓?fù)浣Y(jié)構(gòu),采用NUMA綁定策略,可實(shí)現(xiàn)CPU與最近GPU的指定通信,大幅提升CPU與GPU之間的數(shù)據(jù)傳輸效率,實(shí)現(xiàn)更低的數(shù)據(jù)傳輸延遲和更高的帶寬,滿足各種AI負(fù)載高效數(shù)據(jù)通信需求。

(美通社,2020年8月18日北京)