北京2021年10月28日 /美通社/ -- “人工智能帶來指數(shù)級增長的算力需求,一方面多樣化的智能場景需要多元化的算力,巨量化的模型、數(shù)據(jù)和應用規(guī)模需要巨量的算力,算力已經(jīng)成為人工智能繼續(xù)發(fā)展的重中之重;另一方面從芯片到算力的轉(zhuǎn)化依然存在巨大鴻溝,多元算力價值并未得到充分釋放。如何快速完成多元芯片到計算系統(tǒng)的創(chuàng)新,已經(jīng)成為推動人工智能產(chǎn)業(yè)發(fā)展的關鍵環(huán)節(jié)?!痹?0月26日舉行的2021人工智能計算大會(AICC2021)上,中國工程院院士、浪潮首席科學家王恩東闡釋了計算系統(tǒng)創(chuàng)新在計算到智算轉(zhuǎn)變的產(chǎn)業(yè)新格局下的重大意義。
隨著人工智能在算法領域的不斷突破,不同數(shù)值精度帶來了跨度更大的計算類型,對計算芯片指令集、架構(gòu)的要求更加細分。圖靈獎獲得者 John Hennessy和 David Patterson共同發(fā)表的《計算機架構(gòu)的新黃金時代》中提出:當摩爾定律不再適用,一種更以硬件為中心的針對特定問題領域定制設計計算機體系架構(gòu)的方法DSAs(Domain-Specific Architectures)會成為主導,這種設計的核心在于針對特定問題或特定領域來定義計算架構(gòu)?;贒SAs思想設計的AI芯片,在特定AI工作負載上表現(xiàn)出遠超通用芯片的處理能力,大大推動了AI芯片的多元化發(fā)展。
王恩東認為,芯片多元化為產(chǎn)業(yè)AI化的加速提供了重要的產(chǎn)業(yè)基礎和更加豐富的選擇。但是,芯片從造出來到大規(guī)模用起來,還存在巨大的產(chǎn)業(yè)鴻溝,“因此,如何將百花齊放的AI芯片轉(zhuǎn)變成一個通用性強、綠色高效、安全可靠的計算系統(tǒng),變得至關重要?!?/p>
然而,由于AI芯片在單一計算系統(tǒng)中往往高密度集成,帶來系統(tǒng)功耗、總線速率、電流密度的不斷提升,AI計算系統(tǒng)的設計面臨巨大挑戰(zhàn)。例如一臺浪潮AI服務器,需要整合超過10000個零部件,包含50多類專用芯片、30多個技術方向以及100多種傳輸協(xié)議,涉及到材料、熱力學、電池技術、流體力學、化學等一系列學科;需要經(jīng)歷30多個流程、150多種加工和制造的工藝、280多個關鍵過程的控制點,如何確保整個系統(tǒng)的可靠性是一個非常精細且復雜的工程。
“從火箭發(fā)動機到運載火箭,要在循環(huán)、控制、結(jié)構(gòu)等很多領域做大量的工作。芯片到計算系統(tǒng)同樣如此,需要完成體系結(jié)構(gòu)、信號完整性、散熱、可靠性等大量系統(tǒng)性設計工作?!蓖醵鳀|院士用一個生動形象的比喻,描述了計算系統(tǒng)創(chuàng)新的難度。
值得關注的是,計算系統(tǒng)創(chuàng)新的根本目的,就是要讓算力、算法和數(shù)據(jù)去服務數(shù)字經(jīng)濟,去支撐科研創(chuàng)新,去推動智慧轉(zhuǎn)型,這就需要加大以智算中心為代表的新型人工智能基礎設施建設,以此推動AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化和政府治理的智能化。
對此,王恩東院士強調(diào)說:“我們一方面要重視智算系統(tǒng)的創(chuàng)新,加大人工智能新型基礎設施建設,把從技術到應用的鏈條設計好,從體系結(jié)構(gòu)、芯片設計、系統(tǒng)設計、系統(tǒng)軟件、開發(fā)環(huán)境等各個領域形成既分工明確又協(xié)同創(chuàng)新的局面。同時,也要加快推動開放標準建設,通過統(tǒng)一的、規(guī)范的標準,將多元化算力轉(zhuǎn)變?yōu)榭烧{(diào)度的資源,讓算力好用、易用?!?