浪潮AI加速中國(guó)頂尖語(yǔ)言聲學(xué)研究

浪潮

2020-09-02 19:52 9810

在中國(guó)科學(xué)院語(yǔ)言聲學(xué)與內(nèi)容理解重點(diǎn)實(shí)驗(yàn)室，浪潮AGX-5支撐著數(shù)十項(xiàng)以音頻為核心的人工智能重大項(xiàng)目研究。

北京2020年9月2日 /美通社/ -- 在中國(guó)科學(xué)院語(yǔ)言聲學(xué)與內(nèi)容理解重點(diǎn)實(shí)驗(yàn)室，浪潮AGX-5支撐著數(shù)十項(xiàng)以音頻為核心的人工智能重大項(xiàng)目研究。相比原AI集群方案，AGX-5以強(qiáng)大的單機(jī)訓(xùn)練性能，將人工智能模型的整體訓(xùn)練速度提升了2-3倍。

語(yǔ)音是人類(lèi)進(jìn)行信息交互的一種重要方式，但對(duì)計(jì)算機(jī)或者機(jī)器人來(lái)說(shuō)，理解語(yǔ)音并不是一件容易的事情。讓機(jī)器“能聽(tīng)會(huì)說(shuō)”是人工智能科學(xué)家期望實(shí)現(xiàn)的一大重要目標(biāo)。如今很多語(yǔ)音技術(shù)已經(jīng)走出實(shí)驗(yàn)室，在現(xiàn)實(shí)中應(yīng)用落地，如智能音箱、迎賓機(jī)器人、智能語(yǔ)音導(dǎo)航、語(yǔ)音輸入……讓人們的生產(chǎn)生活更加便利。這些成果離不開(kāi)眾多科研機(jī)構(gòu)的努力，其中就包括中國(guó)科學(xué)院語(yǔ)言聲學(xué)與內(nèi)容理解重點(diǎn)實(shí)驗(yàn)室（以下簡(jiǎn)稱實(shí)驗(yàn)室）。

該實(shí)驗(yàn)室是我國(guó)語(yǔ)言聲學(xué)領(lǐng)域最大的國(guó)立研究機(jī)構(gòu)。經(jīng)過(guò)近20年發(fā)展，實(shí)驗(yàn)室從最初的6人發(fā)展成為包含51名固定人員、總?cè)藬?shù)200余人的科研力量，被譽(yù)為“中國(guó)智能語(yǔ)音人才的搖籃”。

語(yǔ)言聲學(xué)研究改變中國(guó)

實(shí)驗(yàn)室布局于音頻聽(tīng)感知、語(yǔ)音識(shí)別和面向聲學(xué)應(yīng)用的大數(shù)據(jù)分析等研究方向，全方位覆蓋了以音頻為核心的媒體內(nèi)容理解研究?jī)?nèi)容。目前，實(shí)驗(yàn)室承擔(dān)著多項(xiàng)國(guó)家級(jí)和國(guó)際合作研究項(xiàng)目，如中科院戰(zhàn)略性先導(dǎo)專(zhuān)項(xiàng)“面向感知中國(guó)的新一代信息技術(shù)”媒體內(nèi)容項(xiàng)目、中日韓前瞻計(jì)劃A3項(xiàng)目“面向下一代互聯(lián)網(wǎng)的超臨場(chǎng)感聲通信應(yīng)用研究”、自然科學(xué)基金杰青項(xiàng)目“面向語(yǔ)音處理的言語(yǔ)聲學(xué)數(shù)字化建模”、基金重大研究計(jì)劃重點(diǎn)支持項(xiàng)目“多人多方對(duì)話中的語(yǔ)音分離、內(nèi)容分析與理解”、聲學(xué)所率先行動(dòng)計(jì)劃項(xiàng)目“以音頻驅(qū)動(dòng)的媒體深度理解關(guān)鍵技術(shù)研究“等等，科研任務(wù)十分繁重。

實(shí)驗(yàn)室的研究項(xiàng)目對(duì)于社會(huì)生產(chǎn)、生活的發(fā)展有著十分重要的價(jià)值和意義。以語(yǔ)音聽(tīng)覺(jué)感知研究方向?yàn)槔ㄟ^(guò)深入研究多種復(fù)雜因素對(duì)語(yǔ)音聽(tīng)覺(jué)感知的影響機(jī)理，探索復(fù)雜聲學(xué)環(huán)境下的語(yǔ)音感知機(jī)制及其建模方法，可能會(huì)使聽(tīng)力障礙患者過(guò)上正常人的生活。據(jù)2016年3月公布的《全國(guó)聽(tīng)力障礙與耳病調(diào)查結(jié)果》，我國(guó)有15.84%的人患有聽(tīng)力障礙，其中中度以上聽(tīng)力障礙的人占到總?cè)丝跀?shù)的5.17%。伴隨著我國(guó)老齡化趨勢(shì)加劇，聽(tīng)力障礙總現(xiàn)患率仍在進(jìn)一步升高，以語(yǔ)音技術(shù)為核心的助聽(tīng)器具能夠直接為聽(tīng)障患者帶來(lái)福音。此外，該研究方向所包含的三維音頻技術(shù)，通過(guò)研究人對(duì)真實(shí)三維聲學(xué)環(huán)境的感知機(jī)理，能夠?qū)⑻摂M現(xiàn)實(shí)技術(shù)的用戶體驗(yàn)提高約50%，進(jìn)一步促進(jìn)真正的”沉浸式”用戶體驗(yàn)實(shí)現(xiàn)。

目前，實(shí)驗(yàn)室的部分研究成果已在多個(gè)領(lǐng)域得到應(yīng)用：在智能終端領(lǐng)域，推出了智能電視交互系統(tǒng)；在互聯(lián)網(wǎng)領(lǐng)域，先后跟百度、騰訊和阿里巴巴進(jìn)行了卓有成效的合作，推出了語(yǔ)音輸入、語(yǔ)音和音樂(lè)檢索、語(yǔ)音客服等應(yīng)用；在廣電領(lǐng)域，實(shí)驗(yàn)室的連續(xù)語(yǔ)音識(shí)別引擎成為該行業(yè)主流企業(yè)的標(biāo)配，被索貝、大洋集成到各自的媒資管理系統(tǒng)和多媒體信息檢索系統(tǒng)，同時(shí)也被天脈聚源在其為電視臺(tái)提供新聞素材整理服務(wù)的云平臺(tái)中采用。

AGX-5助力語(yǔ)言聲學(xué)研究突破AI算力瓶頸

為了支撐重大項(xiàng)目的科研工作，實(shí)驗(yàn)室在音頻內(nèi)容分析核心技術(shù)方面建立了全面的、具有國(guó)際水平的開(kāi)發(fā)工具和處理平臺(tái)，主要包括非特定人大詞表連續(xù)語(yǔ)音識(shí)別系統(tǒng)、語(yǔ)種識(shí)別系統(tǒng)、說(shuō)話人識(shí)別/確認(rèn)系統(tǒng)、識(shí)別置信度評(píng)價(jià)關(guān)鍵詞檢測(cè)系統(tǒng)、發(fā)音評(píng)估系統(tǒng)、固定音頻檢測(cè)系統(tǒng)、口語(yǔ)理解和對(duì)話系統(tǒng)、噪聲消除系統(tǒng)、音頻水印編解碼系統(tǒng)、基于Hadoop的信息安全大數(shù)據(jù)分析系統(tǒng)等。同時(shí)，在基礎(chǔ)資源數(shù)據(jù)庫(kù)方面，實(shí)驗(yàn)室建立了大規(guī)模的漢語(yǔ)、英語(yǔ)、朝鮮語(yǔ)、維語(yǔ)、日語(yǔ)等語(yǔ)種的語(yǔ)音基礎(chǔ)資源數(shù)據(jù)庫(kù)和音樂(lè)數(shù)據(jù)庫(kù)。

隨著研究項(xiàng)目的增多以及數(shù)據(jù)量的快速增加，實(shí)驗(yàn)室的人工智能相關(guān)研究出現(xiàn)了AI計(jì)算資源緊張的局面，很多研究項(xiàng)目不得不“排隊(duì)”等待，科研進(jìn)度與成果產(chǎn)出均受到重大影響。如自動(dòng)語(yǔ)音識(shí)別的部分研究項(xiàng)目，每次需要訓(xùn)練的語(yǔ)音數(shù)據(jù)樣本規(guī)模高達(dá)數(shù)萬(wàn)小時(shí)，使用原有的分布式集群進(jìn)行訓(xùn)練，單次耗時(shí)就長(zhǎng)達(dá)2周左右，AI算力已成為科研的“瓶頸”之一。

浪潮AI服務(wù)器AGX-5

實(shí)驗(yàn)室希望在短時(shí)間內(nèi)完成海量非結(jié)構(gòu)數(shù)據(jù)的高速吞吐與并行訓(xùn)練，需要計(jì)算平臺(tái)具備強(qiáng)大的模型優(yōu)化處理能力和高可擴(kuò)展性，能夠支持更大規(guī)模設(shè)備間的分布式組網(wǎng)聯(lián)合訓(xùn)練。為此，浪潮為實(shí)驗(yàn)室設(shè)計(jì)并構(gòu)建了一套以AGX-5為核心的AI計(jì)算平臺(tái)，其單機(jī)訓(xùn)練效率相比以往訓(xùn)練集群實(shí)現(xiàn)了2-3倍的提升。

AGX-5是浪潮自研的新一代AI服務(wù)器，專(zhuān)為解決現(xiàn)代AI和深度學(xué)習(xí)需求的擴(kuò)展難題而設(shè)計(jì)，單機(jī)計(jì)算性能高達(dá)2 PetaFLOPS。AGX-5采用業(yè)界最先進(jìn)的AI計(jì)算芯片高速互聯(lián)架構(gòu)，可提供近乎線性的AI計(jì)算性能加速比。

實(shí)驗(yàn)室主任顏永紅表示：“在以前，我們的研究人員經(jīng)常需要花費(fèi)很多時(shí)間去等待計(jì)算資源，嚴(yán)重影響項(xiàng)目進(jìn)度。使用浪潮AGX-5計(jì)算平臺(tái)后，模型訓(xùn)練效率得到了很大的提升，開(kāi)發(fā)周期大幅縮短?？蒲腥藛T可以將更多精力放在項(xiàng)目本身，推動(dòng)了語(yǔ)言聲學(xué)研究和應(yīng)用落地的進(jìn)程?！?/p>

消息來(lái)源：浪潮