omniture

浪潮AI加速中國頂尖語言聲學(xué)研究 | 美通社

2020-09-03 11:58

浪潮AI服務(wù)器AGX-5

在中國科學(xué)院語言聲學(xué)與內(nèi)容理解重點實驗室,浪潮AGX-5支撐著數(shù)十項以音頻為核心的人工智能重大項目研究。相比原AI集群方案,AGX-5以強大的單機訓(xùn)練性能,將人工智能模型的整體訓(xùn)練速度提升了2-3倍。

該實驗室是我國語言聲學(xué)領(lǐng)域最大的國立研究機構(gòu)。經(jīng)過近20年發(fā)展,實驗室從最初的6人發(fā)展成為包含51名固定人員、總?cè)藬?shù)200余人的科研力量,被譽為“中國智能語音人才的搖籃”。

實驗室布局于音頻聽感知、語音識別和面向聲學(xué)應(yīng)用的大數(shù)據(jù)分析等研究方向,全方位覆蓋了以音頻為核心的媒體內(nèi)容理解研究內(nèi)容。目前,實驗室承擔(dān)著多項國家級和國際合作研究項目,如中科院戰(zhàn)略性先導(dǎo)專項“面向感知中國的新一代信息技術(shù)”媒體內(nèi)容項目、中日韓前瞻計劃A3項目“面向下一代互聯(lián)網(wǎng)的超臨場感聲通信應(yīng)用研究”、自然科學(xué)基金杰青項目“面向語音處理的言語聲學(xué)數(shù)字化建?!?、基金重大研究計劃重點支持項目“多人多方對話中的語音分離、內(nèi)容分析與理解”、聲學(xué)所率先行動計劃項目“以音頻驅(qū)動的媒體深度理解關(guān)鍵技術(shù)研究“等等,科研任務(wù)十分繁重。

目前,實驗室的部分研究成果已在多個領(lǐng)域得到應(yīng)用:在智能終端領(lǐng)域,推出了智能電視交互系統(tǒng);在互聯(lián)網(wǎng)領(lǐng)域,先后跟百度、騰訊和阿里巴巴進行了卓有成效的合作,推出了語音輸入、語音和音樂檢索、語音客服等應(yīng)用;在廣電領(lǐng)域,實驗室的連續(xù)語音識別引擎成為該行業(yè)主流企業(yè)的標配,被索貝、大洋集成到各自的媒資管理系統(tǒng)和多媒體信息檢索系統(tǒng),同時也被天脈聚源在其為電視臺提供新聞素材整理服務(wù)的云平臺中采用。

(美通社,2020年9月2日北京)