omniture

‘MMDAgent' 帶來與流行 3D 角色逼真對話的體驗

2010-09-25 10:40 7660

-- 語音互動系統(tǒng) “MMDAgent” 帶來與流行 3D 角色逼真對話的體驗

日本名古屋2010年9月25日電 /美通社亞洲/ -- 名古屋工業(yè)大學 (Nagoya Institute of Technology) 的語音處理實驗室 (Speech Processing Laboratory) 已經(jīng)打造出一款用于建立在個人電腦上運行的語音互動系統(tǒng)的軟件工具包 “MMDAgent” 。用 “MMDAgent” 建立的語音互動系統(tǒng)使得個人電腦用戶可以與顯示器上顯示的 3D(三維)人物角色對話,效果逼真,仿佛與真人聊天一樣。 “MMDAgent” 軟件工具包融合了語音識別、語音合成、 3D 角色顯示和語音交互控制等多項單元技術(shù)。其功能包括:

  1. “MMDAgent” 是自主開發(fā)的、先進的語音合成和語音識別技術(shù)的高水平整合。它由該實驗室經(jīng)過長時間開發(fā)并推出的語音合成工具包 HTS (基于隱馬爾可夫模型 (HMM) 的語音合成系統(tǒng))和具備高速、準確和極富表現(xiàn)力的對話能力的語音識別引擎 Julius 相結(jié)合。
  2. 該工具包擁有基于 OpenGL 的先進的 3D 描繪功能。它通過采用卡通描繪和陰影映射來實現(xiàn)真實的 3D 描繪,并利用一個物理引擎來達到呈現(xiàn)逼真表情的目的。
  3. 該工具包的語音互動控制部分可以使不懂專業(yè)知識的用戶應對各種內(nèi)部條件和外部環(huán)境(包括語音輸入等)的變化,描述出細膩豐富的語音對話場景。
  4. “MMDAgent” 預定作為開源軟件發(fā)布。由于其各種模型等的數(shù)據(jù)格式符合開源規(guī)格,用戶可以對人物角色的 3D模型、動作和聲音以及整個對話場景進行自定義,而且可以使用現(xiàn)有的模型和數(shù)據(jù)。

“MMDAgent” 將在2010年日本高新技術(shù)博覽會 (CEATEC Japan) (10月5日在幕張國際會展中心 (Makuhari Messe) 拉開帷幕)上亮相,該系統(tǒng)將被置入一個大的顯示屏,演示其用于實物大小的數(shù)字標牌的功能。在展會上,參觀者將能夠與流行的 3D 角色逼真對話。該語音處理實驗室作為一個專門的項目實驗室,致力于名古屋工業(yè)大學的國際語音語言處理研究, Tokuda & Lee Laboratory 在其中發(fā)揮主要作用。該實驗室一流的語音技術(shù)研究成果已經(jīng)以開源軟件的形式對外公布。

應用實例

  • 數(shù)字標牌
  • 娛樂
  • 服務臺引導系統(tǒng)
  • 宣傳

參考圖

  • 該系統(tǒng)的外觀(人物角色是“Mei-chan”,出現(xiàn)在名古屋工業(yè)大學校園信息導向系統(tǒng)的屏幕上)。
  • Crypton Future Media, Inc. 創(chuàng)造的人物角色“初音未來” (Miku Hatsune) ,顯示在執(zhí)行屏幕上。

(圖片: http://photos.prnewswire.com/prnh/20100924/NY69879LOGO )

(圖片: http://www.newscom.com/cgi-bin/prnh/20100924/NY69879LOGO )

更多詳情,請聯(lián)系:

名古屋工業(yè)大學的語音處理實驗室
地址:Gokiso-chou,Shouwa-ku,Nagoya city,Japan
電郵:uratec@sp.nitech.ac.jp
電話:+81-052-735-7549

消息來源:名古屋工業(yè)大學
China-PRNewsire-300-300.png
美通社頭條
微信公眾號“美通社頭條”發(fā)布新鮮、有趣、重要的企業(yè)與機構(gòu)新聞,由全球領(lǐng)先的企業(yè)新聞專線美通社(PR Newswire)為您呈現(xiàn)。掃描二維碼,立即訂閱!
關(guān)鍵詞: 教育
collection