omniture

微軟為ASC18世界超算競(jìng)賽出題,機(jī)器閱讀理解將被挑戰(zhàn)

2018-02-05 19:27 8895

北京2018年2月5日電 /美通社/ -- 1月30日,由亞洲超算協(xié)會(huì)和浪潮集團(tuán)聯(lián)合發(fā)起的ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競(jìng)賽在京正式啟動(dòng)18賽季(ASC18)。參加ASC18超算競(jìng)賽的全球300多支隊(duì)伍,將在接下來(lái)的幾個(gè)月里,挑戰(zhàn)一項(xiàng)由微軟出具的極具挑戰(zhàn)性的人工智能賽題——機(jī)器閱讀理解。ASC18各參賽隊(duì)將使用CNTK深度學(xué)習(xí)框架,獨(dú)立開發(fā)機(jī)器閱讀理解和問(wèn)答的算法模型,使用最新超算技術(shù)結(jié)合MS MARCO數(shù)據(jù)集進(jìn)行訓(xùn)練,以試圖讓機(jī)器更準(zhǔn)確地回答問(wèn)題。

讓機(jī)器具備自然語(yǔ)言的閱讀理解與問(wèn)答能力,是人工智能的核心難題之一,也是目前智能語(yǔ)音交互和人機(jī)對(duì)話的核心難題。一般來(lái)說(shuō),人們?cè)谧x完一篇文章之后能夠很輕而易舉地歸納出文章中的重點(diǎn)內(nèi)容,例如這篇文章講的是什么人、在什么地點(diǎn)、做了什么事情等。機(jī)器閱讀理解的研究就是賦予計(jì)算機(jī)與人類同等的閱讀能力,即讓計(jì)算機(jī)閱讀一篇文章,隨后讓計(jì)算機(jī)解答與文中信息相關(guān)的問(wèn)題。這種對(duì)人類而言輕而易舉的能力,對(duì)計(jì)算機(jī)來(lái)說(shuō)卻并非如此。很長(zhǎng)一段時(shí)間以來(lái),自然語(yǔ)言處理的研究都是基于句子級(jí)別的閱讀理解。例如給計(jì)算機(jī)一句話,理解句子中的主謂賓、定狀補(bǔ),誰(shuí)做了何事等,但長(zhǎng)文本的理解問(wèn)題一直是研究的一個(gè)難點(diǎn),因?yàn)檫@涉及到句子之間的連貫、上下文和推理等更高維的研究?jī)?nèi)容。

現(xiàn)在,包括微軟、卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)在內(nèi)的頂級(jí)人工智能專家和學(xué)者們正在研究這項(xiàng)復(fù)雜的任務(wù),這一目標(biāo)若能實(shí)現(xiàn),將意味著當(dāng)前的弱人工智能向強(qiáng)人工智能邁進(jìn)了一大步。在前不久的由斯坦福大學(xué)發(fā)起的SQuAD(Stanford Question Answering Dataset)文本理解挑戰(zhàn)賽的最新榜單上,微軟亞洲研究院自然語(yǔ)言計(jì)算組于2018年1月3日提交的R-NET模型在EM值(Exact Match, 表示預(yù)測(cè)答案和真實(shí)答案完全匹配)上以82.650的較高分領(lǐng)先,并率先超越人類分?jǐn)?shù)82.304。

而從ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競(jìng)賽已經(jīng)發(fā)布的ASC18賽題可以看到,此次比賽采用的是一個(gè)更具難度的機(jī)器閱讀理解與問(wèn)答數(shù)據(jù)集——微軟MS MARCO。這個(gè)數(shù)據(jù)集是基于Bing和Cortana上收集的真實(shí)數(shù)據(jù)構(gòu)建的,包括10萬(wàn)個(gè)問(wèn)題,100萬(wàn)個(gè)段落,以及超過(guò)20萬(wàn)個(gè)文件的鏈接。此次ASC18競(jìng)賽的初賽階段,微軟將提供該數(shù)據(jù)集中的部分?jǐn)?shù)據(jù)供訓(xùn)練模型使用。而在決賽階段,微軟將提供一個(gè)全新的測(cè)試集來(lái)供選手們挑戰(zhàn)。同時(shí)為了更好的讓大學(xué)生入手和了解該賽題,微軟也同時(shí)提供基于CNTK的基準(zhǔn)代碼和相關(guān)論文作為參考。

此次ASC18人工智能賽題評(píng)判標(biāo)準(zhǔn)是基于各參賽隊(duì)訓(xùn)練模型的機(jī)器閱讀理解回答預(yù)測(cè)的準(zhǔn)確率,這就要求隊(duì)員們盡快學(xué)習(xí)掌握機(jī)器閱讀理解與問(wèn)答的算法特點(diǎn),并熟練應(yīng)用CNTK深度學(xué)習(xí)框架。由于賽題的數(shù)據(jù)集規(guī)模較大,如何充分發(fā)掘利用超算硬件的計(jì)算潛力也成為贏得比賽的關(guān)鍵。這次ASC18的人工智能賽題要求參賽隊(duì)伍自己動(dòng)手開發(fā)機(jī)器閱讀理解的算法模型,運(yùn)用最新超算技術(shù)來(lái)加速訓(xùn)練速度及提高精度,更要用真實(shí)的問(wèn)題數(shù)據(jù)集來(lái)驗(yàn)證模型訓(xùn)練的成果,這對(duì)處于本科階段的大學(xué)生參賽選手來(lái)說(shuō),無(wú)疑是一次“超級(jí)挑戰(zhàn)”。

ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競(jìng)賽(ASC Student Supercomputer Challenge)是由亞洲超算協(xié)會(huì)和浪潮集團(tuán)聯(lián)合發(fā)起的世界較大規(guī)模的大學(xué)生超算競(jìng)賽,發(fā)韌于2012年,經(jīng)過(guò)7年發(fā)展,影響力不斷攀升。迄今為止,ASC 競(jìng)賽已吸引到全球超過(guò) 5500 名年輕人才參與,參賽隊(duì)伍總數(shù)超過(guò)1100支。

消息來(lái)源:浪潮集團(tuán)
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection