CCAI 2017 | 小數(shù)據(jù)學(xué)習(xí)對人工智能究竟有著怎樣的影響？

2017-07-04 12:13

近幾年來，得益于大數(shù)據(jù)的積累、計(jì)算能力的提升，深度學(xué)習(xí)從學(xué)術(shù)到工程領(lǐng)域均取得了非常顯著的發(fā)展與突破，尤其是諸如圖像識(shí)別、語音識(shí)別等實(shí)際場景應(yīng)用。但是，依賴于海量的訓(xùn)練數(shù)據(jù)、靈活的模型、足夠的運(yùn)算能力以及足以對抗維度災(zāi)難的先驗(yàn)經(jīng)驗(yàn)，從很大程度上來講妨礙了深度學(xué)習(xí)技術(shù)更為廣泛的運(yùn)用。為此，在全球范圍內(nèi)，眾多人工智能領(lǐng)域的學(xué)術(shù)大師及業(yè)界專家上下求索，也由此催生了小數(shù)據(jù)學(xué)習(xí)（Learning from limited information），通過更少的數(shù)據(jù)以及更確定的方法讓 AI 學(xué)習(xí)更加高效。

然而什么是小數(shù)據(jù)？機(jī)器怎樣從小數(shù)據(jù)中學(xué)習(xí)？小數(shù)據(jù)學(xué)習(xí)將從哪些方面改變?nèi)斯ぶ悄艿难芯颗c應(yīng)用？在即將于 7 月 22 - 23 日舉行的中國人工智能大會(huì)（CCAI2017）上，特別邀請到日本理化學(xué)研究所先進(jìn)智能研究中心主任 Masashi Sugiyama，現(xiàn)場為所有參會(huì)者一解小數(shù)據(jù)學(xué)習(xí)之惑，并分享其團(tuán)隊(duì)在監(jiān)督弱化分類方面的最新研究進(jìn)展。在會(huì)前，CSDN 記者特別采訪了 Masashi Sugiyama 教授，接下來，讓我們一起先睹為快。

Masashi Sugiyama 是日本理化學(xué)研究所先進(jìn)智能項(xiàng)目組主任（ Director of RIKEN Advanced Intelligence Project）。RIKEN 成立于 1917 年，是日本最大的綜合研究機(jī)構(gòu)，其中，由 Masashi Sugiyama 領(lǐng)導(dǎo)的先進(jìn)智能項(xiàng)目組成立于 2016 年，主要著眼于研發(fā)下一代 AI 技術(shù)，如小數(shù)據(jù)學(xué)習(xí)、因果推理（Causal inference）、不確定性學(xué)習(xí)（Learning with uncertainty）以及假設(shè)檢驗(yàn)等，同時(shí)，還有加速醫(yī)學(xué)、材料科學(xué)、制造業(yè)的科研進(jìn)程，解決基礎(chǔ)設(shè)施管理、社會(huì)抗災(zāi)能力、老年醫(yī)療保健等社會(huì)問題。而 Masashi Sugiyama 教授本人的研究領(lǐng)域則包括機(jī)器學(xué)習(xí)的理論和算法（如協(xié)變量適應(yīng)、密度比預(yù)估和強(qiáng)化學(xué)習(xí)等），及其在實(shí)際問題中的應(yīng)用。

CSDN：什么是小數(shù)據(jù)學(xué)習(xí)？為什么要使用小數(shù)據(jù)學(xué)習(xí)？如何實(shí)現(xiàn)？

Masashi Sugiyama：雖然現(xiàn)在大數(shù)據(jù)學(xué)習(xí)仍是主流，但在很多應(yīng)用領(lǐng)域，收集到足夠機(jī)器用來學(xué)習(xí)的龐大的數(shù)據(jù)是非常昂貴的。在這種情況下，使用小數(shù)據(jù)進(jìn)行學(xué)習(xí)是一個(gè)理想的解決方式。但也有它的弊端，因?yàn)楫?dāng)進(jìn)行小數(shù)據(jù)學(xué)習(xí)時(shí)，我們需要目標(biāo)領(lǐng)域中強(qiáng)大的先驗(yàn)知識(shí)作為支撐，過多先驗(yàn)知識(shí)的介入意味著犧牲掉機(jī)器學(xué)習(xí)的靈活性。所以使用有限信息進(jìn)行學(xué)習(xí)的精髓在于，使用領(lǐng)域知識(shí)之外的相對便宜的數(shù)據(jù)進(jìn)行學(xué)習(xí)。

CSDN：若小數(shù)據(jù)學(xué)習(xí)能夠成功，將對哪些 AI 領(lǐng)域造成改變，進(jìn)而對哪些行業(yè)產(chǎn)生影響？

Masashi Sugiyama：利用小數(shù)據(jù)進(jìn)行學(xué)習(xí)是大數(shù)據(jù)學(xué)習(xí)的母集，所以說它一方面可以解決大數(shù)據(jù)學(xué)習(xí)不能解決的問題，另一方面在大數(shù)據(jù)學(xué)習(xí)已經(jīng)得以應(yīng)用的領(lǐng)域也能有所發(fā)揮，因?yàn)槭褂眯?shù)據(jù)學(xué)習(xí)能夠在避免使用昂貴數(shù)據(jù)的同時(shí)達(dá)到更優(yōu)的效果。

CSDN：您和您的團(tuán)隊(duì)在小數(shù)據(jù)學(xué)習(xí)方面已經(jīng)取得了哪些進(jìn)展？

Masashi Sugiyama：多樣性對于小數(shù)據(jù)學(xué)習(xí)至關(guān)重要，因?yàn)閷τ诓煌膽?yīng)用場景，收集數(shù)據(jù)的局限性是不同的。我們正在研發(fā)一種通用的算法使其解決機(jī)器學(xué)習(xí)過程中的不同問題，例如將很多不同種類的未標(biāo)注數(shù)據(jù)集進(jìn)行分類、將標(biāo)注與未標(biāo)注數(shù)據(jù)進(jìn)行分類、半監(jiān)督學(xué)習(xí)中的分類問題、充分標(biāo)注的數(shù)據(jù)的分類問題等。

CSDN：日本的科研機(jī)構(gòu)更傾向于哪些 AI 技術(shù)及應(yīng)用的研究？哪些 AI 應(yīng)用在日本已經(jīng)落地？

Masashi Sugiyama：日本的機(jī)器學(xué)習(xí)研究人員更多地關(guān)注基礎(chǔ)研究，當(dāng)然，同時(shí)也會(huì)有一些人在科學(xué)及工程領(lǐng)域從事應(yīng)用科學(xué)相關(guān)的研究工作。在基礎(chǔ)研究與應(yīng)用之間存在很大的鴻溝，如何搭建鴻溝上的橋梁至關(guān)重要。所幸，這些建橋的工作在一些領(lǐng)域已經(jīng)逐漸展開，例如對癌癥及老年癡呆的研究、再生醫(yī)學(xué)、制造業(yè)、基礎(chǔ)設(shè)施管理以及抗災(zāi)能力提升的研究等方面。

CSDN：您認(rèn)為當(dāng)前 AI 技術(shù)發(fā)展的瓶頸在哪兒？并請展望 AI 未來的發(fā)展方向。

Masashi Sugiyama：私密性、安全性、以及倫理問題會(huì)成為人工智能系統(tǒng)發(fā)展的瓶頸。在 AI 技術(shù)發(fā)展之外，如何分析及管理 AI 可能帶來的社會(huì)問題也是需要重視的方面。

CSDN：在本屆 CCAI 現(xiàn)場，您將帶來的演講主要關(guān)于哪些方面？希望觀眾從中收獲怎樣的啟發(fā)？

Masashi Sugiyama：我的演講題目是《弱監(jiān)督學(xué)習(xí)的最新研究進(jìn)展》，在演講中我將介紹我們對于弱監(jiān)督學(xué)習(xí)下的分類問題的研究成果，包括將兩種類別的無標(biāo)簽數(shù)據(jù)進(jìn)行分類、將有標(biāo)簽與無標(biāo)簽數(shù)據(jù)進(jìn)行分類、一個(gè)對于半監(jiān)督分類問題的通用方法、以及對于有標(biāo)簽數(shù)據(jù)的分類。最后，我將簡單介紹日本理化學(xué)研究所先進(jìn)智能項(xiàng)目組（RIKEN AIP）。

關(guān)于 CCAI

中國人工智能大會(huì)（CCAI），由中國人工智能學(xué)會(huì)發(fā)起，目前已成功舉辦兩屆，是中國國內(nèi)級(jí)別最高、規(guī)模最大的人工智能大會(huì)。秉承前兩屆大會(huì)宗旨，由中國人工智能學(xué)會(huì)、阿里巴巴集團(tuán) & 螞蟻金服主辦，CSDN、中國科學(xué)院自動(dòng)化研究所承辦的第三屆中國人工智能大會(huì)（CCAI 2017）將于 7 月 22-23 日在杭州召開。

作為中國國內(nèi)高規(guī)格、規(guī)模空前的人工智能大會(huì)，本次大會(huì)由中國科學(xué)院院士、中國人工智能學(xué)會(huì)副理事長譚鐵牛，阿里巴巴技術(shù)委員會(huì)主席王堅(jiān)，香港科技大學(xué)計(jì)算機(jī)系主任、AAAI Fellow 楊強(qiáng)，螞蟻金服副總裁、首席數(shù)據(jù)科學(xué)家漆遠(yuǎn)，南京大學(xué)教授、AAAI Fellow 周志華共同甄選出在人工智能領(lǐng)域本年度海內(nèi)外最值得關(guān)注的學(xué)術(shù)與研發(fā)進(jìn)展，匯聚了超過 40 位頂級(jí)人工智能專家，帶來 9 場權(quán)威主題報(bào)告，以及“語言智能與應(yīng)用論壇”、“智能金融論壇”、“人工智能科學(xué)與藝術(shù)論壇”、“人工智能青年論壇”4 大專題論壇，屆時(shí)將有超過 2000 位人工智能專業(yè)人士參與。

目前，大會(huì) 8 折優(yōu)惠門票正在火熱發(fā)售中，掃描下方圖片中的二維碼或直接點(diǎn)擊鏈接火速搶票。