近幾年來,得益于大數(shù)據(jù)的積累、計算能力的提升,深度學習從學術(shù)到工程領域均取得了非常顯著的發(fā)展與突破,尤其是諸如圖像識別、語音識別等實際場景應用。但是,依賴于海量的訓練數(shù)據(jù)、靈活的模型、足夠的運算能力以及足以對抗維度災難的先驗經(jīng)驗,從很大程度上來講妨礙了深度學習技術(shù)更為廣泛的運用。為此,在全球范圍內(nèi),眾多人工智能領域的學術(shù)大師及業(yè)界專家上下求索,也由此催生了小數(shù)據(jù)學習(Learning from limited information),通過更少的數(shù)據(jù)以及更確定的方法讓 AI 學習更加高效。
然而什么是小數(shù)據(jù)?機器怎樣從小數(shù)據(jù)中學習?小數(shù)據(jù)學習將從哪些方面改變?nèi)斯ぶ悄艿难芯颗c應用?在即將于 7 月 22 - 23 日舉行的中國人工智能大會(CCAI2017)上,特別邀請到日本理化學研究所先進智能研究中心主任 Masashi Sugiyama,現(xiàn)場為所有參會者一解小數(shù)據(jù)學習之惑,并分享其團隊在監(jiān)督弱化分類方面的最新研究進展。在會前,CSDN 記者特別采訪了 Masashi Sugiyama 教授,接下來,讓我們一起先睹為快。
Masashi Sugiyama 是日本理化學研究所先進智能項目組主任( Director of RIKEN Advanced Intelligence Project)。RIKEN 成立于 1917 年,是日本最大的綜合研究機構(gòu),其中,由 Masashi Sugiyama 領導的先進智能項目組成立于 2016 年,主要著眼于研發(fā)下一代 AI 技術(shù),如小數(shù)據(jù)學習、因果推理(Causal inference)、不確定性學習(Learning with uncertainty)以及假設檢驗等,同時,還有加速醫(yī)學、材料科學、制造業(yè)的科研進程,解決基礎設施管理、社會抗災能力、老年醫(yī)療保健等社會問題。而 Masashi Sugiyama 教授本人的研究領域則包括機器學習的理論和算法(如協(xié)變量適應、密度比預估和強化學習等),及其在實際問題中的應用。
CSDN:什么是小數(shù)據(jù)學習?為什么要使用小數(shù)據(jù)學習?如何實現(xiàn)?
Masashi Sugiyama:雖然現(xiàn)在大數(shù)據(jù)學習仍是主流,但在很多應用領域,收集到足夠機器用來學習的龐大的數(shù)據(jù)是非常昂貴的。在這種情況下,使用小數(shù)據(jù)進行學習是一個理想的解決方式。但也有它的弊端,因為當進行小數(shù)據(jù)學習時,我們需要目標領域中強大的先驗知識作為支撐,過多先驗知識的介入意味著犧牲掉機器學習的靈活性。所以使用有限信息進行學習的精髓在于,使用領域知識之外的相對便宜的數(shù)據(jù)進行學習。
CSDN:若小數(shù)據(jù)學習能夠成功,將對哪些 AI 領域造成改變,進而對哪些行業(yè)產(chǎn)生影響?
Masashi Sugiyama:利用小數(shù)據(jù)進行學習是大數(shù)據(jù)學習的母集,所以說它一方面可以解決大數(shù)據(jù)學習不能解決的問題,另一方面在大數(shù)據(jù)學習已經(jīng)得以應用的領域也能有所發(fā)揮,因為使用小數(shù)據(jù)學習能夠在避免使用昂貴數(shù)據(jù)的同時達到更優(yōu)的效果。
CSDN:您和您的團隊在小數(shù)據(jù)學習方面已經(jīng)取得了哪些進展?
Masashi Sugiyama:多樣性對于小數(shù)據(jù)學習至關重要,因為對于不同的應用場景,收集數(shù)據(jù)的局限性是不同的。我們正在研發(fā)一種通用的算法使其解決機器學習過程中的不同問題,例如將很多不同種類的未標注數(shù)據(jù)集進行分類、將標注與未標注數(shù)據(jù)進行分類、半監(jiān)督學習中的分類問題、充分標注的數(shù)據(jù)的分類問題等。
CSDN:日本的科研機構(gòu)更傾向于哪些 AI 技術(shù)及應用的研究?哪些 AI 應用在日本已經(jīng)落地?
Masashi Sugiyama:日本的機器學習研究人員更多地關注基礎研究,當然,同時也會有一些人在科學及工程領域從事應用科學相關的研究工作。在基礎研究與應用之間存在很大的鴻溝,如何搭建鴻溝上的橋梁至關重要。所幸,這些建橋的工作在一些領域已經(jīng)逐漸展開,例如對癌癥及老年癡呆的研究、再生醫(yī)學、制造業(yè)、基礎設施管理以及抗災能力提升的研究等方面。
CSDN:您認為當前 AI 技術(shù)發(fā)展的瓶頸在哪兒?并請展望 AI 未來的發(fā)展方向。
Masashi Sugiyama:私密性、安全性、以及倫理問題會成為人工智能系統(tǒng)發(fā)展的瓶頸。在 AI 技術(shù)發(fā)展之外,如何分析及管理 AI 可能帶來的社會問題也是需要重視的方面。
CSDN:在本屆 CCAI 現(xiàn)場,您將帶來的演講主要關于哪些方面?希望觀眾從中收獲怎樣的啟發(fā)?
Masashi Sugiyama:我的演講題目是《弱監(jiān)督學習的最新研究進展》,在演講中我將介紹我們對于弱監(jiān)督學習下的分類問題的研究成果,包括將兩種類別的無標簽數(shù)據(jù)進行分類、將有標簽與無標簽數(shù)據(jù)進行分類、一個對于半監(jiān)督分類問題的通用方法、以及對于有標簽數(shù)據(jù)的分類。最后,我將簡單介紹日本理化學研究所先進智能項目組(RIKEN AIP)。
關于 CCAI
中國人工智能大會(CCAI),由中國人工智能學會發(fā)起,目前已成功舉辦兩屆,是中國國內(nèi)級別最高、規(guī)模最大的人工智能大會。秉承前兩屆大會宗旨,由中國人工智能學會、阿里巴巴集團 & 螞蟻金服主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智能大會(CCAI 2017)將于 7 月 22-23 日在杭州召開。
作為中國國內(nèi)高規(guī)格、規(guī)??涨暗娜斯ぶ悄艽髸?,本次大會由中國科學院院士、中國人工智能學會副理事長譚鐵牛,阿里巴巴技術(shù)委員會主席王堅,香港科技大學計算機系主任、AAAI Fellow 楊強,螞蟻金服副總裁、首席數(shù)據(jù)科學家漆遠,南京大學教授、AAAI Fellow 周志華共同甄選出在人工智能領域本年度海內(nèi)外最值得關注的學術(shù)與研發(fā)進展,匯聚了超過 40 位頂級人工智能專家,帶來 9 場權(quán)威主題報告,以及“語言智能與應用論壇”、“智能金融論壇”、“人工智能科學與藝術(shù)論壇”、“人工智能青年論壇”4 大專題論壇,屆時將有超過 2000 位人工智能專業(yè)人士參與。
目前,大會 8 折優(yōu)惠門票正在火熱發(fā)售中,掃描下方圖片中的二維碼或直接點擊鏈接火速搶票。