在即將過去的 2017 年,深度學習技術蓬勃發展,AlphaZero 從「零」開始在多種棋類競技上快速發展,DeepStack 與 Libratus 在德州撲克中擊敗人類高手,GAN 衍生出各種變體,語音合成從實驗室走向產品,Vicarious 提出全新概率生成模型並擊破人類的 CAPTCHA 驗證碼。這些令人振奮的進展將智能技術從實驗室帶到了產業及應用層面,「人工智慧」及「深度學習」等概念也進入了大眾視野並成為流行辭彙。
在過去幾年的報道工作中,我們看到深度學習引領的又一次人工智慧浪潮,同時也發現由於「AI Effect」的存在,有很多人忽略了深度學習之外的其它人工智慧技術,對人工智慧各種技術分類及基礎概念、技術的歷史進程和發展方向都缺乏成體系化的了解,導致對人工智慧技術的整體發展趨勢及「可用性」缺少宏觀認識,並在試圖採用人工智慧技術進行產業革新時走了很多彎路。
因此,機器之心推出《人工智慧技術趨勢報告》,旨在幫助讀者:
1)系統全面縱覽人工智慧(AI)的23個分支技術。
2)明晰人工智慧(AI)下各分支技術的歷史發展路徑,解讀現有瓶頸及未來發展趨勢。
3)分析人工智慧(AI)下各分支技術在產業中的實際應用情況,評估其在「研究」、「工程」、「應用」、「社會影響」這四個階段中所處位置,為計劃使用人工智慧技術的決策者提供決策參考。
4)為 AI 從業者提供技術趨勢參考;為產業方、初學者等提供系統性的技術學習資料。
報告內容如下:
目錄
1.0 引言
1.1 目的
1.2 背景
2.0 方法
2.1 階段
3.0 人工智慧中的技術
3.1 問題求解(搜索)
3.2 知識、推理與規劃
3.2.1 邏輯
3.2.2 規劃
3.2.3 知識表徵和推理
3.2.4 概率模型
3.3 學習
3.3.1 決策樹/決策規則學習
3.3.2 支持向量機
3.3.3 K-最近鄰
3.3.4 集成學習
3.3.5 回歸分析
3.3.6 神經網路
3.3.7 強化學習
3.3.8 聚類分析
3.3.9 關聯規則學習
3.3.10 推薦系統
3.4 通訊、感知與行動
3.4.1 信息檢索
3.4.2 文本挖掘/分類
3.4.3 信息抽取
3.4.4 機器翻譯
3.4.5 語音識別
3.4.6 計算機視覺
3.4.7 機器人
4.0 總結和影響
參考文獻
1.0 引言
1.1 目的
本報告的目的是縱覽人工智慧(AI)的分支技術,明晰它們的發展路徑,從而讓讀者能夠更加準確和全面地了解人工智慧研究領域的過去、現在和未來。
1.2 背景
人們很容易混淆人工智慧和機器學習(甚至深度學習),覺得它們是一樣的。這是一個很大的誤解。除了流行的神經網路模型之外,人工智慧的歷史可以追溯到1956年,在達特茅斯那場名為「達特茅斯人工智慧夏季研究項目(Dartmouth Summer Research Project on Artificial Intelligence)」的研討會上,「人工智慧(Artficial Intelligence)」(AI)這一術語被首次提出,人工智慧研究領域也就此形成。[1]
本報告所討論的「人工智慧」主要是指可以通過機器體現的智能(也叫做機器智能(Machine Intelligence))。在學術研究領域,就是指能夠感知周圍環境並採取行動以實現最優的可能結果的智能體(intelligent agent)[1]。
一般而言,人工智慧的長期目標是實現通用人工智慧(AGI),這被看作
是「強人工智慧(strong AI)」。在處理交叉領域問題時,AGI的表現會遠遠超過普通的機器,並且它還能同時處理多個任務。而弱人工智慧(weak AI,也被稱為「狹隘人工智慧(narrow AI)」)無法解決之前未見過的問題,而且其能力僅局限在特定的領域內。但是,人工智慧專家和科學家現在對 AGI 的確切定義仍然含混不清。區彆強人工智慧和弱人工智慧的常見方法是進行專業測試,比如咖啡測試、圖靈測試、機器人大學生測試和就業測試[28]。
本報告所討論的「技術(technology)」是一個廣泛的概念,包含了人工智慧領域所使用的方法、演算法和模型,我們將使用「技術」一詞指代這三者。
與人工智慧相關的工作可以追溯到 20 世紀 40 年代,那時候 Warren McCulloch 和 Walter Pitts 的研究表明可以通過互連的神經元網路執行計算,Donald Hebb 也演示了赫布學習(Hebbian learning) 。1956年,當「人工智慧(AI)」這一術語正式成型的時候,相應的研究也開始快速發展。那時候,人工智慧還主要被用於問題求解。儘管在 20 世紀 60 年代和 70 年代期間,神經網路緩慢的發展速度和有限的進展受到過批評,但專家系統的出現維持了人們對人工智慧的興趣和相關研究的增長。不久之後,在 20 世紀 80 年代,因為大多數人工智慧研究都無法實現它們原先過度的承諾,對人工智慧研究的資助也流向了其它領域,由此人工智慧學術研究步入了所謂的「人工智慧冬天(AI Winter)」[1]時期。幸運的是,聯結主義者重新發明的反向傳播將神經網路帶回了舞台。在 20 世紀 90 年代,研究者開始應用概率模型等更科學的方法;與此同時,支持向量機(SVM)在很多領域都超過並取代了神經網路。不久之後就進入了嶄新的21世紀,大數據的時代到來了,這幫助研究者開發了多種學習演算法,使得深度學習在近些年來得到了蓬勃發展。關注人工智慧研究的團隊越來越多,在專註人工智慧的頂級會議(比如 AAAI、IJCAI、AUAI 和 ECAI)上發表的論文也急劇增長。(專註於那些範圍更小的研究主題的會議將在第 3 節進行介紹。)
在第 2 節中,我們將介紹設置的研究方法和標準。在第 3 節中,我們將討論多種人工智慧技術。對於每種人工智慧技術,我們都確定了當前所處的發展階段並進行了詳細討論,並且還簡要概述了相應歷史或主要事件。此外,我們還將從各種角度分析每種技術的瓶頸和未來。本報告不包含技術細節,但提供了一般性的概述,並希望能根據發展歷史確定它們之間的關係。在第 4 節本報告的結尾,我們將討論人工智慧技術的一些影響和局限。
2.0 方法
我們研究的主要方法和信息來源是查閱文獻。對於我們覆蓋的每種技術,我們都參考了最新的文章、新聞和論文,以幫助確定當前所處的發展階段。此外,通過研究之前發表的文獻,我們也討論了與特定技術相關的主要事件。
除了定性地查閱文獻,我們也使用了一種量化方法來幫助讀者理解每種技術的普及程度和成長情況。我們分析了研究者的數量、期刊、出版物、會議、組織、知名獎項授予和對應的資助情況。我們也對適用的案例使用了谷歌趨勢工具來大概了解公眾對特定技術的認識情況。
2.1 階段
技術發展階段的分類學方法有很多,目前常用的是技術生命周期(Technology Life Cycles)方法,其中也包括「衰落」階段。但是,對於這份針對人工智慧技術的研究報告而言,我們沒有考慮「衰落」階段。我們認為儘管一種特定技術的發展可能會在某個時候停滯,但其發展(在科學進步方面看)不會退步;對技術「衰退」的引證通常是在商業角度上考量的。根據我們對[20][21][22][23]等多個信息來源的評估和分析,我們確定了人工智慧技術發展將會經歷的四個周期:研究、工程、應用和社會影響。這裡給出了每個階段的詳細定義,以作為未來詳細分析的範式:
註:實際上這裡涵蓋了很多技術的子類別,而我們將它們當作一個整體來確定它們的發展階段。一旦有特定的跡象說明一種技術已到達特定階段,那麼整個技術類別都將被置於該階段——儘管對該技術可能還有一些持續性的研究、工程或應用工作。
3.0 人工智慧中的技術
根據書籍、論文、博客、視頻和 MOOC(大型開放式網路課程)等介紹性材料,我們發現 Stuart J. Russell 和 Peter Norvig [1] 合著的經典教材《人工智慧:一種現代方法》最有幫助。根據這些材料,我們確定了 23 種不同的人工智慧技術並將它們分成了 4 大領域:
問題求解(搜索)
知識、推理與規劃
學習
通訊、感知與行動
我們根據這23種技術在人工智慧領域內的基本機制、方法和應用相似度進行了分類。這些分類並不是互斥的。你可以將它們看作是人類具有的能力,每種能力都有不同的功能,共同協作才能實現更高級更複雜的目標。