摘要:我們距離通用人工智能還有多遠? 這是一個很多人都在試圖回答的問題。 然而對於人工智能領域的真正從業者來說,我們面前的道路還很長。 Rethink
Robotics創始人,前MITCSAIL主任RodneyB
我們距離通用人工智能還有多遠? 這是一個很多人都在試圖回答的問題。 然而對於人工智能領域的真正從業者來說,我們面前的道路還很長。 Rethink
Robotics 創始人,前 MIT CSAIL 主任 Rodney Brooks 近日撰文對人工智能的起源和發展進行了簡要介紹,並對 AI
的未來進行了展望。 Brooks 指出:在人工智能領域裡,我們現在甚至連起步都算不上。Yann LeCun 對此評論道:「很棒的文章!…… 我們還很難向非專業人士解釋通用人工智能(AGI)『還沒有做出成果』,而以AGI 命名的大多數事物都具有高度投機 性,這些戲劇性的問題有時會顯得天真、自我欺騙、瘋狂或具有欺騙性。」
凡是過往,皆為序章。
莎士比亞在《暴風雨》中藉安東尼奧說出這句話時,人們對此有兩種解釋。
一種解釋是,過去決定後續將要發生的事。 我相信,我們在人工智能領域的現狀將決定我們接下來的方向。 所以,研究過去是值得的。
另一種解釋是,過往其實並不重要,大部分重要的事情都在接下來的未來發生。 我也相信這種解釋。 在人工智能領域我們甚至連起步都算不上,未來還有很多艱難工作要做。
早期
業內普遍認為,人工智能一詞是
John McCarthy 在 1956 年達特茅斯會議上一份提案中提出的。 按照順序,作者依次是達特茅斯學院的 John
McCarthy、哈佛大學的 Marvin Minsky、IBM 的 Nathaniel Rochester 以及貝爾實驗室的 Claude
Shannon。 之後,除了 Rochester,其他三位作者都在 MIT 擔任教職,McCarthy 在 60 年代初離開,去了斯坦福大學。 這份
19 頁的提案有 1 頁標題頁、6 頁導言,然後是每個作者提議的研究。 據推測,McCarthy 寫了前面 6 頁,包括 Rockefeller
Foundation 提供的覆蓋 10 個研究員的資金預算。
該提案的標題是 A PROPOSAL FOR THE DARTMOUTH SUMMER RESEARCH PROJECT ON ARTIFICIAL INTELLIGENCE。 提案第一段有一句話提到了「智能」:
該研究基於這種猜想:學習的每個方向或者智能的任意特徵理論上都能被準確描述,且能製造出一種機器來模仿它。
第二段第一句也提及:
以下是人工智能問題的一些方面:
就是這樣! 沒有對人類智能的描述,沒有說明機器能否做到(即「實現智能」),也沒有大張旗鼓地介紹「人工智能」這一術語(artificial intelligence,所有字母均為小寫)。
上述文件還有另外四頁,作者是
Allen Newell 和 Herb Simon,他們在文件中介紹了自己的研究貢獻。 文件日期為 1956 年 3 月 6
日,當時他們分別在蘭德公司和卡內基技術學院(後來都成為卡內基梅隆大學舉足輕重的人物)。 他們表示自己在復雜信息處理領域進行了一系列的嘗試,「這一活動的很大一部分屬於人工智能的範疇」。 「人工智能」一詞似乎很容易也很快就被採用,而無需任何正式定義。
McCarthy 的導言及六位實名參與者的研究綱要不乏雄心壯志。
現有計算機的速度和存儲容量可能不足以模擬人腦的許多高級功能,但主要的障礙不是機器能力不足,而是我們無法充分利用現有資源編寫程序。
McCarthy
在導言中概述的一些人工智能主題包括:如何讓計算機使用人類語言;如何設計「神經元網絡」(神經元網絡是在 1943
年發明的,距離如今的技術精英首次聽說這一概念並過分激動的時間點也沒差多少)以便使其形成概念;機器如何自行改進(即學習或進化);機器如何使用其傳感器形成抽象 ,以觀察世界;如何使計算機創造性地思考。 Shannon、Minsky、Rochester
和 McCarthy 的個人研究提案對這些主題進行了擴展。 Newell 和 Simon
的補充內容也加了進來,包含機器象棋(包括通過學習)、數學定理證明,及發展關於機器如何學習、機器如何解決人類能夠解決的問題的相關理論。
他們不乏雄心壯志! 要知道當時世界上只有少數幾台數字計算機,而且沒有一台計算機可以提供超過幾十 KB 的內存來運行程序和數據,而且只有穿孔卡片或紙帶用於長期存儲。
當然,McCarthy
並不是第一個討論機器和「智能」的人,其實在此之前,艾倫·圖靈就已撰寫並發表過相關文章,但並未將其命名為「人工智能」。 他最著名的研究是《計算機器與智能》(Computing
Machinery and Intelligence),出版於 1950 年 10 月。 在這篇論文中,他介紹了「模仿遊戲(Imitation
Game)」,這種遊戲後來被稱為「圖靈測試」(Turing Test),即讓一個人判斷通過即時通訊(1950
版本)與他交談的實體是個人還是計算機。 圖靈估計,到 2000 年,一台擁有 128MB 內存的計算機將有 70% 的可能性騙過人類。
雖然論文的標題包含了「智能」一詞,但在論文主體中這個詞僅被使用了一次(而「機器」一詞至少出現了
207 次),它指的是嘗試構建模仿成年人的機器的人類智能。 他的目的很清晰。 他相信製造可以像人一樣思考的機器是可能的,到 2000
年就可以實現。 他甚至估計了需要多少個程序員(他的答案是 60 個,工作 50 年,所以僅僅相當於 3000
個程序員年。 按今天的軟件系統標準來看,這個數字太小了)。
再稍早一點,1948 年,一篇名為《Intelligent
Machinery》的論文誕生,不過這篇論文直到 1970
年才發表,此時作者圖靈已去世多年。 圖靈在論文中概述了「離散控制機」(我們今天稱之為計算機)的本質,他在 1937
年的一篇論文中提出了數字計算機。 然後他轉向研究製造完全模仿人類的機器,他認為人類大腦的功能太強大以至於不能被限制在機器的運動感知部分中,必須實現遠程操作。 他指出當時的傳感器和運動系統可能無法實現這一目標,因此他的結論是,探索智能的最好開端是遊戲和密碼學,並至少擴展到語言翻譯和數學上。
這又是不乏雄心但被當時技術狀況限制的案例。
AI 最初的靈感來源就是人類表現和人類智能,我認為這個目標已經吸引了大量研究者長時間致力於該領域。 實際上,我們還沒有任何能接近這些目標的研究成果,這不是研究社區的問題,而是目標太過艱難。
我在
1991 年寫了一篇長論文《Intelligence without
Reason》,介紹了人工智能的早期起源與歷史。 這篇博客嘗試補充細節,向新一代提供對人工智能這項長期工程的理解。 對於很多人來說,這項工作非常新穎、令人振奮,但對於其他人來說,只有振奮。
發展至今
在 AI 的早期階段,將傳感器連接到數字計算機及讓計算機控制驅動器的方式非常有限。
在
20 世紀 60
年代早期,想要運行計算機視覺算法的人們需要取出膠片中的照片,將它們打印出來,然後貼到一個滾筒上,讓滾筒對著一個光亮度傳感器旋轉、上下移動,以將照片轉換為一個明暗 度數組。 在
70 年代末,利用 20 到 30 磅重的設備,花費成千上萬美元,研究者才能直接從照相機的照片轉換成計算機上的數字照片。 直到 80
年代,這項技術才變得簡單和廉價。
其它模態的傳感器技術的發展也經歷了相似的過程,此外還有將計算機程序是輸出結果轉換到現實世界物理操作的技術。
因此,正如圖靈所推論的,人工智能的早期研究都轉向了很少需要傳感或操作的領域。 當時有在遊戲上的研究,利用鍵盤和打印機,人類動作輸入和計算機輸出可以輕易獲取。 進而可以研究數學練習例如將微積分應用到符號代數,或用邏輯證明定理,以及理解打字英語句子等。
編寫可以玩遊戲的程序很快衍生了「樹搜索」的思想,它是上述其它領域的早期
AI
實驗的關鍵,並且實際上,它已經成為瞭如今的計算機科學的基礎工具。 在不久之前,玩遊戲還提供了探索機器學習並開發特定變體的機會,例如,強化學習正是
AlphaGo 程序取得成功的核心方法。
在很久之前,人們開發了一個積木世界項目,在其中可以探索所有類型的智能問題。 1963 年 Larry Roberts 在 MIT 的發表的論文(可能是第一篇計算機視覺的 PhD 論文)展示了這樣的結果,在精心設計的光照場景中,積木的所有邊緣和表面都可以復原。
該論文驗證了用積木來研究複雜問題的可行性,其中積木的邊緣和位置的描述是程序的輸入,在原則上可以求解這些問題的感知部分。 之後人們將積木世界看成是感知和動作的模擬世界,並在數十年內將其作為主要的測試平台。
有些人研究二維積木世界中用虛擬機器人控制積木的問題,其中機器人可以對積木進行抓取、堆疊操作,或將其放在一維桌面上。
其它研究還包括僅從輸入線(包括陰影等)恢復潛在三維積木的幾何結構,為未來開發更完整的計算機視覺系統鋪平了道路。
此外,仍然有其他人研究複雜的自然語言理解問題,所有這些問題都是在復雜的三維積木世界中求解的。
沒有人研究這些積木世界是出於野心,而是因為使用這些工具,他們能夠在對人類級別智能非常重要的問題上取得進展。 同時他們認為離這個目標還很遙遠。
久而久之,AI
的子領域可能會發展成為人們深入理解特定子問題的方法。 不久以後,會有大量新研究出現,沒人能夠掌握 AI
研究的廣泛覆蓋範圍。 這些子領域包括規劃、問題求解、知識表徵、自然語言處理、搜索、博弈、專家系統、神經網絡、機器推斷、統計機器學習、機器人、移動機器人、同時定位與地圖創建、計算機視覺、圖像理解等 。
研究社區
通常,當很多研究人員發現一組需要解決的共同問題,他們就會從主流研究中走出來,並設立他們自己的期刊和會議,而那些論文審稿人通常都是在特定問題上有非常深 的見解。
20
世紀 80 年代末和 90 年代初,我參與了兩個這樣的團隊,即 Artificial Life 和 Simulation of
Adaptive
Behavior,它們現在仍然存在。 第一個關注混亂中秩序的基本機制,包括進化過程。 而第二個研究如何通過感知、動作和計算之間的交互來模擬動物的行為。 這些研究團隊和他們的學術期刊目前仍然很活躍。
以下是從 1993 到 2014 年發布的部分 Artificial Life 學術期刊,它目前仍然由 MIT 出版社在線發布。
Artificial Life 上面還有其它期刊,且自 1989 年以來,該研究社區都會有國際研討會。 以下是 1992 年到 2013 年發布的 Adaptive Behavior 期刊,它目前仍然由 Sage 在線發布。
目前 SAB(Simulation of Adaptive Behavior)仍然有一系列重要會議,且論文現在都通過在線處理。
Artificial
Life 會議今年 7 月份將在東京舉行,而 SAB 今年八月將在法蘭克福舉行,每一個會議都會吸引數百名研究者。 上述期刊每一個都有 20
多卷,每卷都有 4 期,因此總共有接近 100 期,且每一期大概有 4 到 10 篇論文。 這些社區非常有活力,Artificial Life
社區在開發遺傳算法上同樣對工程有很大的影響,這些遺傳算法通常都用於數值計算與應用。
但是 Artificial Life 和 Simulation of Adaptive Behavior 社區都沒有實現它們最初的目標。
我們仍然不知道生命系統如何從非生命系統中演化出來,事實上我們甚至對生命本身都沒有確切的定義。 我們缺乏普遍可用的進化模擬方法,使我們在計算方面演化出更好的系統,儘管在最初嘗試時我們做出了一些承諾。 我們還不清楚如何演化出具備完整通用智能的基礎因素和系統,即使是與非常簡單的生物相比。
站在 SAB 的立場上,我們仍然不能從計算層面上模擬最簡單生物的行為,目前該研究主要關注的生物是線蟲,它具備 959 個細胞,其中 302 個是神經元。 我們知道它的完整神經連接組(甚至 56 個神經膠質細胞),但是我們仍然無法模擬出它們的行為方式。
我講述這些故事,不是因為它們獨特,而是它們都說明瞭如何開展針對難題的研究,尤其是在學界中。 此外還分離出很多很多(至少二三十)其它同等領域的
AI 子課題。 它們有時繁榮,有時低谷甚至消失。 所有這些子課題都有自己獨特的名字,但是在規模、研究者數量和積極分享和發布獨特思路方面很有意義。
但是所有 AI 領域的研究者最終都對通用人工智能感興趣。 通常他們的研究結果比較狹窄,在現實世界中的應用範圍也比較狹窄,但是通用人工智能一直是他們的目標。
我將用一個大規模計算機視覺研究小組的故事結束這部分內容。 這個小組在工程方面有著實實在在的影響力,它有六個重要期刊且每年舉辦四場或四場以上重要會議,連續舉辦超過
35 年。 1987 年,我與金出武雄合作創立了其中一個期刊 IJCV,IJCV 現在已經發行了 126 卷(我只在前七期時擔任編輯)、350
期,共有 2080 篇論文,而這還只是該領域六大重要期刊之一。 該社區數十年來持續發展,在全球範圍內擁有數千名研究者。
版權聲明
本文僅代表作者觀點,不代表百度立場。
本文係作者授權百度百家發表,未經許可,不得轉載。