走進AI科學之美
人工智能和機器學習的未來研究方向是什么,人們如何使用這項技術去解決諸多科學領域的問題?去年,麻省理工學院與商湯科技共同成立了MIT-商湯科技人工智能聯盟,致力于全方位人工智能原創技術的研發,推動人工智能技術突破,并支持MIT在人工智能領域進行最前沿跨學科探索研究。
而在不久前結束的2019世界人工智能大會(WAIC 2019)上,麻省理工學院名譽校長Eric Grimson在商湯科技“智煥新動能”人工智能主題論壇中,帶來了一堂《走進AI科學之美》的主題演講,分享了麻省理工學院的最新研究和觀點,如下是一些精彩摘錄,分享給大家。
現代認知科學能為AI發展提供哪些建議?
首先,觀察人工智能過去60年的演進。在1956年,人工智能這個詞被首次提出以來,AI就不僅僅是一個能夠執行智能任務的計算系統,而是將人類對人類智慧的理解作為其發展指南,這在當時是一個巨大的創新。我們從過去60年的人工智能研究中看到了很多趨勢,目前一些趨勢是將現代神經科學和認知科學的研究與人工智能研究相結合。
由此,我們不禁要問,現代神經科學和認知科學對未來的AI算法提出了什么建議?
當前的深度學習成果令人嘆為觀止,例如AlphaGo擊敗人類職業圍棋選手或計算機已能夠比人們更好地識別面部特征,但是這些系統往往需要數以億計的訓練樣本和大量的計算能力。然而,對比一下,一個年幼的孩子可以通過極少的例子就能進行學習或推理。
現代認知發展的研究表明,人類幼兒在學習方式上比以前認為的要復雜得多,幼兒不只是進行模式匹配,而是探索并形成認知結構。例如,麻省理工學院腦與認知科學系教授Laura Schulz已經證明,兒童經常創造與物體或情境相關的假設,然后通過觀察或實驗對其進行測試。她的研究表明,兒童可以通過實驗形成并檢驗假設,并可以通過最終結果和因果關系來進行歸納和概括。這種學習理論,尤其是從少數例子中學習的能力,為我們提出不同的人工智能演進算法的方法。
基于這個想法,讓我們從麻省理工學院腦與認知科學系教授Josh Tenenbaum的一個不尋常的例子開始。假設有50個不同的字符,包含1600個簡單的視覺概念,但是每個概念只提供了20個示例,因此這個訓練數據非常有限。實驗結果表明,人們非常擅長識別字符并進行配對,機器可以與人類一樣或者超越人類。以單個手繪字符為例,計算機已可以正確找到匹配的字符。
Josh Tenenbaum教授利用了字符生成的邏輯并將其擴大。假設用戶構建了一個物理模擬引擎,可以生成任何操作的圖像序列,而不僅僅是對字符的筆畫生成進行建模,包括允許可以創建隨機變量。然后,用戶可以像孩子搭積木一樣預測操作的結果。在此邏輯下,他通過一系列引擎和概率程序創建了模擬幼兒行為的人類智能模型。通過使用感知觀察結果并不斷改進對于系統的理解,整個系統可以隨著時間的推移學習,就像新生兒一樣開始學習,逐漸成長為一個兩三歲的孩子。這種方法可能引入一種非常不同的學習方式——一種需要很少的例子,但通過模擬訓練達到目的的方式。
數學可以改進當前的機器學習方法嗎?
除了使用神經科學和認知科學來更好地理解人工智能和機器學習系統以及構建新方法之外,機器學習背后的數學基礎也很重要,如何知道是否信任人工智能系統提供的答案?系統有多強大?系統中存在隱性偏見嗎?這里向大家展示麻省理工學院當前研究項目的例子,其中包括這些問題。
如果訓練數據能夠很好地代表測試數據,那么深度學習系統會很可靠。但是,如果用選定的干擾程序攻擊系統,AI可能會被愚弄。是否有一種數學上合理的方法來創建更強大的系統?
最近,許多研究結果表明深度神經網絡可能非常脆弱,對一個樣本加入微小的干擾就可能導致明顯的分類錯誤。麻省理工學院電子工程和計算機科學系副教授Aleksander Madry為了解決這個問題,創建更魯棒的分類器,他提出把這個問題當作一個博弈論問題來處理。
這種方法的關鍵在于不僅僅在真實數據,而且要在受擾動的樣本上訓練模型。理想的情況下,我們要針對所有可能的擾動進行訓練,但是這是不可能的,因為數量太多了。通過實驗,Madry觀察到,只要在特征空間中選擇有限數量的鄰近點就足夠了,因為損失函數的值在一個小區域內不會有很大的變動。通過有選擇地針對擾動進行訓練,可以構建出更魯棒的神經網絡。在標準數據集上的實驗顯示,他的方法確實顯著改善了分類系統的魯棒性。
人工智能系統如何幫助傳統科學領域?
除了考慮機器學習背后的科學,我們也要思考人工智能系統如何幫助到傳統科學領域去解決一些問題。
材料科學家和計算機科學家共同創建了一個人工智能系統,可以閱讀科學論文并提取“配方”以生產特定類型的材料。他們的系統從理論上為創建材料提供配方,例如提供材料的物理特性以及設計制造這種材料的方法,同時,該系統可以識別更高級別的模式,例如,能夠識別材料配方中使用的前體化學品與所得產品的晶體結構之間的相關性。此外,該系統還提供了生成原始配方的自然機制,研究人員可通過這種機制為已知材料建議替代配方。這項研究工作的應用在可再生能源中尤為重要。
第二個例子是將一組反應物轉化為目標化合物的研究。合成化學是一門藝術,通常由經驗豐富的化學家執行。麻省理工學院材料科學與工程系教授Klavs Jensen及其同事正在創建一個預測結果的框架,該結果將傳統使用的反應模板與神經網絡模式識別的靈活性相結合,可應用于包括藥物設計等領域。
麻省理工學院研究科學家Caleb Harper及其同事將環境與氣候控制、代謝表型測量和機器學習相結合,以更好地了解食物生長的生物學過程。利用機器學習研究光照條件與揮發性風味物質的分子濃度之間的相關性,可以更深入地了解食品生產的化學過程。這項工作旨在開發含有更高水平化合物的植物,可以用于幫助對抗糖尿病等疾病。
以上的一系列示例展示了麻省理工學院的研究人員如何研究構成當前和未來人工智能系統基礎的科學,以及這些系統如何幫助科學家回答有關物理世界的基本問題。