信息來源:中國信息產(chǎn)業(yè)網(wǎng)
CNII網(wǎng)訊 現(xiàn)在人工智能(AI)概念炒得火熱,仿佛未來人類的一切都將被AI所接管。但實際上,人工智能的發(fā)展中仍有一個特別棘手的問題有待解決,那就是機器無法像人類一樣自由靈活地運用通用智慧來應對挑戰(zhàn)。換言之:人工智能在運用過去的經(jīng)驗和知識方面是受限的。因此,發(fā)展“通用型人工智能”就成為最明確的主攻方向。
谷歌的DeepMind團隊近日發(fā)表論文稱,在這一領域再次取得了突破,聯(lián)合帝國理工學院開發(fā)出一套名為“彈性權(quán)重固化”的新算法,讓機器學習、記住并重新使用信息成為可能。
DeepMind的James Kirkpatrick表示:“如果我們想要擁有更智能、更有應用價值的計算機程序,那么,它就必須具備‘通用型人工智能’的能力?!?/span>
對于人類來說,知識技能的遷移是再正常不過的事情了。最典型的例子是:一個專業(yè)的滑雪玩家往往在滑冰時也會得心應手。但這一步的跨越對于人工智能來說卻面臨著不小的挑戰(zhàn)。
其癥結(jié)在于大多數(shù)的人工智能系統(tǒng)都是基于所謂的神經(jīng)網(wǎng)絡來解決問題,就像DeepMind的AI系統(tǒng)可以學會下圍棋或打撲克,這其實都是在經(jīng)歷了無數(shù)次的訓練和失誤之后才練就的技能。但這兩種技能實際上是不能并存的,就比如AI學會了打撲克,那它就必須把有關下圍棋的知識“刪除”。想來也是可惜,難怪研究人員將之稱為“災難性遺忘”。
如果這一問題得不到解決,那么人工智能就永遠不會達到人類的智慧程度,自然其解決問題的靈活程度也就不能和人類相媲美了?!叭祟惡蛣游锬軌蛘莆沾罅恐R的一個關鍵因素,就在于他們可以在以前知識的基礎上不斷學習新東西?!盞irkpatrick說。
而為了實現(xiàn)這一目標,研究人員首先在神經(jīng)科學領域進行了探索,他們發(fā)現(xiàn),動物通過保持頭腦中關于過往技能的印象,來實現(xiàn)不斷學習,而這往往也是在面臨生存的壓力時所不得不做出的抉擇,就比如老鼠如果不能快速地學會尋找食物的技能,那它們很快就會被餓死。
早在2014年,DeepMind通過用機器學習的方法,教會AI系統(tǒng)玩一款Atari公司出品的游戲,突然間吸引了極大關注。那時,AI系統(tǒng)可以做到順利通關,并取得比人類更高的得分,但卻不能記住它贏得游戲的過程。
玩每一款Atari公司出品的游戲,AI系統(tǒng)都需要創(chuàng)建一個單獨的神經(jīng)網(wǎng)絡。一旦沒有把游戲相關的信息傳遞給計算機,AI系統(tǒng)就無法運行這一款游戲。
如今,DeepMind聯(lián)合帝國理工學院開發(fā)出一套新的算法,讓神經(jīng)網(wǎng)絡學習、記住并重新使用信息成為可能。這種名為彈性權(quán)重固化的算法所依賴的是“突觸固化”理論。在人腦中,這一點被稱為學習和記憶的基礎。
DeepMind表示:“我們的方法是通過有選擇性地減慢對重要權(quán)重值的學習,使機器能記住之前的任務?!?/span>
Kirkpatrick解釋說,算法會選擇運用它所學習的內(nèi)容來玩一款游戲,然后保留其中學到的最為重要的部分?!拔覀冎辉试S程序非常緩慢地漸進式地改變,那樣的話才總是會有學習新任務的空間,而同時這種改變不會覆蓋之前學到的內(nèi)容?!?/span>
在測試中,研究人員利用被新算法強化過的DQN深度神經(jīng)網(wǎng)絡隨機玩10款Atari公司的游戲,幾天之后,他們發(fā)現(xiàn)AI系統(tǒng)已經(jīng)可以做到和人類玩家一樣優(yōu)秀了,這其中很大的一部分功勞都屬于這種新的算法。沒有它,人工智能幾乎學不會其中任何一款游戲。
Kirkpatrick說,“我們之前的游戲AI系統(tǒng)只能學習玩一款游戲,而如今我們新發(fā)布的系統(tǒng)已經(jīng)對多款游戲都得心應手了?!?/span>
在AI玩游戲的過程中,研究人員還注意到一些有趣的現(xiàn)象。例如,當AI系統(tǒng)在玩賽車類游戲的時候,對于游戲中的白天、晚上、雪等不同的場景,AI系統(tǒng)已經(jīng)可以將它們分解為不同的任務來一一進行解決了,這倒是很出乎大家的預料。
然而,緊接著又有新的問題出現(xiàn)了,那就是研究人員無法證明,AI系統(tǒng)是否可以把每一款游戲都玩到極致。概括來講,AI系統(tǒng)雖然已經(jīng)可以利用學過的知識來解決現(xiàn)有的問題,但它是否會因為運用這種方法而將問題解決得更好,還值得商榷?!皩τ贏I來說,還有改進的余地?!盞irkpatrick說。
而AI沒有精通每一款游戲的一個原因就在于,它對于游戲策略的運用仍然沒能做得很好?!半m然我們知道連貫學習的重要性,但我們始終沒能實現(xiàn)突破,進入到模擬人類和動物那種學習模式的階段。這的確是一個艱難的挑戰(zhàn),但我們知道沒有什么事是不可逾越的。”Kirkpatrick說。
“我們距離通用型人工智能還有很長的路要走,也還有很多的研究和挑戰(zhàn)需要解決?!盞irkpatrick補充道,“關鍵在于,搭建起一個可以學習解決新任務和新挑戰(zhàn)的系統(tǒng),同時還要繼續(xù)保留他們已經(jīng)學到的技能。而我們所做的研究就是朝這個方向進行的有意義的摸索?!?/span>
倫敦大學學院Gatsby計算神經(jīng)科學科主任Peter Dayan對于這項研究工作給予了高度評價。他說,計算機如果實現(xiàn)通用型人工智能就意味著,它已經(jīng)可以做到將不同任務進行關聯(lián),充分利用已掌握的技能來解決新的問題。
但質(zhì)疑的聲音自然也是存在的。英國西部大學布里斯托機器人實驗室的Alan Winfield說,這項研究的確很好,但它顯然沒有做到更接近通用型人工智能。至少,DeepMind的專家們沒有透露學習能力的遷移是如何具體實現(xiàn)的,我們到底能不能直接運用它也都還沒有定論。