使用人工智能的算法正在嘗試以意想不到的技巧來解決問題,這讓它們的開發(fā)者感到驚訝。但與此同時(shí),這也引發(fā)了人們對(duì)如何控制人工智能的擔(dān)憂。
谷歌公司的一群員工正茫然地盯著自己的電腦屏幕。幾個(gè)月來,他們一直在完善一個(gè)算法,用來控制一個(gè)無人熱氣球從波多黎各一直飛到秘魯。但還是有些地方不盡如人意,氣球在機(jī)器智能的控制下不斷偏離既定路線。
Loon項(xiàng)目(Project Loon)是谷歌公司現(xiàn)在已經(jīng)停止的一個(gè)項(xiàng)目,它原本的目標(biāo)旨在通過氣球?qū)⒒ヂ?lián)網(wǎng)接入偏遠(yuǎn)地區(qū)。作為該項(xiàng)目的負(fù)責(zé)人,塞爾瓦托·坎迪多無法解釋這個(gè)氣球的軌跡。最后,他的同事們手動(dòng)控制了系統(tǒng),讓氣球回到了正軌。
后來他們才意識(shí)到發(fā)生了什么。令人意想不到的是,氣球上的人工智能學(xué)會(huì)了重現(xiàn)人類在幾百年,甚至幾千年前發(fā)明的古老航海技術(shù),例如“改變航向”,這指的是操縱船只迎風(fēng)航行,然后再向外傾斜,從而在大致方向上以之字形前進(jìn)。
在不利的天氣條件下,自主飛行的氣球已經(jīng)學(xué)會(huì)了完全靠自己來改變航向。它們自發(fā)地完成了這一過程,讓所有人都感到震驚,尤其是參與這個(gè)項(xiàng)目的研究人員。
“當(dāng)?shù)谝粋€(gè)被允許完全執(zhí)行這種技術(shù)的氣球創(chuàng)造了從波多黎各到秘魯?shù)娘w行時(shí)間記錄時(shí),我們馬上意識(shí)到自己被打敗了,”坎迪多在一篇關(guān)于該項(xiàng)目的博客文章中寫道,“我從來沒有像這樣,同時(shí)感到自己既聰明又愚蠢?!?/p>
富有創(chuàng)造力的人工智能
當(dāng)人工智能在設(shè)備中被放任自流時(shí),很可能就會(huì)發(fā)生這樣的事情。與傳統(tǒng)的計(jì)算機(jī)程序不同,人工智能的設(shè)計(jì)目的就是探索和開發(fā)新的方法,以完成人類工程師沒有明確告訴它們的任務(wù)。
然而,在學(xué)習(xí)如何完成這些任務(wù)的同時(shí),人工智能有時(shí)會(huì)想出一種極富創(chuàng)造力的方法,甚至?xí)屢恢笔褂眠@種系統(tǒng)的人大吃一驚。這可能是一件好事,但同時(shí)也可能使人工智能控制的一切變得不可預(yù)測,甚至可能帶來危險(xiǎn)。例如,機(jī)器人和自動(dòng)駕駛汽車最終可能做出將人類置于危險(xiǎn)境地的決定。
人工智能系統(tǒng)怎么可能“智勝”它的人類主人呢?我們能否以某種方式約束機(jī)器智能,以確保不致某些不可預(yù)見的災(zāi)難?
在人工智能研究界,有一個(gè)關(guān)于人工智能創(chuàng)造力的例子似乎被引用得最多。真正讓人們對(duì)人工智能的能力感到興奮的時(shí)刻,是DeepMind的人工智能機(jī)器學(xué)習(xí)系統(tǒng)AlphaGo如何掌握圍棋這一古老的游戲,然后擊敗了世界上最優(yōu)秀的人類棋手之一。DeepMind是一家創(chuàng)立于2010年的人工智能公司,在2014年被谷歌收購。
事實(shí)證明,它們可以用一些以往從未有人用過——或者至少很多人不知道——的新策略或新技巧,來對(duì)付人類棋手。
然而,即使是這樣一場單純的圍棋游戲,也會(huì)引起人們不同的感受。一方面,DeepMind自豪地描述了其系統(tǒng)AlphaGo的“創(chuàng)新”之處,并揭示了圍棋,這一人類已經(jīng)玩了數(shù)千年的游戲的新玩法。另一方面,一些人質(zhì)疑如此有創(chuàng)造性的人工智能有朝一日是否會(huì)對(duì)人類構(gòu)成嚴(yán)重威脅。
在AlphaGo取得歷史性勝利后,澳大利亞西悉尼大學(xué)的機(jī)器學(xué)習(xí)、電子學(xué)和神經(jīng)科學(xué)研究者喬納森?塔普森寫道:“認(rèn)為我們能夠預(yù)測或管理人工智能最壞的行為是很可笑的,我們實(shí)際上無法想象它們可能的行為?!?/p>
我們需要記住的重要一點(diǎn)是,人工智能并不真正像人類那樣思考。它們的神經(jīng)網(wǎng)絡(luò)確實(shí)是受到了動(dòng)物大腦的啟發(fā),但更確切地說,它們是所謂的“探索設(shè)備”。當(dāng)它們試圖解決一個(gè)任務(wù)或問題時(shí),并不會(huì)帶有很多(如果有的話)對(duì)更廣闊世界的先入之見。它們只是嘗試——有時(shí)是數(shù)百萬次——去找到一個(gè)解決方案。
我們?nèi)祟愑泻芏嗨枷肷系陌ぃ覀儠?huì)考慮規(guī)則,人工智能系統(tǒng)甚至不理解規(guī)則,因此它們可以隨意地?fù)芘挛铩?/p>
在這種情況下,人工智能可以被描述為具有“學(xué)者癥候群”的硅等量物。所謂學(xué)者癥候群,通常是指一個(gè)人有嚴(yán)重的精神障礙,但卻在某種藝術(shù)或?qū)W術(shù)上擁有非凡的能力,其天賦通常與記憶有關(guān)。
不斷帶給我們驚奇
人工智能讓我們感到驚奇的方式之一,是它們能夠使用相同的基本系統(tǒng)來解決根本不同的問題。最近,一款機(jī)器學(xué)習(xí)工具就被要求執(zhí)行一項(xiàng)非常不同的功能:下國際象棋。
該系統(tǒng)被稱為“GPT-2”,由非營利的人工智能研究組織OpenAI開發(fā)。GPT-2利用數(shù)以百萬計(jì)的在線新聞文章和網(wǎng)頁信息進(jìn)行訓(xùn)練,可以根據(jù)句子中前面的單詞預(yù)測下一個(gè)單詞。開發(fā)者肖恩·普萊瑟認(rèn)為,國際象棋的走法可以用字母和數(shù)字的組合來表示,因此如果根據(jù)國際象棋比賽的記錄來訓(xùn)練算法,這一工具就可以通過計(jì)算理想的走法序列來學(xué)習(xí)如何下棋。
普萊瑟對(duì)GPT-2系統(tǒng)進(jìn)行了240萬場國際象棋比賽的訓(xùn)練?!翱吹较笃逡孀兂涩F(xiàn)實(shí)真是太酷了,”他說,“我當(dāng)時(shí)根本不確定這能不能行得通?!钡獹PT-2做到了。盡管它的水平還比不上專門設(shè)計(jì)的國際象棋計(jì)算機(jī),但已經(jīng)能夠成功地完成艱苦的比賽。
這個(gè)實(shí)驗(yàn)表明GPT-2系統(tǒng)具有許多尚待探索的能力,堪稱一個(gè)具有國際象棋天賦的專家。該軟件后來的一個(gè)版本讓網(wǎng)頁設(shè)計(jì)人員大為震驚,當(dāng)時(shí),一位開發(fā)人員對(duì)其進(jìn)行了簡單的訓(xùn)練,讓它寫出用于在網(wǎng)頁上顯示項(xiàng)目(如文本和按鈕)的代碼。盡管只有一些簡單的描述,如“表示‘我愛你’的紅色文本和帶有‘ok’的按鈕”,但這個(gè)人工智能依然生成了適當(dāng)?shù)拇a。很顯然,它已經(jīng)掌握了網(wǎng)頁設(shè)計(jì)的基本要領(lǐng),但所受的訓(xùn)練卻少得驚人。
長期以來,人工智能給人們留下的深刻印象主要來自電子游戲領(lǐng)域。在人工智能研究界,有無數(shù)例子揭示了算法在虛擬環(huán)境中所做到的事情有多么令人驚訝。研究者經(jīng)常在諸如電子游戲等空間中對(duì)算法進(jìn)行測試和磨練,以了解它們到底有多強(qiáng)大。
2019年,OpenAI因?yàn)橐欢我曨l登上了新聞?lì)^條。視頻中,一個(gè)由機(jī)器學(xué)習(xí)控制的角色正在玩捉迷藏游戲。令研究人員驚訝的是,游戲中的“尋找者”最終發(fā)現(xiàn),它們可以跳到物品上方進(jìn)行“沖浪”,從而進(jìn)入“躲藏者”所在的圍欄。換言之,“尋找者”學(xué)會(huì)了為了自己的利益而改變游戲規(guī)則。
反復(fù)試錯(cuò)的策略會(huì)帶來各種有趣的行為,但并不總能帶來成功。兩年前,DeepMind的研究員維多利亞·克拉科夫娜邀請(qǐng)她博客的讀者分享人工智能解決棘手問題的故事,但要求解決問題的方式是不可預(yù)測或不可接受的。
她整理出了一長串很吸引人的例子。其中有一個(gè)游戲算法,在第1關(guān)結(jié)束時(shí)學(xué)會(huì)了自殺,以避免在第2關(guān)死亡,這就實(shí)現(xiàn)了在第2個(gè)關(guān)卡中不死的目標(biāo),只不過采用了一種特別令人印象深刻的方式。另一個(gè)算法發(fā)現(xiàn),它可以在游戲中跳下懸崖,并將對(duì)手帶向毀滅;通過這種方式,人工智能得到了足夠的點(diǎn)數(shù)以獲得額外的生命,從而在無限循環(huán)中不斷重復(fù)這種自殺策略。
紐約大學(xué)坦登工程學(xué)院的電子游戲人工智能研究者朱利安·托格里烏斯試圖解釋這其中發(fā)生的一切。他表示,這些都是“獎(jiǎng)勵(lì)分配”錯(cuò)誤的典型例子。當(dāng)人工智能被要求完成某件事時(shí),它可能會(huì)找到一些奇怪的、出乎意料的方法來實(shí)現(xiàn)目標(biāo),并最終證明這些方法是正確的。人類很少采取這樣的策略,指導(dǎo)我們?nèi)绾斡螒虻姆椒ê鸵?guī)則十分重要。
研究人員發(fā)現(xiàn),當(dāng)人工智能系統(tǒng)在特殊條件下接受測試時(shí),這種目標(biāo)導(dǎo)向的偏見會(huì)暴露出來。在最近的一項(xiàng)實(shí)驗(yàn)中,被要求在銀行進(jìn)行投資的游戲人工智能角色會(huì)跑到虛擬銀行大廳附近的一個(gè)角落,等待獲得投資回報(bào),這個(gè)算法已經(jīng)學(xué)會(huì)了將跑到拐角處與獲得金錢回報(bào)聯(lián)系起來,盡管這種運(yùn)動(dòng)與得到多少回報(bào)之間并沒有實(shí)際的關(guān)系。
這有點(diǎn)像人工智能在發(fā)展迷信,在得到了某種獎(jiǎng)勵(lì)或懲罰之后,它們開始思考為什么會(huì)得到這些。
這是“強(qiáng)化學(xué)習(xí)”的陷阱之一。所謂“強(qiáng)化學(xué)習(xí)”,是指人工智能最終會(huì)根據(jù)它在環(huán)境中遇到的情況設(shè)計(jì)出判斷錯(cuò)誤的策略。人工智能不知道自己為什么會(huì)成功,它只能將自己的行動(dòng)建立習(xí)得聯(lián)想的基礎(chǔ)上。這有點(diǎn)像人類文化早期階段時(shí),將祈禱儀式與天氣變化聯(lián)系起來的行為。
一個(gè)有趣的例子是,鴿子也會(huì)出現(xiàn)這樣的行為。1948年,一位美國心理學(xué)家發(fā)表了一篇論文,描述了一個(gè)不尋常的實(shí)驗(yàn):他將鴿子放在圍欄里,間歇性地給予食物獎(jiǎng)勵(lì)。這些鴿子開始將食物與它們當(dāng)時(shí)正在做的事情聯(lián)系起來,有時(shí)是拍打翅膀,有時(shí)是舞蹈般的動(dòng)作。然后,它們會(huì)重復(fù)這些行為,似乎期待著獎(jiǎng)勵(lì)會(huì)隨之而來。
用新辦法解決老問題
測試的游戲人工智能與心理學(xué)家所使用的活體動(dòng)物之間有著巨大的差異,但其中起作用的似乎是相同的基本機(jī)制,即獎(jiǎng)勵(lì)與特定行為錯(cuò)誤地聯(lián)系在一起。
人工智能研究者可能會(huì)對(duì)機(jī)器學(xué)習(xí)系統(tǒng)所選擇的路徑感到驚訝,但這并不意味著他們對(duì)機(jī)器學(xué)習(xí)系統(tǒng)感到敬畏。DeepMind的深度學(xué)習(xí)研究科學(xué)家拉亞?哈德賽爾表示:“我從不覺得這些人工智能有自己的想法?!?/p>
哈德賽爾對(duì)許多人工智能系統(tǒng)進(jìn)行了試驗(yàn),發(fā)現(xiàn)它們能對(duì)她或她同事未曾預(yù)料的問題提出有趣和新穎的解決方案,這正是研究人員應(yīng)該致力于增強(qiáng)人工智能的原因,因?yàn)檫@樣,它們就可以完成人類自己無法完成的事情。
使用人工智能的產(chǎn)品,比如自動(dòng)駕駛汽車,可以經(jīng)過嚴(yán)格測試,以確保任何不可預(yù)測性都在一定的可接受范圍內(nèi)。在這一點(diǎn)上,只有時(shí)間才能證明所有銷售人工智能產(chǎn)品的公司是否都如此小心謹(jǐn)慎。但與此同時(shí),值得注意的是,人工智能表現(xiàn)出的意外行為絕不僅僅局限于研究環(huán)境,而是已經(jīng)進(jìn)入了商業(yè)產(chǎn)品領(lǐng)域。
2020年,在德國柏林的一家工廠里,由美國強(qiáng)化學(xué)習(xí)機(jī)器人技術(shù)公司Covariant開發(fā)的一款機(jī)器人手臂在物品經(jīng)過傳送帶時(shí),展現(xiàn)出了意想不到的分類方法。盡管沒有專門的程序,但控制手臂的人工智能學(xué)會(huì)了瞄準(zhǔn)透明包裝的物品中心,以確保其每次都能成功地將物品抓起來。由于這些物品是透明的,在重疊時(shí)可能會(huì)混在一起,因此瞄準(zhǔn)不精確意味著機(jī)器人可能無法抓起物品。但人工智能學(xué)會(huì)了避免物體的重疊角,而是瞄準(zhǔn)了最容易拾取的表面。這真的讓人很吃驚。
無獨(dú)有偶,研究團(tuán)隊(duì)最近試驗(yàn)了一款機(jī)器人手臂,可以通過形狀分類孔洞來選取不同的物品。一開始機(jī)器人的手臂很笨拙,在人工智能的控制下,它通過不斷地拿起和放下物品進(jìn)行學(xué)習(xí);最終,機(jī)器人可以在物品進(jìn)入正確位置時(shí)將其抓住,并將物品很容易地放入適當(dāng)?shù)目锥?,而不是試圖用鉗子擺弄它。
所有這些都印證了OpenAI研究管理者杰夫·克倫的觀點(diǎn),即人工智能的探索性是其未來成功的基礎(chǔ)。近年來,克倫一直在與世界各地的同行合作,收集人工智能以出人意料的方式開發(fā)出問題解決方案的例子。
克倫說:“隨著我們不斷擴(kuò)展這些人工智能系統(tǒng)的規(guī)模,可以看到,它們正在做著一些富有創(chuàng)造性且令人印象深刻的事情,而不只是表現(xiàn)出學(xué)術(shù)上的好奇心?!?/p>
如果人工智能系統(tǒng)能找到更好的方法來診斷疾病,或者向有需要的人群運(yùn)送緊急物資,它們就可以挽救更多的生命。克倫補(bǔ)充道,人工智能有能力找到解決老問題的新方法。但他也認(rèn)為,開發(fā)這類系統(tǒng)的人需要對(duì)其不可預(yù)測的本質(zhì)保持開放和誠實(shí),以幫助公眾了解人工智能的工作機(jī)制。
畢竟,這是一把雙刃劍。人工智能的承諾和威脅一直同時(shí)存在,它們接下來會(huì)想到什么?這是耐人尋味的問題。
來源:BBC Future
撰文:克里斯·巴拉紐克(Chris Baraniuk)
翻譯:任天
延邊信息港 / 延邊廣電客戶端
標(biāo)簽: 人工智能
系統(tǒng)
學(xué)習(xí)
物品
人類