在對人工智能和機(jī)器人的探索中,人們慢慢發(fā)現(xiàn)一個(gè)規(guī)律:雖然我們還沒有徹底搞清楚智能是一種怎樣的存在,但對于人工智能的研究一樣在不斷進(jìn)展中,時(shí)至今日已經(jīng)取得了令人贊嘆的成果,似乎對于人類智能的透徹理解,對研發(fā)人工智能來說并不是必要條件。 IEEE機(jī)
在對人工智能和機(jī)器人的探索中,人們慢慢發(fā)現(xiàn)一個(gè)規(guī)律:雖然我們還沒有徹底搞清楚智能是一種怎樣的存在,但對于人工智能的研究一樣在不斷進(jìn)展中,時(shí)至今日已經(jīng)取得了令人贊嘆的成果,似乎對于人類智能的透徹理解,對研發(fā)人工智能來說并不是必要條件。
IEEE機(jī)器人與自動(dòng)化協(xié)會(huì)機(jī)器人手,抓取與操控技術(shù)委員會(huì)的始創(chuàng)主席、南佛羅里達(dá)大學(xué)計(jì)算機(jī)系的孫宇教授帶領(lǐng)的RPAL(機(jī)器人感知與行為實(shí)驗(yàn)室)研發(fā)了一款能夠精確控制力度、實(shí)現(xiàn)很多日常任務(wù)的機(jī)械臂。在對孫宇的采訪中,我們再次體會(huì)到了這條規(guī)律的存在,和它帶給我們思維上的解放。
提起機(jī)器人的機(jī)械臂,我們通常會(huì)想起一些非常笨重的東西,像下面這樣的。
智能的實(shí)現(xiàn)可以另辟蹊徑——USF機(jī)器人感知與行為實(shí)驗(yàn)室負(fù)責(zé)人孫宇教授專訪
這些機(jī)械臂無論是從靈活性還是通用性上都很難稱得上**。也很難拿來做一些精細(xì)化的活。但孫宇和團(tuán)隊(duì)做出來的機(jī)械臂卻能做到很多這種機(jī)械臂想都不敢想的事。他們是怎么做到的?
機(jī)械臂的精確力度控制
準(zhǔn)確的說,孫宇他們開發(fā)的并不是機(jī)器人的硬件,而是機(jī)器人智能大腦中的抓取中樞,其具有很高的可擴(kuò)展性,是可以很方便的嵌入到現(xiàn)有的機(jī)器人產(chǎn)品中去的。而目前這個(gè)中樞算法已經(jīng)有了很驚艷的表現(xiàn)。
在一個(gè)演示視頻里,機(jī)械臂順利的將放在桌上的一個(gè)燈泡拿了起來,然后擰在了底座上。
石家莊網(wǎng)絡(luò)優(yōu)化消息,人們還很難想象機(jī)器人能順利完成這樣的工作。這個(gè)燈泡被制造出來的時(shí)候,估計(jì)也想象不到自己會(huì)以這樣的方式開始自己發(fā)光發(fā)熱的使命。事實(shí)上要做到這一點(diǎn)確實(shí)很不容易,尤其是相對于較為成熟的認(rèn)知手段來說,機(jī)械臂的精確施力控制是更難做到的。
首先把它抓起來就不是一件容易的事了,孫宇表示,自己希望目前的研究將來能使機(jī)器人進(jìn)入在日常生活,為人類提供服務(wù)。而目前機(jī)器人在日常生活中面對的**挑戰(zhàn)可能就是各種工具的使用了:機(jī)器人如果想要用好一樣?xùn)|西,首先還得保證自己不會(huì)把它弄壞了。然后才能談使用的事。因?yàn)橥ǔG闆r下,機(jī)械臂“拿起”一樣?xùn)|西的方法,都是直接將它“握住”,就像這樣:
或許你注意到了,上面的gif和圖片中握住紅球的機(jī)械手,都是結(jié)構(gòu)比較簡單的機(jī)械手,但是,要讓機(jī)器人的手像人一樣靈活,**的辦法難道不是造一個(gè)同人類的手一模一樣有許多關(guān)節(jié)、可以實(shí)現(xiàn)靈活處理的機(jī)械手,然后寫出一個(gè)精妙的程序來控制它嗎?
事實(shí)上機(jī)器人界確實(shí)早在80年代就流行過高度仿生的多關(guān)節(jié)機(jī)械手,但是孫宇說,這種結(jié)構(gòu)存在一些明顯的缺陷,比如造價(jià)過于昂貴,還有由于其結(jié)構(gòu)非常精細(xì),即使不考慮故障率,也意味著驅(qū)動(dòng)其關(guān)節(jié)的電機(jī)都無法做得足夠大,因此力量也很受限制,能做的事情可能也很有限。所以,**大家還是普遍傾向于使用結(jié)構(gòu)稍微簡單一些的機(jī)械手,這樣一來,不僅成本降下來了,這些機(jī)械手確實(shí)也能完成要求的任務(wù),看似是理念的倒退,實(shí)際上卻有了更好的效果。*近隨著技術(shù)的發(fā)展,仿生機(jī)械手又有所崛起,不過那都是后話了。
孫宇帶領(lǐng)的團(tuán)隊(duì)選擇的是一種只有三根手指的機(jī)械手。不過不管幾根手指,當(dāng)你需要用它來做一件很具體的事情的時(shí)候,很明顯只是握住它是不行的。各位可以試著拿起你的手機(jī)、端起你的碗、拿起刀來切菜,大家會(huì)發(fā)現(xiàn)凡是需要“使用”某樣物體的動(dòng)作,基本都需要指尖同物體的接觸和施力,而如果讓機(jī)器人來做這件事,如何使用工具時(shí)施加正確的力,不毀壞工具,又能完成任務(wù)就是一件需要考慮一下的事了。
感覺和認(rèn)知
不過這個(gè)問題孫宇和他的團(tuán)隊(duì)倒是老早就解決了,早在09年,孫宇就開發(fā)出了一種讓機(jī)械臂能借助機(jī)器視覺從人拿一樣?xùn)|西時(shí)手指的反應(yīng)來判斷物體材質(zhì),從而用合適的力去拿起它的技術(shù)。能讓機(jī)器人在拿起哪怕雞蛋這樣脆弱的物體的時(shí)候也不會(huì)弄壞它。
智能的實(shí)現(xiàn)可以另辟蹊徑——USF機(jī)器人感知與行為實(shí)驗(yàn)室負(fù)責(zé)人孫宇教授專訪
在機(jī)器理解燈泡的材質(zhì)之前,它會(huì)用默認(rèn)的力道握下去,直接將雞蛋壓碎,而理解之后,就能穩(wěn)穩(wěn)的握住了
這種技術(shù)是今天成就的基礎(chǔ)。將雞蛋,或者燈泡穩(wěn)穩(wěn)的握住只是一個(gè)靜態(tài)的過程。事實(shí)上,只需調(diào)整力度讓機(jī)器人將任何物體都輕輕的握住,也能達(dá)到上面的效果。但當(dāng)涉及了具體的操作,機(jī)械臂的手指與物體之間的力就不再是簡單不變的一個(gè)*小值。
就比如說拿這個(gè)燈泡的時(shí)候,如果你需要把燈泡擰到燈座上去,那你需要考慮的就不止是重力的問題了,當(dāng)燈泡伸入燈座內(nèi)之后,底座內(nèi)的彈簧和螺紋還會(huì)給你帶來一個(gè)額外的力,機(jī)械臂需要據(jù)此調(diào)整自己握著燈泡的力,才能保證穩(wěn)定的握持。而當(dāng)機(jī)械臂開始旋轉(zhuǎn)燈泡時(shí),還需要額外的再加一些力。
孫宇說,在機(jī)械臂擰燈泡這個(gè)過程中,尋找底座并將燈泡的底部與其對準(zhǔn)算是相對容易的部分了。因?yàn)榻o予視覺的姿態(tài)估計(jì)技術(shù)已經(jīng)比較成熟。難點(diǎn)就在于機(jī)器對力的理解和調(diào)節(jié)上。當(dāng)機(jī)器收到任務(wù)去擰這個(gè)燈泡的時(shí)候,他就要考慮到擰燈泡的時(shí)候可能會(huì)遇到什么樣的各種力,然后依此來決定用怎樣的力道和手抓方式來執(zhí)行這個(gè)任務(wù)了。
當(dāng)然,孫宇和RPAL的目的遠(yuǎn)遠(yuǎn)不止是做一個(gè)擰燈泡的機(jī)器人,正如前面所說的,孫宇希望自己的技術(shù)能應(yīng)用在日常家庭的生活中,具體一點(diǎn),就是幫助機(jī)械手變得更靈活,讓它像人手一樣使用各種物體。孫宇說在日常生活中,即使是拿著同一個(gè)東西的時(shí)候,做不同的事時(shí)也需要用不同的力和姿勢去行動(dòng),比如當(dāng)你拿著一把刀去切面包和去給面包抹黃油的時(shí)候,需要施加的力和拿物體的姿勢也是完全不同的,因?yàn)楫?dāng)你抹黃油的時(shí)候刀片是刀側(cè)受力,切面包的時(shí)候是刀鋒受力,需要不同的姿勢才能實(shí)現(xiàn)這兩個(gè)用力的方式。
不過畢竟世界上的“面包”和“燈泡”都是無窮無盡的,你不可能指望機(jī)器人拿每種東西之前都要你先去在數(shù)據(jù)庫中添加什么數(shù)據(jù)。“學(xué)習(xí)”這項(xiàng)能力是非常重要的。之前提到的根據(jù)人手的反應(yīng)來決定握東西的力度,其實(shí)也是一種學(xué)習(xí)。
為了教給機(jī)器人如何使用工具,通過美國自然科學(xué)基金的支持,孫宇和團(tuán)隊(duì)建立了一個(gè)日常工具使用的數(shù)據(jù)庫,可以記錄之前的每次同物品互動(dòng)的各種細(xì)節(jié),比如力度、姿勢、運(yùn)動(dòng)方式。當(dāng)被要求做新的任務(wù)時(shí),機(jī)械手就可以根據(jù)之前的數(shù)據(jù),機(jī)械手的形狀和物體的形狀來預(yù)估一個(gè)合適的方式和力度。
深度學(xué)習(xí)
其實(shí)在現(xiàn)在說到機(jī)器的學(xué)習(xí)就不得不提到深度學(xué)習(xí),深度學(xué)習(xí)是目前大熱的研究領(lǐng)域,甚至開始有人懷疑深度學(xué)習(xí)是不是已經(jīng)對科研界形成了一種不利的壟斷,不過對于這種質(zhì)疑,孫宇總體還是持一種比較樂觀的態(tài)度。因?yàn)樯疃葘W(xué)習(xí)從客觀上來說確實(shí)是能產(chǎn)生很好的結(jié)果。
因此孫宇和RPAL也將深度學(xué)習(xí)應(yīng)用到了他們的系統(tǒng)中,除了之前提到的數(shù)據(jù)庫,目前他們還在開發(fā)一個(gè)基于圖機(jī)構(gòu)的機(jī)器人的知識(shí)系統(tǒng),這個(gè)系統(tǒng)的理念是將所有日常生活中的物體都用動(dòng)作聯(lián)系起來,脫胎于人腦中的鏡像神經(jīng)元 (Mirror Neuron),孫宇和RPAL正在建立機(jī)器人智能大腦中鏡像神經(jīng)元。
孫宇表示,比如之前舉例的切面包,面包和刀本身是兩個(gè)獨(dú)立的物體,但是“切”這個(gè)動(dòng)作將這兩者聯(lián)系了起來。同樣“切”這個(gè)動(dòng)作也可以和其它物體聯(lián)系起來。而刀不僅可以通過切這個(gè)動(dòng)作和面包聯(lián)系起來,還可以同菜、水果等物體聯(lián)系起來,同樣,面包也可以通過“裝入容器”這樣的“裝”的動(dòng)作同碗、袋子等容器聯(lián)系起來,生活中的物品就是這樣通過功能建立起來了一個(gè)網(wǎng)絡(luò),它的英文名叫functional object-oriented network,這樣的一個(gè)網(wǎng)絡(luò)就可以很方便的被機(jī)器人理解,讓它們知道做什么事的時(shí)候應(yīng)該怎樣做。
那如何得到這個(gè)網(wǎng)絡(luò)呢?孫宇表示,他們目前的網(wǎng)絡(luò)建立主要有兩個(gè)途徑,一是通過人工手動(dòng)添加,一是通過讓機(jī)器觀看YouTube的視頻自動(dòng)學(xué)習(xí)。這其中也用到了深度學(xué)習(xí)。這個(gè)項(xiàng)目由另一項(xiàng)美國自然科學(xué)基金資助,已經(jīng)初具規(guī)模。
智能的實(shí)現(xiàn)可以另辟蹊徑——USF機(jī)器人感知與行為實(shí)驗(yàn)室負(fù)責(zé)人孫宇教授專訪
對于這項(xiàng)技術(shù)的*終落地,孫宇認(rèn)為,技術(shù)從研究角度來說已經(jīng)成熟了,只是需要一些針對應(yīng)用和機(jī)器人的工程開發(fā),機(jī)器人就可以使用鏡像神經(jīng)網(wǎng)絡(luò)和抓取中樞來為人類日常生活提供服務(wù)。出現(xiàn)在市場上的時(shí)間已經(jīng)不會(huì)遠(yuǎn)了。
人工智能可能是一種全新的東西
我們越來越明顯的發(fā)現(xiàn)這個(gè)規(guī)律:至少在現(xiàn)階段,機(jī)器人、人工智能的**實(shí)現(xiàn)方式并不是對人類的直接模仿,而是對人類的行為、智能等特征進(jìn)行抽象后,另辟蹊徑的實(shí)現(xiàn)。從起源于大腦神經(jīng)網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò)、曾經(jīng)流行但后來被更簡單的機(jī)械手取代的高度仿生機(jī)械手、到早期“捏雞蛋機(jī)器人”通過視覺來實(shí)現(xiàn)觸覺的調(diào)整、模仿人腦鏡像神經(jīng)元卻用不同概念替換其中元素的機(jī)器人智能大腦鏡像神經(jīng)元,無一不是這樣思維的產(chǎn)物。我們可以把它理解成技術(shù)局限下的妥協(xié),但換一個(gè)角度講,或許人類確實(shí)不應(yīng)該局限于一味的模仿智能。雖然人工智能中有著“智能”的名字,但這不意味著它就需要以同人類的智能一樣的思路來建造。在那些復(fù)雜的電路和元件之下,或許人工智能的**形態(tài)會(huì)以一種完全超越現(xiàn)在人類想象的形式出現(xiàn)?