上周臺(tái)灣鴻海聯(lián)手日本軟銀以及大陸的阿里巴巴推出一款人形機(jī)器人Pepper。這款手售價(jià)約1萬元人民幣的機(jī)器人,首批300臺(tái)在推出1分鐘內(nèi)就被搶購一空。Pepper具有識(shí)別表情和對(duì)話的能力,可用于導(dǎo)購和照顧老人病患。它是世界最著名的電子生產(chǎn)企業(yè)與IT風(fēng)投公司、互聯(lián)網(wǎng)公司的一次強(qiáng)強(qiáng)聯(lián)合,昭示著機(jī)器人正在從科幻、科研、生產(chǎn)逐步走入人們的生活中。
人形機(jī)器人早在近一百年前就由捷克科幻小說家提出。在綜合人類近幾十年的科技精華后,機(jī)器人或許會(huì)是下一個(gè)技術(shù)爆點(diǎn),像其他電子設(shè)備一樣走入人類生活的方方面面。
日本暫時(shí)領(lǐng)先
仿生機(jī)器人是一種在外觀上模仿人類或其他生物的機(jī)器人。日本人對(duì)于其中的人形機(jī)器人有著近乎狂熱的追逐,全世界有四成機(jī)器人在在日本,日本也是世界上擁有機(jī)器人最多的國家。
日本在機(jī)器人方面的強(qiáng)大是有其深厚工業(yè)基礎(chǔ)的,控制機(jī)器人精密動(dòng)作的伺服電機(jī)主要被日本、德國、美國所壟斷,其中包括了被大眾熟知的松下、三菱等企業(yè)。
在日本,有非常多的公司已推出機(jī)器人成型產(chǎn)品,包括面向企業(yè)和大眾。這些人形機(jī)器人價(jià)格不菲,從幾萬美元到幾百萬美元都有。其中最有名的當(dāng)屬日本本田公司的ASIMO機(jī)器人,他外形酷似宇航員,具備聽覺和視覺。ASIMO可以識(shí)別人類的面部表情和聽懂人類語言,最重要的是他的手和腳都可以完成復(fù)雜的動(dòng)作。他的手可以完成擰開杯蓋的動(dòng)作,甚至能打出手語,雙腳可離地奔跑,最高時(shí)速可達(dá)9公里。
今年CES上,東芝公司推出了一款“美女”,“她”能夠?qū)崿F(xiàn)手語交流,并擁有全球最高級(jí)的面部表達(dá)能力??梢酝ㄟ^43個(gè)氣壓傳動(dòng)裝置提供安靜、迅速、流暢的肢體運(yùn)動(dòng)。它的主要用途是為老人和病患提供幫助。
除日本企業(yè)外,美國也有公司在研發(fā)類似產(chǎn)品,其中一家名為“波士頓動(dòng)力”近期開始步入公眾視野,該公司成立于1992年并在前年被谷歌公司收購。波士頓動(dòng)力一直與美國軍方有合作,最著名的是BigDog的機(jī)器狗項(xiàng)目。這種機(jī)器狗可以在各種復(fù)雜地形包括光滑冰面行走,被人踹后也能保持平衡而不倒。同時(shí),該公司也有Atlas雙足站立的機(jī)器人,也由美國軍方贊助,他擁有兩套視覺系統(tǒng)和在崎嶇地形行走攀登的能力。美國企業(yè)顯然是看中了機(jī)器人在戰(zhàn)爭(zhēng)中搜索偵查和背馱貨物的能力。
人形機(jī)器人在機(jī)械方面還存在著不少問題,由于人類四肢的復(fù)雜度,對(duì)于機(jī)械部件設(shè)計(jì)有著很高的要求。而且直立行走能力還有很大的改進(jìn)空間,從近期國外舉辦的機(jī)器人奔跑大賽中可以看出,直立行走對(duì)于技術(shù)積累不足的企業(yè)還是很大的挑戰(zhàn)。
鑒于日本企業(yè)幾十年來在硬件上的技術(shù)積累,他們能在人形機(jī)器人上取得如此成就也就不足為奇了。這一方面讓人感嘆日本機(jī)械和電子工業(yè)的發(fā)展高度,另一方面也讓人產(chǎn)生疑問:日本是不是對(duì)機(jī)器人的外觀太過于執(zhí)著而忽視了內(nèi)在。
美國專注內(nèi)在
美國企業(yè)對(duì)于仿生機(jī)器人的關(guān)心程度不如日本那樣強(qiáng)烈。除了機(jī)械方面,美國在機(jī)器人的內(nèi)在,即人工智能方面的研究,要比日本要深入得多。
早在上世紀(jì)90年代,國際商用機(jī)器公司(IBM)就在研發(fā)專門用于國際象棋的超級(jí)電腦深藍(lán),這臺(tái)電腦在經(jīng)歷首次挑戰(zhàn)失敗后,于1997年打敗了當(dāng)時(shí)的國際象棋冠軍,名噪一時(shí)。第一次引發(fā)了人們對(duì)于未來人工智能技術(shù)的擔(dān)憂。IBM并未停下腳步,隨后開發(fā)了人工智能計(jì)算機(jī)系統(tǒng)“沃森”(Watson)。它在2011年參加了美國的電視智力節(jié)目,并打平了兩位人工對(duì)手。“沃森”的處理速度相當(dāng)于每秒讀完100萬本書,而且并未聯(lián)網(wǎng),如此強(qiáng)大的知識(shí)儲(chǔ)備遠(yuǎn)非人類所能比擬,它的問題主要在于對(duì)描述較少問題上的無力。上個(gè)月沃森完成了對(duì)1900個(gè)TED公開課課程的學(xué)習(xí),這些內(nèi)容足以讓一個(gè)人從生到死都學(xué)不完。
美國一家軟件公司W(wǎng)olfram于2009年推出問答搜索引擎Wolfram Alpha(W | A)。這一搜索引擎不同于我們通常所用的谷歌與百度,W | A會(huì)直接給出問題的答案,作為一家數(shù)學(xué)軟件公司,Wolfram Alpha能輕易回答各類數(shù)學(xué)問題,解答數(shù)學(xué)問題不必借助軟件,直接在搜索中求解。而且W | A還可以回答物理化學(xué)乃至人文歷史等方面的問題,比如詢問“現(xiàn)任美國總統(tǒng)夫人是誰”、“喬布斯的生卒日期”,W | A均能直接給出答案,從而省去了在搜索結(jié)果中自己組織答案嗯過程。W | A強(qiáng)大的問答系統(tǒng)已經(jīng)被蘋果公司的Siri語音助手采用。
在語音識(shí)別技術(shù)上,美國三家科技公司蘋果、谷歌、微軟都在加緊布局,Siri、Google Now、Cortana三款智能語音助手已經(jīng)成為各家操作系統(tǒng)的一大賣點(diǎn)。蘋果Siri得益于布局早以及iOS設(shè)備較高的普及度,Google Now憑借谷歌十幾年在搜索引擎上的深耕,微軟Cortana則利用在PC操作系統(tǒng)上的霸主地位,三家各具優(yōu)勢(shì),未來還將在該領(lǐng)域繼續(xù)廝殺。
同時(shí),谷歌、微軟、Facebook等公司在圖像識(shí)別領(lǐng)域也開始發(fā)力。以圖搜圖、識(shí)別圖像內(nèi)物品、人像識(shí)別都是圖像識(shí)別的重要應(yīng)用。而今年谷歌推出的Photos應(yīng)用打開了圖像識(shí)別技術(shù)實(shí)用化的大門,Photos智能整理照片的功能初露端倪,未來圖像識(shí)別的發(fā)展方向即代替人類進(jìn)行繁復(fù)的整理審查工作。
總之,與日本企業(yè)不同,自計(jì)算機(jī)技術(shù)革命以來,美國一直在軟件領(lǐng)域處于領(lǐng)先地位。
在家用機(jī)器人硬件還無法進(jìn)入尋常百姓家的情況下,美國企業(yè)首先在軟件方面發(fā)力,依托于互聯(lián)網(wǎng)上的云計(jì)算技術(shù)和手機(jī)、PC等現(xiàn)有移動(dòng)設(shè)備,將“機(jī)器人”引入生活。這條道路顯然比日本要好走得多。
中國暫露頭角
相比日本企業(yè)對(duì)機(jī)器人的鐘情,在中國國內(nèi),由于技術(shù)積累的劣勢(shì),人形機(jī)器人落后于美日等國家,仍然主要處于高校研究的階段。
目前,哈工大、清華、上海交大等高校的機(jī)器人研究在國內(nèi)頗具名氣。企業(yè)方面,如新松等知名機(jī)器人公司還是以提供工業(yè)生產(chǎn)為主,尚未有人形的民用級(jí)產(chǎn)品問世。
在軟件方面,中國科技企業(yè)與西方國家的差距并沒有硬件那么大,諸多實(shí)用化的人工智能產(chǎn)品已經(jīng)問世。其中,最大的中文搜索引擎百度近來在圖像識(shí)別方面奮起直追,招募了一些像吳恩達(dá)、余凱這樣的人工智能專家。今年初百度也聲稱識(shí)別錯(cuò)誤率上已經(jīng)低于微軟和谷歌。不過,本月ImageNet爆出百度作弊的“丑聞”,讓原本公布的研究成果不可信,也為百度人工智能團(tuán)隊(duì)抹上了一層陰影。
中國另一家科技公司——科大訊飛無疑在中文語音識(shí)別上處于領(lǐng)先地位。借助智能機(jī)的發(fā)展,科大訊飛推出了手機(jī)上的語音輸入法和語音助手。而在這之前,該公司的文字轉(zhuǎn)語音技術(shù)就曾在北京奧運(yùn)會(huì)期間投入使用。相較于美國企業(yè),本土企業(yè)在中文語音技術(shù)上具有民族情感與政策扶持的優(yōu)勢(shì),已在中國的人工智能研究中率先展露頭角。
結(jié)語
日前,鴻海與軟銀、阿里巴巴合作推出的“機(jī)器人”Pepper有著明顯的日系特征,1萬元人民幣的價(jià)格雖不算太貴,但和手中移動(dòng)設(shè)備相比,并不具備價(jià)格優(yōu)勢(shì),若和美國亞馬遜推出的180美元智能音響Echo相比則劣勢(shì)明顯。而Echo也一樣能做到語音識(shí)別和語音合成發(fā)聲的功能。
從亞洲文化來看,日本與中國企業(yè)的合作顯然是要做出一款外形友善的智能機(jī)器人,它承載著更多情感的角色,而非呼之則來揮之即去的助手。我們對(duì)Pepper也不必期望過高,畢竟它只是第一代產(chǎn)品。況且1萬美金的價(jià)格和試水的發(fā)售量,也讓我們對(duì)它背后的技術(shù)支持產(chǎn)生懷疑。
Pepper的推出是亞洲地區(qū)的企業(yè)在機(jī)器人領(lǐng)域的一次成功嘗試,但若要在這個(gè)領(lǐng)域有更大作為,日企、臺(tái)企和大陸企業(yè)還應(yīng)該在軟件上奮起直追,而不是把機(jī)器人做成徒有其表的玩具。