本文來(lái)自李瑞峰教授在機(jī)器人論壇的分享。以下是哈工大機(jī)器人研究所副所長(zhǎng)李瑞峰教授的演講實(shí)錄:
非常高興來(lái)到這里和大家分享,下面的時(shí)間里我會(huì)就目前服務(wù)機(jī)器人國(guó)際國(guó)內(nèi)的一些動(dòng)態(tài)和技術(shù)趨勢(shì)結(jié)合在服務(wù)機(jī)器人方面的研究和大家進(jìn)行探討。
服務(wù)機(jī)器人現(xiàn)狀如何?
隨著中國(guó)人口紅利的消失,機(jī)器人在制造業(yè)和工業(yè)領(lǐng)域被大批量應(yīng)用,包括現(xiàn)在非常熱的機(jī)器換人和自動(dòng)化升級(jí)改造,服務(wù)機(jī)器人作為和工業(yè)機(jī)器人相對(duì)應(yīng)的領(lǐng)域,在軍事、服務(wù)和娛樂(lè)各個(gè)領(lǐng)域都發(fā)揮著越來(lái)越重要的作用,也逐漸取代人類(lèi)的一些工作。
過(guò)去服務(wù)機(jī)器人只是存在于科幻電影當(dāng)中,未來(lái)我們也會(huì)在生活當(dāng)中遇到形形色色、各種各樣的服務(wù)機(jī)器人。
目前服務(wù)機(jī)器人的市場(chǎng)化程度和工業(yè)機(jī)器人相比還是處于起步階段,但隨著勞動(dòng)力不足以及老齡化的影響,未來(lái)的市場(chǎng)會(huì)有一個(gè)很大的發(fā)展。
國(guó)際相關(guān)的組織也有一個(gè)報(bào)告,2012年服務(wù)機(jī)器人市場(chǎng)規(guī)模已經(jīng)達(dá)到了兩百億美元,到了2017年,年增長(zhǎng)率可能會(huì)達(dá)到17%,大概會(huì)達(dá)到四百六十億美金。中國(guó)有著巨大的市場(chǎng),所以發(fā)展速度會(huì)更快。目前世界上有48個(gè)國(guó)家在發(fā)展機(jī)器人,其中25個(gè)國(guó)家已經(jīng)涉足服務(wù)型機(jī)器人的開(kāi)發(fā)。特別是在日本、北美和歐洲,市面上可以看到四十余款機(jī)器人。當(dāng)然,這些發(fā)達(dá)國(guó)家在這個(gè)領(lǐng)域處于領(lǐng)先,就是以美國(guó)、德國(guó)、法國(guó)、日本和韓國(guó)作為代表。

現(xiàn)在國(guó)際上有一些比較有代表性的服務(wù)機(jī)器人產(chǎn)品,比如美國(guó)面向家庭養(yǎng)老陪護(hù)方面的機(jī)器人,還有日本開(kāi)發(fā)出來(lái)的家務(wù)機(jī)器人以及與小孩進(jìn)行教育溝通娛樂(lè)的機(jī)器人,可以說(shuō)應(yīng)用已經(jīng)非常廣泛了。對(duì)于世界經(jīng)濟(jì)增長(zhǎng)的引擎我們有一個(gè)判斷,過(guò)去是從IT時(shí)代逐漸轉(zhuǎn)變成了RT時(shí)代,家庭機(jī)器人可能作為一個(gè)核心終端存在。
軍用特種機(jī)器人領(lǐng)域,隨著美國(guó)開(kāi)發(fā)的偵查機(jī)器人和大狗機(jī)器人的出現(xiàn),未來(lái)美國(guó)、德國(guó)和法國(guó)這些國(guó)家在軍事上對(duì)于服務(wù)機(jī)器人的采購(gòu)量會(huì)有一個(gè)非常大的增長(zhǎng),這也是服務(wù)機(jī)器人市場(chǎng)增長(zhǎng)的一個(gè)很大的方面。
各國(guó)人形服務(wù)機(jī)器人如下:

人形服務(wù)機(jī)器人的發(fā)展可以在未來(lái)真正使人類(lèi)的生活產(chǎn)生深刻變革,就是這種具有通用性的類(lèi)人形機(jī)器人,就從大家對(duì)機(jī)器人的認(rèn)識(shí)來(lái)說(shuō)可能覺(jué)得人形機(jī)器人在外觀(guān)上和人更相近,我們也更容易接受,所以未來(lái)真正的機(jī)器人形態(tài)可能還是要朝著類(lèi)人形態(tài)發(fā)展。
過(guò)去我們關(guān)注的都是一般的機(jī)電控制系統(tǒng),包括進(jìn)行動(dòng)態(tài)和固態(tài)的行走,未來(lái)人形機(jī)器人可能會(huì)變成復(fù)雜的人機(jī)交互,不光是具有人的形狀,還要和人進(jìn)行自然的溝通和交流,這是未來(lái)技術(shù)的發(fā)展。
對(duì)于面向消費(fèi)級(jí)用戶(hù)來(lái)說(shuō),日本的機(jī)器人講究高性?xún)r(jià)比,就是價(jià)格平民化,讓大家都能夠接受。另外未來(lái)用到了大量的增值服務(wù),從云計(jì)算、大數(shù)據(jù)來(lái)把網(wǎng)絡(luò)技術(shù)應(yīng)用到機(jī)器人領(lǐng)域,使之具備持續(xù)的服務(wù)能力。
對(duì)于特種環(huán)境的航天機(jī)器人是需要一個(gè)高協(xié)作性,復(fù)雜的極端環(huán)境里面需要機(jī)器人和人有一個(gè)共同協(xié)作的配合,這種配合能力是我們的要求。
高仿真機(jī)器人方面也是未來(lái)機(jī)器人發(fā)展的領(lǐng)域,國(guó)內(nèi)也有很多領(lǐng)域在做這方面的研究,逼真度上從更接近人類(lèi)的角度去做服務(wù)機(jī)器人,比如迎賓服務(wù)和娛樂(lè)影視方面未來(lái)會(huì)有比較大的發(fā)展。
真正具有作業(yè)功能的機(jī)器人具有高柔韌性,就是人機(jī)協(xié)同合作的能力,面向不同的用戶(hù)、不同的環(huán)境,機(jī)器人的特點(diǎn)和要求也是不一樣的。

中國(guó)國(guó)內(nèi)機(jī)器人的發(fā)展經(jīng)歷了幾個(gè)階段,八十年代就已經(jīng)出現(xiàn)了各種服務(wù)型機(jī)器人的雛形,九十年代是發(fā)展的中期,國(guó)家也有“863項(xiàng)目”的重點(diǎn)支持,現(xiàn)在就是巨大的市場(chǎng)需求牽引。
過(guò)去機(jī)器人與現(xiàn)在機(jī)器人發(fā)展的幾個(gè)變化:
過(guò)去的機(jī)器人就是簡(jiǎn)單的機(jī)械外形,更多的是在功能上面模仿人,現(xiàn)在外觀(guān)上需要更加友好,或者是具有仿人形的外觀(guān),這也是現(xiàn)在設(shè)計(jì)技術(shù)的發(fā)展。
過(guò)去的機(jī)器人只能具備單一的服務(wù),現(xiàn)在一個(gè)服務(wù)機(jī)器人可能具有多種功能。
過(guò)去機(jī)器人的市場(chǎng)化主要是清潔和教學(xué)方面,未來(lái)生活、娛樂(lè)、教育和醫(yī)療服務(wù)機(jī)器人都會(huì)走向市場(chǎng)。
過(guò)去的標(biāo)準(zhǔn)也是不統(tǒng)一的,這是目前困擾服務(wù)機(jī)器人最大的問(wèn)題,大家做的系統(tǒng)語(yǔ)言和構(gòu)件都是沒(méi)有標(biāo)準(zhǔn)的,這樣我們沒(méi)有通用性,制約了進(jìn)行大規(guī)模的發(fā)展。
計(jì)算機(jī)技術(shù)之所以可以進(jìn)行大規(guī)模發(fā)展就是因?yàn)闃?biāo)準(zhǔn)化,我們做硬盤(pán)、CPU和鍵盤(pán)的各司其職,最后就以統(tǒng)一的標(biāo)準(zhǔn)接口接入,這個(gè)產(chǎn)業(yè)就可以做大。未來(lái)服務(wù)機(jī)器人肯定要進(jìn)行標(biāo)準(zhǔn)化,就是從硬件系統(tǒng)、軟件系統(tǒng)到各個(gè)方面都會(huì)制定一系列的標(biāo)準(zhǔn)。
過(guò)去的研究主要也是集中在科研院所,目前隨著市場(chǎng)化的發(fā)展,越來(lái)越多的企業(yè)已經(jīng)投入到了這個(gè)行業(yè)當(dāng)中。
國(guó)家政策也把服務(wù)機(jī)器人作為重點(diǎn)支持,現(xiàn)在已經(jīng)制定了國(guó)家的中長(zhǎng)期發(fā)展計(jì)劃,把服務(wù)機(jī)器人列入未來(lái)十五年的重點(diǎn)發(fā)展技術(shù)。
未來(lái)國(guó)家的家用服務(wù)機(jī)器人從吸塵機(jī)器人到教育機(jī)器人,再到其它各種形態(tài)的機(jī)器人都會(huì)出現(xiàn),包括智能康復(fù)、智能可穿戴、玩具和醫(yī)療,隨著標(biāo)準(zhǔn)化的統(tǒng)一,一系列的核心控制器、傳感器、驅(qū)動(dòng)器的企業(yè)都會(huì)大規(guī)模出現(xiàn),這也是為未來(lái)整個(gè)產(chǎn)業(yè)化打下一個(gè)很好的基礎(chǔ)。
服務(wù)機(jī)器人有哪些?
1、國(guó)產(chǎn)服務(wù)機(jī)器人有仿人形機(jī)器人、國(guó)家電網(wǎng)的巡檢機(jī)器人,還有去年比較火熱的送餐機(jī)器人,表現(xiàn)出來(lái)的特點(diǎn)就是技術(shù)上的多樣性。
既有復(fù)雜、高大上和技術(shù)要求比較高的,也有品種比較豐富的,只要能想到就會(huì)出現(xiàn)各式各樣的服務(wù)機(jī)器人,把各種技術(shù)集成起來(lái)就會(huì)推出一些好的服務(wù)機(jī)器人產(chǎn)品,所以從市場(chǎng)的開(kāi)拓性方面還是有很大的空間,可以向不同的領(lǐng)域擴(kuò)展。
2、教育機(jī)器人是過(guò)去十年當(dāng)中服務(wù)機(jī)器人領(lǐng)域最成熟的行業(yè),包括單元套間到功能部件,國(guó)內(nèi)的一系列教育娛樂(lè)機(jī)器人通過(guò)競(jìng)賽的牽引有了很大的發(fā)展。
現(xiàn)在中小學(xué)當(dāng)中都有機(jī)器人的課程,所以也有一個(gè)普及,教育機(jī)器人基本上出現(xiàn)了模塊化,包括里面的部件驅(qū)動(dòng)、傳感單元都已經(jīng)做成了標(biāo)準(zhǔn)化的模塊,所以這樣便于學(xué)生進(jìn)行組裝開(kāi)發(fā),有了一定的標(biāo)準(zhǔn),但是還需要整個(gè)標(biāo)準(zhǔn)繼續(xù)的整合。
3、家用智能吸塵機(jī)器人是目前服務(wù)機(jī)器人當(dāng)中,市場(chǎng)成熟度最高的產(chǎn)品。也是占有服務(wù)機(jī)器人市場(chǎng)銷(xiāo)量最大的一個(gè)產(chǎn)品,但是從它的發(fā)展來(lái)說(shuō)目前也出現(xiàn)了一些問(wèn)題。
首先是價(jià)格的低廉化。
現(xiàn)在國(guó)產(chǎn)機(jī)器人是三個(gè)級(jí)別,一個(gè)是七百塊錢(qián)到七百九十八塊錢(qián),還有就是一千塊錢(qián)和一千二百塊錢(qián),國(guó)外的可以賣(mài)到四五千塊錢(qián)。
另外就是產(chǎn)品的山寨化,只要市場(chǎng)大就做。
深圳做機(jī)器人的大大小小企業(yè)有四十多家,各種各樣的都能做,最后貼出來(lái)的商標(biāo)不一定是誰(shuí)的,但是大家都會(huì)做這個(gè)東西。而技術(shù)上的差異就很大,我買(mǎi)來(lái)的七百塊錢(qián)的吸塵器可能就像沒(méi)頭蒼蠅一樣在屋里亂轉(zhuǎn),能不能吸塵就不知道了。這里面還需要加上一些慣性導(dǎo)航技術(shù)以達(dá)到更先進(jìn)的地面路徑規(guī)劃,至于成本已經(jīng)做得很低了,能不能占領(lǐng)市場(chǎng)也是一個(gè)問(wèn)題。
無(wú)人機(jī)現(xiàn)在是異軍突起,有些公司已經(jīng)做到了六七十個(gè)億。現(xiàn)在的特點(diǎn)首先是價(jià)格平民化,正是因?yàn)樽龅搅巳那K錢(qián)這樣的價(jià)格級(jí)別,大家就可以當(dāng)做一個(gè)玩具來(lái)買(mǎi),市場(chǎng)的銷(xiāo)量也就大起來(lái)了。產(chǎn)品也娛樂(lè)化了,汪峰求婚都用無(wú)人機(jī)送戒指。還有應(yīng)用多樣化,現(xiàn)在從工業(yè)、農(nóng)業(yè)和國(guó)防以及影視娛樂(lè)的拍照都用到了無(wú)人機(jī),多種多樣的應(yīng)用也促進(jìn)了這個(gè)行業(yè)的大發(fā)展。
4、最近比較流行網(wǎng)絡(luò)機(jī)器人,百度的李彥宏剛剛發(fā)布了“度秘”。

(度秘)
當(dāng)然,現(xiàn)在主要還是網(wǎng)絡(luò)助理軟件的形態(tài),以后可能也會(huì)推出真正的機(jī)器人形態(tài),包括孫正義的這種小型機(jī)器人,就是發(fā)展迅猛市場(chǎng)推廣能力強(qiáng),因?yàn)樽叩氖荌T行業(yè)的路線(xiàn)。所以有著非常強(qiáng)大的市場(chǎng)網(wǎng)絡(luò)推廣能力。實(shí)體功能都比較簡(jiǎn)單,基本上就是一個(gè)網(wǎng)絡(luò)攝像頭,因?yàn)樗麄冇匈Y金和原有的網(wǎng)絡(luò)技術(shù)支持,也會(huì)促進(jìn)網(wǎng)絡(luò)機(jī)器人未來(lái)有一個(gè)非常大的發(fā)展。
哈工大對(duì)于服務(wù)機(jī)器人也是做了很多年,目前有迎賓導(dǎo)游、娛樂(lè)游戲、安防巡邏,這些機(jī)器人的形態(tài)不一樣,應(yīng)用的場(chǎng)景也不一樣,主要含的技術(shù)包括人機(jī)交互、移動(dòng)規(guī)劃和作業(yè),還有安全探測(cè)等等技術(shù)和產(chǎn)品。

特種機(jī)器人方面我們有軍用危險(xiǎn)的作業(yè)機(jī)器人,還有可穿戴的機(jī)器人和醫(yī)療機(jī)器人。哈工大機(jī)器人產(chǎn)業(yè)集團(tuán)今年成立以后也推出了一些機(jī)器人,包括掃地機(jī)器人、迎賓機(jī)器人和餐廳機(jī)器人。這些看著都比較熱,所以大家都想從中分一杯羹。
未來(lái)的服務(wù)機(jī)器人到底是什么樣的?
新一代機(jī)器人需要給到一個(gè)重新的定義,過(guò)去我們是把機(jī)器人作為一個(gè)奴仆,你讓它干啥它就干啥,這種關(guān)系要逐漸變成一種合作者,因?yàn)樗谏町?dāng)中跟你共存。

作為一個(gè)合作者,我們需要有機(jī)器人和人互相的感知和交互,機(jī)器人要感知人、理解人、幫助人,人也是一樣,我們把這種關(guān)系進(jìn)行一個(gè)重新的定義。我們要求服務(wù)機(jī)器人更加智能,要有視覺(jué)交互,人最大的能力就是視覺(jué)。
通過(guò)視覺(jué)看到的東西怎么再進(jìn)行視覺(jué)交互?還要進(jìn)行自主學(xué)習(xí)和主動(dòng)學(xué)習(xí)。還有就是更加魯棒(Robust,健壯)的控制系統(tǒng)。
目前之所以不能進(jìn)行很好的應(yīng)用就是因?yàn)槟愕姆?wù)能力不可靠,稍微復(fù)雜一點(diǎn)就會(huì)出問(wèn)題,說(shuō)明它的任務(wù)可執(zhí)行力不強(qiáng)。
面向現(xiàn)在的技術(shù)發(fā)展,根據(jù)大數(shù)據(jù)、云計(jì)算和無(wú)處不在的網(wǎng)絡(luò),韓國(guó)到處都是無(wú)線(xiàn)接入,現(xiàn)在我們到哪里還得加上一個(gè)密碼,所以也制約了服務(wù)機(jī)器人的發(fā)展。

服務(wù)機(jī)器人要想成為一個(gè)伙伴,就要能夠與我們自然交流,可以可靠地服務(wù),最后達(dá)到人機(jī)協(xié)作。
實(shí)現(xiàn)這三個(gè)部分的功能無(wú)非是這些技術(shù)。包括人機(jī)交互、定位導(dǎo)航、路徑規(guī)劃、比較強(qiáng)大的能源、仿人形的結(jié)構(gòu)。這里的技術(shù)很多,我們也在人機(jī)交互方面做了一些研究。我們?nèi)伺c人之間是通過(guò)聽(tīng)、看和感覺(jué)這幾種感知能力對(duì)外界進(jìn)行感知,得到以后我們進(jìn)行、推理和思維,最后變成我們的行為,得到一個(gè)可控的交流和互動(dòng)。
機(jī)器人要想具備人這樣的能力也是一樣,需要通過(guò)聲音識(shí)別、表情識(shí)別和環(huán)境感知才能具備一種很好的交互能力。
機(jī)器人就是通過(guò)這些傳感器達(dá)到對(duì)人的交互,人把機(jī)器人表達(dá)主要的東西通過(guò)喇叭和表情展現(xiàn)出來(lái),所以是一個(gè)互動(dòng)的過(guò)程。
人機(jī)交互的方式有哪些?
首先講一講針對(duì)視覺(jué)的人機(jī)交互。
這是針對(duì)視覺(jué)的情感、理解。對(duì)于一個(gè)人來(lái)說(shuō)最主觀(guān)的就是看臉部表情,今天看老板高不高興直接一看臉色就知道了,高興就多說(shuō)幾句,不高興就躲得遠(yuǎn)一點(diǎn)。
未來(lái)機(jī)器人也要理解人的感情,涉及到對(duì)人臉識(shí)別的技術(shù)。當(dāng)然,我們也有一些具體的方法,包括特征提取和分類(lèi),國(guó)外也有,我們自己也在做。做完以后達(dá)到了什么結(jié)果呢?對(duì)于七種表情的識(shí)別率可以達(dá)到百分之八十。當(dāng)然,這種表情還是比較夸張的,高興和發(fā)怒的時(shí)候是完全不一樣的,但人在自然的交流過(guò)程當(dāng)中不可能這么夸張,人的表情是很微妙的。我們說(shuō)皮笑肉不笑,這到底是笑還是沒(méi)笑,其實(shí)也分辨不出來(lái),這個(gè)過(guò)程需要進(jìn)行一些更加復(fù)雜的特征來(lái)是不,這些技術(shù)就是未來(lái)交流的過(guò)程當(dāng)中需要實(shí)時(shí)了解情緒的變化。

實(shí)際上除了對(duì)表情的理解,人最直接的是手勢(shì)。
通過(guò)一些手勢(shì)也可以達(dá)到很多的命令,我們可以通過(guò)幾個(gè)手勢(shì)的形狀,不同的手勢(shì)從不同的方向可以構(gòu)成很多的動(dòng)作指令。
因?yàn)檎Z(yǔ)言傳遞會(huì)有一些識(shí)別的困難,而通過(guò)一個(gè)手勢(shì)就知道具體的任務(wù)。雖然手勢(shì)有幾十種,但是可以找到比較容易記憶的手勢(shì),然后進(jìn)行交互。復(fù)雜一點(diǎn)的就是人體姿態(tài),無(wú)論是在跑、跳還是摔倒,我們看到的就是整個(gè)人體的姿態(tài)。對(duì)于人體姿態(tài)的研究也是監(jiān)控和跟蹤,包括實(shí)時(shí)監(jiān)控,這種狀況到底是良好還是異常,從動(dòng)作上也可以模仿。
目前我們是通過(guò)把動(dòng)作序列和時(shí)間序列分開(kāi),達(dá)到一個(gè)很好的識(shí)別效果,也可進(jìn)行最后人體特征的讀取。
有些比較明顯的動(dòng)作識(shí)別率就比較高,但單腿跳和跳躍到底是哪一種可能就有些區(qū)分不開(kāi),也會(huì)產(chǎn)生一些誤差,肢體動(dòng)作就相對(duì)更加復(fù)雜。
語(yǔ)音識(shí)別的人機(jī)交互方式。
目前主要是和科大訊飛通過(guò)云計(jì)算平臺(tái)進(jìn)行合作,把人的語(yǔ)音進(jìn)行提取以后在云計(jì)算里面進(jìn)行處理,最后通過(guò)客戶(hù)端進(jìn)行反饋,形成一個(gè)可以實(shí)時(shí)交流的東西。
最后就是基于肌電信號(hào)的人機(jī)交互技術(shù)。
在交互的過(guò)程中,不光是動(dòng)作,肌肉的硬度也是很重要的。所以在人體技術(shù)傳遞和研究當(dāng)中,肌電信號(hào)的研究也是非常重要的方面。模仿人的肌肉的調(diào)節(jié)機(jī)理,可以達(dá)到更好的效果,人體肌肉的松緊程度也可以在冷卻之后體現(xiàn)出來(lái)。

未來(lái)我們是提供一種多種的交互方式,包括語(yǔ)音、肢體動(dòng)作、面部特征,綜合起來(lái)就可以達(dá)到一個(gè)很好的人機(jī)交互。
服務(wù)機(jī)器人的技術(shù)是網(wǎng)絡(luò)化、云計(jì)算、大數(shù)據(jù),智能思維以及決策,從單一功能向多功能發(fā)展,從單一的輸入輸出向多方式交互發(fā)展。
目前服務(wù)機(jī)器人的特點(diǎn)是無(wú)所不知,因?yàn)楹竺孢B接著云計(jì)算和網(wǎng)絡(luò),什么都可以搜索一下,加上WiFi可以達(dá)到互聯(lián)互通,無(wú)所不能是我們對(duì)它的期望,希望能夠像人們?cè)诳苹闷?dāng)中看到的那樣無(wú)所不能。
當(dāng)然,它不能無(wú)法無(wú)天,大家會(huì)擔(dān)心未來(lái)機(jī)器人會(huì)不會(huì)對(duì)人類(lèi)進(jìn)行傷害甚至統(tǒng)治人類(lèi),為了避免這種情況我們就要制定一些規(guī)則。比如過(guò)去的“機(jī)器人三原則”,以后還有可能制定法律讓機(jī)器人來(lái)遵守,這些在未來(lái)都是有可能做到的。