中國(guó)自動(dòng)化學(xué)會(huì)專家咨詢工作委員會(huì)指定宣傳媒體
新聞詳情
gkongbbs

人機(jī)交互的昨天、今天和明天

http://casecurityhq.com 2015-06-19 10:39 來(lái)源:中國(guó)科學(xué)報(bào)

  什么是人機(jī)交互?簡(jiǎn)單來(lái)說(shuō),就是“人和機(jī)器打交道的方式”。人和計(jì)算機(jī)打交道根源于人類把計(jì)算機(jī)當(dāng)成一種有效的計(jì)算服務(wù)工具。計(jì)算機(jī)自產(chǎn)生以來(lái),計(jì)算能力日益強(qiáng)大,人類對(duì)計(jì)算機(jī)的態(tài)度也開始在計(jì)算機(jī)只是呆板的“機(jī)器”,還是可能變得像“人”一樣聰明,甚至比人更聰明之間搖擺。這種模糊的態(tài)度伴隨著計(jì)算機(jī)的進(jìn)化不斷演變。

  人機(jī)交互的前世今生

  目前,計(jì)算機(jī)的發(fā)展經(jīng)歷過(guò)幾種典型形態(tài):算盤、繼電器計(jì)算器、計(jì)算機(jī)、個(gè)人電腦、智能移動(dòng)終端等,計(jì)算機(jī)形態(tài)的演變直接導(dǎo)致了人機(jī)交互形式的變化。

  算盤是中國(guó)特色的計(jì)算工具,由于無(wú)法存儲(chǔ)中間計(jì)算結(jié)果,算盤具有使用方式復(fù)雜、計(jì)算過(guò)程緩慢的缺陷。而繼電器計(jì)算器是現(xiàn)在計(jì)算機(jī)的雛形,但其計(jì)算速度和實(shí)用有很大限制。

  第一臺(tái)真正意義的計(jì)算機(jī)產(chǎn)生于1946年,它占地170平方米,重30多噸,體型有半個(gè)足球場(chǎng)那么大,通過(guò)穿孔紙帶的方式輸入和輸出。早期計(jì)算機(jī)交互方式不僅復(fù)雜,同樣計(jì)算緩慢。

  1983年11月,蘋果公司的喬布斯在Comdex大展上首次展示了Macintosh計(jì)算機(jī),從此,個(gè)人電腦千篇一律的黑屏字符界面逐漸被生動(dòng)、極富個(gè)性的圖形界面代替。圖形界面使得鼠標(biāo)、鍵盤變成用戶自由操作電腦的有力工具,也使得觸覺和筆式交互成為可能。

  1971年,肯塔基大學(xué)研究基金會(huì)的一名青年教師塞繆爾·赫斯特開發(fā)出一款觸摸傳感器“AccuTouch”,為后來(lái)透明觸摸屏發(fā)展奠定了基礎(chǔ)。3年后,赫斯特研制出了真正意義上的觸摸屏。

  1985年出現(xiàn)了第一臺(tái)現(xiàn)代意義上的移動(dòng)電話,它將電源和天線放置在一個(gè)盒子中,重達(dá)3公斤,笨重且不方便,交互操作無(wú)從談起。

  1993年,隨著手機(jī)迅速瘦身以及觸摸屏技術(shù)的發(fā)展,IBM公司與貝爾電話(南方)公司合作推出了帶觸摸屏的IBMSimon手機(jī)。這是歷史上第一款真正意義的觸摸屏智能手機(jī)。但此時(shí)的觸摸屏手機(jī)無(wú)論是從成本、耐用性、可維護(hù)性還是使用習(xí)慣上看,比之普通的按鍵手機(jī)都沒有明顯的優(yōu)勢(shì)。這種局面直到蘋果公司開發(fā)的iPhone手機(jī)問(wèn)世,才被徹底改變。至此,觸摸方式成為手機(jī)交互的主流。

  自上世紀(jì)90年代以來(lái),隨著手寫識(shí)別、語(yǔ)音識(shí)別、網(wǎng)絡(luò)通信技術(shù)的發(fā)展,人機(jī)交互已發(fā)生了巨變,一個(gè)完全不懂編程以及網(wǎng)絡(luò)通信原理的普通小孩,可能會(huì)比計(jì)算機(jī)科學(xué)家和網(wǎng)絡(luò)工程師更好地使用計(jì)算機(jī)。方式的變革使得人機(jī)交互變得簡(jiǎn)單,而這個(gè)變革,就發(fā)生在短短不到30年內(nèi)??深A(yù)見的是,未來(lái)計(jì)算機(jī)會(huì)更加智能,人類使用它會(huì)更加自然和簡(jiǎn)單。

  未來(lái)的機(jī)器人比人還聰明?

  就像一些科幻電影里描述的那樣,未來(lái)的人機(jī)交互模式是“自由”“智能”“自然”的?!冻荜憫?zhàn)隊(duì)》中的暖男型智能健康看護(hù)機(jī)器人“大白”、《鋼鐵俠2》中的人工觸碰交互技術(shù)實(shí)驗(yàn)室的人工智能管家“賈維斯”、《星際穿越》中能干、聰明又幽默的“塔斯”等,這些未來(lái)的計(jì)算機(jī)通過(guò)語(yǔ)音識(shí)別等技術(shù)理解人類語(yǔ)言,通過(guò)姿態(tài)識(shí)別和情感檢測(cè)技術(shù)判斷人的情緒,通過(guò)非接觸生物特征檢測(cè)與識(shí)別技術(shù)判斷當(dāng)前人的生理活動(dòng)狀態(tài)……借助專家知識(shí)庫(kù),智能計(jì)算機(jī)可以對(duì)人的健康、當(dāng)前情緒、當(dāng)前狀態(tài)做決策和判斷。從一定程度上講,未來(lái)的機(jī)器人甚至比人還聰明,比如大白可以采用非觸碰方式獲得脈搏和心跳數(shù)據(jù),并察覺腦電活動(dòng)情況;賈維斯可以聽從鋼鐵俠的指令,采用全息投影的方式在空氣中展示原子核的內(nèi)部模型,甚至糾正鋼鐵俠的口誤。

  未來(lái),這些健康聰明的智能“人形”計(jì)算機(jī)使得計(jì)算機(jī)比人更完美,人機(jī)交互的未來(lái)是美好的、讓人期待的。

  當(dāng)然,科幻作品中歷來(lái)不缺乏對(duì)人類濫用科技成果拷問(wèn)的作品,比如《2001太空奧德賽漫游》中的深空探索太空旅行管家“HAL500”,《異形》中只聽命于主人設(shè)定任務(wù)的人工智能艾什(Ash)和主教(Bishop),還有《普羅米修斯》中為了完成任務(wù)背叛人類的人工智能David。這類計(jì)算機(jī)違反了機(jī)器人三定律,從人類的道德審判角度看,它們是邪惡的。但是從主人制造它們時(shí)賦予的使命看,它們是正確的。究竟計(jì)算機(jī)的智能發(fā)展以及人機(jī)交互何去何從,是一個(gè)值得深思的問(wèn)題。

  告別單一模式

  多模態(tài)自然人機(jī)交互是下一代人機(jī)交互的發(fā)展趨勢(shì)。融合視覺、聽覺、觸覺、嗅覺甚至味覺的多模態(tài)交互方式,其表達(dá)效率和表達(dá)的信息都優(yōu)于單一的視覺或者聽覺模式。

  多模態(tài)自然人機(jī)交互主要分為3個(gè)模塊,分別是信息多模態(tài)交互信息輸入、多模態(tài)交互信息融合和處理、多模態(tài)交互信息反饋。其中,信息輸入模塊主要接收來(lái)自人的“視聽觸嗅味”五感信息,然后借助多模態(tài)信息融合和理解模塊,形成“感”覺和認(rèn)知,并根據(jù)專家知識(shí)庫(kù)系統(tǒng)和檢索技術(shù)形成對(duì)用戶的信息反饋,構(gòu)建出多模態(tài)自然人機(jī)交互系統(tǒng)。

  從自然人機(jī)交互的未來(lái)趨勢(shì)看,高度便利的多模態(tài)自然人機(jī)口語(yǔ)對(duì)話模式是最為自然和最理想人機(jī)交互方式。比如,利用中科院自動(dòng)化所構(gòu)建的一個(gè)多模態(tài)自然人機(jī)交互系統(tǒng),用戶可以自由地和兩個(gè)設(shè)置有不同聊天主題的數(shù)字虛擬人交互,對(duì)話主題包括咖啡、天氣、科普、娛樂(lè)等主題。這種新型的多通道融合的人機(jī)對(duì)話模式,是下一代新型人機(jī)界面操作模式的有效探索。

  目前,盡管多模態(tài)自然人機(jī)對(duì)話已經(jīng)獲得了很大進(jìn)展,但由于環(huán)境噪聲、用戶方言口音及光照變化遮擋情況下的影響,計(jì)算機(jī)對(duì)人類視聽覺信息獲取、理解還存在一定誤差,加上目前計(jì)算機(jī)在自然語(yǔ)言理解方面還存在一定困難,這使得計(jì)算機(jī)在與人交互的時(shí)候,存在答非所問(wèn)的情形。這類現(xiàn)象嚴(yán)重影響了人機(jī)交互的體驗(yàn)。其根本原因在于,計(jì)算機(jī)雖然計(jì)算能力越來(lái)越強(qiáng),然而對(duì)人而言很簡(jiǎn)單的推理、聯(lián)想和夸張,計(jì)算機(jī)卻很困難。因此,讓計(jì)算機(jī)具有“智能”或者讓計(jì)算機(jī)具有“思維”能力,是計(jì)算機(jī)是否能與人自由交互的關(guān)鍵。

  計(jì)算機(jī)是否會(huì)發(fā)展出意識(shí)?

  隨著近幾年深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法在學(xué)術(shù)界和工業(yè)界的成功,很多人愿意相信計(jì)算機(jī)會(huì)進(jìn)化出和人一樣的意識(shí)和思維能力。2009年,歐盟(瑞士洛桑理工學(xué)院)在藍(lán)腦計(jì)劃(Blue Brain)中用微電路芯片模擬了36萬(wàn)個(gè)細(xì)胞的大腦皮質(zhì),當(dāng)給這些微電路芯片群“看”或者“聽”一些大自然的照片和聲音時(shí),微電路芯片群自發(fā)地產(chǎn)生了伽馬振蕩波。伽馬波是大腦中一種快速的電振蕩,它可能涉及到學(xué)習(xí)過(guò)程、記憶力和注意力。這種周期為每秒25~80次的伽馬波腦電波不能就說(shuō)是意識(shí),但卻是驗(yàn)證類大腦意識(shí)活動(dòng)存在的重要特征。

  藍(lán)腦計(jì)劃的確促使很多科學(xué)家和工程師們堅(jiān)信計(jì)算機(jī)會(huì)“進(jìn)化”出意識(shí),一些研究機(jī)構(gòu)(甚至政府)都啟動(dòng)了相應(yīng)的類腦計(jì)劃。

  計(jì)算機(jī)是否會(huì)發(fā)展出意識(shí)會(huì)帶來(lái)人機(jī)交互發(fā)展的多種可能性。

  如果計(jì)算機(jī)產(chǎn)生意識(shí),并通過(guò)進(jìn)化發(fā)展出機(jī)器人自己的語(yǔ)言、視覺以及情感等“生理”系統(tǒng),則說(shuō)明人類最引以為自豪的“思維”能力是可以按照一定模式被設(shè)計(jì)然后進(jìn)化出來(lái)。如果機(jī)器人是被人類創(chuàng)造出來(lái)的,那么人類是否也是被設(shè)計(jì)然后進(jìn)化出來(lái)的?

  在同一個(gè)星球上,如果機(jī)器人進(jìn)化能力始終超不過(guò)人類進(jìn)化能力,人類可以借助完全智能的計(jì)算機(jī)在深海探索、深空外星移民等領(lǐng)域獲得重大突破。那么未來(lái)的人機(jī)交互技術(shù)主要在于研究:向外怎么利用人工智能進(jìn)行太空探索,向內(nèi)怎么利用微型智能機(jī)器人進(jìn)入人體為人類健康服務(wù)。當(dāng)然,由于智能機(jī)器人有自己的情感系統(tǒng),人機(jī)交互技術(shù)也有可能演變?yōu)槲幕涣鞯氖侄危热?,人機(jī)交互技術(shù)可能會(huì)成為論證人是否可以與“機(jī)器人”結(jié)婚之類的倫理問(wèn)題的基礎(chǔ)。

  如果人工智能進(jìn)化超過(guò)人類,一旦機(jī)器人具有“生死”的意識(shí),因?yàn)橘Y源競(jìng)爭(zhēng),那么一些科幻電影中的常見橋段就會(huì)成為現(xiàn)實(shí):機(jī)器戰(zhàn)勝人類導(dǎo)致人類成為機(jī)器的工具。這種情況下,人機(jī)交互技術(shù)將是用于研究人類抵抗機(jī)器人的手段和武器的重要工具。

  如果計(jì)算機(jī)不能產(chǎn)生意識(shí),則說(shuō)明目前人類尚沒發(fā)現(xiàn)宇宙中的類人智能的產(chǎn)生規(guī)律?;蛟S人類智能產(chǎn)生的規(guī)律本身除了外在條件之外,本身就是一個(gè)隨機(jī)的問(wèn)題。沿著這個(gè)方向發(fā)展的人機(jī)交互技術(shù),將是人類利用計(jì)算機(jī)的在工業(yè)控制、計(jì)算服務(wù)、醫(yī)療診斷、外空探索等重要工具。即便這樣,人類探索人工智能還任重而道遠(yuǎn)。

  究竟人機(jī)交互何去何從,我會(huì)說(shuō)“我會(huì)永遠(yuǎn)欣賞,未來(lái)你的任何模樣”。(楊明浩 中科院自動(dòng)化所模式識(shí)別 國(guó)家重點(diǎn)實(shí)驗(yàn)室副研究員)

版權(quán)所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved