中國(guó)自動(dòng)化學(xué)會(huì)專(zhuān)家咨詢工作委員會(huì)指定宣傳媒體
新聞詳情
gkongbbs

十大科技趨勢(shì)——半機(jī)人

http://casecurityhq.com 2012-02-20 16:02 來(lái)源:二十一世紀(jì)商業(yè)評(píng)論

  2011年剛結(jié)束,CNN預(yù)測(cè)2012年的十大科技趨勢(shì)中,與自然用戶界面相關(guān)的技術(shù)發(fā)展趨勢(shì)占據(jù)三席,觸屏電腦名列榜首,聲控技術(shù)和體感技術(shù)分列六、七位。人機(jī)交互的再一次變革就發(fā)生在你身邊。

  你能想象身體是計(jì)算機(jī)的輸入設(shè)備嗎?

  體溫、脈搏、肌肉都是向計(jì)算機(jī)傳遞指令的信號(hào),佩戴于手臂上端的傳感器能收集肌肉信號(hào),再通過(guò)肌點(diǎn)信號(hào)識(shí)別器解讀手勢(shì)動(dòng)作,從而識(shí)別手掌和手指點(diǎn)擊在皮膚上的信號(hào),向計(jì)算機(jī)傳遞無(wú)線信號(hào),進(jìn)而控制電腦,這就是肌肉-計(jì)算機(jī)界面,研究人員將它命名為“帶有生理感知的自然用戶界面”。

  這個(gè)略顯生疏的長(zhǎng)短語(yǔ)是自然用戶界面的一種新形態(tài),雖然自然用戶界面并不是新鮮事物,但它的流行足以改變你和機(jī)器互動(dòng)方式,隨著自然用戶界面應(yīng)用的廣度和深度的擴(kuò)展,人機(jī)交互的技術(shù)革命必將引發(fā)一場(chǎng)新的科技產(chǎn)業(yè)變革。

  早期的自然用戶界面是命令行界面和圖形用戶界面的補(bǔ)充。早在1970年代起,多位美國(guó)計(jì)算機(jī)學(xué)家進(jìn)行了手勢(shì)、多點(diǎn)觸摸系統(tǒng)的實(shí)驗(yàn),而彼時(shí)正是命令行界面和和圖形用戶界面的時(shí)代,用戶需要借助鍵盤(pán)輸入指令,或者用鼠標(biāo)點(diǎn)擊圖形下達(dá)命令讓機(jī)器完成相應(yīng)的動(dòng)作。

  而在自然用戶界面,用戶下達(dá)的指令是日常的行為,例如,手指觸碰圖標(biāo)開(kāi)啟程序;與機(jī)器對(duì)話下達(dá)口頭命令,如開(kāi)機(jī)、關(guān)機(jī)、跳轉(zhuǎn)窗口等;圖標(biāo)隨著手指而移動(dòng)……總的來(lái)說(shuō),自然用戶界面利用手勢(shì)、機(jī)器推斷和意識(shí)情景以及豐富的3D環(huán)境讓計(jì)算變得更簡(jiǎn)單、便捷,讓用戶的體驗(yàn)變得更加直觀。

  IBM的科學(xué)家曾在2007年預(yù)測(cè),5年后,人們不再需要密碼。在沒(méi)有傳統(tǒng)字符密碼的環(huán)境中,生物識(shí)別變得尤為重要,如指紋識(shí)別、視網(wǎng)膜識(shí)別、人臉識(shí)別。

  人臉識(shí)別技術(shù)的基礎(chǔ)技術(shù)已經(jīng)得到較成熟的發(fā)展,在公安、安防領(lǐng)域?qū)崿F(xiàn)了較為廣泛的應(yīng)用。網(wǎng)易的最新研究則實(shí)現(xiàn)了基于互聯(lián)網(wǎng)的人臉識(shí)別應(yīng)用,人臉的錄入、掃描、匹配工作均可通過(guò)互聯(lián)網(wǎng)來(lái)完成。未來(lái),你可能像《霹靂嬌娃》中女戰(zhàn)士在進(jìn)入密室時(shí)那樣輸入郵箱、游戲賬戶的密碼——通過(guò)人臉或者視網(wǎng)膜的匹配登錄。網(wǎng)易稱(chēng)這項(xiàng)技術(shù)將有望在2012年上半年投入到網(wǎng)易郵箱登錄上,“人臉識(shí)別技術(shù)不存在將軍令、手機(jī)密碼等傳統(tǒng)密碼使用中常出現(xiàn)的遺失、被盜的難題。”網(wǎng)易杭州研究院副總監(jiān)汪源說(shuō),“用戶可以選擇傳統(tǒng)的字符和人臉兩種密碼登錄郵箱。”

  相比指紋識(shí)別、視網(wǎng)膜識(shí)別,人臉識(shí)別技術(shù)在密碼保護(hù)領(lǐng)域有先天不足。雖然理論上說(shuō),配備超級(jí)計(jì)算機(jī)和超高清圖像設(shè)備后,人臉識(shí)別精準(zhǔn)度能達(dá)到99.9%,但現(xiàn)實(shí)條件很可能是室內(nèi)光線、普通計(jì)算機(jī)和攝像頭的組合。如果僅核對(duì)臉部圖像是否匹配,一張照片就能破解密碼了。

  但人臉識(shí)別技術(shù)在其他商業(yè)領(lǐng)域和社交媒體應(yīng)用中的前景廣闊。三電株式會(huì)社和岡谷株式會(huì)社研制了一款最新自動(dòng)販賣(mài)機(jī),一旦顧客靠近機(jī)器,人臉識(shí)別系統(tǒng)將自動(dòng)分析顧客的容貌來(lái)判定顧客的年齡,并播放適合該年齡層的廣告。自動(dòng)販賣(mài)機(jī)2.0版將會(huì)推向北美市場(chǎng)。

  語(yǔ)音識(shí)別技術(shù)是也人機(jī)交互應(yīng)用中的重要一環(huán)。人機(jī)對(duì)話的前提在于語(yǔ)音識(shí)別技術(shù)——語(yǔ)音識(shí)別和語(yǔ)義識(shí)別。語(yǔ)音識(shí)別即是機(jī)器捕捉到用戶的話語(yǔ),并將其在后臺(tái)轉(zhuǎn)化成計(jì)算機(jī)語(yǔ)言,而語(yǔ)義識(shí)別則是讓計(jì)算機(jī)聽(tīng)懂用戶所表達(dá)的含義。語(yǔ)音識(shí)別技術(shù)中的兩個(gè)難點(diǎn)在于提高準(zhǔn)確度和實(shí)現(xiàn)人工智能。

  UC優(yōu)視研發(fā)出一款適用于手機(jī)的語(yǔ)音瀏覽器,它能減少用戶在使用手機(jī)瀏覽網(wǎng)頁(yè)時(shí)的輸入動(dòng)作,而把語(yǔ)言作為指令,包括前進(jìn)、語(yǔ)言搜索、跳轉(zhuǎn)網(wǎng)頁(yè)等。

  但通常人們說(shuō)的同一個(gè)詞語(yǔ)能表達(dá)多個(gè)含義。“讓機(jī)器在不同的場(chǎng)景下識(shí)別語(yǔ)義是語(yǔ)言識(shí)別系統(tǒng)的難點(diǎn)所在。”UC優(yōu)視產(chǎn)品總監(jiān)鄭叢威說(shuō),“這就是人工智能需要解決的問(wèn)題。”在現(xiàn)階段,人工智能是基于對(duì)用戶的使用習(xí)慣進(jìn)行統(tǒng)計(jì)分析的結(jié)果而達(dá)到的智能。

  但如何讓瀏覽器理解用戶所說(shuō)的指令是搜索相關(guān)網(wǎng)頁(yè),還是跳轉(zhuǎn)到相應(yīng)的網(wǎng)站呢?UC優(yōu)視對(duì)用戶使用UCweb瀏覽器的習(xí)慣進(jìn)行統(tǒng)計(jì)分析,并選用概率最大的結(jié)果作為語(yǔ)音瀏覽器的指令。而遇到語(yǔ)音瀏覽器無(wú)法識(shí)別的場(chǎng)景,瀏覽器會(huì)出現(xiàn)多個(gè)選項(xiàng)共用戶選擇,這時(shí)用戶還是需要手勢(shì)等其他操作。

  2007年Google為了測(cè)試、改進(jìn)其語(yǔ)音搜索技術(shù),發(fā)布了免費(fèi)的語(yǔ)音搜索服務(wù)。百度在2008年效仿Google公開(kāi)測(cè)試了“百度語(yǔ)音搜索”的電話業(yè)務(wù),但最終沒(méi)有普及。2009年,Google便發(fā)布了中文版的語(yǔ)音搜索軟件,運(yùn)用于諾基亞塞班操作平臺(tái),但一直沒(méi)有得到更廣泛應(yīng)用。

  事實(shí)上,移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展是手機(jī)領(lǐng)域人機(jī)交互興起的催化劑。受限于手機(jī)屏幕的尺寸,語(yǔ)音識(shí)別、語(yǔ)音搜索逐漸成為手機(jī)人機(jī)交互的新寵。在智能手機(jī)領(lǐng)域,UC語(yǔ)音瀏覽器僅是數(shù)目龐大的推廣語(yǔ)音識(shí)別的軟件之一,Siri的發(fā)布,掀起了人機(jī)對(duì)話的熱潮,騰訊QQ、微信等即時(shí)通訊工具都具備了語(yǔ)音識(shí)別功能。為了省去用戶在不到5英寸的小屏幕上打字的麻煩,韋伯斯特詞典、有道詞典都配備了語(yǔ)音識(shí)別功能。鄭叢威預(yù)計(jì)語(yǔ)音識(shí)別和語(yǔ)音搜索的市場(chǎng)前景相當(dāng)廣闊,UC在2012年第一季度正式發(fā)布UC語(yǔ)音瀏覽器后,20%的用戶會(huì)選擇替代目前使用的版本。

  除了語(yǔ)音、人臉識(shí)別,捕捉人們的動(dòng)作是自然用戶界面的另一個(gè)重點(diǎn)領(lǐng)域。游戲終端設(shè)備已經(jīng)在這一領(lǐng)域取得突破,Kinect游戲終端實(shí)現(xiàn)了人臉識(shí)別、手勢(shì)、動(dòng)作等綜合自然用戶界面技術(shù)。2010年11月4日微軟發(fā)布Kinect的60天內(nèi),Kinect累計(jì)銷(xiāo)售800萬(wàn)臺(tái),總銷(xiāo)量突破1000萬(wàn)臺(tái),足可見(jiàn)其受歡迎程度。

  自然用戶界面讓人們甩掉鼠標(biāo)和鍵盤(pán)玩游戲成為可能,這無(wú)疑挑逗著玩家的好奇心。

  智能游戲終端發(fā)布后,市場(chǎng)普遍認(rèn)為Kinect可以實(shí)現(xiàn)更多的價(jià)值。由于機(jī)器可以捕捉并反應(yīng)用戶肢體動(dòng)作,研究人員可以操控機(jī)器人進(jìn)行科學(xué)研究,例如代替自己進(jìn)入危險(xiǎn)的事故現(xiàn)場(chǎng)進(jìn)行操作。而Top Shop莫斯科旗艦店則打起了智能試衣鏡的主意,用戶只需要站在屏幕前,點(diǎn)擊對(duì)應(yīng)的商品,就可以“試穿”所有的衣服、鞋子,借助這一應(yīng)用,服裝電子商務(wù)能夠得到更好的展示機(jī)會(huì)。

  自然用戶界面強(qiáng)調(diào)用戶通過(guò)語(yǔ)言、手勢(shì)、動(dòng)作,而不是鍵盤(pán)、鼠標(biāo)操控計(jì)算機(jī),以此來(lái)標(biāo)榜“自然”。但不得不注意的是,自然用戶界面也可能會(huì)帶來(lái)一些“不自然”的結(jié)果。

  將捕捉到的動(dòng)作傳遞到計(jì)算機(jī),再由計(jì)算機(jī)反映在屏幕上的時(shí)滯引起了用戶的不滿,智能游戲終端機(jī)的反應(yīng)速度和鼠標(biāo)的反應(yīng)速度還是有一定的差距。而一些對(duì)力道、角度要求嚴(yán)格的應(yīng)用場(chǎng)合中,例如,遠(yuǎn)程醫(yī)療手術(shù),自然用戶界面所提供的體驗(yàn)還有很大的提升空間。此外,人工智能的研究還處于公司各自為營(yíng)的分散階段,也就是各個(gè)公司的統(tǒng)計(jì)結(jié)果存在差異,缺乏一個(gè)統(tǒng)一的人工智能標(biāo)準(zhǔn),這可能會(huì)成為制約業(yè)界技術(shù)精準(zhǔn)化的因素之一。

  “自然用戶界面在目前還處于‘點(diǎn)’的突破階段,要實(shí)現(xiàn)‘面’上的廣泛應(yīng)用尚需假以時(shí)日。”鄭叢威說(shuō)。

  但毋庸置疑,自然用戶界面將會(huì)成為未來(lái)技術(shù)發(fā)展的主流。

版權(quán)所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved