中國自動化學(xué)會專家咨詢工作委員會指定宣傳媒體
新聞詳情
gkongbbs

十大科技趨勢——半機人

http://casecurityhq.com 2012-02-20 16:02 來源:二十一世紀(jì)商業(yè)評論

  2011年剛結(jié)束,CNN預(yù)測2012年的十大科技趨勢中,與自然用戶界面相關(guān)的技術(shù)發(fā)展趨勢占據(jù)三席,觸屏電腦名列榜首,聲控技術(shù)和體感技術(shù)分列六、七位。人機交互的再一次變革就發(fā)生在你身邊。

  你能想象身體是計算機的輸入設(shè)備嗎?

  體溫、脈搏、肌肉都是向計算機傳遞指令的信號,佩戴于手臂上端的傳感器能收集肌肉信號,再通過肌點信號識別器解讀手勢動作,從而識別手掌和手指點擊在皮膚上的信號,向計算機傳遞無線信號,進而控制電腦,這就是肌肉-計算機界面,研究人員將它命名為“帶有生理感知的自然用戶界面”。

  這個略顯生疏的長短語是自然用戶界面的一種新形態(tài),雖然自然用戶界面并不是新鮮事物,但它的流行足以改變你和機器互動方式,隨著自然用戶界面應(yīng)用的廣度和深度的擴展,人機交互的技術(shù)革命必將引發(fā)一場新的科技產(chǎn)業(yè)變革。

  早期的自然用戶界面是命令行界面和圖形用戶界面的補充。早在1970年代起,多位美國計算機學(xué)家進行了手勢、多點觸摸系統(tǒng)的實驗,而彼時正是命令行界面和和圖形用戶界面的時代,用戶需要借助鍵盤輸入指令,或者用鼠標(biāo)點擊圖形下達(dá)命令讓機器完成相應(yīng)的動作。

  而在自然用戶界面,用戶下達(dá)的指令是日常的行為,例如,手指觸碰圖標(biāo)開啟程序;與機器對話下達(dá)口頭命令,如開機、關(guān)機、跳轉(zhuǎn)窗口等;圖標(biāo)隨著手指而移動……總的來說,自然用戶界面利用手勢、機器推斷和意識情景以及豐富的3D環(huán)境讓計算變得更簡單、便捷,讓用戶的體驗變得更加直觀。

  IBM的科學(xué)家曾在2007年預(yù)測,5年后,人們不再需要密碼。在沒有傳統(tǒng)字符密碼的環(huán)境中,生物識別變得尤為重要,如指紋識別、視網(wǎng)膜識別、人臉識別。

  人臉識別技術(shù)的基礎(chǔ)技術(shù)已經(jīng)得到較成熟的發(fā)展,在公安、安防領(lǐng)域?qū)崿F(xiàn)了較為廣泛的應(yīng)用。網(wǎng)易的最新研究則實現(xiàn)了基于互聯(lián)網(wǎng)的人臉識別應(yīng)用,人臉的錄入、掃描、匹配工作均可通過互聯(lián)網(wǎng)來完成。未來,你可能像《霹靂嬌娃》中女戰(zhàn)士在進入密室時那樣輸入郵箱、游戲賬戶的密碼——通過人臉或者視網(wǎng)膜的匹配登錄。網(wǎng)易稱這項技術(shù)將有望在2012年上半年投入到網(wǎng)易郵箱登錄上,“人臉識別技術(shù)不存在將軍令、手機密碼等傳統(tǒng)密碼使用中常出現(xiàn)的遺失、被盜的難題。”網(wǎng)易杭州研究院副總監(jiān)汪源說,“用戶可以選擇傳統(tǒng)的字符和人臉兩種密碼登錄郵箱。”

  相比指紋識別、視網(wǎng)膜識別,人臉識別技術(shù)在密碼保護領(lǐng)域有先天不足。雖然理論上說,配備超級計算機和超高清圖像設(shè)備后,人臉識別精準(zhǔn)度能達(dá)到99.9%,但現(xiàn)實條件很可能是室內(nèi)光線、普通計算機和攝像頭的組合。如果僅核對臉部圖像是否匹配,一張照片就能破解密碼了。

  但人臉識別技術(shù)在其他商業(yè)領(lǐng)域和社交媒體應(yīng)用中的前景廣闊。三電株式會社和岡谷株式會社研制了一款最新自動販賣機,一旦顧客靠近機器,人臉識別系統(tǒng)將自動分析顧客的容貌來判定顧客的年齡,并播放適合該年齡層的廣告。自動販賣機2.0版將會推向北美市場。

  語音識別技術(shù)是也人機交互應(yīng)用中的重要一環(huán)。人機對話的前提在于語音識別技術(shù)——語音識別和語義識別。語音識別即是機器捕捉到用戶的話語,并將其在后臺轉(zhuǎn)化成計算機語言,而語義識別則是讓計算機聽懂用戶所表達(dá)的含義。語音識別技術(shù)中的兩個難點在于提高準(zhǔn)確度和實現(xiàn)人工智能。

  UC優(yōu)視研發(fā)出一款適用于手機的語音瀏覽器,它能減少用戶在使用手機瀏覽網(wǎng)頁時的輸入動作,而把語言作為指令,包括前進、語言搜索、跳轉(zhuǎn)網(wǎng)頁等。

  但通常人們說的同一個詞語能表達(dá)多個含義。“讓機器在不同的場景下識別語義是語言識別系統(tǒng)的難點所在。”UC優(yōu)視產(chǎn)品總監(jiān)鄭叢威說,“這就是人工智能需要解決的問題。”在現(xiàn)階段,人工智能是基于對用戶的使用習(xí)慣進行統(tǒng)計分析的結(jié)果而達(dá)到的智能。

  但如何讓瀏覽器理解用戶所說的指令是搜索相關(guān)網(wǎng)頁,還是跳轉(zhuǎn)到相應(yīng)的網(wǎng)站呢?UC優(yōu)視對用戶使用UCweb瀏覽器的習(xí)慣進行統(tǒng)計分析,并選用概率最大的結(jié)果作為語音瀏覽器的指令。而遇到語音瀏覽器無法識別的場景,瀏覽器會出現(xiàn)多個選項共用戶選擇,這時用戶還是需要手勢等其他操作。

  2007年Google為了測試、改進其語音搜索技術(shù),發(fā)布了免費的語音搜索服務(wù)。百度在2008年效仿Google公開測試了“百度語音搜索”的電話業(yè)務(wù),但最終沒有普及。2009年,Google便發(fā)布了中文版的語音搜索軟件,運用于諾基亞塞班操作平臺,但一直沒有得到更廣泛應(yīng)用。

  事實上,移動互聯(lián)網(wǎng)的快速發(fā)展是手機領(lǐng)域人機交互興起的催化劑。受限于手機屏幕的尺寸,語音識別、語音搜索逐漸成為手機人機交互的新寵。在智能手機領(lǐng)域,UC語音瀏覽器僅是數(shù)目龐大的推廣語音識別的軟件之一,Siri的發(fā)布,掀起了人機對話的熱潮,騰訊QQ、微信等即時通訊工具都具備了語音識別功能。為了省去用戶在不到5英寸的小屏幕上打字的麻煩,韋伯斯特詞典、有道詞典都配備了語音識別功能。鄭叢威預(yù)計語音識別和語音搜索的市場前景相當(dāng)廣闊,UC在2012年第一季度正式發(fā)布UC語音瀏覽器后,20%的用戶會選擇替代目前使用的版本。

  除了語音、人臉識別,捕捉人們的動作是自然用戶界面的另一個重點領(lǐng)域。游戲終端設(shè)備已經(jīng)在這一領(lǐng)域取得突破,Kinect游戲終端實現(xiàn)了人臉識別、手勢、動作等綜合自然用戶界面技術(shù)。2010年11月4日微軟發(fā)布Kinect的60天內(nèi),Kinect累計銷售800萬臺,總銷量突破1000萬臺,足可見其受歡迎程度。

  自然用戶界面讓人們甩掉鼠標(biāo)和鍵盤玩游戲成為可能,這無疑挑逗著玩家的好奇心。

  智能游戲終端發(fā)布后,市場普遍認(rèn)為Kinect可以實現(xiàn)更多的價值。由于機器可以捕捉并反應(yīng)用戶肢體動作,研究人員可以操控機器人進行科學(xué)研究,例如代替自己進入危險的事故現(xiàn)場進行操作。而Top Shop莫斯科旗艦店則打起了智能試衣鏡的主意,用戶只需要站在屏幕前,點擊對應(yīng)的商品,就可以“試穿”所有的衣服、鞋子,借助這一應(yīng)用,服裝電子商務(wù)能夠得到更好的展示機會。

  自然用戶界面強調(diào)用戶通過語言、手勢、動作,而不是鍵盤、鼠標(biāo)操控計算機,以此來標(biāo)榜“自然”。但不得不注意的是,自然用戶界面也可能會帶來一些“不自然”的結(jié)果。

  將捕捉到的動作傳遞到計算機,再由計算機反映在屏幕上的時滯引起了用戶的不滿,智能游戲終端機的反應(yīng)速度和鼠標(biāo)的反應(yīng)速度還是有一定的差距。而一些對力道、角度要求嚴(yán)格的應(yīng)用場合中,例如,遠(yuǎn)程醫(yī)療手術(shù),自然用戶界面所提供的體驗還有很大的提升空間。此外,人工智能的研究還處于公司各自為營的分散階段,也就是各個公司的統(tǒng)計結(jié)果存在差異,缺乏一個統(tǒng)一的人工智能標(biāo)準(zhǔn),這可能會成為制約業(yè)界技術(shù)精準(zhǔn)化的因素之一。

  “自然用戶界面在目前還處于‘點’的突破階段,要實現(xiàn)‘面’上的廣泛應(yīng)用尚需假以時日。”鄭叢威說。

  但毋庸置疑,自然用戶界面將會成為未來技術(shù)發(fā)展的主流。

版權(quán)所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved