中國(guó)自動(dòng)化學(xué)會(huì)專家咨詢工作委員會(huì)指定宣傳媒體
新聞詳情
gkongbbs

人機(jī)大戰(zhàn)再對(duì)決 沃森將人工智能推向新階段

http://casecurityhq.com 2011-02-21 11:54 來(lái)源:中國(guó)計(jì)算機(jī)報(bào)

  深藍(lán)余波未盡,沃森熱浪又起。超級(jí)計(jì)算機(jī)系統(tǒng)再次與人類對(duì)決,究竟誰(shuí)能獲勝?剛剛結(jié)束的美國(guó)智力競(jìng)賽節(jié)目《危險(xiǎn)邊緣》的人機(jī)對(duì)戰(zhàn)中,IBM超級(jí)計(jì)算機(jī)系統(tǒng)沃森戰(zhàn)勝了人類冠軍!沃森是20多名IBM研究人員4年心血的結(jié)晶,正是他們突破性地給予了沃森理解自然語(yǔ)言和精確回答問(wèn)題的能力,才將人工智能推向新的階段。 所以,盡管沃森取得了比賽的勝利,但是人類才是最終的智者。

  “在20年前,可能所有人都會(huì)認(rèn)為機(jī)器在智力問(wèn)答中戰(zhàn)勝人類是不可能的。”圖靈獎(jiǎng)獲得者、斯坦福大學(xué)人工智能專家Edward Feigenbaum就曾發(fā)出這樣的感嘆。但是,今天它變成了現(xiàn)實(shí)!

  在美國(guó)家喻戶曉的電視智力競(jìng)賽節(jié)目《危險(xiǎn)邊緣( Jeopardy!)》中,IBM超級(jí)計(jì)算機(jī)系統(tǒng)沃森(WATSON)在北京時(shí)間2月17日上午戰(zhàn)勝了該節(jié)目有史以來(lái)最優(yōu)秀的兩位人類冠軍Ken和Brad,圓滿結(jié)束了這場(chǎng)歷時(shí)三天的人機(jī)大戰(zhàn)。

  相較1997年人機(jī)大戰(zhàn)第一役中的主角深藍(lán),沃森可謂是另一個(gè)里程碑式的超級(jí)計(jì)算機(jī)系統(tǒng)。和它的前輩相比,沃森的計(jì)算能力已不可同日而語(yǔ),更大 的差異還在于它們所應(yīng)對(duì)的算法挑戰(zhàn)。第一次人機(jī)大戰(zhàn),深藍(lán)對(duì)國(guó)際象棋的精熟曾讓世人震驚,因?yàn)閲?guó)際象棋定義明確,主要涉及數(shù)學(xué)方面的處理能力,計(jì)算機(jī)可以 輕易計(jì)算每一個(gè)游戲狀態(tài)及相應(yīng)步驟。然而,《危險(xiǎn)邊緣》節(jié)目中的智力問(wèn)答,則要求計(jì)算機(jī)必須理解人類的語(yǔ)言。與國(guó)際象棋不同,人類語(yǔ)言是完全開(kāi)放式的,往 往模棱兩可,需要上下文才能理解其意思。雖然IBM的研究人員可以輕松理解人類語(yǔ)言,但開(kāi)發(fā)理解人類語(yǔ)言的超級(jí)計(jì)算機(jī)系統(tǒng)卻極具挑戰(zhàn)性。

  盡管存儲(chǔ)了大量的百科全書(shū)和其他信息,但《危險(xiǎn)邊緣》的問(wèn)題并不會(huì)讓沃森輕易地找到答案,因?yàn)閷ふ掖鸢笍膩?lái)不是計(jì)算機(jī)的強(qiáng)項(xiàng)。搜索引擎沒(méi)法回答 問(wèn)題,只能給出符合搜索關(guān)鍵詞的成千上萬(wàn)個(gè)似是而非的可能答案,而沃森要通過(guò)各種不同的算法對(duì)所有的候選答案取得更多的證據(jù)支持,再根據(jù)證據(jù)的強(qiáng)度對(duì)每個(gè) 候選答案給出其置信度,最后根據(jù)置信度來(lái)決定是否向用戶提供置信度最高的唯一答案。這一過(guò)程是極其復(fù)雜的,因此需要?jiǎng)佑脦浊€(gè)處理器的超級(jí)計(jì)算機(jī)來(lái)處理一 個(gè)問(wèn)題。

  沃森需要掌握大量的知識(shí),并在相關(guān)和不相關(guān)的信息中發(fā)現(xiàn)線索。對(duì)計(jì)算機(jī)來(lái)說(shuō),這是一個(gè)巨大的挑戰(zhàn)。因?yàn)槿祟惪梢栽谒查g辨別出事物之間的聯(lián)系,但是電腦卻必須并行地考慮所有事情,從而得出結(jié)論。

  這次人機(jī)大戰(zhàn),沃森勝利了。這意味著IBM掌握了對(duì)人類信息需求和問(wèn)題給予更準(zhǔn)確響應(yīng)的技術(shù)能力,并預(yù)見(jiàn)到了這個(gè)領(lǐng)域存在巨大商機(jī)。這項(xiàng)成果還 將被廣泛應(yīng)用于多個(gè)領(lǐng)域,例如更快、更準(zhǔn)確地進(jìn)行醫(yī)療診斷,研究潛在的藥物交互作用,幫助律師和法官尋找案例,在金融領(lǐng)域?qū)崿F(xiàn)“假設(shè)”場(chǎng)景分析和法規(guī)遵 從,幫助公司培養(yǎng)更精明的銷售人員……沃森的出現(xiàn),顛覆了此前簡(jiǎn)單的人機(jī)關(guān)系,并將帶來(lái)一個(gè)嶄新的人機(jī)合作時(shí)代。

  沃森善思

  盡管IBM沃森項(xiàng)目語(yǔ)義分析部門(mén)負(fù)責(zé)人David Ferrucci表示:“我們的目標(biāo)并不是模擬人類大腦,而在于開(kāi)發(fā)一臺(tái)能更好地理解并通過(guò)語(yǔ)言與用戶交流的計(jì)算機(jī),它理解和交流的方式并不需要與人一 樣。”不過(guò),我們?nèi)匀幌M牢稚降资侨绾嗡伎紗?wèn)題的,它思考問(wèn)題的過(guò)程和人類有什么區(qū)別?

  沃森首先要理解問(wèn)題。一個(gè)問(wèn)題可能有多種理解,沃森會(huì)針對(duì)不同的理解,在存儲(chǔ)的信息里尋找可能的答案;而這又會(huì)得到多個(gè)答案,對(duì)于每個(gè)答案,沃 森需要研究相應(yīng)的證據(jù);因?yàn)樽C據(jù)的數(shù)量是龐大的,所以沃森需要為所有的答案根據(jù)其證據(jù)的關(guān)聯(lián)強(qiáng)度進(jìn)行比較和排除;最后,根據(jù)其答案的信心級(jí)別決定是否向外 提供答案。

  最了不起的是,沃森是一個(gè)能夠與人類回答問(wèn)題的能力相匹敵的超級(jí)計(jì)算機(jī)系統(tǒng),具有足夠的速度、精確度和可信度,并且能使用自然語(yǔ)言回答問(wèn)題。而 對(duì)人類自然語(yǔ)言的理解,也是超級(jí)計(jì)算機(jī)系統(tǒng)所要解決的核心問(wèn)題,特別是如何更快地利用各種非結(jié)構(gòu)化和結(jié)構(gòu)化的知識(shí)來(lái)幫助其進(jìn)行自然語(yǔ)言的理解。這其中涉及 到語(yǔ)義分析處理、計(jì)算機(jī)自學(xué)習(xí)能力、大規(guī)模并行計(jì)算等多個(gè)領(lǐng)域,IBM把這些技術(shù)整合在一個(gè)體系架構(gòu)下,幫助沃森來(lái)應(yīng)對(duì)自然語(yǔ)言理解的巨大挑戰(zhàn)。

  理解自然語(yǔ)言

  沃森的問(wèn)世與三大領(lǐng)域的進(jìn)步密不可分:計(jì)算機(jī)自然語(yǔ)言的進(jìn)步、巨大的計(jì)算能力、海量的數(shù)字化全球信息。

  沃森的第一大突破正是,在回答以自然語(yǔ)言提出的針對(duì)各個(gè)知識(shí)領(lǐng)域的問(wèn)題方面取得的巨大成功。自然語(yǔ)言是人類實(shí)際使用的語(yǔ)言,包含雙關(guān)語(yǔ)、俚語(yǔ)、 行話、縮寫(xiě),甚至在錯(cuò)誤語(yǔ)境中使用的詞匯。計(jì)算機(jī)非常擅于計(jì)算,但是自然語(yǔ)言具有模糊、與語(yǔ)境高度相關(guān)、模棱兩可,甚至不嚴(yán)密等特點(diǎn),特別是《危險(xiǎn)邊緣》 節(jié)目的設(shè)計(jì),向IBM研究人員提出了更大的挑戰(zhàn)。這項(xiàng)比賽的題目涉及各個(gè)知識(shí)領(lǐng)域,需要分析人類語(yǔ)言中微妙的含義、諷刺口吻、謎語(yǔ)等,這些通常是人類擅長(zhǎng) 的方面,而計(jì)算機(jī)對(duì)此則毫無(wú)優(yōu)勢(shì)。沃森的DeepQA(深度開(kāi)放域問(wèn)答系統(tǒng))采用突破性分析技術(shù),能夠理解問(wèn)題的內(nèi)容,分析海量的信息,然后根據(jù)它找到的 證據(jù),給出最佳答案。

  精確回答問(wèn)題

  沃森的第二大突破在于,它通過(guò)高級(jí)分析技術(shù)對(duì)信息需求和問(wèn)題給予更準(zhǔn)確的響應(yīng)。在《危險(xiǎn)邊緣》的比賽中,有一個(gè)問(wèn)題是“一種出現(xiàn)在14世紀(jì)的有色彩的瘟疫,后被阿瑟·米勒改寫(xiě)成了著名戲劇”,其正確答案應(yīng)該是《推銷員之死》。

  當(dāng)沃森被問(wèn)到一個(gè)問(wèn)題的時(shí)候,數(shù)百種算法會(huì)通過(guò)不同的方式對(duì)問(wèn)題進(jìn)行分析,并給出可能的答案以及選擇它們的證據(jù),而這些分析都是同步進(jìn)行的。對(duì) 于每個(gè)候選答案,沃森都會(huì)找出支持以及反對(duì)這個(gè)答案的證據(jù)。因此,這上百個(gè)答案中的每一個(gè)又都會(huì)有數(shù)百條證據(jù),然后由數(shù)百種算法對(duì)這些證據(jù)支持答案的程度 進(jìn)行評(píng)估。證據(jù)評(píng)估的結(jié)果越好,置信度也就越高,其中置信度最高的一個(gè)答案會(huì)最終成為被沃森挑中的答案。在比賽中,如果置信度最高的答案沒(méi)有達(dá)到或超過(guò)閥 值,它可能會(huì)根據(jù)情況決定不進(jìn)行搶答,以免輸?shù)舄?jiǎng)金。這所有的一切計(jì)算、選擇與決策,都必須在三秒鐘之內(nèi)完成。

  中國(guó)團(tuán)隊(duì)的分析力量

  值得一提的是,在研制沃森的全球團(tuán)隊(duì)中,IBM中國(guó)研究院的團(tuán)隊(duì)也是重要的力量。IBM美國(guó)總部的研究團(tuán)隊(duì)主要研究如何利用非結(jié)構(gòu)化知識(shí)源來(lái)進(jìn) 行統(tǒng)計(jì)和分析,破解對(duì)人類語(yǔ)言進(jìn)行理解的難題。但是,研究人員對(duì)從非結(jié)構(gòu)化知識(shí)源中所獲得知識(shí)的準(zhǔn)確性和可靠性,通常很難把握,而結(jié)構(gòu)化知識(shí)源則能夠提供 一個(gè)互補(bǔ)的幫助。中國(guó)團(tuán)隊(duì)的任務(wù)之一,就是盡可能利用結(jié)構(gòu)化的知識(shí)來(lái)幫助沃森回答問(wèn)題,更準(zhǔn)確地評(píng)估答案的可靠性。

  IBM研究院沃森團(tuán)隊(duì)的高級(jí)經(jīng)理潘越表示:“在計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域,即使是針對(duì)一個(gè)固定結(jié)構(gòu)的完全可靠的知識(shí),如何用它來(lái)回答自然語(yǔ)言的 提問(wèn)也仍然是一個(gè)難題。”最重要的是,如何理解問(wèn)題,并在大量的結(jié)構(gòu)化知識(shí)中根據(jù)問(wèn)題定位答案并評(píng)估其可靠性。其中一個(gè)重要的內(nèi)容就是評(píng)估答案的類型與問(wèn) 題所問(wèn)的類型是否匹配,這樣就可以幫助沃森排除那些“愚蠢”的答案。。

  但是,這種類型的排斥和重疊不是絕對(duì)的。例如,問(wèn):鄧布利多教授的哪個(gè)學(xué)生打敗了伏地魔?問(wèn)題所問(wèn)的類型是“學(xué)生”。這就需要評(píng)估“哈利·波 特”是“學(xué)生”類型的可靠性。這對(duì)人來(lái)說(shuō)輕而易舉,而對(duì)于計(jì)算機(jī)來(lái)說(shuō)就需要在各種結(jié)構(gòu)化知識(shí)中進(jìn)行匹配。例如,在電影數(shù)據(jù)庫(kù)中會(huì)發(fā)現(xiàn),這是電影名稱也是角 色名稱;在小說(shuō)數(shù)據(jù)庫(kù)中會(huì)發(fā)現(xiàn),這是小說(shuō)名稱;可是很難找到一個(gè)列有世界上所有學(xué)生名稱的數(shù)據(jù)庫(kù)。因此在結(jié)構(gòu)化知識(shí)中,“哈利·波特”的類型不包括“學(xué) 生”。在這種困難的情況下,算法一方面要避免給沃森錯(cuò)誤的信號(hào),另外一方面,甚至要告訴沃森結(jié)構(gòu)化知識(shí)不排除“哈利·波特”是“學(xué)生”的可能,因?yàn)?ldquo;角 色”類型和“學(xué)生”類型是有重疊的。

  神秘的自學(xué)習(xí)能力

  對(duì)人類來(lái)講,最重要的是大腦儲(chǔ)存的知識(shí),而對(duì)計(jì)算機(jī)而言,就是后臺(tái)的數(shù)據(jù)庫(kù)了。如果沃森可以像人類一樣具有自我學(xué)習(xí)的能力,也能通過(guò)讀書(shū)、看報(bào)、瀏覽互聯(lián)網(wǎng)獲得新的知識(shí),那么計(jì)算機(jī)將變得更加智能。

  對(duì)計(jì)算機(jī)自我學(xué)習(xí)能力的研究,是計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的一個(gè)重要課題。令人驚喜的是,沃森目前已經(jīng)具備了一定的學(xué)習(xí)能力?!段kU(xiǎn)邊緣》節(jié)目 的“粉絲”創(chuàng)建和維護(hù)了大量的關(guān)于該節(jié)目的數(shù)據(jù),其中就包括所有往期節(jié)目的問(wèn)題和答案。如何讓沃森從往期節(jié)目的問(wèn)題和答案中學(xué)習(xí)提高,是研發(fā)過(guò)程中的一個(gè) 關(guān)鍵。

  據(jù)潘越介紹,每次沃森在分析和解答往期問(wèn)題時(shí),都會(huì)產(chǎn)生大量的數(shù)據(jù)。有的時(shí)候,一次實(shí)驗(yàn)就會(huì)產(chǎn)生幾百GB的數(shù)據(jù),中國(guó)團(tuán)隊(duì)試驗(yàn)和研究了各種不同 的數(shù)學(xué)模型和方法,并把它們應(yīng)用到實(shí)際數(shù)據(jù)中。其中,中國(guó)團(tuán)隊(duì)關(guān)于“兩階段”的學(xué)習(xí)方法被證明十分有效,全球團(tuán)隊(duì)還把這一方法擴(kuò)展成復(fù)雜的多階段學(xué)習(xí),應(yīng) 用在沃森項(xiàng)目中,極大地提高了它的學(xué)習(xí)能力。

  不過(guò),目前沃森還是得依靠專家來(lái)決定收錄何種信息源,因?yàn)榛ヂ?lián)網(wǎng)具有海量的信息,這些信息源良莠不齊,信息的完整性和可靠度也很難保證。目前沃 森還沒(méi)有自動(dòng)評(píng)估信息源可靠度的能力,而是依靠專家來(lái)決定收錄何種信息源,當(dāng)然這也是因?yàn)樯婕暗叫畔⒃吹陌鏅?quán)問(wèn)題。IBM研究人員期望,將來(lái)沃森可以根據(jù) 問(wèn)題的類型,來(lái)自動(dòng)評(píng)估信息源的相關(guān)度和可靠度,從而自己決定是否收錄。這樣將它連入互聯(lián)網(wǎng),就可以很快更新知識(shí),提高解決問(wèn)題的能力。

  沃森其“人”

  雖然沃森能在智力問(wèn)答中挑戰(zhàn)人類,但它與人類依舊有很多區(qū)別。不妨讓我們看看,超級(jí)計(jì)算機(jī)系統(tǒng)和人類相比的優(yōu)劣勢(shì)。

  性格激進(jìn)

  和人類相比,沃森最缺少的是什么?毫無(wú)疑問(wèn)是人類特有的性格要素和情感。如果非要沃森有所表示,只能看到它在比賽過(guò)程中,一直在動(dòng)態(tài)變化的圖 表。觀眾可以從中看到沃森對(duì)答案的自信程度,數(shù)字閾值將決定它是否回答問(wèn)題。環(huán)繞中央核心的彩線和思維射線在不停根據(jù)游戲過(guò)程中發(fā)生的情況,改變顏色和變 換速度。例如,當(dāng)沃森覺(jué)得對(duì)答案充滿信心,射線會(huì)變?yōu)榫G色;答錯(cuò)時(shí),射線則會(huì)變?yōu)槌燃t色,這也許可以代表沃森“臉紅了”。當(dāng)沃森回答某個(gè)問(wèn)題時(shí),觀眾會(huì)看 到圖表動(dòng)畫(huà)的速度明顯加快,表明它正在努力思考。

  從某種角度講,沃森也有自己的“性格”。它回答問(wèn)題的聲音是頗具磁性的男士嗓音,在面對(duì)不同獎(jiǎng)金選擇題目的分值時(shí),它的行為表現(xiàn)也和普通人不 同,沃森的戰(zhàn)術(shù)相當(dāng)激進(jìn)。比如,它一開(kāi)始可能就會(huì)選擇獎(jiǎng)金數(shù)額較大的問(wèn)題,因?yàn)樗翢o(wú)人類的心理壓力,而且這樣還會(huì)給它的人類對(duì)手帶來(lái)更大的壓力。

  膽大心細(xì)

  雖然沃森的戰(zhàn)術(shù)激進(jìn),但它卻從不魯莽行事。這是因?yàn)?,在IBM沃森項(xiàng)目組中,專門(mén)有策略團(tuán)隊(duì)負(fù)責(zé)研究博弈與投注策略。《危險(xiǎn)邊緣》的游戲規(guī)則相 當(dāng)復(fù)雜,例如組別不同、問(wèn)題分值不同,答錯(cuò)要扣分,有的問(wèn)題可以讓現(xiàn)有分值雙倍增加,而最后一個(gè)問(wèn)題則可自行投注,最高可與現(xiàn)有分值相等,可謂步步驚險(xiǎn), 翻盤(pán)機(jī)會(huì)甚多。比如進(jìn)行到?jīng)Q賽的最后一題需要自行投注時(shí),由于沃森已經(jīng)領(lǐng)先兩名人類選手較高分值,所以它就“膽小”地選擇了很小的投注額,恰好這個(gè)問(wèn)題它 回答錯(cuò)誤,扣分后也未能影響比賽結(jié)果。又如,一般情況下,沃森只搶答結(jié)果高于信息級(jí)別閥值的問(wèn)題,但是當(dāng)比分落后的情況下,它也會(huì)“大膽”回答信心級(jí)別低 的問(wèn)題。在第二天的比賽中就有這樣一個(gè)問(wèn)題:

  問(wèn):2003年這個(gè)古老的“Lion of Nimrud”在這個(gè)城市的國(guó)家博物館被偷,一起丟失的還有很多其他東西。(文化組別題,還是復(fù)式下注題)

  答:巴格達(dá)。(這就是正確答案)

  點(diǎn)評(píng):此題沃森答案的置信度只有32%,但由于得分并不領(lǐng)先,所以它還是搶答了這道題?;ヂ?lián)網(wǎng)中關(guān)于“Lion of Nimrud”(象牙浮雕藝術(shù)品)只有很少的網(wǎng)頁(yè)提及,而包含正確答案巴格達(dá)的網(wǎng)頁(yè)則更少。沃森在沒(méi)有聯(lián)網(wǎng)的情況下,居然根據(jù)很少的信息準(zhǔn)確找到了答案, 得到了讓人驚喜的結(jié)果。

  由此可見(jiàn),沃森確實(shí)“膽大心細(xì)”。精確的計(jì)算為沃森取得勝利提供了重要的策略支持,而人類選手基本不可能在短時(shí)間內(nèi)綜合計(jì)算出精確投注分?jǐn)?shù)。

[page_break]

  語(yǔ)文欠佳

  沃森在語(yǔ)義理解上相比其他計(jì)算機(jī)獲得了重大突破,它能夠處理很多難題,如具有雙關(guān)語(yǔ)的問(wèn)題和字謎類的問(wèn)題等。但是,這個(gè)聰明的機(jī)器,依舊無(wú)法與人類相比,因?yàn)槿祟惖恼Z(yǔ)言天賦是與生俱來(lái)的。

  沃森的短板在于對(duì)語(yǔ)義的理解上,尤其是在《危險(xiǎn)邊緣》這樣復(fù)雜的智力比賽中,與語(yǔ)言相關(guān)的問(wèn)題,它回答的準(zhǔn)確度遠(yuǎn)比不上其他組別的問(wèn)題。比如,沃森在第一天的比賽中,就一連答錯(cuò)了數(shù)個(gè)與語(yǔ)言有關(guān)的問(wèn)題。

  問(wèn):來(lái)自拉丁語(yǔ),意思是“end”,火車也可以從這里出發(fā)。

  答:finis(正確答案是英文單詞terminal)

  點(diǎn)評(píng):?jiǎn)栴}里面包含了多條線索,沃森只能利用拉丁語(yǔ)“end”這條線索,而起到關(guān)鍵性作用的“火車也可以從這里出發(fā)”卻沒(méi)有用到,沃森把帶雙引號(hào)的詞作為更重要的線索了。

  “聾盲”沃森

  沃森在功能上聽(tīng)不到、看不見(jiàn),它不能回答以往《危險(xiǎn)邊緣》中以音頻或視頻呈現(xiàn)的問(wèn)題,為此在沃森參與的游戲中這些都被放棄了。特別是與人類的主觀體驗(yàn)相關(guān)的問(wèn)題,沃森還難以應(yīng)對(duì)。在第一場(chǎng)的題目中就有這樣一題:

  問(wèn):這是生理的奇觀,1904年,美國(guó)體操運(yùn)動(dòng)員George Eyser贏得了雙杠的金牌。

  答:腿。(正確答案是他少了一條腿)

  點(diǎn)評(píng):這是一道最高獎(jiǎng)金1000美元的問(wèn)題。Ken搶到了第一次,但“他只有一支手”的答案是錯(cuò)的。沃森搶到了第二次,回答的是“腿”,但卻不 是“少了一條腿”。因?yàn)?ldquo;奇聞”是一個(gè)比較主觀的詞,對(duì)于缺少主觀意識(shí)的計(jì)算機(jī)來(lái)說(shuō),理解奇聞的確切意義是不容易的。他不僅需要知道Eyser少了一條 腿,還需要知道這是一件奇聞,這是很困難的。

  沃森闖關(guān)

  圖靈測(cè)試,這是人工智能之父——阿蘭·圖靈在1950年的著名論文《機(jī)器能思考嗎》中,提出的一種測(cè)試計(jì)算機(jī)人工智能的方法。這篇論文第一次提 出“機(jī)器思維”的概念,并提出一個(gè)假想:即一個(gè)人在不接觸對(duì)方的情況下,通過(guò)一種特殊的方式,和對(duì)方進(jìn)行一系列的問(wèn)答,如果在相當(dāng)長(zhǎng)的時(shí)間內(nèi),他無(wú)法根據(jù) 這些問(wèn)題判斷對(duì)方是人還是計(jì)算機(jī),那么就可以認(rèn)為這個(gè)計(jì)算機(jī)具有同人類相當(dāng)?shù)闹橇ΑN稚A得了比賽勝利,它能通過(guò)圖靈測(cè)試嗎?答案就在《危險(xiǎn)邊緣》決賽的 智力問(wèn)答中。

  問(wèn):第一個(gè)現(xiàn)代的填字游戲發(fā)布&奧利奧餅干出現(xiàn)。(年代類別題)

  答:1920年。(正確答案是1910年)

  點(diǎn)評(píng):其實(shí),Ken第一次搶答的答案就是1920年,主持人已經(jīng)表示錯(cuò)誤,這樣沃森才獲得了再次搶答的機(jī)會(huì),但它居然又把錯(cuò)誤答案重復(fù)了一遍。 對(duì)人類來(lái)說(shuō),這是不可能出現(xiàn)的情況。但由于IBM研究人員在設(shè)計(jì)沃森的時(shí)候,認(rèn)為分析對(duì)手的錯(cuò)誤答案是沒(méi)有必要的,所以沃森不能“聽(tīng)到”或“看到”Ken 之前的錯(cuò)誤答案,導(dǎo)致它出現(xiàn)了這樣的低級(jí)錯(cuò)誤。難怪沃森回答問(wèn)題的時(shí)候總是“旁若無(wú)人”。

  問(wèn):彭布羅克學(xué)院和伊曼紐爾學(xué)院的小禮堂是這個(gè)建筑師設(shè)計(jì)的。(劍橋類別題)

  答:克里斯托弗·雷恩。(這就是正確答案)

  點(diǎn)評(píng):答案本身并無(wú)可非議,關(guān)鍵在于這是一個(gè)可以復(fù)式下注的題目。不同于人類的是,沃森下的賭注是6435美元,以至于現(xiàn)場(chǎng)的觀眾都笑了起來(lái)。 要知道,人類下注一般更喜歡用整數(shù),很少精確到個(gè)位,而沃森則使用了一個(gè)數(shù)學(xué)模型來(lái)計(jì)算如何冒最小的風(fēng)險(xiǎn)獲得最大的收益。這也體現(xiàn)了計(jì)算機(jī)和人類的不同。

  問(wèn):這座城市的最大機(jī)場(chǎng)是以二戰(zhàn)中一個(gè)英雄的名字命名的,而它的第二大機(jī)場(chǎng)則是以二戰(zhàn)中一場(chǎng)戰(zhàn)役的名稱命名的。(美國(guó)城市類別題。是第一場(chǎng)比賽的《最終危險(xiǎn)邊緣》題目,不少選手可以借助這樣的賽點(diǎn)翻盤(pán))。

  答:多倫多。(正確答案是芝加哥,多倫多是加拿大城市)

  點(diǎn)評(píng):沃森給出了一個(gè)可笑的答案,以致主持人在第二場(chǎng)比賽的開(kāi)場(chǎng)白中打趣地說(shuō)道:“感謝沃森讓多倫多加入到了美國(guó)城市的行列。”引起現(xiàn)場(chǎng)一片笑聲。的確,在美國(guó)民眾看來(lái),這是一般人類不會(huì)出現(xiàn)的常識(shí)性錯(cuò)誤。

  IBM研發(fā)人員分析認(rèn)為,沃森答錯(cuò)有以下幾點(diǎn)原因:第一,這道題在美國(guó)城市類別中,而題目本身并沒(méi)有提到美國(guó)城市一詞?!段kU(xiǎn)邊緣》的類別經(jīng)常 不能給任何提示,因此IBM研究人員將其作為重要性很低的線索,但恰恰這道題中類別是重要的限制條件;第二,也許只有沃森知道,美國(guó)的確有叫多倫多的地 方,還不止一個(gè),只不過(guò)沒(méi)有大到有機(jī)場(chǎng)的地步,但這成了沃森答題的“噪音信息”;第三,沃森也沒(méi)有找到足夠的證據(jù)將城市機(jī)場(chǎng)和二戰(zhàn)關(guān)聯(lián)起來(lái)。

  由此可見(jiàn),雖然沃森在比賽中獲勝,并以大比分超出人類冠軍;雖然沃森可以接受人類自然語(yǔ)言,并能夠用磁性的男聲搶答問(wèn)題,但是它仍然會(huì)犯人類認(rèn)為很簡(jiǎn)單的錯(cuò)誤。

  鏈接

  真正的沃森

  IBM超級(jí)計(jì)算機(jī)系統(tǒng)"沃森"以 IBM 創(chuàng)始人 Thomas J. Watson 的姓氏命名。雖然在比賽中它以"智慧地球"的形象出現(xiàn)在舞臺(tái)上,但舞臺(tái)背后的機(jī)房中,擁有多個(gè)龐大的機(jī)身的設(shè)備才是沃森的本來(lái)"面目"。

  它通過(guò) 10 臺(tái)由 IBM POWER7 系統(tǒng)組成的冰箱大小的機(jī)架提供動(dòng)力,運(yùn)行 Linux 操作系統(tǒng),包含 15 TB 內(nèi)存和 2880 個(gè)處理器內(nèi)核,運(yùn)行速度高達(dá) 80 Teraflops,即每秒執(zhí)行 80 萬(wàn)億次浮點(diǎn)計(jì)算。沃森能夠快速回答棘手的問(wèn)題完全得益于采用了 IBM POWER 7 系統(tǒng)作為分析引擎。POWER7 系統(tǒng)經(jīng)過(guò)專門(mén)的工作負(fù)載優(yōu)化,能夠同時(shí)處理大量信息并且運(yùn)行數(shù)千個(gè)分析任務(wù),以便跟上參賽者的速度,通過(guò)分析微妙的含義、諷刺口吻、謎語(yǔ)等理解線索并提供 準(zhǔn)確的答案。沃森能夠在不到三秒鐘的時(shí)間內(nèi)研讀存儲(chǔ)在內(nèi)存中的約 2 億頁(yè)自然語(yǔ)言內(nèi)容(相當(dāng)于100萬(wàn)本書(shū)),并找到問(wèn)題的確切答案。

  為什么還是IBM?

  1997年IBM深藍(lán)戰(zhàn)勝卡斯帕羅夫,2011年IBM沃森贏得《危險(xiǎn)邊緣》大賽,這并非偶然。從上個(gè)世紀(jì)40年代到80年代,人工智能曾一度 被認(rèn)為是未來(lái)計(jì)算機(jī)的制高點(diǎn),無(wú)數(shù)專家學(xué)者投入其中,但始終沒(méi)有獲得突破。在漫長(zhǎng)的低潮期中,多數(shù)商業(yè)公司停止了對(duì)人工智能的研究,但I(xiàn)BM卻是少數(shù)堅(jiān)持 投入的企業(yè)之一。

  它還是一家專注未來(lái)20 年創(chuàng)新的公司,每年都要投入約 60 億美元用于研發(fā)和聘請(qǐng)全球頂級(jí)研究人員。在分析能力方面,IBM在過(guò)去 4 年投資超過(guò) 110 億美元,進(jìn)行了20 余次收購(gòu);超過(guò)200名IBM研究院的數(shù)學(xué)家在專門(mén)從事分析工作;迄今為止,IBM 已收到近500項(xiàng)與分析相關(guān)的專利。分析能力正是沃森核心的DeepQA所需的技術(shù)基礎(chǔ)。IBM預(yù)計(jì)在 2015 年之前將在業(yè)務(wù)分析及優(yōu)化方面創(chuàng)造160 億美元的收入,此次“沃森”的成功無(wú)疑將為IBM回報(bào)更多的社會(huì)和商業(yè)價(jià)值。

版權(quán)所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved