首頁 新聞 工控搜 論壇 廠商論壇 產(chǎn)品 方案 廠商 人才 文摘 下載 展覽
中華工控網(wǎng)首頁
  P L C | 變頻器與傳動 | 傳感器 | 現(xiàn)場檢測儀表 | 工控軟件 | 人機(jī)界面 | 運(yùn)動控制
  D C S | 工業(yè)以太網(wǎng) | 現(xiàn)場總線 | 顯示調(diào)節(jié)儀表 | 數(shù)據(jù)采集 | 數(shù)傳測控 | 工業(yè)安全
  電 源 | 嵌入式系統(tǒng) | PC based | 機(jī)柜箱體殼體 | 低壓電器 | 機(jī)器視覺
什么是機(jī)器學(xué)習(xí)
中華工控網(wǎng)
收藏本文     查看收藏

  機(jī)器學(xué)習(xí)(Machine Learning)是研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,它主要使用歸納、綜合而不是演譯。

  機(jī)器學(xué)習(xí)是關(guān)于理解與研究學(xué)習(xí)的內(nèi)在機(jī)制、建立能夠通過學(xué)習(xí)自動提高自身水平的計(jì)算機(jī)程序的理論方法的學(xué)科。近年來機(jī)器學(xué)習(xí)理論在諸多應(yīng)用領(lǐng)域得到成功的應(yīng)用與發(fā)展,已成為計(jì)算機(jī)科學(xué)的基礎(chǔ)及熱點(diǎn)之一。采用機(jī)器學(xué)習(xí)方法的計(jì)算機(jī)程序被成功用于機(jī)器人下棋程序、語音識別、信用卡欺詐監(jiān)測、自主車輛駕駛、智能機(jī)器人等應(yīng)用領(lǐng)域,除此之外機(jī)器學(xué)習(xí)的理論方法還被用于大數(shù)據(jù)集的數(shù)據(jù)挖掘這一領(lǐng)域。實(shí)際上,在任何有經(jīng)驗(yàn)可以積累的地方,機(jī)器學(xué)習(xí)方法均可發(fā)揮作用。

  學(xué)習(xí)能力是智能行為的一個(gè)非常重要的特征,但至今對學(xué)習(xí)的機(jī)理尚不清楚。人們曾對機(jī)器學(xué)習(xí)給出各種定義。H.A.Simon認(rèn)為,學(xué)習(xí)是系統(tǒng)所作的適應(yīng)性變化,使得系統(tǒng)在下一次完成同樣或類似的任務(wù)時(shí)更為有效。R.s.Michalski認(rèn)為,學(xué)習(xí)是構(gòu)造或修改對于所經(jīng)歷事物的表示。從事專家系統(tǒng)研制的人們則認(rèn)為學(xué)習(xí)是知識的獲取。這些觀點(diǎn)各有側(cè)重,第一種觀點(diǎn)強(qiáng)調(diào)學(xué)習(xí)的外部行為效果,第二種則強(qiáng)調(diào)學(xué)習(xí)的內(nèi)部過程,而第三種主要是從知識工程的實(shí)用性角度出發(fā)的。

  機(jī)器學(xué)習(xí)在人工智能的研究中具有十分重要的地位。一個(gè)不具有學(xué)習(xí)能力的智能系統(tǒng)難以稱得上是一個(gè)真正的智能系統(tǒng),但是以往的智能系統(tǒng)都普遍缺少學(xué)習(xí)的能力。例如,它們遇到錯(cuò)誤時(shí)不能自我校正;不會通過經(jīng)驗(yàn)改善自身的性能;不會自動獲取和發(fā)現(xiàn)所需要的知識。它們的推理僅限于演繹而缺少歸納,因此至多只能夠證明已存在事實(shí)、定理,而不能發(fā)現(xiàn)新的定理、定律和規(guī)則等。隨著人工智能的深入發(fā)展,這些局限性表現(xiàn)得愈加突出。正是在這種情形下,機(jī)器學(xué)習(xí)逐漸成為人工智能研究的核心之一。它的應(yīng)用已遍及人工智能的各個(gè)分支,如專家系統(tǒng)、自動推理、自然語言理解、模式識別、計(jì)算機(jī)視覺、智能機(jī)器人等領(lǐng)域。其中尤其典型的是專家系統(tǒng)中的知識獲取瓶頸問題,人們一直在努力試圖采用機(jī)器學(xué)習(xí)的方法加以克服。

  機(jī)器學(xué)習(xí)的研究是根據(jù)生理學(xué)、認(rèn)知科學(xué)等對人類學(xué)習(xí)機(jī)理的了解,建立人類學(xué)習(xí)過程的計(jì)算模型或認(rèn)識模型,發(fā)展各種學(xué)習(xí)理論和學(xué)習(xí)方法,研究通用的學(xué)習(xí)算法并進(jìn)行理論上的分析,建立面向任務(wù)的具有特定應(yīng)用的學(xué)習(xí)系統(tǒng)。這些研究目標(biāo)相互影響相互促進(jìn)。

  機(jī)器學(xué)習(xí)已經(jīng)有了十分廣泛的應(yīng)用例如搜索引擎、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰(zhàn)略游戲和機(jī)器人運(yùn)用。

  自從1980年在卡內(nèi)基-梅隆大學(xué)召開第一屆機(jī)器學(xué)術(shù)研討會以來,機(jī)器學(xué)習(xí)的研究工作發(fā)展很快,已成為中心課題之一。

  目前,機(jī)器學(xué)習(xí)領(lǐng)域的研究工作主要圍繞以下三個(gè)方面進(jìn)行:

  (1)面向任務(wù)的研究 研究和分析改進(jìn)一組預(yù)定任務(wù)的執(zhí)行性能的學(xué)習(xí)系統(tǒng)。

  (2)認(rèn)知模型 研究人類學(xué)習(xí)過程并進(jìn)行計(jì)算機(jī)模擬。

 。3)理論分析 從理論上探索各種可能的學(xué)習(xí)方法和獨(dú)立于應(yīng)用領(lǐng)域的算法。

  機(jī)器學(xué)習(xí)是繼專家系統(tǒng)之后人工智能應(yīng)用的又一重要研究領(lǐng)域,也是人工智能和神經(jīng)計(jì)算的核心研究課題之一,F(xiàn)有的計(jì)算機(jī)系統(tǒng)和人工智能系統(tǒng)沒有什么學(xué)習(xí)能力,至多也只有非常有限的學(xué)習(xí)能力,因而不能滿足科技和生產(chǎn)提出的新要求。本章將首先介紹機(jī)器學(xué)習(xí)的定義、意義和簡史,然后討論機(jī)器學(xué)習(xí)的主要策略和基本結(jié)構(gòu),最后逐一研究各種機(jī)器學(xué)習(xí)的方法與技術(shù),包括機(jī)械學(xué)習(xí)、基于解釋的學(xué)習(xí)、基于事例的學(xué)習(xí)、基于概念的學(xué)習(xí)、類比學(xué)習(xí)和基于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)等。對機(jī)器學(xué)習(xí)的討論和機(jī)器學(xué)習(xí)研究的進(jìn)展,必將促使人工智能和整個(gè)科學(xué)技術(shù)的進(jìn)一步發(fā)展 。

  一、 機(jī)器學(xué)習(xí)的定義和研究意義

  學(xué)習(xí)是人類具有的一種重要智能行為,但究竟什么是學(xué)習(xí),長期以來卻眾說紛紜。社會學(xué)家、邏輯學(xué)家和心理學(xué)家都各有其不同的看法。按照人工智能大師西蒙的觀點(diǎn),學(xué)習(xí)就是系統(tǒng)在不斷重復(fù)的工作中對本身能力的增強(qiáng)或者改進(jìn),使得系統(tǒng)在下一次執(zhí)行同樣任務(wù)或類似任務(wù)時(shí),會比現(xiàn)在做得更好或效率更高。西蒙對學(xué)習(xí)給出的定義本身,就說明了學(xué)習(xí)的重要作用。

  機(jī)器能否象人類一樣能具有學(xué)習(xí)能力呢?1959年美國的塞繆爾(Samuel)設(shè)計(jì)了一個(gè)下棋程序,這個(gè)程序具有學(xué)習(xí)能力,它可以在不斷的對奕中改善自己的棋藝。4年后,這個(gè)程序戰(zhàn)勝了設(shè)計(jì)者本人。又過了3年,這個(gè)程序戰(zhàn)勝了美國一個(gè)保持8年之久的常勝不敗的冠軍。這個(gè)程序向人們展示了機(jī)器學(xué)習(xí)的能力,提出了許多令人深思的社會問題與哲學(xué)問題。

  機(jī)器的能力是否能超過人的,很多持否定意見的人的一個(gè)主要論據(jù)是:機(jī)器是人造的,其性能和動作完全是由設(shè)計(jì)者規(guī)定的,因此無論如何其能力也不會超過設(shè)計(jì)者本人。這種意見對不具備學(xué)習(xí)能力的機(jī)器來說的確是對的,可是對具備學(xué)習(xí)能力的機(jī)器就值得考慮了,因?yàn)檫@種機(jī)器的能力在應(yīng)用中不斷地提高,過一段時(shí)間之后,設(shè)計(jì)者本人也不知它的能力到了何種水平。

  什么叫做機(jī)器學(xué)習(xí)(machine learning)?至今,還沒有統(tǒng)一的“機(jī)器學(xué)習(xí)”定義,而且也很難給出一個(gè)公認(rèn)的和準(zhǔn)確的定義。為了便于進(jìn)行討論和估計(jì)學(xué)科的進(jìn)展,有必要對機(jī)器學(xué)習(xí)給出定義,即使這種定義是不完全的和不充分的。顧名思義, 機(jī)器學(xué)習(xí) 是研究如何使用機(jī)器來模擬人類學(xué)習(xí)活動的一門學(xué)科。稍為嚴(yán)格的提法是:機(jī)器學(xué)習(xí)是一門研究機(jī)器獲取新知識和新技能,并識別現(xiàn)有知識的學(xué)問。這里所說的“機(jī)器”,指的就是計(jì)算機(jī);現(xiàn)在是電子計(jì)算機(jī),以后還可能是中子計(jì)算機(jī)、光子計(jì)算機(jī)或神經(jīng)計(jì)算機(jī)等等

  二、 機(jī)器學(xué)習(xí)的發(fā)展史

  機(jī)器學(xué)習(xí)是人工智能研究較為年輕的分支,它的發(fā)展過程大體上可分為4個(gè)時(shí)期。

  第一階段是在50年代中葉到60年代中葉,屬于熱烈時(shí)期。…>

  第二階段是在60年代中葉至70年代中葉,被稱為機(jī)器學(xué)習(xí)的冷靜時(shí)期。

  第三階段是從70年代中葉至80年代中葉,稱為復(fù)興時(shí)期。

  機(jī)器學(xué)習(xí)的最新階段始于1986年。

  機(jī)器學(xué)習(xí)進(jìn)入新階段的重要表現(xiàn)在下列諸方面:

  (1) 機(jī)器學(xué)習(xí)已成為新的邊緣學(xué)科并在高校形成一門課程。它綜合應(yīng)用心理學(xué)、生物學(xué)和神經(jīng)生理學(xué)以及數(shù)學(xué)、自動化和計(jì)算機(jī)科學(xué)形成機(jī)器學(xué)習(xí)理論基礎(chǔ)。

  (2) 結(jié)合各種學(xué)習(xí)方法,取長補(bǔ)短的多種形式的集成學(xué)習(xí)系統(tǒng)研究正在興起。特別是連接學(xué)習(xí)符號學(xué)習(xí)的耦合可以更好地解決連續(xù)性信號處理中知識與技能的獲取與求精問題而受到重視。

  (3) 機(jī)器學(xué)習(xí)與人工智能各種基礎(chǔ)問題的統(tǒng)一性觀點(diǎn)正在形成。例如學(xué)習(xí)與問題求解結(jié)合進(jìn)行、知識表達(dá)便于學(xué)習(xí)的觀點(diǎn)產(chǎn)生了通用智能系統(tǒng)SOAR的組塊學(xué)習(xí)。類比學(xué)習(xí)與問題求解結(jié)合的基于案例方法已成為經(jīng)驗(yàn)學(xué)習(xí)的重要方向。

  (4) 各種學(xué)習(xí)方法的應(yīng)用范圍不斷擴(kuò)大,一部分已形成商品。歸納學(xué)習(xí)的知識獲取工具已在診斷分類型專家系統(tǒng)中廣泛使用。連接學(xué)習(xí)在聲圖文識別中占優(yōu)勢。分析學(xué)習(xí)已用于設(shè)計(jì)綜合型專家系統(tǒng)。遺傳算法與強(qiáng)化學(xué)習(xí)在工程控制中有較好的應(yīng)用前景。與符號系統(tǒng)耦合的神經(jīng)網(wǎng)絡(luò)連接學(xué)習(xí)將在企業(yè)的智能管理與智能機(jī)器人運(yùn)動規(guī)劃中發(fā)揮作用。

  (5) 與機(jī)器學(xué)習(xí)有關(guān)的學(xué)術(shù)活動空前活躍。國際上除每年一次的機(jī)器學(xué)習(xí)研討會外,還有計(jì)算機(jī)學(xué)習(xí)理論會議以及遺傳算法會議。

  三、 機(jī)器學(xué)習(xí)的主要策略

  學(xué)習(xí)是一項(xiàng)復(fù)雜的智能活動,學(xué)習(xí)過程與推理過程是緊密相連的,按照學(xué)習(xí)中使用推理的多少,機(jī)器學(xué)習(xí)所采用的策略大體上可分為4種——機(jī)械學(xué)習(xí)、通過傳授學(xué)習(xí)、類比學(xué)習(xí)和通過事例學(xué)習(xí)。學(xué)習(xí)中所用的推理越多,系統(tǒng)的能力越強(qiáng)。

  四、機(jī)器學(xué)習(xí)系統(tǒng)的基本結(jié)構(gòu)

  上圖表示學(xué)習(xí)系統(tǒng)的基本結(jié)構(gòu)。環(huán)境向系統(tǒng)的學(xué)習(xí)部分提供某些信息,學(xué)習(xí)部分利用這些信息修改知識庫,以增進(jìn)系統(tǒng)執(zhí)行部分完成任務(wù)的效能,執(zhí)行部分根據(jù)知識庫完成任務(wù),同時(shí)把獲得的信息反饋給學(xué)習(xí)部分。在具體的應(yīng)用中,環(huán)境,知識庫和執(zhí)行部分決定了具體的工作內(nèi)容,學(xué)習(xí)部分所需要解決的問題完全由上述3部分確定。下面我們分別敘述這3部分對設(shè)計(jì)學(xué)習(xí)系統(tǒng)的影響。

  影響學(xué)習(xí)系統(tǒng)設(shè)計(jì)的最重要的因素是環(huán)境向系統(tǒng)提供的信息。或者更具體地說是信息的質(zhì)量。知識庫里存放的是指導(dǎo)執(zhí)行部分動作的一般原則,但環(huán)境向?qū)W習(xí)系統(tǒng)提供的信息卻是各種各樣的。如果信息的質(zhì)量比較高,與一般原則的差別比較小,則學(xué)習(xí)部分比較容易處理。如果向?qū)W習(xí)系統(tǒng)提供的是雜亂無章的指導(dǎo)執(zhí)行具體動作的具體信息,則學(xué)習(xí)系統(tǒng)需要在獲得足夠數(shù)據(jù)之后,刪除不必要的細(xì)節(jié),進(jìn)行總結(jié)推廣,形成指導(dǎo)動作的一般原則,放入知識庫,這樣學(xué)習(xí)部分的任務(wù)就比較繁重,設(shè)計(jì)起來也較為困難。

  因?yàn)閷W(xué)習(xí)系統(tǒng)獲得的信息往往是不完全的,所以學(xué)習(xí)系統(tǒng)所進(jìn)行的推理并不完全是可靠的,它總結(jié)出來的規(guī)則可能正確,也可能不正確。這要通過執(zhí)行效果加以檢驗(yàn)。正確的規(guī)則能使系統(tǒng)的效能提高,應(yīng)予保留;不正確的規(guī)則應(yīng)予修改或從數(shù)據(jù)庫中刪除。

  知識庫是影響學(xué)習(xí)系統(tǒng)設(shè)計(jì)的第二個(gè)因素。知識的表示有多種形式,比如特征向量、一階邏輯語句、產(chǎn)生式規(guī)則、語義網(wǎng)絡(luò)和框架等等。這些表示方式各有其特點(diǎn),在選擇表示方式時(shí)要兼顧以下4個(gè)方面:

  (1)表達(dá)能力強(qiáng)。(2)易于推理。(3)容易修改知識庫。(4)知識表示易于擴(kuò)展。

  對于知識庫最后需要說明的一個(gè)問題是學(xué)習(xí)系統(tǒng)不能在全然沒有任何知識的情況下憑空獲取知識,每一個(gè)學(xué)習(xí)系統(tǒng)都要求具有某些知識理解環(huán)境提供的信息,分析比較,做出假設(shè),檢驗(yàn)并修改這些假設(shè)。因此,更確切地說,學(xué)習(xí)系統(tǒng)是對現(xiàn)有知識的擴(kuò)展和改進(jìn)。

  執(zhí)行部分是整個(gè)學(xué)習(xí)系統(tǒng)的核心,因?yàn)閳?zhí)行部分的動作就是學(xué)習(xí)部分力求改進(jìn)的動作。同執(zhí)行部分有關(guān)的問題有3個(gè):復(fù)雜性、反饋和透明性。

  五、機(jī)器學(xué)習(xí)分類

  1、基于學(xué)習(xí)策略的分類

  學(xué)習(xí)策略是指學(xué)習(xí)過程中系統(tǒng)所采用的推理策略。一個(gè)學(xué)習(xí)系統(tǒng)總是由學(xué)習(xí)和環(huán)境兩部分組成。由環(huán)境(如書本或教師)提供信息,學(xué)習(xí)部分則實(shí)現(xiàn)信息轉(zhuǎn)換,用能夠理解的形式記憶下來,并從中獲取有用的信息。在學(xué)習(xí)過程中,學(xué)生(學(xué)習(xí)部分)使用的推理越少,他對教師(環(huán)境)的依賴就越大,教師的負(fù)擔(dān)也就越重。學(xué)習(xí)策略的分類標(biāo)準(zhǔn)就是根據(jù)學(xué)生實(shí)現(xiàn)信息轉(zhuǎn)換所需的推理多少和難易程度來分類的,依從簡單到復(fù)雜,從少到多的次序分為以下五種基本類型:

  1)機(jī)械學(xué)習(xí)(Rote learning)

  學(xué)習(xí)者無需任何推理或其它的知識轉(zhuǎn)換,直接吸取環(huán)境所提供的信息。如塞繆爾的跳棋程序,紐厄爾和西蒙的LT系統(tǒng)。這類學(xué)習(xí)系統(tǒng)主要考慮的是如何索引存貯的知識并加以利用。系統(tǒng)的學(xué)習(xí)方法是直接通過事先編好、構(gòu)造好的程序來學(xué)習(xí),學(xué)習(xí)者不作任何工作,或者是通過直接接收既定的事實(shí)和數(shù)據(jù)進(jìn)行學(xué)習(xí),對輸入信息不作任何的推理。

 。玻┦窘虒W(xué)習(xí)(Learning from instruction或Learning by being told)。

  學(xué)生從環(huán)境(教師或其它信息源如教科書等)獲取信息,把知識轉(zhuǎn)換成內(nèi)部可使用的表示形式,并將新的知識和原有知識有機(jī)地結(jié)合為一體。所以要求學(xué)生有一定程度的推理能力,但環(huán)境仍要做大量的工作。教師以某種形式提出和組織知識,以使學(xué)生擁有的知識可以不斷地增加。這種學(xué)習(xí)方法和人類社會的學(xué)校教學(xué)方式相似,學(xué)習(xí)的任務(wù)就是建立一個(gè)系統(tǒng),使它能接受教導(dǎo)和建議,并有效地存貯和應(yīng)用學(xué)到的知識。目前,不少專家系統(tǒng)在建立知識庫時(shí)使用這種方法去實(shí)現(xiàn)知識獲取。示教學(xué)習(xí)的一個(gè)典型應(yīng)用例是FOO程序。

  3)演繹學(xué)習(xí)(Learning by deduction)。

  學(xué)生所用的推理形式為演譯推理。推理從公理出發(fā),經(jīng)過邏輯變換推導(dǎo)出結(jié)論。這種推理是"保真"變換和特化(specialization)的過程,使學(xué)生在推理過程中可以獲取有用的知識。這種學(xué)習(xí)方法包含宏操作(macro-operation)學(xué)習(xí)、知識編輯和組塊(Chunking)技術(shù)。演繹推理的逆過程是歸納推理。

  4)類比學(xué)習(xí)(Learning by analogy)。

  利用二個(gè)不同領(lǐng)域(源域、目標(biāo)域)中的知識相似性,可以通過類比,從源域的知識(包括相似的特征和其它性質(zhì))推導(dǎo)出目標(biāo)域的相應(yīng)知識,從而實(shí)現(xiàn)學(xué)習(xí)。類比學(xué)習(xí)系統(tǒng)可以使一個(gè)已有的計(jì)算機(jī)應(yīng)用系統(tǒng)轉(zhuǎn)變?yōu)檫m應(yīng)于新的領(lǐng)域,來完成原先沒有設(shè)計(jì)的相類似的功能。類比學(xué)習(xí)需要比上述三種學(xué)習(xí)方式更多的推理。它一般要求先從知識源(源域)中檢索出可用的知識,再將其轉(zhuǎn)換成新的形式,用到新的狀況(目標(biāo)域)中去。類比學(xué)習(xí)在人類科學(xué)技術(shù)發(fā)展史上起著重要作用,許多科學(xué)發(fā)現(xiàn)就是通過類比得到的。例如著名的盧瑟福類比就是通過將原子結(jié)構(gòu)(目標(biāo)域)同太陽系(源域)作類比,揭示了原子結(jié)構(gòu)的奧秘。

 。担┗诮忉尩膶W(xué)習(xí)(Explanation-based learning, EBL)。

  學(xué)生根據(jù)教師提供的目標(biāo)概念、該概念的一個(gè)例子、領(lǐng)域理論及可操作準(zhǔn)則,首先構(gòu)造一個(gè)解釋來說明為什該例子滿足目標(biāo)概念,然后將解釋推廣為目標(biāo)概念的一個(gè)滿足可操作準(zhǔn)則的充分條件。EBL已被廣泛應(yīng)用于知識庫求精和改善系統(tǒng)的性能。著名的EBL系統(tǒng)有迪喬恩(G.DeJong)的GENESIS, 米切爾(T.Mitchell)的LEXII和LEAP, 以及明頓(S.Minton)等的PRODIGY。

 。叮w納學(xué)習(xí)(Learning from induction)。

  歸納學(xué)習(xí)是由教師或環(huán)境提供某概念的一些實(shí)例或反例,讓學(xué)生通過歸納推理得出該概念的一般描述。這種學(xué)習(xí)的推理工作量遠(yuǎn)多于示教學(xué)習(xí)和演繹學(xué)習(xí),因?yàn)榄h(huán)境并不提供一般性概念描述(如公理)。從某種程度上說,歸納學(xué)習(xí)的推理量也比類比學(xué)習(xí)大,因?yàn)闆]有一個(gè)類似的概念可以作為"源概念"加以取用。歸納學(xué)習(xí)是最基本的,發(fā)展也較為成熟的學(xué)習(xí)方法,在人工智能領(lǐng)域中已經(jīng)得到廣泛的研究和應(yīng)用。

  2、基于所獲取知識的表示形式分類

  學(xué)習(xí)系統(tǒng)獲取的知識可能有:行為規(guī)則、物理對象的描述、問題求解策略、各種分類及其它用于任務(wù)實(shí)現(xiàn)的知識類型。

  對于學(xué)習(xí)中獲取的知識,主要有以下一些表示形式:

  1)代數(shù)表達(dá)式參數(shù):學(xué)習(xí)的目標(biāo)是調(diào)節(jié)一個(gè)固定函數(shù)形式的代數(shù)表達(dá)式參數(shù)或系數(shù)來達(dá)到一個(gè)理想的性能。

  2)決策樹:用決策樹來劃分物體的類屬,樹中每一內(nèi)部節(jié)點(diǎn)對應(yīng)一個(gè)物體屬性,而每一邊對應(yīng)于這些屬性的可選值,樹的葉節(jié)點(diǎn)則對應(yīng)于物體的每個(gè)基本分類。

 。常┬问轿姆ǎ涸谧R別一個(gè)特定語言的學(xué)習(xí)中,通過對該語言的一系列表達(dá)式進(jìn)行歸納,形成該語言的形式文法。

 。矗┊a(chǎn)生式規(guī)則:產(chǎn)生式規(guī)則表示為條件—動作對,已被極為廣泛地使用。學(xué)習(xí)系統(tǒng)中的學(xué)習(xí)行為主要是:生成、泛化、特化(Specialization)或合成產(chǎn)生式規(guī)則。

 。担┬问竭壿嫳磉_(dá)式:形式邏輯表達(dá)式的基本成分是命題、謂詞、變量、約束變量范圍的語句,及嵌入的邏輯表達(dá)式。

 。叮﹫D和網(wǎng)絡(luò):有的系統(tǒng)采用圖匹配和圖轉(zhuǎn)換方案來有效地比較和索引知識。

  7)框架和模式(schema):每個(gè)框架包含一組槽,用于描述事物(概念和個(gè)體)的各個(gè)方面。

 。福┯(jì)算機(jī)程序和其它的過程編碼:獲取這種形式的知識,目的在于取得一種能實(shí)現(xiàn)特定過程的能力,而不是為了推斷該過程的內(nèi)部結(jié)構(gòu)。

 。梗┥窠(jīng)網(wǎng)絡(luò):這主要用在聯(lián)接學(xué)習(xí)中。學(xué)習(xí)所獲取的知識,最后歸納為一個(gè)神經(jīng)網(wǎng)絡(luò)。

  10)多種表示形式的組合:有時(shí)一個(gè)學(xué)習(xí)系統(tǒng)中獲取的知識需要綜合應(yīng)用上述幾種知識表示形式。

  根據(jù)表示的精細(xì)程度,可將知識表示形式分為兩大類:泛化程度高的粗粒度符號表示、??泛化程度低的精粒度亞符號(sub-symbolic)表示。像決策樹、形式文法、產(chǎn)生式規(guī)則、形式邏輯表達(dá)式、框架和模式等屬于符號表示類;而代數(shù)表達(dá)式參數(shù)、圖和網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)等則屬亞符號表示類。

  3、按應(yīng)用領(lǐng)域分類

  目前最主要的應(yīng)用領(lǐng)域有: 專家系統(tǒng)、認(rèn)知模擬、規(guī)劃和問題求解、數(shù)據(jù)挖掘、網(wǎng)絡(luò)信息服務(wù)、圖象識別、故障診斷、自然語言理解、機(jī)器人和博弈等領(lǐng)域。

  從機(jī)器學(xué)習(xí)的執(zhí)行部分所反映的任務(wù)類型上看,目前大部分的應(yīng)用研究領(lǐng)域基本上集中于以下兩個(gè)范疇:分類和問題求解。

 。1)分類任務(wù)要求系統(tǒng)依據(jù)已知的分類知識對輸入的未知模式(該模式的描述)作分析,以確定輸入模式的類屬。相應(yīng)的學(xué)習(xí)目標(biāo)就是學(xué)習(xí)用于分類的準(zhǔn)則(如分類規(guī)則)。

 。2)問題求解任務(wù)要求對于給定的目標(biāo)狀態(tài),??尋找一個(gè)將當(dāng)前狀態(tài)轉(zhuǎn)換為目標(biāo)狀態(tài)的動作序列;機(jī)器學(xué)習(xí)在這一領(lǐng)域的研究工作大部分集中于通過學(xué)習(xí)來獲取能提高問題求解效率的知識(如搜索控制知識,啟發(fā)式知識等)。

  4、綜合分類

  綜合考慮各種學(xué)習(xí)方法出現(xiàn)的歷史淵源、知識表示、推理策略、結(jié)果評估的相似性、研究人員交流的相對集中性以及應(yīng)用領(lǐng)域等諸因素。將機(jī)器學(xué)習(xí)方法區(qū)分為以下六類:

 。保┙(jīng)驗(yàn)性歸納學(xué)習(xí)(empirical inductive learning)。

  經(jīng)驗(yàn)性歸納學(xué)習(xí)采用一些數(shù)據(jù)密集的經(jīng)驗(yàn)方法(如版本空間法、ID3法,定律發(fā)現(xiàn)方法)對例子進(jìn)行歸納學(xué)習(xí)。其例子和學(xué)習(xí)結(jié)果一般都采用屬性、謂詞、關(guān)系等符號表示。它相當(dāng)于基于學(xué)習(xí)策略分類中的歸納學(xué)習(xí),但扣除聯(lián)接學(xué)習(xí)、遺傳算法、加強(qiáng)學(xué)習(xí)的部分。

  2)分析學(xué)習(xí)(analytic??learning)。

  分析學(xué)習(xí)方法是從一個(gè)或少數(shù)幾個(gè)實(shí)例出發(fā),運(yùn)用領(lǐng)域知識進(jìn)行分析。其主要特征為:

  ·推理策略主要是演繹,而非歸納;

  ·使用過去的問題求解經(jīng)驗(yàn)(實(shí)例)指導(dǎo)新的問題求解,或產(chǎn)生能更有效地運(yùn)用領(lǐng)域知識的搜索控制規(guī)則。

  分析學(xué)習(xí)的目標(biāo)是改善系統(tǒng)的性能,而不是新的概念描述。分析學(xué)習(xí)包括應(yīng)用解釋學(xué)習(xí)、演繹學(xué)習(xí)、多級結(jié)構(gòu)組塊以及宏操作學(xué)習(xí)等技術(shù)。

 。常╊惐葘W(xué)習(xí)。

  它相當(dāng)于基于學(xué)習(xí)策略分類中的類比學(xué)習(xí)。目前,在這一類型的學(xué)習(xí)中比較引人注目的研究是通過與過去經(jīng)歷的具體事例作類比來學(xué)習(xí),稱為基于范例的學(xué)習(xí)(case_based learning),或簡稱范例學(xué)習(xí)。

 。矗┻z傳算法(genetic??algorithm)。

  遺傳算法模擬生物繁殖的突變、交換和達(dá)爾文的自然選擇(在每一生態(tài)環(huán)境中適者生存)。它把問題可能的解編碼為一個(gè)向量,稱為個(gè)體,向量的每一個(gè)元素稱為基因,并利用目標(biāo)函數(shù)(相應(yīng)于自然選擇標(biāo)準(zhǔn))對群體(個(gè)體的集合)中的每一個(gè)個(gè)體進(jìn)行評價(jià),根據(jù)評價(jià)值(適應(yīng)度)對個(gè)體進(jìn)行選擇、交換、變異等遺傳操作,從而得到新的群體。遺傳算法適用于非常復(fù)雜和困難的環(huán)境,比如,帶有大量噪聲和無關(guān)數(shù)據(jù)、事物不斷更新、問題目標(biāo)不能明顯和精確地定義,以及通過很長的執(zhí)行過程才能確定當(dāng)前行為的價(jià)值等。同神經(jīng)網(wǎng)絡(luò)一樣,遺傳算法的研究已經(jīng)發(fā)展為人工智能的一個(gè)獨(dú)立分支,其代表人物為霍勒德(J.H.Holland)。

 。担┞(lián)接學(xué)習(xí)。

  典型的聯(lián)接模型實(shí)現(xiàn)為人工神經(jīng)網(wǎng)絡(luò),其由稱為神經(jīng)元的一些簡單計(jì)算單元以及單元間的加權(quán)聯(lián)接組成。

  6)加強(qiáng)學(xué)習(xí)(reinforcement learning)。

  加強(qiáng)學(xué)習(xí)的特點(diǎn)是通過與環(huán)境的試探性(trial and error)交互來確定和優(yōu)化動作的選擇,以實(shí)現(xiàn)所謂的序列決策任務(wù)。在這種任務(wù)中,學(xué)習(xí)機(jī)制通過選擇并執(zhí)行動作,導(dǎo)致系統(tǒng)狀態(tài)的變化,并有可能得到某種強(qiáng)化信號(立即回報(bào)),從而實(shí)現(xiàn)與環(huán)境的交互。強(qiáng)化信號就是對系統(tǒng)行為的一種標(biāo)量化的獎懲。系統(tǒng)學(xué)習(xí)的目標(biāo)是尋找一個(gè)合適的動作選擇策略,即在任一給定的狀態(tài)下選擇哪種動作的方法,使產(chǎn)生的動作序列可獲得某種最優(yōu)的結(jié)果(如累計(jì)立即回報(bào)最大)。

  在綜合分類中,經(jīng)驗(yàn)歸納學(xué)習(xí)、遺傳算法、聯(lián)接學(xué)習(xí)和加強(qiáng)學(xué)習(xí)均屬于歸納學(xué)習(xí),其中經(jīng)驗(yàn)歸納學(xué)習(xí)采用符號表示方式,而遺傳算法、聯(lián)接學(xué)習(xí)和加強(qiáng)學(xué)習(xí)則采用亞符號表示方式;分析學(xué)習(xí)屬于演繹學(xué)習(xí)。

  實(shí)際上,類比策略可看成是歸納和演繹策略的綜合。因而最基本的學(xué)習(xí)策略只有歸納和演繹。

  從學(xué)習(xí)內(nèi)容的角度看,采用歸納策略的學(xué)習(xí)由于是對輸入進(jìn)行歸納,所學(xué)習(xí)的知識顯然超過原有系統(tǒng)知識庫所能蘊(yùn)涵的范圍,所學(xué)結(jié)果改變了系統(tǒng)的知識演繹閉包,因而這種類型的學(xué)習(xí)又可稱為知識級學(xué)習(xí);而采用演繹策略的學(xué)習(xí)盡管所學(xué)的知識能提高系統(tǒng)的效率,但仍能被原有系統(tǒng)的知識庫所蘊(yùn)涵,即所學(xué)的知識未能改變系統(tǒng)的演繹閉包,因而這種類型的學(xué)習(xí)又被稱為符號級學(xué)習(xí)。

  


 

狀 態(tài): 離線

公司簡介
產(chǎn)品目錄

公司名稱: 中華工控網(wǎng)
聯(lián) 系 人: 客服中心
電  話: 0755-26546361
傳  真: 0755-26585268
地  址: 深圳市南山區(qū)創(chuàng)業(yè)路現(xiàn)代城華庭1棟6A
郵  編: 518054
主  頁:
 
該廠商相關(guān)技術(shù)文摘:
智能儀器儀表的發(fā)展特點(diǎn)與前景分析
電動機(jī)性能虛擬儀器測試系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
視頻監(jiān)控護(hù)航高鐵安全運(yùn)營
基于PLC,觸摸屏及變頻器對吹膜機(jī)的改造
永宏P(guān)LC應(yīng)用于自助圖書借還終端機(jī)
基于永宏P(guān)LC的GSM通訊原理及其應(yīng)用
改善汽車生態(tài)學(xué)、安全性和舒適性,四大測試分析是關(guān)鍵
改善汽車生態(tài)學(xué)、安全性和舒適性,四大測試分析是關(guān)鍵
數(shù)控技術(shù)的發(fā)展趨勢及產(chǎn)業(yè)化
數(shù)控技術(shù)發(fā)展戰(zhàn)略與發(fā)展途徑的思考
用Energid 的軟件進(jìn)行機(jī)器人的抓取和操作
如何借助RFID技術(shù)升級企業(yè)信息管理水平
更多文摘...
立即發(fā)送詢問信息在線聯(lián)系該技術(shù)文摘廠商:
用戶名: 密碼: 免費(fèi)注冊為中華工控網(wǎng)會員
請留下您的有效聯(lián)系方式,以方便我們及時(shí)與您聯(lián)絡(luò)

關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 本站動態(tài) | 友情鏈接 | 法律聲明 | 不良信息舉報(bào)
工控網(wǎng)客服熱線:0755-86369299
版權(quán)所有 中華工控網(wǎng) Copyright©2022 Gkong.com, All Rights Reserved