1
| 本文作者: 李尊 | 2016-10-21 21:16 | 專題:2016中國計算機大會(CNCC 2016) |
編者注:譚鐵牛現為中國科學院副院長、中科院自動化所智能感知與計算研究中心主任,他是中國科學院院士、英國皇家工程院外籍院士、發展中國家科學院(TWAS)院士、巴西科學院通訊院士、中國圖像圖形學學會理事長、中國人工智能學會副理事長。主要從事圖像處理、計算機視覺和模式識別等相關領域的研究工作,已出版編著和專著11部,并在主要的國內外學術期刊和國際學術會議上發表論文500多篇,獲準和申請發明專利80多項。曾任中科院自動化所所長、模式識別國家重點實驗室主任、中國計算機學會副理事長、國際模式識別協會副主席、IEEE生物識別理事會主席,曾獲得國家技術發明二等獎、國家自然科學二等獎和國家科技進步二等獎各1項。
本文根據譚鐵牛副院長今天上午在 CNCC 2016 上所做的大會特邀報告《大數據時代的模式識別》編輯整理而來,在未改變原意的基礎上稍作刪減。

各位老師、各位同學、各位同仁,大家上午好。因為時間有限,今天的報告會盡量簡略一點。另外考慮到大家不都是做模式識別,所以今天的報告不會講的太專業。
首先我注意到今年不管開什么會、誰組織、在哪里開,只要和人工智能掛上邊,都很火爆。大家都在提今年是人工智能的60周年,其實今年對整個計算機科學,同樣值得紀念的一年。因為
80年以前圖靈機模式誕生
70年以前計算機誕生
60年以前才有人工智能
50年以前,計算機領域的諾貝爾獎——圖靈獎第一次頒發
所以說今年是整個計算機科學非常值得紀念的一年。
鑒于最近大家人工智能講得比較多,所以我今天要給大家講得是一個更具體的問題,也是我本人多年從事的領域——大數據時代下的模式識別。

今天這個報告里我主要講四個問題。它們分別是:
模式識別的基本概念和歷史
模式識別的發展現狀
大數據時代的機遇與挑戰
值得關注的研究方向

首先是什么是模式識別?
其實很好解釋,用我自己的語言來說就是:世上萬物,不管是物質的還是精神的,看得見還是看不見的都是一種模式。

所以對這些模式進行分析與處理,進而實現描述、辨識、分類、解釋,這就是一種模式識別,后面我還講提到更多的定義。
模式識別為什么重要?在此我要引用Ray Kurzwell的兩句話:
人類思維的真正力量是基于模式識別。
計算機越擅長模式識別會變得越發和人一樣。

不管是哪種定義,模式識別基本都可以分為這幾個步驟:信號獲取—預處理—特征抽取—分類器設計。
當下,與其說人工智能火,不如說是深度學習火。而深度學習之所以火的原因,是因為要提升模式識別的能力(如語音識別、圖像識別等)。

因為模式識別是作為人類的一個基本能力,同時這也是模式識別起源的一個基本動力。

跟模式最相關的兩個熱門話題,一個當然就是機器學習,另一個則是數據挖掘。

模式識別目前也不斷引進借助于很多其他學科的基礎理論,推動相關學科交叉快速發展。
模式識別發展簡史

我到現在為止,也沒查到第一次是誰、在哪里提出了模式識別。但是我知道從18世紀、19世紀開始,數學領域中特別是統計科學就涉及到了模式識別,這也為人工智能的誕生奠定了基礎。
模式識別的發展大概是如上圖所示這么幾個階段,從最開始一直到后來各種基礎領域出現,再一直到大數據時代。
模式識別發展到今天,我把它總結為幾句話。
模式的基礎理念不斷創新
從統計模式識別到階段模式模式識別,還有一直以來都又在研究的神經網絡。大概是這么幾大類:
句法模式識別(規則學習)
統計模式識別(人工特征)
深度神經網絡(自動歸檔)
它們相互間的結合是未來的發展方向,我一會兒也會講到這個。

模式識別應用領域不斷拓展
另外模式識別的應用領域一直在不斷拓展,因為能夠應用模式識別的地方實在太多,所以一直在不斷提升。

模式識別系統性能不斷提升
模式識別系統的性能也一直在不斷提升中,比如像ImageNet圖像識別賽上,它的結果一直在不斷提升中。

模式識別的典型成功應用
語言識別、語言合成
人臉識別
虹膜識別
模式識別的成功應用很多,在此不展開講了,稍微舉幾個例子大家參看一下。
人臉識別,但雙胞胎人臉識別解決不了。

虹膜識別,下圖展示的是在真實的煤礦場所,煤礦工人考勤場景。為什么用虹膜對他進行識別?因為指紋識別在這種場景下無法使用,人臉識別在上班之前可以,下班的時候就不行了。

另外再舉一個模式識別的例子——步態識別。為什么要特別提到步態識別這個例子呢?因為目前相對來說還有一點挑戰。

在你相距幾十米遠的時候,虹膜也好、人臉也好,你無法進行識別。
另外一個挑戰就是,他是從正面走來,還是從側面走來。最近借助于深度學習,這個部分也有了一些新的進展。

還有一個例子是智能視覺監控,在此就不展開詳細講述了。

現有模式識別的局限性
盡管模式識別在很多領域都成功應用,但還是有巨大的挑戰。在此我想再引用Robert M.Haralick和Thomas G.Dletterich的兩句話:
計算機視覺(模式識別)的根本問題是一個魯棒性問題,如果不考慮魯棒性問題,計算機視覺幾乎所有問題都解決了。
現階段只能系統需要在開發環境下具有自適應性,對噪聲具有魯棒性。
核心的意思就是它的局限性受限于魯棒性和自適應性。如果這兩個問題解決了,很多問題就能迎難而解。

大數據的出現、深度學習的性能提升在一定程度上解決了魯棒性、自適應性的問題,但是跟人相比還有巨大的差距。

所以這個領域還需要我們繼續去努力學習,深度學習盡管取得很大成功,但是跟人的相比它的魯棒性、自適應性、泛化能力有很大差距。

所以,我把現狀概括這么幾句話:
面向特定任務的模式識別已取得突破性進展,有的性能可與人媲美。
統計與基于神經網絡的模式識別目前占主導地位,深度學習開創了新局面。
通用模式識別依然任重道遠。
魯棒性、自適應性和可泛化性是一個進一步發展的三大瓶頸。

我們目前實實在在的處在大數據時代,大數據的價值不在于大數據本身,而在于它內容的理解與識別,而這里面很多就是模式識別的問題。

所以我覺得第一個機遇,就是把大數據變成知識、變成決策能夠依據的根據。而發掘這個金庫的鑰匙就是模式識別,只有這樣才能實現“From Data Bonanza to Data Bonus”。

機遇2:推動理論和方法創新

機遇3:加速學科領域交叉和滲透
加速學科領域交叉和滲透主要分兩個方面:
以數據驅動為代表的分析方法在大數據時代具有廣泛用武之地,使得若干傳統學科(如神經科學)等的研究方法也出現了巨大創新,為模式識別方法拓展到其他領域的方法中帶來了重要契機。
相關領域在大數據時代的原創成功也能夠對模式識別理論與方法帶來影響,進而推動模式識別學科與其他學科的協同創新。

機遇4:引導科技發展新變革

機遇和挑戰同在,機遇抓不住也是挑戰。
挑戰1:復雜的大數據

挑戰2:計算效率和性能

挑戰3:大數據的語義計算與理解

語義就是人們根據自己對現實世界的理解而賦予信息的解釋。
挑戰4:大數據理解需要信息論的創新

還是那句話,在這些機遇和挑戰面前,盡管我們講機遇大于挑戰,但是機遇抓不住就是挑戰,挑戰解決不了,那就是機遇。
一、面向大規模多源異構數據的魯棒特征表達

二、結構與統計相結合的模式識別新理論

三、數據與知識相結合的模式識別

四、具有魯棒性和自適應性的生物啟發模式識別

五、基于跨領域跨模態知識遷移的模式識別

六、以互聯網為中心的模式識別


模式識別是人工智能的核心內容,是大數據時代的關鍵使能技術。
大數據帶給模式識別諸多新的機遇與挑戰。
大數據時代的模式識別具有十分廣闊的創新空間與發展前景。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。