0

雷鋒網 AI 科技評論按:2019年9月21日,2019第五屆中國人工智能大會(CCAI 2019)在山東省青島市舉行。大會為期兩天,包括中國人工智能學會理事長、中國工程院院士李德毅,清華大學人工智能研究院院長、中國科學院院士張鈸,卡內基梅隆大學計算機學院副院長、蘇格蘭皇家學院院士賈斯汀·卡塞爾,加拿大滑鐵盧大學教授、國際計算學習理論學會前主席賽·本·大衛,騰訊人工智能實驗室主任張正友,中國人工智能學會秘書長王衛寧等多位重磅學術嘉賓出席,還有一百多位國際人工智能領域頂尖人才,一千多位國內外人工智能領域專家教授、頭部企業高管參會。這也是青島市「建設現代化國際大都市,打造對外開放新高地」戰略下的重要活動,青島期待打造人工智能的國際合作新平臺,整合全球的要素資源,加快推進人工智能的發展。
山東省委常委、青島市委書記王清憲在開幕致辭中說道,本屆大會的主題是「智變融合」,人工智能最大的價值在于賦能,與場景的應用結合起來,與產業融合起來,從而帶來點石成金的變化。人工智能為百業賦能的過程,將會形成巨大的產業;「人工智能科技服務產業」,就是利用人工智能的發展成果,推動更廣泛的產業應用,實現人工智能為百業賦能的價值。

清華大學人工智能研究院院長、中國科學院院士張鈸上午進行演講,題目是「邁向第三代人工智能的新征程」。雷鋒網 AI 科技評論根據現場速記把演講內容整理如下。
張鈸:各位領導、各位專家、各位來賓,我今天講的題目是「邁向第三代人工智能的新征程」。這個題目是我經過認真考慮的,特別加了「新征程」。我一直向大家傳達一個信息,人工智能遇到新的機遇,如果我們有可能突破現在面臨的問題,人工智能就會長足往前發展。

人工智能有個特點,我今天在報告里面主要傳達這么個特點:大家不能指望人工智能一出來就「畢其功于一役」。它永遠在路上,這就是人工智能的魅力所在。

我們看一下人工智能究竟做了什么事兒?第一件事就是第一代人工智能提出的符號模型,以知識經驗為基礎的推理模型,這是人工智能的第一個重大突破。這個突破后來產生了一個結果,就是這個理論提出時有個非常樂觀的估計,1956年由西蒙提出,基于這種模型,十年之后機器可以打敗所有棋手,二十年以后機器取代人類所有的工作。實際并不是這樣,六十年以后機器才打敗棋手,機器究竟代替人類的所有工作是什么時間,可能還很遙遠,這也是人工智能的另外一個特點,往往被高估。

人工智能的第一代模型,有優點,但是也有很大局限性。這個優點是顯然的,因為它是模仿人類的,它可解釋,魯棒性很強,但是它的局限性也非常大。因為最大的問題是人類的知識經驗,很難準確表達,這就是產生的后來人工智能冬天的根本原因。當時的應用很有限,幾乎沒有推廣,但是,有了大數據以后,這個問題得到了很大改善,特別是機器的能力提高以后,可以把大量的數據作為知識放在機器里,這就是最典型的沃森系統。

沃森系統可以做癌癥的免疫治療,這里面用多少知識呢?100萬個醫學雜志中抽取的2500個摘要,400萬病人的數據,再加上1861年以前所有藥物的專利,它有醫學知識,并聯的數據再加上藥物知識,就可以做癌癥的免疫治療。當然了,很多慢性病的治療和管理,這個系統也做得很好,中國的國內也有大量這方面的工作在探索和研究。

第二代人工智能,一個最重要的成果就是深度學習。也就是說,第一代人工智能提出來,如果能夠很好地利用人類的知識,就可以建立很好的人工智能系統,如果我們有充分數據,也有可能建立起有用的人工智能的系統。

深度學習為什么這么受重視?一個很重要的原因,它有兩個重大變化。當網絡層次增加以后,有兩個重大變化:第一個變化,輸入只要原始數據,不需要預處理。第二個是性能提高很多,這就造成了深度學習的重大突破。也就是說,它從一定意義上有通用工具,對領域的知識要求不高,同時能夠處理大數據。

這就帶來很大的變化,大家也看到了,語音識別,2001年時它的識別率停留在80%,也就是20%的誤識別率;2016年誤識率就降到了5.9%,達到專業速記員的水平,到了2017年,所有產品包括谷歌、微軟,包括中國的訊飛、百度,用的全是深度學習。

變化更大的是圖像識別。有一個標準的圖像識別數據集 ImageNet,大家知道,2011年,它的誤識率是50%,有一半認錯了。但是四年以后,2015年就超過了人類水平,原因也是利用了深度學習。

最后一個,給大家印象最深就是AlphaGo,大家都知道了。因此就有很多估計,十年之內代替40%以上人類的工作,三五年里面,智能駕駛車就可以量產,等等,剛剛李院士說到了這個問題,他分析得很深刻。實際三五年里面不可能量產。

技術已經完全成熟,我們現在的研究已不成熟,主要是應用問題。為什么在人工智能上往往產生樂觀估計?主要原因有兩個:一個是對發展人工智能的困難性估計不足,對取得的成果估計過高。一個估計不足,一個估計過高,就產生了問題。另外一個很重要的原因,受歷史事件的影響。過去我們發現,有了蒸汽機以后就產生了工業革命,有了電動機發動機以后就產生了電氣革命,有了計算機以后產生了信息革命,大家很希望有一個東西出來以后引起人工智能的革命。
現在的問題是,有沒有?至今為止,還沒有發現人工智能里面的蒸汽機和計算機。曾經最開始寄希望于符號模型,結果發現符號模型也沒有那么管用。第二次發現的是大數據+深度學習,以為大數據+深度學習就是人工智能的蒸汽機和計算機,為什么這樣?

這不能不考慮到人工智能的特點,我們說深度學習根本不是AI的通用機。現在大家在尋找通用的人工智能,到底有沒有,還有爭論,不去管它,但至少深度學習不是人工智能。這個非常明顯,第一代人工智能也好,第二代人工智能也好,它的應用場景必須滿足以下五個條件。
從正面來講,所有的應用場景,如果滿足以下五個條件,計算機絕對能夠戰勝人類,不管這個問題多么復雜:具有豐富的數據或知識,完全信息,確定性信息,靜態,單領域和單任務。
最明顯的例子是圍棋,圍棋多么復雜,但是圍棋滿足這五個條件,所以計算機戰勝在圍棋上戰勝人類是早晚的事情。所以從正面來講,如果你滿足這五個條件,不管多復雜,計算機絕對戰勝人類。長遠來看,如果你的應用場景不完全滿足這五個條件,其中有些條件不滿足,你這個工作就變成困難。自動駕駛為什么如此困難?根本的原因在這里。為什么我們難以做出來廉價、可靠的自動駕駛呢?背后的原因就在這里,因為自動駕駛很多條件都不滿足,它不是完全信息,它不是確定性信息,它不是靜態的環境,或者是按照確定性規律演化的,它的很多東西是不可預測的,它也不是單領域的,里面有人駕駛的車、行人、其它車輛。所以剛剛李院士提出來專用道,就是把這些東西弄干凈,變成單領域。所以我們一直說,如果有些條件是不符合這五條,你就需要下功夫。

現在人工智能能夠在這些領域里面得到應用,換句話說,這些領域里面有很多應用產品符合剛才講的五個條件。如果這些領域里面的應用場景符合五個條件,大家大膽去做,絕對會超過人。根據現在計算機強大的力量,是可以做到這一點的。但是,這些應用里面,也有大量不符合那五個條件的,大家必須下功夫,不能指望靠現在的第一代、第二代人工智能去解決它。

舉個簡單的例子,復合場景下的決策,完全信息條件下的決策或者完全信息下的博弈,計算機戰勝人類是絕對的。下面一個問題,不完全信息的博弈及打牌,大家都知道,今年5月份對撲克牌這個問題也解決了。換句話說,6人無限注的德州撲克,計算機能戰勝人類,這就意味著概率意義下的不確定性,機器也可以戰勝人類。但是人類的決策環境都不符合前面兩個條件。所以在復合環境下的博弈或者復雜環境下的決策,機器跟人類還差得比較遠。從這里來講,應用場景是極為重要的。

第二個,我們必須要重視的,用數據驅動的方法做出來的系統,有大量毛病,或者說這些毛病是根本性的,是極為危險的。這里面列出來的,簡單舉個例子,一個圖像識別系統,都可以說它的識別率超過人類,但是這個圖象識別系統跟人類的感知完全不同。

就是這樣的系統,你給它噪聲,它可以識別為知更鳥。你給它一個噪聲,它可以識別為獵豹。換句話說,模式識別系統并沒有達到人類認知的水平,只達到低等動物的水平,所以感知這個詞翻譯得非常好,感覺+知覺,低等動物只有感覺,沒有認知。所以機器現在達到的水平是低等動物的水平,它可以分辨不同的物體,但是它本質上不認識這個物體。另外是它非常脆弱,非常容易受攻擊。

這是阿爾卑斯山圖片,人起來是,機器看起來也是,只要給它加上噪聲,右邊這個圖和左邊那個圖,唯一的區別是噪聲多一點,人看起來還是阿爾卑斯山,機器看起來是一條購,而且它的置信度是99.99%,它99.99%認為這是一條狗,非常容易受欺騙,這就說明機器跟人的認知差異非常大。

語音也是同樣的道理,前面的英文說的是一句話,我們加上一點點噪聲,人聽起來還是一樣的,機器聽起來就是另外的內容,這就非常危險。
搞軍事的人說,過去你語音傳過去,它進行干擾,你聽不見而已。現在語音傳過去,它說進攻,可以讓你聽成退卻,加一點噪聲就行了,這就是AI的安全性。

另外,缺少自我知識,這是非常重要的。你說我用這個話,讓它翻譯,「說你行的人行」,這句話計算機怎么翻呢?「說你專業的人行道」,瞎翻,為什么瞎翻?它不知道自己不知道,沒有任何自知之明。這是很危險的。為什么翻譯成人行道呢?「人行」,它以為是人行道。為什么翻譯成「你的專業」呢?「你行」。這是非常危險的。大家想想,我帶了一個翻譯,翻譯水平挺高的,大多數翻譯是很準確的,但是他會瞎說,你敢用嗎?人類不會,因為他知道這句話如果沒有聽明白會再問是什么意思,計算機沒有自知之明,人貴有自知之明,這是人類智慧的一個部分。怎么讓機器有自知之明?這是很困難的事。

下一步,我們現在有個新的歷史機遇,就是邁向第三代人工智能。第三代人工智能就要糾正前面說的兩個局限性,建立可解釋、魯棒的人工智能理論,發展安全、可信、可用的人工智能技術,促進人工智能的創新應用。

我們成立人工智能研究院就是想擔負這個責任,用什么辦法解決這個問題?就通過一個核心和兩個融合:一個核心是加強基礎研究,必須從理論上去突破。我們剛才講了,深度學習,所以有這么多毛病,這個原因是它的原理開始的,它的原理就不對,不是用人類一樣的原理。所以我們必須更好地去解決它,才有可能往前邁進。用的方法主要是兩條:一個是多學科交叉,必須多學科交叉,跟心理學、神經科學。大家知道,第一個模型是心理學家提出來的,第二個模型是神經科學家和數學家提出來的,都不是計算機的人提出來的,必須要加強學科交叉,應用結合。
我們一共成立了十個研究中心,包括全校的18個系和學院,利用各種學科,不光是計算機的,不光是信息領域的,也有心理學的、法律的、文學的,都參與進來。

除了技術上的研究以外,目前人工智能的技術與治理也是重大的問題,現在清華大學也參與了這個工作,必須在國際上要有我們的話語權,要在這個問題上發出中國的聲音。做的辦法有兩條:一條是新原理和新模型,就是跟其它學科交叉,我們都在做。還有腦科學啟發的,還有神經科學的。把數據驅動和知識驅動結合起來,也是重點做的內容,我們已經有不少成果。大家看展覽,我們用的珠算平臺開了一個公司,就是應用新的算法,比谷歌算法又進了一步,帶了第三代算法的特色。第一輪投資,對我們平臺的估值是7億人民幣。這個平臺跟國際已有的其它平臺相比,還是有很多優勢的。我們也在知識表示、知識推理上做了很多工作,還有小樣本、因果推理。常識,剛才李院士也提到常識推理。

最后做一下總結,人工智能的確是本世紀最重要的發展領域之一,它的發展將會對人類產生重大影響。但是我們一直強調,人工智能不像以前遇過的科學,以為某一個定理解決了,所有問題就迎刃而解。人工智能太復雜了,我們要不斷往前推進,才能使人工智能進一步發展。
(完)
更多 CCAI 2019 內容請期待后續報道。雷鋒網 AI 科技評論現場報道。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。