0
| 本文作者: 陳伊莉 | 2018-09-26 20:03 |
雷鋒網(wǎng)AI金融評論報(bào)道,在近日世界人工智能大會智能金融主題論壇上,加州大學(xué)伯克利分校邁克爾·歐文·喬丹(Michael I. Jordan)教授進(jìn)行了精彩的分享。甫一開始,他就笑談稱,金融論壇讓他更加舒服和自如。“這兩天參加的AI論壇,讓我不是那么自在,感覺他們是在講科幻小說,金融領(lǐng)域更加實(shí)際。”
在他看來,AI就是統(tǒng)計(jì)學(xué),并不是要創(chuàng)造一個(gè)“人造人”。智能也存在局限,當(dāng)前計(jì)算機(jī)科學(xué)和現(xiàn)在的經(jīng)濟(jì)學(xué)當(dāng)中出現(xiàn)了一個(gè)空白,需要研究如何連接他們,并從市場這一自然衍生的智慧體中獲取知識。另外,很多經(jīng)常只是一個(gè)單一的決策,或者是一個(gè)線性系列的決策,但是實(shí)際生活更多是多重決策,還要考慮一個(gè)負(fù)載均衡的問題。
據(jù)了解,Michael I. Jordan是加州大學(xué)伯克利分校電機(jī)工程與計(jì)算機(jī)系和統(tǒng)計(jì)學(xué)系教授、美國科學(xué)工程藝科三院院士,一眾學(xué)生如吳恩達(dá),Zoubin Ghahramani, Tommi Jaakkola, Lawrence Saul 和 David Blei 目前都是機(jī)器學(xué)習(xí)領(lǐng)域重要的研究者。同時(shí),也是螞蟻金服科學(xué)智囊團(tuán)的主席。
以下是演講原文,經(jīng)過雷鋒網(wǎng)編輯:
我覺得AI提到很多,但我們更重要的不是AI,而是服務(wù)、數(shù)據(jù)和統(tǒng)計(jì),還是舊世界的東西,只是現(xiàn)在煥發(fā)了新潛力。支付、搜索、服務(wù)這些詞聽上去非常無聊,但是背后是廣闊的領(lǐng)域。人們不僅僅是想要支付,是希望能夠理解互動,是場景,我們才能夠真正賦予這些場景新的意義。
很多人在講AI,我覺得AI就是統(tǒng)計(jì)學(xué)。中國有很多優(yōu)勢,一個(gè)是在數(shù)學(xué)方面和統(tǒng)計(jì)學(xué)方面做的非常好,AI方面不僅僅是計(jì)算機(jī)科學(xué),更多是數(shù)學(xué)、統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)學(xué)。我們一直看到當(dāng)我們講到AI的時(shí)候,大部分講的是范式認(rèn)可,你找到一個(gè)數(shù)據(jù),把一個(gè)范式放上去,獲得一個(gè)產(chǎn)出。另外一邊更有意思的就是決策端,我所做的一個(gè)決定是,我現(xiàn)在看到的是不是一個(gè)熊,是一個(gè)壞人。有時(shí)候是一系列決定,比如說AlphaGo下圍棋,或者是幾萬個(gè)涉及到不同人、產(chǎn)品互聯(lián)的決定,這里面的錯(cuò)誤比例是多少,如何降低這些錯(cuò)誤。當(dāng)這些決定涉及到人們的欲望,我們不能給每個(gè)人同樣的建議,因?yàn)橥粯訓(xùn)|西是有限的,所以這些問題是AI科學(xué)家沒有想到,他們是計(jì)算機(jī)科學(xué)家。經(jīng)濟(jì)問題當(dāng)中其實(shí)稀缺性非常關(guān)鍵,這就是今天我要講的AI決策層面,這塊可能還沒得到過多的關(guān)注。
很多人說AI是沒有歷史的,但不是。早在1990年代的時(shí)候,其實(shí)AI就已經(jīng)在后端存在。比如說降低欺詐率,這非常重要,亞馬遜沒有這一點(diǎn)就沒有辦法生存下去。如果沒有供應(yīng)鏈管理和搜索,就沒有亞馬遜,沒有阿里巴巴。建立平臺非常重要,這當(dāng)中必須要有計(jì)算機(jī)科學(xué)來建平臺,有了這些平臺之后我們要做AB測試,做供應(yīng)鏈管理。同時(shí)可以用于其他的領(lǐng)域,基于這些平臺,就有了所謂的推薦系統(tǒng)。
推薦系統(tǒng)是第一個(gè)AI或者說第一個(gè)統(tǒng)計(jì)學(xué)大規(guī)模給自然人提供服務(wù)的系統(tǒng),而不是在后端服務(wù)。這塊是非常重要的第二代AI,把人帶入到這樣一個(gè)計(jì)算機(jī)科學(xué)的領(lǐng)域。我們現(xiàn)在所在的時(shí)代并不一定是深度學(xué)習(xí)或者是神經(jīng)網(wǎng)絡(luò),或者人機(jī)聯(lián)合。但是我們現(xiàn)在應(yīng)該要用AI做一些比較復(fù)雜的東西,比如語言識別等,又或者把它作為一個(gè)商品,放到一個(gè)大系統(tǒng)當(dāng)中,或者是一個(gè)視覺。很多公司包括AI系統(tǒng),他們都是提供一種商品化的像人一樣的或者類似于人的技能,但是沒有辦法替代人,AI無法理解,只能模仿某一項(xiàng)具體的技能。我覺得并沒有像人們說的這么有變革性。真正出現(xiàn)變革的并不是仿造人的智能,而是要創(chuàng)造市場。通過算法和數(shù)據(jù)實(shí)現(xiàn)市場的智能。在90年代,當(dāng)時(shí)最大的行業(yè)應(yīng)用統(tǒng)計(jì)學(xué)和AI的用途主要在詐騙、入侵檢測等,基于數(shù)據(jù)的質(zhì)量和數(shù)據(jù)的數(shù)字增長。

人們常說數(shù)據(jù)、算法、平臺或硬件是三個(gè)要素,但是我覺得都不對。首先算法沒有那么復(fù)雜,其實(shí)搜索非常簡單,而且檔案都可以找到。大部分學(xué)生都知道你在檔案當(dāng)中就可以找到世界上所有的知識。公司可以知道的東西都是可以在存檔檔案當(dāng)中的。算法沒有那么神奇。
第二,平臺,也許五年之前是,但現(xiàn)在不是。每個(gè)人都可以上云,任何的問題可以獲得足夠的算力。真的是數(shù)據(jù)嗎?不一定,比如說現(xiàn)在已經(jīng)到T級的數(shù)據(jù),但是當(dāng)你做具體決定時(shí),數(shù)據(jù)并不一定需要那么多。不管是監(jiān)測欺詐,還是其他科學(xué)研究。其實(shí)更重要的是收集相關(guān)數(shù)據(jù),而不是收集足夠多的數(shù)據(jù)。
AI從業(yè)者需要培訓(xùn)。我之前也說過,雖然都是數(shù)據(jù)推理,但是每個(gè)國家有各個(gè)不同的問題,所以沒有一個(gè)國家會占主導(dǎo),每一個(gè)國家要解決自己的問題,應(yīng)該有自己的AI能力。
另外,現(xiàn)在公司也有很多數(shù)據(jù),像谷歌、臉書、百度等,但是他們的數(shù)據(jù)使用不好,他們沒有給人們提供更好的服務(wù),他們提供的是廣告。大部分的廣告對我來講是沒有意義的,所以錢就是在公司和廣告商之間用來用去,而我們的用戶沒有拿到錢。我們提供了所有的數(shù)據(jù),但是我們一分錢都沒有拿到,我覺得這個(gè)市場是破碎的,沒有很好地連接起來。
而其中,數(shù)據(jù)利用比較好的是電商和支付公司,因?yàn)樗麄冇泻芏嘟灰椎臄?shù)據(jù),比如說我上一個(gè)電商買東西,他們就知道我的偏好,比搜索引擎更加了解,因?yàn)楹芏鄷r(shí)候,我們會搜索一些很無聊的問題,比如說英國的女王是誰。而這個(gè)問題根本不會顯示我的偏好。
我們?nèi)绾蝸砝眠@樣一些人的偏好數(shù)據(jù)呢?它的關(guān)鍵是能不能將客戶和商戶聯(lián)系在一起。很多AI都在做平臺,比如說是搜索引擎、社交網(wǎng)絡(luò)等等。但是真的不夠智能。搜索引擎確實(shí)改變了世界,但是它沒有變得更聰明。不同的是電商公司,他們與現(xiàn)實(shí)生活發(fā)生聯(lián)系,你購物后包裹送至你家門口,這是消費(fèi)者和商戶、生產(chǎn)者之間的關(guān)系,這是有市場價(jià)值的,而且對我也是有價(jià)值的,因?yàn)榭梢曰谶@種交易創(chuàng)造一個(gè)市場。
另外,還有一點(diǎn)用戶留存,很多公司面臨這樣的問題,實(shí)際上他們的用戶都在流失。五年以前,美國人很喜歡臉書,但是下一代會覺得臉書一點(diǎn)不酷。我覺得臉書會消亡,雖然現(xiàn)在可能還比較大,通過做廣告賺了很多錢,還在進(jìn)行大筆收購。但是我覺得這個(gè)公司已經(jīng)沒有創(chuàng)新,已經(jīng)支離破碎了。用戶是喜新厭舊的,如何提高黏性呢?我覺得黏性非常重要的是,把平臺上的客戶和商家都能夠聯(lián)系起來。一些傳統(tǒng)手段比如是會員卡、積分等。IT平臺也要想怎么樣通過一種方式把客戶和商家進(jìn)行連接。
我想接著講一下智能。什么是智能?其實(shí)我們也不知道,我們是摸索出來的。但其實(shí)它就是一些算法,去模擬人類智能,自己本身并不是智能的。所以越來越多我們發(fā)現(xiàn)看不懂這個(gè)詞了,特別的復(fù)雜,每一個(gè)神經(jīng)元都是很復(fù)雜的,我們不知道怎么才叫真正的智能。可能350年以后會知道,但絕對不是現(xiàn)在。
而智能也是有它的局限。別的方面或許可以給我們啟發(fā)。舉個(gè)例子,每天上海的每一家餐廳都有足夠的食材去給它的客戶燒菜。這些食材哪里來的?就是上海市以外的郊區(qū),那些農(nóng)民,他們用了非常復(fù)雜的運(yùn)輸系統(tǒng),用卡車來運(yùn)輸。如果站在更高角度來看這個(gè)問題,其實(shí)市場是最聰明的發(fā)明。而且并不是來自于現(xiàn)在的人工智能,都是出自于人類的大腦,這是一種自然智慧。而現(xiàn)在的計(jì)算機(jī)科學(xué)里面并沒有特別多的強(qiáng)調(diào),而是一味地說要創(chuàng)造新的智能。
我們可以看到在計(jì)算機(jī)科學(xué)和現(xiàn)在的經(jīng)濟(jì)學(xué)當(dāng)中出現(xiàn)了一個(gè)空白,沒有聯(lián)系起來,這實(shí)際上是非常重要的。我們要把市場和計(jì)算機(jī)科學(xué)聯(lián)系起來,也就是計(jì)量經(jīng)濟(jì)學(xué)。用數(shù)據(jù)來創(chuàng)造市場,是真正比較好玩的。
還要注意的是,信息的傳遞除了采用經(jīng)濟(jì)的方式外,為了讓人們有更多的幸福感,還需要考慮公平性,也就是個(gè)性化需求。因?yàn)橛泻芏嗳苏f我不希望有跟別人一模一樣的領(lǐng)帶,我希望有自己的領(lǐng)帶,個(gè)人的效應(yīng)如何表達(dá)體現(xiàn),這是我們所謂的新時(shí)代的公平性。
舉個(gè)例子。在一個(gè)沒有連接的市場中,我們怎么樣用技術(shù)來打造一個(gè)藝術(shù)市場。現(xiàn)在藝術(shù)、音樂市場非常蓬勃,一些人有天賦有路徑,而很多人只是興趣愛好。美國就有個(gè)音樂原創(chuàng)平臺,主要通過廣告費(fèi)來賺錢,而且錢給不到原創(chuàng)藝人。這種廣告費(fèi)打造平臺的模式,非常無聊。無論是消費(fèi)者或者是原創(chuàng)音樂的藝人,都是沒有產(chǎn)生足夠多的價(jià)值。換而言之,也損失了大量潛在的就業(yè)機(jī)會。那么如何增加人們的幸福感,創(chuàng)造更多的就業(yè)?
如果我們要打造一個(gè)市場,要有這些信息:首先你可以給音樂人一個(gè)信息,讓他可以看到全部消費(fèi)者的數(shù)據(jù),比如說他可以知道上個(gè)禮拜在成都有一千個(gè)人或者一萬人聽了我的歌,或者他們還跟朋友談?wù)摰轿业母琛S辛诉@些信息之后,他可以趕緊去成都開一場小型演唱會,他知道哪里有需求,他就可以到那里舉辦小型演唱會,多賺一些錢,越做越大。或者說,可以拍賣婚禮等慶典的商業(yè)演出,這又是一個(gè)新的市場。
這樣很多人可以找到新的工作。只需要通過平臺打造一個(gè)市場,連接用戶和原創(chuàng)藝人,就可以讓藝人賺錢了。美國已經(jīng)有這方面的例子了,網(wǎng)站unitedmasters使用了一些機(jī)器學(xué)習(xí)的技術(shù),我也是這家公司的董事會成員,我比較看好這個(gè)模式,我相信它在未來會讓人們更加幸福。
這就是基于數(shù)據(jù)流來創(chuàng)造市場。長久以來關(guān)于AI,大家經(jīng)常有一個(gè)誤解,覺得它會扼殺就業(yè),但實(shí)際上它會創(chuàng)造更多的就業(yè)。現(xiàn)在有很多的就業(yè)崗位是缺失的。打造市場,可以創(chuàng)造更多的就業(yè)崗位。AI就是可以做得到的,我們不能是僅靠個(gè)別的平臺,還是要靠大的統(tǒng)計(jì)數(shù)字。
一些案例經(jīng)常只是一個(gè)單一的決策,或者是一個(gè)線性系列的決策,但是實(shí)際生活更多是多重決策,我們要考慮一個(gè)負(fù)載均衡(Load Balancing)的問題。

比如說前面講到的推薦系統(tǒng),傳統(tǒng)的推薦系統(tǒng)假設(shè)是沒有稀缺性的,如果大家上亞馬遜,它可能會推薦一部電影,另外一個(gè)消費(fèi)者上了亞馬遜,也推薦了一部電影,所以這個(gè)推薦沒有稀缺性,它可以給所有人都推薦這部電影,這沒有什么問題。但是如果向所有人推薦一本書呢?行,只要這本書還有貨,雖然稍微有一些壓力,但是還好。但向每個(gè)人都推薦同一家餐廳呢?那晚上可能就是大排長龍,客戶都不會高興。
更糟糕的情況是,在向每個(gè)人推薦一樣的股票。如果所有人都買一只股,股價(jià)會被人為抬高,這不是真正的市場行為。在實(shí)際的小范圍內(nèi),我們看到確實(shí)有一些人在做這樣的事情,但面積一旦放大,肯定不能這樣做。
比如剛才的餐廳推薦,我們不能給很多人都推薦同一家餐廳。餐廳的容量有限,所以這方面還涉及到多重決策,實(shí)現(xiàn)負(fù)載均衡,其中其實(shí)也蘊(yùn)藏著很大的商機(jī)。舉個(gè)例子,在現(xiàn)在交通領(lǐng)域,Uber、滴滴他們都有分司機(jī)端和客戶端,他們會通過這樣一個(gè)平臺來平衡供應(yīng)和需求,這就是這樣一個(gè)市場。
稀缺性是經(jīng)濟(jì)學(xué)的問題,負(fù)載均衡是統(tǒng)計(jì)學(xué)的問題,在不確定性的情況下,我們怎么樣做決策。有的時(shí)候我們會隨機(jī)分配,把這個(gè)人分在這個(gè)條件里,那個(gè)人分在那個(gè)條件里面。就像在這里我們看到有一個(gè)案例,說有一個(gè)痘痘糖能讓你長痘,我們看是不是存在這樣的因果關(guān)系。他們就會做這個(gè)實(shí)驗(yàn)了,給一組人吃痘痘糖,還有一組人不吃,過6個(gè)月看他們的情況。發(fā)現(xiàn)并沒有太多的關(guān)聯(lián)。但實(shí)際上我們的實(shí)驗(yàn)還得做下去,要去驗(yàn)證各種各樣的假設(shè)。不一定是所有的痘痘糖都會引發(fā)痘痘,可能是紅色的或者是某一種顏色的痘痘才能夠讓人長痘痘。可能你隨機(jī)選的這些人,他們皮膚已經(jīng)不好,已經(jīng)生痘痘了,但是純粹是巧合。這樣會誤導(dǎo)你得到錯(cuò)誤的結(jié)論——綠色的痘痘糖是能讓人發(fā)痘痘的。
統(tǒng)計(jì)學(xué)當(dāng)中也有漏洞和缺陷,也有很多人在致力于這個(gè)問題。我想稍微介紹一下從統(tǒng)計(jì)學(xué)家的角度我們怎么做決策的。在任何決策的背后都是會有假設(shè),分為零假設(shè)及非零假設(shè)。


比如說你做一萬次不同的獨(dú)立AB測試,在某一天做AB測試,大部分的假設(shè)是零假設(shè),就像有一個(gè)互聯(lián)網(wǎng)公司要設(shè)計(jì)一個(gè)網(wǎng)站,網(wǎng)站的字體、顏色、大小想換一換。他說我做了一萬個(gè)AB測試當(dāng)中,9900個(gè)是沒有什么意義的,剩下一百個(gè)比較重要,要重點(diǎn)看。剛才說的概率就是錯(cuò)誤發(fā)現(xiàn)的占比,在這些假設(shè)的驗(yàn)證當(dāng)中,我有495次是錯(cuò)誤發(fā)現(xiàn),有80次是真的發(fā)現(xiàn),所以功效是0.8,這還是比較高的。也就是說我做了0.8次真實(shí)的發(fā)現(xiàn)。如果我算剛才的錯(cuò)誤發(fā)現(xiàn)占比,是575次里面有495次錯(cuò)誤的發(fā)現(xiàn),實(shí)際上這個(gè)比例就是會比較高。就像我在做了575次決策當(dāng)中,但是實(shí)際上495次決策是不好的決策,是做錯(cuò)了,這樣老板肯定會炒你的魷魚。

我們可以在一個(gè)實(shí)際序列當(dāng)中這樣做,我可以在任何時(shí)間點(diǎn)停下來,我會問你到現(xiàn)在為止你的錯(cuò)誤發(fā)現(xiàn)率是多少。比如說今天下午的時(shí)候再問你一次,或者明天再問你一次,或者一年之后問你一次,或者整個(gè)事情結(jié)束之后我問你錯(cuò)誤發(fā)現(xiàn)率,我希望是非常小的。這是和任務(wù)具體型是不一樣的,我看一個(gè)批次的東西,在整個(gè)非常長的時(shí)間先當(dāng)中,或者說在公司當(dāng)中每一個(gè)人的錯(cuò)誤發(fā)現(xiàn)率,我希望是非常小的。怎么做到這點(diǎn)呢?
這里的關(guān)鍵錯(cuò)誤發(fā)現(xiàn)率是一個(gè)比例,有兩種方法,一個(gè)是分母比較大,一個(gè)是分子比較小。如果我沒有做很多實(shí)驗(yàn),導(dǎo)致分母比較小,這就不好。我應(yīng)該進(jìn)入一個(gè)非常小的區(qū)域,就是說我們就進(jìn)入一個(gè)新的領(lǐng)域,讓我的錯(cuò)誤率變的比較低,這是數(shù)學(xué)。我們今年發(fā)了一篇論文,我們可以讓任何的在整個(gè)時(shí)間線當(dāng)中,如果說是相互聯(lián)系的P值,但是在任何相互聯(lián)系的P值下面,我不停做這些測試,每一個(gè)測試關(guān)注不同的特征,這樣做的話在任何時(shí)間點(diǎn)讓整體錯(cuò)誤率比較低。

最后總結(jié)一下,首先我們要做的不是一個(gè)跟人一樣的“人造人”。我們已經(jīng)有足夠的人,而且人類的大腦也有很多力所不能及的地方,比如大規(guī)模計(jì)算等。自動化也不該是AI的主要目標(biāo),而是能使其相互配合工作或者人機(jī)耦合。
當(dāng)前階段的AI不是一些瘋狂科幻小說,而是新的工程學(xué),像四十年代的工程學(xué)一樣。做好它非常困難,可能是需要幾十年的時(shí)間,不是任何一個(gè)國家單獨(dú)可以完成,必須要讓世界各國不同人集合起來,共同合作。
另外我們是希望能夠讓每一個(gè)人在整個(gè)所有努力當(dāng)中生活的更好,我是非常樂觀的,但是這些樂觀是要從工程學(xué)的角度看待這樣一個(gè)學(xué)科,比如統(tǒng)計(jì)學(xué)工程。
更多資訊,請關(guān)注雷鋒網(wǎng)AI金融評論
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。