0

人工智能的研究理論講了這么多,那么它如何才能夠落地,形成能給人類帶來價值的產品或服務呢?關于人工智能應用產品化,搜狗CTO楊洪濤以搜索引擎為例,介紹了如何利用AI技術做出好產品。
我從網上找到一些數據,美國的數據說全球人工智能領域的企業和創業企業達到一千家,以及40多億美元的投資規模。國內艾瑞1月份也有個數據,說國內有100家企業拿到了投資金額。這代表這個領域極受關注。但今天我想談的話題是,
這些企業容易從產品角度去思考他們做的很多事情,這有可能是有問題的,這個后面去探討。我們談到的很多領域,比如說機器學習、機器視覺,機器人、推薦引擎、個人助手、語音相關的技術等等,我們從產品角度思考的時候,發現跟技術角度思考不一樣。
此外,今年圍棋大戰導致一個焦慮:機器人到底會不會戰勝人。我們當然希望機器在有限的時間內能戰勝人,但我們希望從技術角度思考可以發現,很多問題是解決不了的——比如說我們知道深度學習現在不可解釋,我們很難從數學角度去推理,它是不可解釋的。也因為這些不可解釋,它在一些工業應用上就會有比較大的問題,比如,如果出了車禍的時候不能解釋,那百姓對它的信任程度就會下降。
另一方面,現在人工智能對語言能力的理解,現在很難做到真實地理解人的語言能力。此外,大數據的產生、訓練都需要很大的成本和用戶入口,才能夠在訓練當中去使用,現在也是一個不算有效的領域。
如果從產品角度來看這個問題,我覺得從這兩個角度來看:
第一個是,做談論機器能不能戰勝人的時候,我們想想:什么叫戰勝?如果說機器跑得比人快,算得比人快,這樣的一個回答的話,其實發現機器早已經戰勝人了,今天我們說機器能不能戰勝人的時候,指的是直接瞄向了人的大腦部分,能不能替代你的大腦和思考決策。
第二點是,產品能不能做出一個輔助人做決策的產品形態來?很重要一點是說我們能不能生產出足夠多的數據。
首先第一個是Siri,2011年的時候蘋果發布了Siri,引起了關于語音識別的極大討論和熱潮;還有Echo智能家居的產品,在美國賣得非常好;還有AlphaGo,它雖然不是一個產品,但引起了普通網民的關注,對技術進步貢獻非常大;然后是特斯拉的自動駕駛,包括消費者關心的一個領域,不斷地出現事故,也引起了很多探討。
但是允許我老王賣瓜一下,從搜索引擎產品的從業者來講,我們認為搜索引擎其實是人工智能最大的一個場景。
為什么這么說呢?第一個原因從產品角度看,搜索引擎在過去這么多年當中,它起到的作用,就是人的大腦外延,它增強了你解決問題的能力,我們日常生活、工作當中很多問題其實是通過搜索引擎去實現的。
我記得谷歌的創始人之一很早的時候說過,“我們的目標就是要成為人類的第三塊大腦。”這描述了搜索引擎產品的單位。但今天的搜索引擎是基于關健詞和搜索結果的產品形態,用戶要自己去思考,出來這十套結果是否滿足自己的東西。
其實搜索引擎下一步要解決的問題,或者說人工智能技術在搜索引擎里有巨大應用的場景就是說能不能不要用這樣的一個用戶自己思考的方式,而是我能夠直接知道你想要的東西,這是大家都想要去解決的一個工作的方向。
最后一個是,對話機器人仍不可能替代搜索引擎。聊天機器人剛上線的時候只有幾十個,現在做到一千個了,它是開平帶的方式,大量合作伙伴給它增強系統的功能。Siri就是個例子,2011年就上線服務,蘋果公司自己研發siri的對話功能和給用戶提供的服務,到今年它發現這個功能終于不行了,沒辦法運轉下去。因為大量的用戶發現它很難解決實際問題,用戶實際用Siri的時候是:我要給誰打電話,我要給誰發短信這樣簡單的服務。今年開發者希望給它提供很多功能的研發,但實際上它都無法替代搜索引擎海量的用戶帶來的問題的解答。
關于搜索引擎和AI的關系,我們知道,近十年來人工智能的發展,更明確的說是深度學習的發展取決于這三個元素。今天因為互聯網的進展,或者網絡的進展,足夠的應用、足夠的信息和足夠的用戶能上網,最后產生足夠多的數據——這些數據使得我們能研究出更好的算法,以及讓我們有了很好的計算力,有了大量低成本把計算力連接起來的方式。
這三個角度上看,誰擁有最好的三個元素?還是看搜索引擎界的老大。谷歌雖然沒有公開過自己的服務器數量的數據,但根據它的能耗來估計,以及它擁有幾百萬臺服務器的數量,可見搜索引擎公司就有這樣巨大的計算力。上午張老師就提到“找貓的圖象識別”,程序能夠很容易的就把16000個CPU連接起來做這個訓練。
再看數據,搜索引擎公司有足夠大的網頁,去作為數據的基礎,它們還能做很多怎么去促進數據的收集工作,谷歌為什么要去發射,用來聯網的切球,谷歌為什么要免費拉光纖。大家知道谷歌的母公司它里面有兩個關于醫療的子公司,一個做的方式是用傳感器放到眼睛里的隱形眼鏡,要把一個得了病的人的數據進行搜集,然后分析,他們有這種條件去獲得這樣的數據的能力。
怎么能夠讓用戶以很自然的方式跟產品去互動?讓搜索引擎懂你想要的是什么東西,而不是一個用關健詞去表達的——是一個自然語言的句子,像人與人對話一樣,描述我有什么樣的問題。這當中不僅僅是語言和對話,還包括視覺,能看到你的表情、樣貌,讀懂你的情緒。
怎么能夠對知識有足夠好的獲取計算或者推理的方式?在這個領域上目前我們能夠獲得的進展是非常有限的。
在這兩個方向上,目前的搜索引擎產品也好,或者同類的對話系統、服務系統也好,還解決得不夠好。那么,從產品上怎么解決這個問題?
解決不了的時候就攢數據
當一個產品體驗不好的時候,我們怎么辦?我們攢數據。
舉一個我們自己做產品做技術時候的真實的例子:
大家知道搜狗輸入法做了很長時間,我們很早也意識到用戶通過語音與機器交互的方式非常重要,那時候我們還沒有語音識別的技術,我們還找了一些做語音交互的公司去合作,但沒有找到比較好的合作方式。于是逼得我們自己去做研發。
當時我們想了一個辦法,直接調用谷歌在國外提供的語音識別接口,雖然很慢,但可以用。它的自錯率43%,意思就是說如果你輸入一段話100個字40個字是錯的。但因為一個產品里面功能的入口,大量用戶就開始用,用了之后我們開始迭代數據,積攢了足夠多的用戶錄語音的數據。2012年11月份的時候,不到半年的時間我們把自己的數據做出來了,一上線了就獲得了跟谷歌接近而且比它好的結果。隨著后面用戶使用越來越多,以及新技術在過程中的使用,錯誤率直線下降,今年4%左右的錯誤率,最近還在繼續下降。
所以當打不過的時候,攢數據是價值提升的作用。值得一提的事,我們掌握這么多數據之后怎么辦?
這需要找一些數據標注公司去標注這些數據,每一句話說的是什么,后來因為把這樣一個功能用到產品里之后,用戶沒有選擇語音識別的句子實際上是輔助標注的過程。如果用戶沒有選說明是錯的,錯的數據我們就拿給數據標注公司去標注。
使用AI技術的好產品才創造價值,這個價值有兩方面:一個是給用戶提供一個好的辦法,第二個是真正能生產數據,從而使自己迭代。
好的產品能得到媒體和用戶的關注,能得到資源,賣座的產品能獲得用戶,用戶能生產數據,以及能不斷迭代。賺錢更不用說,一個好產品能賺錢才能使企業研發不斷滾動。
不足夠好的產品的例子,我們做個自我批評。搜狗前兩年出了一個己的云助手產品,當時覺得這樣一種對話形態可能是未來新一代的互動方式和解決問題的方式,于是我們做了跟Siri基礎一樣的產品架構和問答式的技術架構。但是這個產品上線之后,我們發現用戶的使用率并不高,開始幾天覺得好玩用了一段時間,后來就不用了,為什么?我覺得原因有很多,其中關鍵原因就是它沒有足夠好的解決用戶新的需求。
鄭宇:兩個例子里面我覺得第二個例子可能更加有意義,因為搜索空間有限,而且字比較短,第一個發微信的例子可能不是最好的,有點鼓勵大家開車發微信的意思。現在給大家提個問題:搜狗投資和布局了很多人工智能項目,目前有什么樣的收獲?最大的成果是什么?
楊洪濤:我的答案有點像剛剛KK(小米聯合創始人黃江吉)的答案,我覺得現在還沒有讓我們覺得足夠滿意的產品,或者叫做真正讓產品幫人做決策,或者幫人做出好的選擇的這樣一個功能上還沒有完全做得到。但我們的產品確實要去解決這樣的問題,然后我們還要去投入。你剛才說到投入我覺得非常好,給我一個打廣告的機會,我們今年跟清華大學投入了大概1.8億人民幣建一個人工智能研究院,推動技術的進步,有了技術的進步,有了產品應用的進步,我們在這個領域的關注都是為了做一個好的產品體驗出來。然后去積攢數據,現在還只能做到積攢數據的地步。下一步真的是能夠去主動地給人提供輔助,我覺得還沒有做到。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。