1
| 本文作者: 林藠頭 | 2016-07-18 14:39 |
編者按:林德康,前Google高級管理科學家(senior staff research scientist),主攻自然語言處理。在加入Google之前,林德康是加拿大Alberta大學計算機教授,發表過逾90篇論文、被引用超過12000次,他也是國際計算語言學會ACL Fellow——整個華人圈的ACL Fellow不用一只手都數得過來。難怪他回國之后,有人驚異于他“竟然沒選擇去清華教書,也沒接受BAT的邀請”,而是聯合發起了一家小小的初創公司:奇點機智。
奇點機智做的還是林德康最擅長的NLP相關的事情,目前主攻一款語音助手“小不點”,林德康說它“跟大部分語音助手的方式不太一樣,甚至可以說很不一樣”。產品目前在開發完善中,年內會上線。
雷鋒網來到了位于中關村某辦公大樓的奇點機智辦公室,大約有30余位全職員工在從事語音助手的研發工作,其中部分員工來自Google、微軟,絕大多數員工畢業于北大、清華、浙大、南大等高校。創始人鄔霄云曾在Yahoo、Google北美研究院工作,在大規模機器學習、自然語言處理等領域有10多年項目經驗積累。
這款語音助手和Siri、Cortana等等有什么不同?以下是林德康自述,雷鋒網整理。

Google Now、Siri、Cortana這種都是操作系統的owner做的語音助手 ,他們只著重于操作系統能做的事情,比如設鬧鐘、發信息等等,外接app的時候,也只能接操作系統剛好能做的事情,比如Siri“用微信給XX發信息”,這個是基于Siri自己首先可以發信息,才可以接入微信。
另一種語音助手,Viv、Soundhound和國內一個叫渡鴉科技的公司類似,他們的想法是手機上只需要他們這一個App,這個App可以做所有事情,打車、訂外賣、訂機票。比如訂機票,語音助手理解語義之后,去訪問比如說攜程的服務器端口,向攜程的后端直接發一個webrequest,填參數,然后返回訂票結果——整個過程用戶只需要跟手機助手交互,不用去跟訂票軟件交互。所以這類助手除了做語義分析的工作,還需要重新發明(recreate)用戶的交互過程,這些訂票的流程需要自己做一遍。
我們自己并不重新發明這種交互過程,實際上我們是把一句話翻譯成App里的操作,App可以做什么,我們把語音指令翻譯成動作。比如在攜程訂票,用戶說完“我要訂從哪里到哪里的機票之后”,界面就會到攜程里訂機票的界面,并且預填好語音里已經有的信息——語音完成一部分App的操作工作。我們是幫用戶更簡潔地操作這些App。
說到這里,林德康展示了幾個功能,首屏狀態下按住Home鍵說“給孟X發個紅包”,經過一層層自動索引,手機直接進入微信孟X的聊天窗口,再彈出紅包界面,整個過程,用戶只需要輸入紅包金額點擊發送就可以完成;按住Home鍵說“告訴林XX我遲到了”,微信跳到了和林XX的聊天界面并且對話框已經預先輸入了“我遲到了”四個字,用戶要做的只需要按“發送”。
有的APP功能隱藏得很深(比如預約用車,因為叫車軟件可能并不希望用戶預訂,所以稍微隱蔽一些),但功能有,這時候你說“我想明天預定一個5:00去首都機場T3的專車”,就比手動操作APP要簡便,我們想做的就是這件事情。我們說cover一個app,比如微信,會包括發紅包、放大字體、付款等等幾乎所有的操作,Siri所說的Cover可能只是接入發信息這個功能。
(雷鋒網:每一個App的每一個操作都需要“翻譯”,開發工作量會很大嗎?)
每一個App可以做的事情其實不是很多,比如攜程到底有多少功能,就訂票而言,在語音助手理解起來,都是“從一個城市飛到另一個城市”這一件事。微信看似這么多功能,實際上所有的項目加起來也就幾十個(當然不包括玩游戲的部分)。
我們做的更多的是自然語言方面的事情,比如發紅包,“把紅包發給誰”、“給誰誰誰發紅包”、“我想發給紅包給誰”,“從北京到上海的航班”和“從北京到上海的飛機”說的其實是一回事,不管怎么說,機器都要能分析出來,這一部分是我們的核心競爭力。我們的語料來自網頁和其他的語料庫,幾乎所有的網頁都拿來學,我們學習時需要從海量的語料里找出語料之間的相關性,然后應用到助手里。
我們的做法跟大部分語音助手的方式不太一樣,甚至可以說很不一樣。大部分語義分析都是靠語法,我們也用語法,但我們用的辦法不太一樣,我們不用語法驅動理解的過程,語法有的話更好,沒有也可以,這樣我們的系統更robust一些,可以handle更復雜的變量。
編后:NLP是個世界級難題,Google、微軟也沒有很好的解決方案。如果有好的解決方案,意味著整個遷移學習、機器學習領域都會有一些質的進展。Viv宣稱要“吞并整個互聯網”,吊足了觀眾胃口,但產品到目前也沒有和用戶見面。奇點機智的這款助手“小不點”,會給我們帶來一些耳目一新的體驗嗎?
下個月的12、13號,雷鋒網將在深圳舉辦一場盛況空前的人工智能與機器人峰會,林德康也會出席,關于這款助手的更多技術細節我們留到大會上展現。屆時我們將發布“人工智能&機器人Top25創新企業榜”榜單,為此我們在搜集并確認AI、機器人、自動駕駛、無人機等幾個領域的優質項目。如果您的項目是相關領域的,且足夠有技術壁壘、足夠有成長性,歡迎聯系2020@leiphone.com。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。