2
在今年的AWE 2017中國家電及消費電子博覽會上,雷鋒網觀察到,除了傳統的家電廠商循規蹈矩的參展之外,各家家電巨頭以及新興廠商都使出了渾身解數,讓自己的家電產品向「智能家居」方向靠攏。
在這些參展的「智能家居」企業中,絕大多數在做智能家居產品時,大多數都放棄了幾年前「用手機APP控制家電」的智能家居概念,集體轉向了「人工智能」概念的路子。其中人工智能在智能家居的運用中,語音控制和交互成為了智能家居的主要控制方式。其中,不乏有一些家電廠商推出了作為中樞控制的語音盒、機器人等產品,以追趕亞馬遜Echo的腳步。
從目前的趨勢來看,隨著人工智能的快速發展,未來語音交互將成為智能家居產品必不可少的一種操作方式,那么未來語音交互會發展到什么狀態?為什么語音交互將成為智能家居產品的標配?在發展過程中中國的市場將會有哪些機遇和挑戰?
本期的硬創公開課,雷鋒網請來了海知智能CEO謝殿俠來跟我們聊一聊未來智能家居的語音控制/交互的趨勢。

謝殿俠:海知智能 CEO,畢業于北京大學,從事過文字處理、知識管理等工作;創辦海知智能,打造個性化聊天機器人開放技術服務平臺,為智能硬件、智能機器人以及企業智能化提供語義理解 API,即基于自然語言理解和知識圖譜的技術接口,使得「人人會做機器人」,最終可以「人人能有機器人」。
公開課視頻:
以下是經雷鋒網精編的謝殿俠演講實錄,關注雷鋒網旗下微信公眾號「新智造」,回復「PPT」可獲取嘉賓完整PPT。

2017年是一個非常有意思的一年,從年初的拉斯維加斯CES展到剛剛結束的中國家電展上,我們都可以看到一個非常有意思的現象:大大小小的家電廠商都在擁抱智能,或者說,都在擁抱語音交互,一些傳統的智能硬件也在往新型的智能交互方式躍遷,我們來看一些具體的情況。

圖中都是一些非常新型的智能設備,比如左上角這個智能燈,你可以用語音交互的方式用它來控制家里的智能設備,下面是一個智能語音的鬧鐘,沒有了傳統設備那么多的按鍵,而是使用語音交互的方式來操控。
在這些設備中,目前最大的贏家是亞馬遜的Alexa,雖然他們沒有來參加這次CES展會, 但是目前國外有很多的設備都已經接入了Alexa,包括上面的所有的設備。
雖然Alexa沒有參展,但是我們中國自己制造的智能音箱參展了,就是圖中這款聯想智能音箱,這款面向北美產品目前也接入了Alexa,可以像Echo一樣接入一些智能產品,也獲得了一些相應的資源。

圖中這個智能廚房,包括冰箱、抽油煙機等等,這些所有的設備都具備了語音交互的能力,當然背后的主角仍然是Alexa。
我們把目光移回中國上海,剛剛過去的智能家居展也展出了一些具有黑科技的產品,比如帶語音交互的攝像頭、桌面機器人、智能臺燈等一些常用的智能設備,還有別具中國特色的智能后視鏡,這個后視鏡的主要交互方式也是語音。傳統家電廠商海爾已經包了整個N1場館,在里面展出了一些海爾的智能家居的產品,這些產品體現出海爾在家居方面的智能化戰略發展方向。

假設我們從五年后回頭看今天,究竟什么樣的產品在語音交互上,能讓傳統的家電設備變成真正的智能家居,真正的走入智慧家庭?

其實用語音控制設備這個事情很多年前已經玩過了,比如最早前還沒有Siri的iPhone就可以用語音來控制,用戶可以對它說一些簡單的命令詞,讓它來執行一些任務,但是它能執行的任務非常有限,本質上只能稱之為「語音控制」,而不是「語音交互」。
所以說語音控制對語音交互來講是一個非常非常初級的狀態,目前很多的智能設備都具備了語音交互的能力和聯網的能力,但是從很大程度上來說,它只是一種語音輸入法,其原理是將聲音變成文本,然后用文本來對設備進行控制。
此前業內做過這方面的人應該知道,帶有語音控制的產品做出來之后看起來很好,雖然這些產品都具備了語音控制的能力,可以用語音控制各種家用電器,用「命令詞」來替代以前的遙控器,從而做智能化的嘗試。但是數據是會說話的,這些產品普遍賣得都不是很理想。原因是雖然到今天語音識別已經有了很大的突破,但是仍然達不到百分之百的準確。

和傳統的遙控器相比,用戶用傳統的按遙控器控制家電,可能按十次會有九次對,一次手滑按錯了,但是用語音控制遙控器,十次可能只有八次是對的,所以語音控制并沒有比傳統遙控器更加的快捷、高效,這就是目前的具體的一個現狀。我作為一個語義理解公司的創始人,目前在控制空調的時候,都是更喜歡使用按鍵遙控器。在這種情況下,很多語音控制的的功能就會變成一個擺設,在最初的時候大家可能會嘗鮮玩兒一下,但是過一段時間之后就會放棄了。

另外,我們看下傳統意義上的智能家庭的智能設備的遙控器,比如之前很火的nest,它采用了觸摸屏+旋鈕的方式來實現對家庭智能設備的控制。用戶既可以手動用它來控制家電,另外它內部帶有大數據,可以用來學習,也可以自動地完成一些自動化的控制,比如你什么時候在家、什么時候出門,當你出門自動幫你關掉某些電氣設備等等。在這種情況下,它仍然要比語音控制交互更加直接,更加準確。但是如果你問它今天出門要帶傘嗎?那么強大的nest就傻了。
關于真正的產品智能化,這里有三個關鍵詞,就是你要做的到底是個「道具」還是個「工具」還是個「玩具」?
當我們把語音控制的功能,作為替代遙控器功能的控制器來做,那么很大程度上它的意義就是個道具或是個玩具。因為它不能帶來更加直接更加有效,或者更多功能上的附加值,也許就是大家新鮮一下玩一玩就完了。那么怎么才能讓語音控制成為一個工具,讓大家用了之后離不開、有粘性呢?
那我們從大的方向來看一個變遷。
PC到機器人

鍵盤鼠標是PC時代的產物,眾所周知,當初我們學鍵盤的時候需要很高的學習成本,而到了觸屏機時代,也就是移動互聯網時代,我們學習智能手機的成本就會降低很多。由此看來,設備的提升和相應的使用學習是應該趨于越來越簡單易用的。
從PC時代到智能手機時代,我們用了差不多二十年,而從智能手機觸摸屏時代到現在的Echo之類的語音交互設備,我們用了差不多十年。
Echo這個產品在北美的市場非常的成功,而在中國,類似的設備卻還在探索的過程當中。這里面非常非常重要的一點,就是我們現在的產品更多是語音控制為主。而Echo更多意義上來講它是一個智能的機器人。
之前我們所說的機器人,更多是那種電影里面有胳膊有腿的人形機器,但實際上,目前很多「機器人」產品能動、能跳舞,那是因為這些機器人是通過程序控制的,它并不能聽懂你的話,只是一個玩具而已。真正能被稱作機器人的應該是它具有區別于動物或植物的本質特征——能聽得懂人話,并且能夠以自然語言跟人交流。另外,它有信息、有知識、有服務,他能夠聽懂人的話,而且能滿足人的要求。這些才是機器能被稱作「人」的本質的特征。那么Echo和其背后的Alexa就具備了這些特點,這也是我們稱其為機器人的原因。
智能音箱和音箱智能

左邊的這款產品是羅技的智能音箱,右邊的是Echo,以這兩個為對比,普通的「智能音箱」需要連接手機使用,手機播放的音樂可以從智能音箱中放出來。雖然Echo也可以連接手機,但多數時候它并不需要手機去控制,你只要在連接WiFi的情況下跟它說話,它就能去滿足一些要求,比如說播放音樂、幫你打車、查詢天氣、聽書等功能。它能聽懂用戶的話,可以提供用戶所需要的各種各樣的服務,在這種情況下它儼然成為了家庭的一個成員。在初期的時候,它的能力只覆蓋了二十多個領域,而現在它開放了平臺之后已經覆蓋了超過1萬個領域。也許以后就會出現像App Store一樣的各種應用庫,在里面有很多個插件,來滿足人們各種各樣的需求。
下面我們來看一看真正的語音交互和傳統的語音控制在設計上有什么區別。
以前我們是把機器人當作一種工具,叫做人機交互,現在我們把機器人當作人來看,就成了人“人”交互。
舉一個具體場景的事例。
普通的語音控制情況下,早上鬧鐘響了之后我們會說:「關閉鬧鐘吧」,「把鬧鐘關掉」等等,「關閉」這個關鍵詞總是在用,但是在日常生活中,人說話的語境是不一樣的,有的時候我們會說「我想多睡一會兒」、「別吵了」等等,這樣機器缺少了關鍵詞就很難理解了。當然這個也可以設置多種多樣的關鍵詞來解決,但終究是有限的,因為人們的說法會多種多樣。真正的智能設備應該像有一個人在那里一樣,它能夠聽懂你的意思、知道你的意圖。
一個真正的智能家居或智慧家庭里的一個場景應該是,設備上沒有限定,只要有麥克風能把你的聲音進行收取和分析即可,它的形態可以是鬧鐘、可以是冰箱,也可以是其他的東西,這些東西能使用云端的大腦來跟你交流。
拿天氣預報來舉例,比如說以前的語音控制之類的軟件,會抓住你的關鍵詞,來向你播報天氣,其出現的結果就會像第一張圖一樣,出現日期、地點、天氣等所有的結果。但是實際生活中我們所說的話是非常口語化的,一句話有多種多樣的說法,一個真正的智能設備應該是能夠聽懂人各種各樣的說法,并給出既定答案。比如問「今天北京有霧霾嗎?」,他就會告訴你北京的霧霾指數有多少。你問「今天風大嗎?」,它只會跟你說外面風力的情況,而不是把所有的數據都報出來。你問「今天出門需要帶傘嗎?」,它也能夠聽得懂這是一句問天氣的話,而不是問其他的。就好像你有一個氣象管家一樣。

再拿音樂來舉例,雖然很多設備可以實現語音控制的方式來搜一首歌,但實際情況是用語音搜索,還不如打開一個app來得快捷。而且很多音樂APP的推薦也很多、很準。在這種情況下,用戶更喜歡用手機來搜索,然后用手機連著音響來聽。
而在理想的語音交互層面來說,不管我的音箱、電視甚至冰箱、空調,都可以為我們搜索歌曲,不管我走到哪個房間,只要我想聽歌張嘴說話就可以。這里面需要一個關鍵點,就是說語音交互的方式,能不能比傳統的方式,更便捷更好,讓人放棄傳統的方式去搜索。
如果以后能夠發展到每一個房間都有相應的智能設備,那么語音交互的方式應該是什么樣呢?就如下圖所示,光搜索還不夠,比如跟機器說「我想聽劉德華最火的歌」、「我今天累了,給我放一些舒緩的音樂」等等,機器都能夠滿足你的條件。只要有足夠的曲庫、所有的設備里面都能聽懂你說的話并且還能給你結果,就達到了真正的語音交互的方式。除了音樂之外還有其他的場景,比如聽書、廚房應用等等。

在這種情況下,冰箱不僅僅是冰箱,空調也不僅僅是空調。他們首先都是一個機器人。
當智能家居具備了語音交互的能力,而不僅僅是語音控制的能力之后。就意味著每一臺家用電器都變成了機器人。這些機器人都能聽懂你的話,并且具備一些相應的能力。拿冰箱為例,一旦打通了交互的能力就會有音樂的功能、菜譜的功能等等,如果你在使用中有什么問題也可以通過冰箱去連接相應的客服。這樣一來,就把很多傳統的業務的邊界給打破了。
比如說,家用電器和音樂服務、電商服務等等這些服務相融合。另外一邊,一些具備服務能力的人也多了一種可能性。他們可以利用這些設備進入更多的家庭。
比如說,有個朋友在北京某個飯店吃了一個某個法國大廚做的非常好吃的面包,當他回到家里之后,他就可以直接問烤箱,XXX廚師的XXX面包怎么做?除此之外,那個法國大廚的面包做法和配料需要付錢才能得到,智能設備也會打通一些支付服務,付幾塊錢,然后教你如何做這個面包。
這種方式的好處就是用戶的使用成本降低了,比如說我在廚房做一件事物的時候,我只要去跟冰箱、烤箱等電器說說話就能把食物做出來,而不是坐到電腦面前或用手機APP去查詢,在支付上非常的方便。這個就會改變過去APP、網頁時代的整體的業務模式。

上面是通過一些具體的場景來描述語音交互為傳統的家居家電產品帶來的一些變化。其實語音交互未來會成為家電的標配是一種趨勢。
從2017的CES展上我們就可以看到,的的確確有很多的最新的智能家居設備都打通了Alexa的功能/聯網的功能,具備了機器人最基本的智能。當這些使用場景穩定了之后,這些智能設備就會變成一個家庭的新成員。家里面雖然智能設備不同,比如說,廚房有冰箱、微波爐,客廳有空調、電視、音箱,但其背后可能都是同一個機器人。而且不同的家庭成員之間有不同的機器人,每個人在使用機器人的時候可以把自己的機器人調用出來,并體現在不同的設備上。
這個場景的實現取決于三個條件。
第一是硬件成本的降低,比如說WiFi模塊、各種聲音處理的芯片等硬件模組成本的降低。隨著市場的火熱,現在已經降低了很多,再過個幾年,沒準兒這些硬件成本會降到幾十塊,到時候,幾十塊對于一臺家用電器整體來說,將會是一個很低的成本占比。等硬件成本降低到一定程度,用戶體驗也達到一定的程度,達到一個臨界點之后,那么這個領域就會被引爆了,規模越大,硬件成本降得越低,這是一個良性循環。
第二是內容資源和服務的豐富。當硬件具備了語音交互的支撐能力之后,技術提供商在內容資源和服務方面就可以發力了,比如去簽一些內容版權等等。而內容提供商也可以把他們的內容打包成基本插件,來把這些內容變成機器人的基本能力。其實,這一塊隨著智能硬件接入的越來越多,也會給內容服務帶來更多的流量。更多的流量會刺激更多的內容提供商,去接入這些服務。也會成為一個良性循環。
第三個是一個非常關鍵的點,就是需要語音識別非常的準,語義理解也非常的準。而在這一塊,語音識別的速度發展得非常快,應該會在兩三年內,甚至在今年,就達到非常非常高的水準,甚至會接近或達到人的水平。但是語義理解方面,會挑戰得更大一些。

在限定的條件下,只能為我們的家庭用戶,在廚房或客廳等場景中解決有限的部分問題,但是在上述三個條件邊界明確的情況下,實際上現在產品是可以做的十分成熟的。所以,語音交互成為智能家居的標配是一種必然。
接下來我們說說中國市場的情況。

市場剛剛覺醒
當硬件成本降低,語音語義技術的容錯率達到人們可接受的范圍之內之后。那么,智能家居這個市場就偏向成熟了。想達到這個程度,對于中國的市場來講不是今年就是明年,而對于北美市場來說,一般認為是2016年,因為Alexa的的確確已經賣了1000萬臺,而且有很多家庭都已經形成了使用習慣,將其變成了用戶家里面一個不可缺少的部分。
之前在這一方面,中國市場坐了很長時間的冷板凳,所以大家覺悟都比較慢,甚至在2014年和2015年,這時候人們還對這個有爭議,甚至懷疑Echo數據有水分,現在已經沒有這個爭議了,而且各廠家都開始朝這個方向去發展,市場已經開始覺醒、開始嘗試。
芯片的成熟
未來芯片和板卡都會相應地成熟起來,成本也會降低,屆時的市場就會崛起。但這一塊還有一個巨大挑戰,比如說我們要把產品的出貨訂到具體的幾個月能不能搞得定?目前還是不能保證的,供應鏈良莠不齊,真正具備承受能力的、成本可控的解決方案商還是有限的。 但是在這方面對于中國的智能制造的能力來講,還是沒什么問題的。我們希望,會有更多的原來做手機做平板等智能芯片板卡的供應商加入到這個里面來。
內容生態鏈尚需完善
相對于國內來講,內容生態鏈方面在國外確實做得相對完善一些。而國內也在逐步的完善,近兩年有聲資源版權意識都有所增加。但是我們目前國內的情況也有一個問題,就是資源過于集中了,并且都集中到了幾家巨頭手上,然后他們對目前智能家居等新興產業這塊支持力度不夠,內容的成本也比較高。這些內容版權商如何開放、如何降低成本、如何能讓更多的智能設備來接入,這也是一個挑戰。
另外的挑戰基本就是語音識別語音理解的成熟這一塊,國內也有在努力,有很多企業在做,但是這樣的企業還需要更多。
總的來說,市場非常的大,未來就在眼前,前途是光明的,道路是坎坷的。還有許多具體的問題要克服,只有把這些問題都克服了,才能夠打造一款大家都喜歡的產品、一款有粘性的產品,而不只是一個概念、一個Demo、一個玩幾天就不玩了的玩具。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。