0
2017年底起,翻譯機成為人工智能硬件的熱門品類。搜狗是最早發布AI翻譯機的公司之一,以語音和翻譯為核心技術的AI硬件也已然成為搜狗的重點投入領域。

9月19日,搜狗新品AI翻譯機——搜狗翻譯寶Pro正式上線。9月25日,搜狗召開了一場媒體溝通會,搜狗CEO王小川也來到現場與媒體暢談搜狗翻譯寶Pro。
搜狗翻譯寶Pro有多種顏色,采用鋁合金機身,手感不錯。搜狗翻譯寶Pro的主頁面很簡單,主要有三個功能模塊:語音翻譯、拍照翻譯、錄音備忘。點擊語音翻譯后可以選擇需要翻譯的語言,雷鋒網編輯選擇了中文翻譯為英文。機身側面有一紅一藍兩個按鍵,按住藍鍵可以開始錄音,紅鍵可以播放翻譯結果。

搜狗翻譯寶Pro在線翻譯支持42種語言實時互譯,不僅支持中文和其它41種語言互譯,還可以實現42種語言互相雙向翻譯;離線翻譯支持中英日韓4種語言互譯。
不少人剛接觸到搜狗翻譯寶Pro這款產品時,會有驚艷的感覺,主要來源于語音技術與翻譯技術結合產生的火花。如果你想把你說的中文翻譯成英文,那么只需要在搜狗翻譯寶Pro上設定中文轉英文,然后錄下你說的中文,搜狗翻譯寶Pro會自動翻譯成英文,并且將其讀出來。在此前,使用翻譯軟件都需要手動輸入文字,得到翻譯結果后,使用者還會面臨無法讀出翻譯結果的問題。語音識別技術和語音合成技術使得翻譯寶就像是私人隨身翻譯官,你只需要自然地說話,就能完成跨語言的交流。
目前,手機上的在線翻譯軟件也已經實現了自然的對話翻譯。但是搜狗翻譯寶Pro這款產品卻有其獨特的存在價值:離線翻譯。離線AI翻譯和離線語音技術是手機硬件難以攻堅的兩大堡壘。
翻譯機的火爆其實源于AI翻譯技術的進步。2016年9月,谷歌推出了神經網絡翻譯(Neural Network Translation),顛覆原來的的統計翻譯方法,大幅度提升機器翻譯的質量。2016年11月,搜狗上線了神經網絡翻譯技術,并且不斷進行技術迭代,2017年7月升級為Transformer-NMT機器翻譯。2017 年 5 月份,搜狗參加了國際頂級機器翻譯評測 WMT,獲得了中英機器翻譯全球第一。
神經網絡翻譯對算力要求極高,由于手機的硬件達不到要求,目前主要是借助云端的能力,而一旦手機沒有網絡,AI翻譯就無法使用。搜狗翻譯寶Pro是專為AI翻譯定制的硬件,其全部的硬件能力都用來支持離線的AI翻譯。搜狗第一代旅行翻譯寶就已經用到了離線的Transformer-NMT機器翻譯。
據雷鋒網了解,微軟、谷歌等公司也都在嘗試離線神經機器翻譯技術,將深度學習模型壓縮到手機可以管理的大小。但是在王小川看來,手機能支持的離線神經機器翻譯技術與翻譯機還是有相當大的差距,并且手機還沒辦法做離線的語音識別和語音合成。
離線AI翻譯之外,離線語音識別和語音合成是另一個手機硬件還未邁過的檻。搜狗目前的語音識別準確率已經達到97%,在線和離線語音識別模型也幾乎一致。語音識別是語音翻譯的第一步,其重要性可想而知,語音識別準確才能保證后續翻譯正確,如果識別錯了一個字,很可能導致整句話的翻譯全部錯誤。現在手機上還無法實現如此高準確度的語音識別模塊。
雷鋒網編輯在現場體驗了搜狗翻譯寶Pro的在線中英翻譯和離線中英翻譯,從語音識別、翻譯速度、準確性方面都難以感受到兩者之間的差別。
搜狗翻譯寶Pro采用3.1寸高清觸摸屏。在一些人看來,翻譯機沒有做屏幕的必要,設計觸摸屏后跟手機還有什么區別?然而,從體驗來看,大屏幕確實是必要的。

前面解釋了語音識別對于整個語音翻譯起著決定性的作用,用戶確保翻譯準確的一個重要步驟就是從屏幕上確認語音識別結果的準確性,如果語音識別結果準確,那么翻譯就不至于錯得太多。
此外,屏幕對拍照翻譯至關重要。目前僅有為數不多的幾家翻譯機有拍照翻譯的功能。在日常的語言翻譯需求中,除了對話之外,圖像里的內容也占據了很大比率,例如:路牌、菜單、印刷品、網絡內容等。
搜狗翻譯寶Pro的拍照翻譯采用了搜狗自研的OCR圖像識別技術,能夠識別出圖像內包含的文字內容,然后經過斷字斷句之后進行翻譯。OCR技術能應對光線、曲面、角度、透視、畸變等拍照狀態,可以覆蓋多種場景。還可以做到理解圖像的排版,將翻譯后的內容以原圖的排版和格式呈現,方便查看。
2018年3月,搜狗發布AI翻譯機——旅行翻譯寶,主打出國游語音翻譯。近年來,中國出境旅游人數逐年上漲,2017年出境游人數超過兩千萬,這是一個龐大的市場。而二代AI翻譯機的名字里去掉了“旅行”兩個字,將目光鎖定了更多的場景,例如商務、英語教學、體育賽事等。王小川談到,一開始叫“旅行翻譯寶”是為了在進入市場時有一個明確的定位和目標人群,但是我們發現除了旅游之外,這款產品還有更加廣闊的需求。

搜狗翻譯寶Pro主要的功能有語音翻譯、拍照翻譯、離線翻譯、口語練習、錄音備忘等。口語練習就是搜狗翻譯寶Pro拓展的又一垂直領域。搜狗發現,翻譯機這款產品面對的是有語言翻譯需求的人群,這一人群同時也會有語言學習的需求。口語練習可以通過語音識別來清晰地記錄用戶的發音,然后比對正確的發音,指出用戶的發音問題。
9月17日,搜狗和中網舉辦合作發布會,宣布搜狗翻譯寶Pro為中國網球公開賽官方唯一指定翻譯機。網球賽事成為搜狗翻譯寶Pro的一大新的領域。
可以看出,搜狗翻譯寶Pro的功能和場景都在不斷增加。這也帶來了一個疑問,搜狗翻譯寶Pro會越來越像手機嗎?有什么事情是搜狗翻譯寶不會做的呢?王小川談到,搜狗翻譯寶會一直專注于語音和翻譯,不會做語音和翻譯之外的事情,而是會選擇手機上無法實現的功能來做。
近兩年,搜狗已經將AI作為其長遠的戰略方向,圍繞“自然交互”和“知識計算”兩大方向做以語言為核心的人工智能,核心的產品主要圍繞輸入法、搜索、同傳和翻譯。王小川透露,在今年年末,還會有三款令人意想不到的AI硬件推出,其中一款將具備同傳功能。
王小川說,這三款AI硬件將給人耳目一新的感覺。對此,雷峰網(公眾號:雷峰網)將持續關注,并跟蹤報道。
相關文章:
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。