<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      特寫 正文
      發私信給haoxiaoru
      發送

      1

      為了趕翻譯下崗,微軟又向前走了一步

      本文作者: haoxiaoru 2016-09-19 10:59
      導語:很多人認為,語音翻譯就是先把語音識別為文本,再把文本翻譯為另一種語言的過程。其實不是這樣。

      —— 你這是什么意思???

      —— 沒什么,意思意思。

      一名新入職場的翻譯員,擔心越來越厲害的機器翻譯搶了自己飯碗,于是在知乎上發問,“這個行業還有沒有前途?”老司機們紛紛上前安慰,其中一位說,年輕人你兔樣兔森破,讓機器翻譯一下上面這個對話,看能不能搞定,再來擔心吧。

      不知道“年輕人”有沒有去試。雷鋒網去試了試,發現行業公認最厲害的 Google 翻譯和微軟翻譯(Microsoft Translator),確實都搞不定這個極具中國特色的語音對話。但兩者的表現,又是不一樣的。

      同一段語音,這是 Google 的結果:

      為了趕翻譯下崗,微軟又向前走了一步

      這是微軟的結果:

      為了趕翻譯下崗,微軟又向前走了一步

      具體來說。使用語音翻譯,Google 會完整保留所有字;微軟則會把第一句中的語氣詞“啊”字省略掉,把第二句中的“意思”省略掉一個(可判定為誤傷)。為什么?

      TrueText:去掉“哼哼哈嘿”

      為了趕翻譯下崗,微軟又向前走了一步

      微軟告訴雷鋒網,之所以省略掉“啊”以及誤傷一個“意思”,是因為他們在語音翻譯中運用了一項獨門絕技——TrueText(智能文本校正)。在一份官方文檔中,微軟這么解釋 TureText 的作用:

      這個過程包括去除造成不流利的字詞(例如“啊”“嗯”以及重復措辭)、將文本分解成句子、添加標點符號和大小寫識別。

      這就是微軟的語音翻譯技術,為“口頭語”所做的優化之一。Olivier Fontana 是微軟研究院 Microsoft Translator 產品戰略總監,在八月中旬的一次溝通中,他告訴雷鋒網,我們平時說話,說出來的和寫下來的表達方式是不一樣的(口頭語和書面語),TrueText 可以把語音識別出的文字,變成機器更容易理解的、有意義的內容,這一技術微軟在全球范圍內是獨一無二的。

      因為工作關系,本文作者日常要處理不少采訪速記,盡管文本經過速錄員的“人工優化”——去掉了不少語氣詞,但通篇文檔中找到幾個連續的完整句子,幾乎是不可能的。除了準備好的演講稿,很少有人平時說話的時候可以用連貫的語句,表達自己的意思。人在說話時,本來就是磕磕絆絆的,是“話中有話”的,是“不言而喻”的,機器理解人的本意,再轉換成另一種語言,更是難上加難。TrueText 技術相當于用機器做了口語文本內容的整理。

      語音翻譯:為對話而優化

      為了趕翻譯下崗,微軟又向前走了一步

      很多人認為,語音翻譯就是先把語音識別為文本,再把文本翻譯為另一種語言的過程。其實不是這樣。

      Olivier Fontana 告訴雷鋒網,微軟嘗試過這種簡單拼接的方式,但翻譯質量無法令人滿意。最終微軟的方案是,在語音識別階段就為口語的識別做了特殊的輸入優化,識別之后的文本經過 TrueText 技術的處理,再進入文本翻譯階段,文本翻譯的輸出結果也要為口語做優化,最終通過成熟的 TTS 技術讓機器“讀出來”翻譯結果。

      Olivier Fontana 說,在“實時對話場景”的翻譯模型研發過程中,微軟面臨著三項關鍵的挑戰:

      1. 收集口語語料。需要大量時間和金錢,來收集口語化的語料數據。

      2. 訓練這些語料。這一項的運算成本非常高,需要大量的運算能力和硬件加速系統。

      3. 開發口語模型。每一種語言的口語表達方式和發音方法都不一樣,同一種語言不同年級的人聲音、俚語、語速和表達方式也不一樣,很難用同一種模型去實現。

      微軟介紹,針對口語的翻譯優化,尤其是針對聊天對話內容的優化,以及 TrueText 技術,微軟在業界都是唯一的。

      Olivier Fontana 表示,傳統機器翻譯都是基于比較正式的文本翻譯,微軟則加入了大量基于口語對話的語料庫。他透露,微軟甚至還花錢請了很多人到 Skype Translator 上聊天,談他們的假期,日常生活,作為口語數據進行搜集。

      “對話即平臺”

      為了趕翻譯下崗,微軟又向前走了一步

      Skype Translator 的實時語音翻譯技術,一經問世,就引發了行業關注。這是一項讓兩個不同語言的人,可以實時通過自己的母語進行語音進行溝通的“黑科技”(見視頻)。微軟最早在 2012 年天津的一次學術活動上展示了這項技術。2014年12月,這項技術在 Skype Translator 應用上實現商用,之后陸續運用到桌面版 Skype Translator 和 Microsoft Translator 手機App中。今年上半年,這項技術迎來新的里程碑,微軟將 API 開放給所有人,方便開發者將其集成到自己的應用中。

      微軟翻譯針對語音“對話”進行的種種優化,很容易讓人聯想到,這家公司在年初 Build 大會上公布的戰略“對話即平臺”。他們還透露,在今年年底前,將為Office 365企業用戶提供 Skype Meeting Broadcast 服務。通過該服務,可以自動為網絡會議添加字幕,并將會議實時地翻譯成不同語言展現出來。 

      注:本文曾用標題《微軟翻譯:別人還在為“書面語”奮斗,我們已經為“口頭語”優化》

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      分享:
      相關文章

      帥編輯

      你猜猜猜
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 精品国产一区二区三区四区| 丰满人妻熟妇乱又伦精品软件| 少妇无码| 99国产亚洲精品美女久久久久 | 老司机精品网| 亚洲精品成人无码| 超碰国产在线| 成在线人免费视频| 亚洲毛片多多影院| 中文字幕色av一区二区三区| 亚洲熟妇自偷自拍另欧美| 亚洲精品国偷拍自产在线观看| 最新国产精品精品视频| 99精品视频在线观看| 国产乱码一区二区三区| 熟女精品| 久久人妻乱| 国产人妻| 无码视频一区二区三区在线观看 | 亚洲 丝袜 另类 校园 欧美| 国产爆初菊哭了| 国产精品无码专区| va精品在线| 亚洲偷偷色| 亚洲色A| 无卡无码| 国产精品久久久久久福利69堂| 蜜桃av亚洲精品一区二区| 亚洲综合精品第一页| 狠狠噜天天噜日日噜| 草草地址线路①屁屁影院成人| 在线毛片免费| 亚洲va国产va天堂va久久| 成年网站拍拍拍Av| 欧美精品人人做人人爱视频| 江永县| 99国产精品99久久久久久 | 日日cao| 久久久久99精品成人片牛牛影视| 久久久精品一区| 亚洲欧美国产精品久久|