<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給叨叨
      發送

      0

      專訪網易有道段亦濤:丁磊親自過問的神經網絡翻譯技術到底是什么?

      本文作者: 叨叨 2017-05-18 15:13
      導語:神經網絡翻譯帶來的提升是過去十年的總和

      近日,網易有道正式對外公布:由網易公司自主研發的神經網絡翻譯( Neural Machine Translation)技術正式上線,網易內部人士稱,該項目受到了丁磊的親自過問。

      有道2008年誕生,誕生伊始的核心業務是搜索。在2013年剝離搜索業務之后,有道僅翻譯業務(包括有道詞典、有道翻譯官等)就獲得了7億用戶,體量龐大。

      就此,雷鋒網獨家專訪了有道首席科學家段亦濤,聊了聊有道在機器翻譯領域的研究和探索。

      專訪網易有道段亦濤:丁磊親自過問的神經網絡翻譯技術到底是什么?

      有道是國內第一批提供機器翻譯服務的互聯網公司,從2008年正式推出到現在,已近十年。十年時間里,有道一直聚焦于中文與其他外語之間的翻譯,通過不斷提升機器翻譯的質量,吸引了大量用戶,積累了海量的語料和數據。

      即便如此,機器翻譯的質量還是差強人意。隨著人工智能技術的發展,深度學習逐漸應用在機器翻譯領域,神經網絡翻譯模型開始得以運用,而有道也借此將其機器翻譯能力提到了一個新的高度。用段亦濤的話來說就是:

      神經網絡翻譯是人工智能及深度學習在機器翻譯領域的具體應用,是目前最前沿的機器翻譯技術,它帶來的翻譯質量提升是過去十年的總和。

      通過機器來實現翻譯一直是人類一個夢想,在計算機誕生之前,人類就設想過用自動化的方法將一種語言的文字翻譯成另外一種語言。計算機誕生之后,人類開始希望做出一個能夠實現自動翻譯的程序。早期的嘗試都不太成功,統計翻譯模型的出現,給機器翻譯領域帶來了第一次飛躍。

      統計翻譯模型不依賴于人為設定的規則,而是從大量的平行語料里總結語言規律,從而得到翻譯的結果。但它的問題也很多,最大的問題在于統計翻譯模型是一個由很多組件組成的模型,比如分詞、短語、對齊,調序等組件,這些組件獨立存在,各司其職,每個組件完成自己的意向任務,最后“拼湊”起來,產生一個“還看得過去”的翻譯結果,遠遠談不上“滿意”。但兩年前,無論是我們熟知的谷歌翻譯、百度翻譯,還是其他翻譯類產品,用的基本都是統計翻譯模型。

      當神經網絡模型用于機器翻譯之后,這一切有了改觀。神經網絡翻譯能夠對整個句子進行編碼,更充分地利用上下文信息,判定多義詞的詞義,生成更自然的譯文。最直觀的一點,是神經網絡翻譯的譯文句子結構完整,語序更符合人類語言使用習慣,翻譯結果通順。

      專訪網易有道段亦濤:丁磊親自過問的神經網絡翻譯技術到底是什么?

      神經網絡翻譯原理

      如此評價,除了實際使用中用戶的感知,還有一個更為理性的標準,由IBM在2002年建立,被稱為BLEU(Bilingual Evaluation understudy)值。據維基百科介紹,BLEU是一種評價機器翻譯文本質量的算法,該算法的核心價值觀認為:機器翻譯越接近專業翻譯,質量越高。

      BLEU的具體方法是將候選譯文和參考答案做對比,把單個翻譯片段(一般是句子)與一組良好的質量參考譯文進行比較,判斷詞語、語序的重合部分,重合越多,得分越高,之后通過整個語料庫平均得出翻譯的總體質量的估計。

      在機器翻譯領域,神經網絡翻譯模型逐漸取代了統計翻譯模型,其中一個重要原因就是,前者的BLEU值大幅度提升。

      除了縱向對比,橫向和其他同行比較的話,BLEU值也是一個重要參考標準。按照有道官方給出的數據顯示,在英語學習場景中,有道神經網絡翻譯的英譯中和中譯英的BLEU值領先了同行7個百分點;而在新聞文章翻譯場景中,其英譯中BLEU值超同行6個百分點,而中譯英超過了8個百分點。

      專訪網易有道段亦濤:丁磊親自過問的神經網絡翻譯技術到底是什么?

      神經網絡翻譯中譯英對比

      之所以能比同行高出6-8個百分點,段亦濤認為優勢在于兩個方面:

      • 以中文為核心,更加專注。針對中文特有的語言現象做了非常多的優化,包括中文的分詞等;

      • 詞典近十年積累了龐大數據,依托有道詞典積累的語料和用戶數據,能夠在英語學習這種翻譯場景下做到最好。

      “效果不錯”,但段亦濤也承認,“在缺乏完備的理論基礎的情況下,實踐中需要非常依賴經驗和摸索。效果是最硬的指標,理論再完美,不起效果對我們來說就沒有意義”。

      在行業里曾經有人做過一個類比,“深度學習(包括神經網絡模型)就像煉丹,把各種素材放在一起,然后掌握火候,在不斷試煉中才能達到最好效果”,或許這也反映了,在行業缺乏完備的理論基礎的情況下,現實的困難是——大家都只能摸索,這就存在非常大的不確定性。但對目前有道做出來的效果,段亦濤還是滿意的。

      當然,這離不開一個強大的技術團隊。段亦濤表示,有道團隊將會持續聚焦在機器翻譯領域,未來將著力于三個方面:

      • 調整模型和算法

      • 獲取更多數據

      • 不同領域適配

      雷鋒網了解到,有道神經網絡翻譯技術已經在有道詞典、有道翻譯官、有道翻譯網頁版、有道e讀等產品中應用,覆蓋用戶超過7億。

      小結

      在采訪的最后,段亦濤還向雷鋒網聊起加入網易有道的經歷。段亦濤本碩專業讀的是北航的飛機設計,專注研究"隱身技術",和計算機基本沒關系。但去加州大學伯克利分校讀博時,因為興趣,轉到了計算機科學,讀的方向是分布式計算領域的隱私和加密。對于這種轉變,段亦濤覺得難度沒有想象那么大,因為在工程上都是相通的,其次他有數學的優勢。

      在伯克利讀博期間,段亦濤結識了的周楓,也就是現在網易有道CEO。

      當時,周楓受丁磊之邀,正在考慮加入網易開發有道項目。于是,周楓便邀請段亦濤一起加入了網易。從2008年到2017年,接近十年,段亦濤熱情不減,他說"我還是挺喜歡的"。

      很多業內人士,并不知道網易有道也在做 Al方面的研究。段方濤表示,希望有更多 Al人才加入進來。

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。

      專訪網易有道段亦濤:丁磊親自過問的神經網絡翻譯技術到底是什么?

      分享:
      相關文章

      編輯

      雷鋒網北京編輯。關注人工智能,略雜。微信(yougo5654)可以找到我。
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 国产在线精品一区二区三区直播| 成人免费区一区二区三区| 一区二区三区偷拍系列| 人妻久久中文| 亚洲第一在线综合网站| 日韩精品免费一区二区夜夜嗨| 91久久国产综合精品| 色综合久久综合欧美综合网| 国产又黄又爽又刺激的免费网址 | 国产精品| 青椒国产97在线熟女| 金寨县| 99re6这里有精品热视频| 国产精成人品| 日韩激情无码av一区二区| 在线精品亚洲一区二区绿巨人| 中文字幕一区二区三区乱码| 中文字幕美人妻亅u乚一596| 蜜臀久久精精品久久久久久噜噜 | 亚洲精品国产自在久久| 久久久久国产一区二区三区| 国产精品???A片带套| 麻豆91久久婷婷五月| av中文在线| 九九热视频在线免费观看| 欧美又粗又大AAA片| 亚洲最大成人在线播放| 国精产品一区一区三区有限公司 | 国产一区二区三区精品综合 | 精品久久人人妻人人做精品| 国产精品毛片av999999| 精品日韩亚洲av无码| 老头边吃奶边弄进去呻吟| 大陆一级毛片免费播放| 老司机亚洲精品影院| 亚洲爆乳精品无码一区二区| 亚洲女同精品中文字幕| 99精品国产中文字幕| 午夜亚洲www湿好爽| 屄视频| 野花香社区在线视频观看播放|