<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能開發者 正文
      發私信給楊鯉萍
      發送

      0

      谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      本文作者: 楊鯉萍 2019-10-09 18:37
      導語:有效地度量模型對詞序和結構的敏感性

      雷鋒網 AI 開發者按:近日,谷歌發布了包含 7 種語言釋義對的全新數據集,即:PAWS 與 PAWS-X。BERT 通過該數據集的訓練,在釋義對問題上的精度實現了約為 3 倍的提升;其它先進的模型也能夠利用該數據集將精度提高到 85-90%。谷歌希望這些數據集將有助于推動多語言模型的進一步發展,并發布了相關文章介紹了該數據集,雷鋒網 AI 開發者將其整理編譯如下。

      谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      背景環境

      詞序和句法結構對句子意義有很大影響,即使詞序中的一點小改動也能完全改變句子的意思,例如下面的一組句子:

      1. Flights from New York to Florida.(從紐約飛往佛羅里達州的航班)

      2. Flights to Florida from New York.(從紐約出發到佛羅里達州的航班)

      3. Flights from Florida to New York.(從佛羅里達州飛往紐約的航班)

      盡管這三個詞都有相同的詞組;但是 1 和 2 具有相同的含義,我們將這樣的一組句子對稱為釋義對(paraphrase pairs),而 1 和 3 有完全相反的含義,所以我們將其稱為非釋義對(non-paraphrase pairs)。識別一對句子是否為釋義對的任務則被稱為釋義識別,這一任務對于許多實際應用中的自然語言理解(NLU)處理而言是非常重要的,例如:常見的問答任務等。

      但令人驚訝的是,目前即使是最先進的模型,如:BERT,如果僅在現有的 NLU 數據集下進行訓練,并不能正確地識別大部分非釋義對(就像上面所列舉的 1 與 3)之間的差異。其中很大的原因是由于在現有 NLU 數據集中,缺少諸如此類的訓練數據。因此,即使現有的機器學習模型能夠很好地理解復雜的上下文短語,它們依舊很難擁有對該類任務的判斷能力。

      PAWS 數據集與 PaWS-X 數據集

      為了解決這一問題,我們發布了兩個新的數據集,致力于幫助社區進行相關的研究。數據集包括:

      其中,PaWS-X 數據集則是在 PAWS 數據集基礎上,擴展得到包含另外六種不同類型語言的釋義識別對抗性數據集,支持的語言包括:法語、西班牙語、德語、漢語、日語和韓語。

      這兩個數據集都包含了格式良好、具有高度重疊詞匯的句子對。其中大約有一半的句子對是釋義對,另一些則不是,數據集也包含了最先進模型的訓練數據。通過新數據的訓練,該模型對釋義識別任務的精度從 50% 提高到了 85-90%。

      相比之前即使在有新的訓練數據時,無法獲得非本地上下文信息的模型仍然無法完成釋義識別任務的情況;這一新數據集則為測量模型對語序和結構的敏感性提供了一個有效的工具。

      數據集詳情

      PAWS 數據集共計包含了 108463 組由人工標記的句子對,這些數據來源于 Quora Question Pairs(QQP,https://www.quora.com/q/quoradata/First-Quora-Dataset-Release-Question-Pairs)以及維基百科頁面(https://www.wikipedia.org/)。

      PAWS-X 數據集則包含了 23659 組由人工判斷而得的 PAWS 擴展句子對,以及 296406 組由機器翻譯的訓練對。下表給出了數據集的詳細統計。谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      PAWS-X 的訓練集是從 PAWS wiki 數據集的一個子集通過機器翻譯而來的

      支持英語的 PAWS 數據集

      在「PAWS: Paraphrase Adversaries from Word Scramblinghttps://arxiv.org/abs/1904.01130)」一文中,我們介紹了在生成具有高度詞重疊的且具有釋義性的句子對的工作流程。

      為了生成數據對,源語句首先被傳遞到一個專門的語言模型(https://en.wikipedia.org/wiki/Language_model),該模型將創建具有語義的單詞交換變體句,但無法保證生成句子與原句是否互為釋義對的關系;接著再由人工評判員判斷句子的語法是否正確,然后由其它人工評判員來判斷它們是否互為釋義句。

      谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      PAWS 語料庫創建工作流

      這種簡單的單詞交換策略存在的一個問題,即它往往會產生不符合常識的「釋義句」,例如:「why do bad things happen to good people」和「why do good things happen to bad people」,盡管單詞都相同,但「為什么壞事會發生在好人身上」的意義和「為什么好事會發生在壞人身上」完全不同。

      因此,為了確保釋義和非釋義之間的平衡,我們增加了其他基于反譯的數據信息。因為反譯往往表現出與此類方法相反的傾向,它會選擇優先保留句子意義,然后在這基礎上改變詞序和詞語選擇。這兩種策略共同保證 PAWS 語料庫總體的平衡,尤其是維基百科部分的數據。

      多語言 PAWS-X 數據集的創建

      在建立了 PAWS 數據集之后,我們將它擴展出了其它六種語言,包括:漢語、法語、德語、韓語、日語和西班牙語。在這過程中,我們采用了人工翻譯來完成句子對的翻譯擴展和測試集生成工作,并使用神經網絡機器翻譯(neural machine translation,NMT)服務來完成訓練集的翻譯。

      我們從六個語言中(共計 48000 組翻譯)的每一個 PAWS 擴展集上,隨機抽取了 4000 個句子對進行人工翻譯(翻譯者所翻譯語言均為母語)。每一組句子都是獨立的,從而保證翻譯不會受到語境的影響,然后再由第二個工作者驗證隨機抽樣子集,最終使得數據集的字級錯誤率小于 5%。

      注意,如果所得句子不完整或模棱兩可,我們允許專業人士不翻譯。平均只有不到 2% 的句子對沒有被翻譯,我們暫且將它們排除在外。最終的翻譯對被分為新的擴展集和測試集,每個集合大約包含 2000 組句子對。

      谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      德語(DE)和漢語(ZH)的人工翻譯句子對的例子

      使用 PAWS 和 PAWS-X 來理解語言

      我們在所創建的數據集上訓練多個模型,并對評估集上的分類精度進行度量。當用 PAWS 訓練強大的模型后,如 BERT 和 DIN,這些模型對現有 QQP 數據集進行訓練時的表現會產生顯著的改善。

      如果在現有 QQP 上訓練,BERT 僅獲得 33.5 的精度,但是當給定 PAWS 訓練實例時,即使用來自 QQP的 PAWS 數據(PAWS-QQP),它的精度將達到 83.1 。

      不過與 BERT 不同,Bag-of-Words(BoW,https://en.wikipedia.org/wiki/Bag-of-words_model)模型無法從 PAWS 訓練實例中進行學習,這也展示了它在捕捉非局部上下文信息方面的弱點。但總體來看,這些結果都表明了 PAWS 可以有效地度量模型對詞序和結構的敏感性。

      谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      PAWS-QQP 精度評估設置(英文)

      下圖顯示了主流的多語言 BERT 模型(https://github.com/google-research/bert/blob/master/multilingual.md)在 PAWS X 上使用幾種常用方法所表現的性能,其中:

      • Zero Shot:該模型使用支持英語的 PAWS 數據集進行訓練,然后直接評估所有其他翻譯,這種方法不涉及機器翻譯。(引申:Zero-Shot 翻譯則是指在完成語言 A 到語言 B 的翻譯訓練之后,語言 A 到語言 C 的翻譯不需要再經過任何學習,它能自動把之前的學習成果轉化到翻譯任意一門語言,即便工程師們從來沒有進行過相關訓練)

      • Translate Test(翻譯測試):使用英語訓練數據訓練一個模型,并將所有測試用例翻譯成英文進行評估。

      • Translate Train(翻譯訓練):英語訓練數據被機器翻譯成每種目標語言,以提供數據來訓練每一個模型。

      • Merged(歸并):在所有語言上訓練多語言模型,包括原始英語對和所有其他語言的機器翻譯數據。

      結果表明,新數據集除了為跨語言的技術提供了幫助,同時也留下了很大的余地進而驅動多語種釋義識別問題的研究。

      谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      基于 BERT 模型的 PAWS-X 測試集的精度

      數據集下載相關

      PAWS-Wiki 

      該語料庫包含從維基百科頁面生成的句子對(可直接下載),包括:

      • PAWS-Wik 標記集(終版) 包含從單詞交換和反譯方法生成的句子對。所有的組別都有釋義性和流暢性的人工判斷,它們被分為訓練/擴展/測試部分。

      • PAWS-Wik 標記集(僅交換) 包含沒有反譯對應項的句子對,因此該子集不包含在第一組中。但數據集質量很高,包含人工對釋義性和流暢性的判斷,可以作為輔助訓練集。

      • PAWS-Wik 未標記集(終版) 包含從單詞交換和反譯方法生成的句子對。但該子集中有噪聲標記但沒有人工判斷,也可用作輔助訓練集。

      PAWS-QQP 

      該語料庫包含了從 QQP 語料庫生成的對,但由于 QQP 的許可證,我們不能直接獲得 PAWS-QQP 數據,因此必須通過下載最原始數據,然后運行腳本生成數據并附加標記來重建示例。

      重建 PAWS-QQP 語料庫,首先需要下載原始的 QQP 數據集,并將 tsv 文件保存到某個位置/path/to/original_qqp/data.tsv;然后從特定鏈接下載 PAWS-QQP 索引文件。

      PAWS-X

      該語料庫包含六種不同語言的 PAWS 示例翻譯,包含:法語、西班牙語、德語、漢語、日語和韓語。詳情可通過這里查看(https://github.com/google-research-datasets/paws/tree/master/pawsx)。

      需要注意的是,對于多語言實驗,請使用 paws-x repo 中提供的 dev_2k.tsv 作為所有語言(包括英語)的擴展集。

      谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      數據集下載地址:

      https://github.com/google-research-datasets/paws

      原文鏈接:

      https://ai.googleblog.com/2019/10/releasing-paws-and-paws-x-two-new.html

      雷鋒網 AI 開發者 

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      谷歌發布含 7 種語言的全新數據集:有效提升 BERT 等多語言模型任務精度高達 3 倍!

      分享:
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 成人午夜免费无码视频在线观看| AV一区二区三区| 99国产精品欧美一区二区三区| 最近中文字幕免费手机版| 日韩av裸体在线播放| 国产精品美女黑丝流水| 狠狠色噜噜狠狠狠狠2021| 国产91特黄特色A级毛片| 亚洲鲁丝片一区二区三区| 女人色熟女乱| 人妻放荡乱h文| 日韩黄色av一区二区三区| 色噜噜狠狠一区二区三区果冻| 97人伦色伦成人免费视频| 亚洲国产午夜精品理论片在线播放| 真实国产乱子伦视频| 97久久精品人人做人人爽| 日韩中文字幕v亚洲中文字幕 | 内射老阿姨1区2区3区4区| 霸州市| 国产欧美VA天堂在线观看视频| 男人一边吃奶一边做爰免费视频| 中文字幕在线精品视频入口一区| 末发育女av片一区二区| 国产在线亚州精品内射| 国产亚洲精品成人av在线| 久久精品免视看国产成人 | 亚洲夂夂婷婷色拍ww47| 亚洲av不卡电影在线网址最新| AV秘 无码一区二| 久久波多野结衣av| 人妻无码中出| wwwjizzjizz| 欧美白人一级| 富宁县| aaa午夜级特黄日本大片| 亚洲精品久久久久久久蜜桃臀| 亚洲国产一区在线二区三区| 久久精品国产亚洲av热一区| 国产成人h在线观看网站站| 久久99久久99精品免视看动漫|