<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      業界 正文
      發私信給楊麗
      發送

      0

      讓米粉為之瘋狂的聲音克隆技術:深聲科技如何用90秒錄音克隆出你的聲音?

      本文作者: 楊麗 2020-03-18 16:32
      導語:聲音,正成為消除人與機器之間隔閡的關鍵。

      “通過克隆,把自己心愛之人的聲音永久珍藏……這可能就是科技應該有的溫度吧。”

      與小米的最近一次合作中,深聲科技為其提供了聲音克隆技術,應用在其最新發布的小愛同學定制聲音功能上,能讓米粉合成自己的、甚至是父母、兒女、戀人的聲音,同時還支持音色分享功能。比如,明星將自己音色分享給粉絲后,就能通過聲音實現明星和粉絲的“常相伴”。

      讓米粉為之瘋狂的聲音克隆技術:深聲科技如何用90秒錄音克隆出你的聲音?

      智能語音助手這個頗具想象力的AI應用,正逐漸成為智能終端的基礎功能,包括智能手機、智能家居、車載、陪伴機器人等,其普及率有了較大提升,而聲音克隆技術的應用,很可能會加速整個進程。

      說到聲音克隆技術,并非深聲科技所獨有的,但與競爭對手相比,深聲科技CEO周俊明表示:“聲音克隆技術上,我們在音色還原度、發音準確率、音質清晰度等方面,具有明顯的優勢,手機語音助手是我們首個落地場景。” 

      聲音克隆面臨哪些技術挑戰?

      2020年1月中旬,深聲科技聲音克隆產品正式上線。在此期間,深聲團隊在眾多競爭者中成功拿下了小米方的需求標的。作為與小米小愛同學的一次深度合作,深聲科技將為之提供聲音克隆核心技術支持。

      包括雙方的需求對接、內部評估,再到交付,前后用了1個多月時間。

      與傳統語音合成相比,聲音克隆面臨更大的技術挑戰。首先,聲音克隆需要C端用戶配合錄音,就不能對其錄音環境和設備有過分要求。

      我們會建議用戶選擇一個盡可能安靜的地方,使用手機完成錄音過程。 

      其次,考慮用戶的體驗,需要盡可能縮短錄音的時長。

      這就對我們有很高的要求,傳統的語音合成需要幾十分鐘到幾個小時的語音數據,相比之下,聲音克隆的數據量少,對聲學模型的訓練有更高的要求,比如發音模糊、發錯音、音素覆蓋等一系列問題。當然,最重要的還是音色還原度的問題。

      現在,用戶只需配合朗讀20句話短文本,大約錄音90秒的語音數據,就能快速克隆出自己的聲音,將個人的情感表達、發音特點等信息遷移到合成聲音中,就連口音也能很好地克隆出來。

      再次,在實際應用中,還要考慮海量用戶發起聲音克隆請求的高并發問題。為了節約成本,提升用戶體驗,就要解決模型切換、模型并發數,以及合成延遲等一系列挑戰。

      海量用戶對聲音克隆的頻繁調用時,模型間的切換邏輯非常重要。

      最后,因為采集到的用戶數據會上傳到服務器進行模型訓練,考慮到用戶隱私安全的保護,團隊提供了私有化部署的方案,以確保用戶數據不外泄。

      是否迎來大規模商業化? 

      過去一段時間,百度、訊飛、搜狗等公司也曾推出聲音克隆服務,但似乎并未贏得用戶市場的關注。為什么深聲科技此次聲音克隆技術的上線,會在用戶市場引起如此大的反響呢?

      周俊明表示,聲音克隆大規模商業化需要具備幾個條件:

      一是克隆的聲音有較高的音色還原度,跟真人聲音無差異;

      二是用戶使用門檻不能太高,例如錄音條件、發音標準等不能有太高要求;

      三是對計算資源的消耗,需要具備個人都能用得起的基礎;

      四是具備創造出真正的價值,能夠提升人們的生活品質。

      從這個角度來講,深聲科技與小米的合作開始,就已經具備了將聲音克隆技術大規模商業化的能力。

      在談到與普通語音合成的差異時,周俊明表示:

      普通語音合成,解決的是如何將語音內容很好地傳遞出去、更容易地被接收的問題。而聲音克隆,體現了用戶的社會屬性,能夠讓用戶通過聲音來服務于他人。這就意味著,每個人的聲音的價值能夠得到充分體現,在包括親子互動、情感陪伴、泛娛樂在內的各種場景中具有巨大的應用價值。

      讓米粉為之瘋狂的聲音克隆技術:深聲科技如何用90秒錄音克隆出你的聲音?

      安全問題如何解決?

      將聲音克隆引入智能語音助手,會不會引發更多語音詐騙案件的發生?

      目前可能普通存在這樣的擔憂:合成技術的水平發展越高,合成語音與人聲的差異就越小,技術鑒定的難度就越大。對此,周俊明也指出,

      不必過度擔心。問題在于人耳的敏感度不夠高,才會對克隆聲音沒有發覺。但應用技術手段進行區分還是毫無壓力的,克隆出來的聲音在語譜圖中跟真人的聲音有明顯區別,克隆聲音中的很多特征信息已經丟失了。

      作為技術服務的輸出方,深聲科技也十分關注如何規避這項技術的非法應用,在推出之前就考慮了到法律倫理的問題,并給出了三點應對方案:

      • 一是將聲音克隆能力只授權給那些有控制能力的企業客戶,對于C端用戶來講,只有選擇音色的權限,沒有自定義克隆聲音內容的權限;

      • 二是加強對內容安全的嚴格審核。不支持用戶用隨意一段語音進行克隆,要求用戶對指定文本進行錄音,從而降低聲音被利用的風險;

      • 三是通過身份認證、結合生物識別等技術,以限制聲音克隆的使用。

      關于深聲

      深聲科技是一家專注于“智能語音”技術研發和業務落地的人工智能公司,于2018年在廣州天河成立。深聲科技擁有一支頂級的人工智能技術團隊,自主研發了行業領先的語音合成、聲音定制、聲音克隆等語音AI技術。

      深聲的語音AI技術已在眾多場景中落地,包括語音助手、智能客服、有聲閱讀、車載語音、AI教育、動漫等。深聲提供的“文字轉語音”技術服務,支持的語言也從中文、英文,逐步擴展到了國內方言和海外語種。除了持續不斷的技術突破,深聲的語音數據制作效率也有了大幅度提升,比如三天交付客戶專屬定制聲音, 兩個月支持一門新語種。

      讓聲音服務好每個人的生活,深聲致力于將語音AI技術融入人們生活的點滴之中,賦予企業和用戶以創新與科技力量來創造更美好的世界。

      對深聲科技智能語音技術感興趣的讀者,可前往深聲科技的官網http://www.deepsound.cn/ 或微信小程序“深聲AI”親身體驗。

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      分享:
      相關文章

      高級主筆

      關注企業軟件、操作系統、云原生(PaaS)、數據中臺 | 微信:leeyangamber
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 狠狠色狠狠色综合日日不卡| 揉捏奶头高潮呻吟视频| 国产精品123| 国产在线观看91精品2021| 夜夜高潮夜夜爽高清视频| 日韩性网站| 在线观看亚洲国产| av免费网站在线免费观看| 亚洲av成人在线网站| 亚洲av无码片在线播放| 摸丰满大乳奶水www免费| 一区二区三区AV波多野结衣| 中文字幕久久亚洲一区| 亚洲日韩一区精品射精| 综合色久| 粉嫩高中生无码视频在线观看| 亚洲国产精品18久久久久久| 色999亚洲人成色| av无码天一区二区一三区| 日本高清熟妇老熟妇| 无码人妻精品一区二区三区温州| 国产VA免费精品高清在线| 极品人妻videosss人妻| 超碰123| 抽搐一进一出gif免费动态 | 一级毛片网| 河间市| 国产丰满乱子伦无码专| 一区二区三区日本大片| 亚洲丶国产丶欧美一区二区三区| 家庭激情网| 亚洲国产专区| 一本色道久久综合亚洲精品按摩 | 少妇下蹲露大唇无遮挡| 云和县| 国产精品久久久久久久久久久久人四虎 | 亚洲中文字幕无码av在线| 51精品国自产在线| 级毛片免费看无码| 亚洲国产午夜精品理论片在线播放 | 国产妇女馒头高清泬20p多|