<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給楊曉凡
      發送

      0

      騰訊正式開源高性能分布式計算平臺Angel1.0,追趕同行腳步

      本文作者: 楊曉凡 2017-06-19 10:25
      導語:大規模、高性能、超高維度,一個為了支持大規模機器學習模型的計算平臺

      雷鋒網 AI 科技評論消息,騰訊的高性能分布式計算平臺Angel 1.0自去年公開宣布后,今天已經正式開源。發布地址為 https://github.com/Tencent/angel,感興趣的開發者可以下載或者貢獻源碼。

      騰訊正式開源高性能分布式計算平臺Angel1.0,追趕同行腳步

      用于支持大規模機器學習模型運算

      據雷鋒網 AI 科技評論了解,騰訊Angel 1.0是騰訊數據平臺部與香港科技大學合作、北京大學參與共同開發的分布式計算框架,它的主要設計目標是為了支持超大維度的機器學習模型運算。

      Angel的核心設計理念圍繞模型。它將高維度的大模型切分到多個參數服務器節點,并通過高效的模型更新接口和運算函數,以及靈活的同步協議,實現機器學習算法的高效運行。

      在去年公開消息時,Angel已經支持了SGD、ADMM優化算法,同時提供了一些常用的機器學習模型,現在開源的Angel 1.0.0正式版也新增了Logistic Regression、SVM、KMeans、LDA、MF、GBDT 等機器學習算法的集成。用戶可以方便地在最優化算法上層封裝自己的模型。

      根據騰訊數據平臺部總經理、首席數據專家蔣杰的介紹,Angel還可以支持運行Caffe、TensorFlow、Torch等深度學習框架,實現這些框架的多機多卡的應用場景。

      Angel基于Java和Scala開發,能在社區的Yarn上直接調度運行,并基于PS Service,支持Spark on Angel,未來將會支持圖計算和深度學習框架集成。

      根據騰訊大數據部的說法,Angel自去年以來已經在千萬級到億級的特征緯度條件下運行SGD用于實際的生產任務,已經在騰訊視頻推薦、廣點通等精準推薦業務上實際應用。他們還在擴大騰訊內部的應用范圍,未來目標是支持包括騰訊在內多家公司的大規模機器學習任務。

      Angel主要技術特點

       - 整體架構

      Angel的整體架構參考了谷歌的DistBelief,這是一種最初為了深度學習而設計、使用了參數服務器來解決巨大模型在訓練時更新問題的架構。參數服務器同樣可用于機器學習中非深度學習的模型,如SGD、ADMM、LBFGS的優化算法在面臨在每輪迭代上億個參數更新的場景中,需要參數分布式緩存來拓展性能。

      騰訊正式開源高性能分布式計算平臺Angel1.0,追趕同行腳步

      如這個系統框圖,Client作為客戶端可以發送啟動或停止、加載或存儲模型命令,可以獲取運行狀態;具體的任務分配、協調調度、資源申請由Master完成;Parameter Sever復雜存儲和更新參數,一個Angel計算任務中可以包含多個ParameterSever實例,隨著任務啟動而生成,隨著任務結束而銷毀;Work實例負責具體的模型訓練或者結果推理,每個Worker可以包含一個或者多個Task,這樣的Task可以更方便地共享Worker的公共資源。

      機器模型運算中需要反復迭代更新參數。Angel采用的Parameter Sever架構相比其它類型的架構更適合解決巨大模型中的參數更新問題;實際運行中相比參數更新方面有單點瓶頸的Spark平臺,Angel能夠取得成倍的性能優勢,而且模型越大優勢越明顯。

      Angel與Spark做了如下比較:在有5000萬條訓練樣本的數據集上,采用SGD解的邏輯回歸模型,使用10個工作節點(Worker),針對不同維度的特征逐一進行了每輪迭代時間和整體收斂時間的比較(這里Angel使用的是BSP模式)。

      騰訊正式開源高性能分布式計算平臺Angel1.0,追趕同行腳步

      通過數據可見,模型越大Angel對比Spark的優勢就越明顯。

       - 網絡優化

      Angel的網絡解決方案使用的是香港科技大學的Chukonu。借助Chukonu,Angel可以通過網絡流量再分配的方式,解決半同步的運算協調機制SSP中可能出現的快節點等待慢節點的問題,減少了窗口空閑等待時間。

      如下圖所示,在1億維度、迭代30輪的效果評測中,可以看到Chukonu使得累積的空閑等待時間大幅度減少,達3.79倍。

      騰訊正式開源高性能分布式計算平臺Angel1.0,追趕同行腳步

      以及,Chukonu配合參數服務器,可以讓慢的節點有更大的可能獲得最新的參數,因此對比原始的SSP計算模型,算法的收斂性得到了提升。下圖所示,同樣是針對五千萬維度的模型在SSP下的效果評測,原生的Angel任務在30輪迭代后(276秒)loss達到了0.0697,而開啟了Chukonu后,在第19輪迭代(145秒)就已達到更低的loss。

      騰訊正式開源高性能分布式計算平臺Angel1.0,追趕同行腳步

      快速發展的騰訊計算平臺

      雷鋒網 AI 科技評論了解到,去年Angel發布時,騰訊平臺部總經理、首席數據專家蔣杰對騰訊計算平臺的發展歷程做過介紹。2009到2011年的第一代平臺主要目標是規?;?,形成了TDW(騰訊分布式數據倉庫)這樣的架構;2012到2014年第二代平臺主要是實時化,把大規模計算搬到平臺上,支持了實時性強、規模大的業務需求,但是基于Spark的數據訓練就遇到了超大維度時出現瓶頸的問題。

      這樣,騰訊開始建設新的高性能計算框架,要能支持超大規模數據集,能完成十億級別維度的訓練。這就是騰訊的第三臺計算平臺Angel。圍繞Angel,騰訊還建立了一個小生態圈,可以支持Spark之上的MLLib,支持上億的維度的訓練;也支持更復雜的圖計算模型。

      也就是依靠Angel,騰訊獲得了2016年的Sort benchmark的排序的4項冠軍,用98.8秒時間完成了100T數據的排序,刷新了四項世界紀錄。2015年的這項排序時間還高達329秒。

      騰訊開源的Angel給頭疼于大規模機器學習模型計算的業內人員提供了一個新選擇。發展自己技術、擴大自己的平臺的同時,騰訊也承諾未來的開源力度只會越來越大。

      相關文章:

      騰訊大數據宣布開源第三代高性能計算平臺Angel | 重磅

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

      騰訊正式開源高性能分布式計算平臺Angel1.0,追趕同行腳步

      分享:
      相關文章

      讀論文為生

      日常笑點滴,學術死腦筋
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 昌吉市| jizzjizz亚洲| 国产欧美网站| 一 级 黄 色 片免费网站 | 亚洲AV永久久久久久久浪潮| AV一区二区三区| 国产91成人精品亚洲精品| 无码人妻丰满熟妇区毛片| 亚洲熟女视讯2| 天堂av在线免费观看| 亚洲中文字幕伊人久久无码| av中文字幕国产精品| 国产做a爱免费视频在线观看| 日韩午夜福利无码专区a| 国产精品毛片无遮挡高清| 人人插人人| 99蜜桃在线观看免费视频网站| 无码人妻AV一区二区| 隔壁老王国产在线精品| 国产一级r片内射免费视频| 亚洲成a人片在线观看导航| 秋霞在线观看秋| 国产国语chinesevideosex| 丁香色婷婷国产精品视频| 墨玉县| 久久精品亚洲精品国产色婷 | 免费a级毛片无码av| 99伊人| 欧美精品导航| 337p日本欧洲亚洲大胆艺术图| 欧美槡bbbb槡bbb少妇| 久久人妻精品白浆国产| 石林| 亚洲免费观看视频| 日韩www| 久久在线视频免费观看| 日本亚洲国产| 国产95在线| 丰满少妇猛烈进入| 亚洲一页在线| 亚洲人成亚洲人成在线观看|