<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      業界 正文
      發私信給nebula
      發送

      0

      國產大模型全陣容,中文大模型競技場推出!

      本文作者: nebula 2024-05-31 14:16
      導語:LMSYS Org推出的大模型競技場Chatbot Arena,已成為海外最具公信力的大模型榜單之一,但該榜單中文化程度相對不足。

      LMSYS Org推出的大模型競技場Chatbot Arena,已成為海外最具公信力的大模型榜單之一,但該榜單中文化程度相對不足。近日,上海人工智能實驗室聯合魔搭社區推出中國大語言模型評測競技場Compass Arena,首度集齊國內主流大模型全陣容,阿里通義千問、百度文心一言、騰訊混元、訊飛星火、字節跳動豆包、智譜AI、百川智能、零一萬物、月之暗面、Minimax、深度求索、書生·浦語等20款國產大模型出戰,角逐中國大模型“最強王者”。

      相比考題固定的傳統測評,大模型競技場采用盲測、開放的測評模式,可以更全面地檢驗模型實力。Compass Arena設置了隨機、匿名對戰,大模型選手們成為“蒙面唱將”,模型信息隱去后,由系統隨機匹配進行PK,用戶可以天馬行空自由出題,并作為評委主觀評判和投票。如果大模型不小心“自報家門”,則對話被過濾,不計入成績。通過成千上萬輪PK挑戰和用戶投票,系統將對大模型進行自動排名。

      國產大模型全陣容,中文大模型競技場推出!

       魔搭社區直播時,網友腦洞大開在線出題 

      Compass Arena由上海人工智能實驗室OpenCompass司南評測體系與魔搭社區聯合建設,前者負責組織評測,后者負責開源模型引入及社區打造。據上海人工智能實驗室OpenCompass團隊介紹,Compass Arena力求體現社區用戶的真實反饋,評測機制借鑒Chatbot Arena,采用Elo評分系統,即國際象棋等對弈活動評估的權威標準。在這種模式下,大模型競技類似“在游戲中打排位”,勝率成為評估模型水平的關鍵指標,同時隨著排位變高,系統也會自動匹配高段位選手進行對戰。

      與Chatbot Arena相比,Compass Arena更聚焦中文大模型,主流國產大模型全覆蓋,同時評測用戶大多使用中文,可以充分評估國產大模型的性能。

      目前,Compass Arena已匯聚超20款商業及社區模型,包括Qwen-Max、ERNIE-4.0-8K、Spark3.5 Max、Abab6.5、GLM4等國內頭部廠商的旗艦款大模型,并引入了Llama3、Mixtral等海外標桿模型進行參照。更多模型及廠商還在不斷加入中。

      上線不到一周,已有上萬人訪問魔搭Compass Arena頁面。魔搭社區表示,歡迎廣大開發者和網友參與大模型排位賽的投票,共同促進國產大模型的進步和趕超。后續,Compass Arena首期排行榜將揭曉,并將定期公布更新。

      魔搭社區Compass Arena鏈接:https://www.modelscope.cn/studios/opencompass/CompassArena

      Compass Arena首批大模型名單:

      Abab6.5-Chat (MiniMax)

      Baichuan 4 (百川智能)

      C4AI Command R+ (Cohere)

      DBRX-Instruct (DataBricks)

      Deepseek-LLM-67B-Chat(深度求索)

      Deepseek-MoE-16B-Chat(深度求索)

      Doubao-Pro-4K (字節豆包)

      ERNIE-4.0-8K (百度文心一言)

      GLM4 (智譜AI)

      Hunyuan-Pro (騰訊混元)

      InternLM2系列(上海AILab書生·浦語)

      Llama3系列(Meta)

      Mixtral 8x22B Instruct (Mistral)

      MoonShot-V1-32K (月之暗面)

      Qwen1.5系列 (阿里通義千問)

      Qwen-Max (阿里通義千問)

      Spark3.5-Max (訊飛星火)

      Yi-34B-Chat (零一萬物)

      Yi-Large (零一萬物)

      雷峰網(公眾號:雷峰網)

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 55大东北熟女啪啪嗷嗷叫| 亚洲天堂人妻| 日本毛茸茸的丰满熟妇| 三上悠亚ssⅰn939无码播放| 污网站大全免费| 少妇下面好紧好多水真爽播放| 日韩放荡少妇无码视频| 中文字幕久久久久人妻| 日日夜夜噜噜| 国产色视频一区二区三区| 国产成人精品手机在线观看| 久久av高潮av喷水av无码| 亚洲 a v无 码免 费 成 人 a v| 国产在线精品一区二区中文| 好紧好湿好爽免费视频| 久久精品成人免费看| 老熟妇一区二区三区啪啪| 国产九九在线| 色婷婷成人网| 免费国产麻豆传| 日韩精品成人一区二区三区| 成年无码av片完整版| 永久免费无码av在线网站| 国产AV一区二区三区| 德格县| 在线观看精品自拍视频| 国产AV影片麻豆精品传媒| 精品毛片日| 最近最好的中文字幕2019免费| jlzz大jlzz大全免费| 日本高清一区| 亚洲精品动漫免费二区| 97精品伊人久久大香线蕉| 国产精品资源管理站在线直播| 国产精品成人一区二区不卡| 日韩在线视频观看免费网站| 北条麻妃无码| 汨罗市| 九九热免费在线视频| 丰满人妻在线一区二区三区视频53| 精品福利视频一区二区三区|