<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能 正文
      發私信給張進
      發送

      0

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      本文作者: 張進 2024-03-19 19:25
      導語:長文本、多模態依然是當下大模型公司努力攻堅的領域。

      【雷峰網(公眾號:雷峰網)】近日,大模型初創公司零一萬物發布了Yi 大模型 API 開放平臺,為開發者提供通用 Chat、200k 超長上下文、多模態交互等模型。

      零一萬物由創新工場董事長兼首席執行官李開復創辦于 2023 年 6 月,六個月后,零一萬物便成功發布了 Yi 系列模型,包含 6B 和 34B 兩個版本,并開源,打破了當時國產開源模型一直難以超過 14B 的現狀。34B也是黃金尺寸的模型,既達到了大模型“涌現”能力的門檻,同時也能在消費級顯卡上訓練,對開發者相對友好。

      此后較長一段時間 Yi-34B 在 Hugging Face 英文開源社區平臺躋身前列,一舉打響了零一萬物的模型名聲。

      而此次推出 Yi 大模型 API 開放平臺,意味著經過過去一年的籌措與準備,零一萬物已經具備了一個初步的模型產品矩陣,將模型能力完全開放出去供開發者測試、使用。

      跟開源一樣,這同樣需要很大的勇氣,是對零一模型能力進一步的測試與考驗,但好在經過前期體驗與一些用戶實測,收獲了諸多好評。在 Yi-34B-Chat-0205、Yi-34B-Chat-200K 之外,零一萬物開放平臺此次同期上新的多模態大模型 Yi-VL-Plus,支持文本、視覺多模態輸入,面向實際場景大幅增強。多位用戶反饋:中文體驗超過 GPT-4V。

      開發者作為大模型生態中非常重要的一環,從開源 Yi-34B 模型免費供開發者使用,到今天又推出Yi 大模型 API 開放平臺,可以看到零一萬物非常重視開發者生態的塑造。

      Yi 大模型 API 名額目前限量開放,零一萬物會為新用戶免費贈送 60 元,感興趣的開發者不妨多多申請體驗一下。

      API 開放平臺:聚焦 200K 長上下文和多模態

      據介紹,此次 API 開放平臺提供以下模型,包括:

      Yi-34B-Chat-0205:支持通用聊天、問答、對話、寫作、翻譯等功能。

      Yi-34B-Chat-200K:200K 上下文,多文檔閱讀理解、超長知識庫構建小能手。

      Yi-VL-Plus:多模態模型,支持文本、視覺多模態輸入,中文圖表體驗超過 GPT-4V。

      (零一萬物API開放平臺鏈接:https://platform.lingyiwanwu.com/)

      AI 科技評論發現,此次零一萬物 API 開放平臺主要聚焦于當下兩個最重要的領域,一是長文本,二是多模態。

      大模型早已進入長文本時代,各家大模型都在推自己的長文本能力,Yi-34B-Chat-200K 支持處理約 30 萬個中英文字符,更具象的體現是可以輕松處理整本《哈利·波特與魔法石》 小說,適合用于多篇文檔內容理解、海量數據分析挖掘和跨領域知識融合等行業人員。

      例如金融分析師可用 Yi-34B-Chat-200K 快速閱讀報告并預測市場趨勢、律師可以用它精準解讀法律條文、科研人員可以用它提取論文要點等。

      在“大海撈針”的測評中,Yi-34B-Chat-200K 的性能提高了 10.5%,從 89.3% 提升到 99.8% 。該測試是將一個目標句子(針)放進一個隨機文檔語料庫(大海),然后提出一個只能使用“針”(目標句子)中的信息才能回答的問題來測試模型的回憶能力。

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      Yi-34B-Chat-200K 可以對200多頁的英文長篇小說《Frankentein》進行中文歸納總結和用表格例舉書中人物。

      而零一萬物開發的多模態模型 Yi-VL-Plus,可支持文本、視覺多模態輸入,面向實際應用場景大幅增強:

      增強Charts, Table, Inforgraphics, Screenshot 識別能力,支持復雜圖表理解、信息提取、問答以及推理。中文圖表體驗超過GPT-4V。

      在 Yi-VL 基礎上進一步提高了圖片分辨率,模型支持 1024*1024 分辨率輸入,顯著提高生產力場景中的文字、數字 OCR 的準確性。

      保持了 LLM 通用語言、知識、推理、指令跟隨等能力。

      在全球多項權威評測榜單中,Yi 大模型表現優異,性能直追 GPT-4。從實際測評結果顯示,很多場景 Yi-VL-Plus 效果超過 GPT-4V。

      例如,當我們把下述表格分別給 Yi-VL-Plus 和 ChatGPT 處理,發現兩個模型的處理結果不同:

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      Yi-VL-Plus 得出了正確答案,GPT-4V 沒有,可見 Yi-VL-Plus 對中文復雜表格的信息識別處理準確度高于 GPT-4V:

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      再例如,我們將下述模糊漢字的圖片提交給 Yi-VL-Plus 和 ChatGPT 識別:

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      發現Yi-VL-Plus 回答正確了,ChatGPT 沒能答對:

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      在實際應用場景中的效果:用戶評價較高

      據零一萬物透露,此前,Yi 大模型 API 小范圍開放內測,全球已有不少開發者申請使用,并普遍反饋效果超出預期,其中,星云愛店 CTO 大董、技術人負責人劉亞光和測試過零一萬物 API 開放平臺后,也給出了較高評價。

      星云愛店是知識探索服務的先行者,該公司的業務包含2C的“學術科研助手”,2B的兒童心理健康診療、青少年科學素養培養三大領域。

      大模型爆火后,針對科研學術場景,星云愛店“萬能小in科研助手”可以加載大模型能力,幫助用戶進行深層次文本資料解讀、文獻分析以及創造性寫作;針對青少年科學素養培育計劃,星云可以利用大模型來輔助制定個性化學習計劃,提供學習輔導,評估學習成果,并引導學生舉一反三,創造性提升學習效果。

      所以要求大模型同時具備智商IQ和情商  EQ——做研究時大模型要有智商IQ,精確、嚴謹、化繁為簡,而在服務用戶時又有情商EQ,善解人意、無微不至。

      星云愛店 CTO 大董參加過諸多一線大模型的測評,但他發現找到雙商兼并的平臺并不容易,他們要求大模型能達到:長文本精確摘要,對話文案專業化、精細化,拒答率低。這次,星云愛店成為零一萬物 Yi 大模型 API 開放平臺邀測的首批用戶。大董說,相比其他大模型,滿分 10 分的話,給 Yi 大模型 API 開放平臺整體評分可達 8.5,屬于他們測試大模型 API 中的頭部玩家。

      經過多次測試后,大董發現零一萬物 Yi 大模型 API 開放平臺,相對其他模型有以下優勢:

      (1)當執行復雜任務時,拒絕任務率低,完成度好,測試案例如下:

      其他模型,被拒率達 40%。

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V


      切換到零一模型后,任務未發生拒絕執行,且篇幅控制準確,撰寫創業優良,翻譯專業準確。

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      (2)學習專業知識并立即用于解讀,表現優良。有深度、有創意。

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      結合歷史病歷和從圖片信息,零一模型可以較好的完成對青少年心理健康水平解讀。并被中國頂級精神衛生醫院評價為:較準確。

      (3)閱讀18萬字的報告集合,未遺漏重點

      其他模型(左標黃圖所示):無地緣政治風險。

      零一模型(右圖所示):英國脫歐導致索尼總部搬遷,導致索尼歐洲業務連續性受影響。

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      使用了 Yi 大模型API開放平臺后,現在,星云愛店的業務能力和用戶體驗明顯提升。

      首先是復雜場景下多指令理解反饋高效精準。不管是學術研究還是為兒童青少年提供輔導,經常都會有“既要又要還要”的刁鉆需求,比如需要總結一系列文章核心觀點,并按照某一標準排序打分后進行語言翻譯,這是對模型的指令遵循、創意內容生成以及推理速度的綜合考驗。大董說:“Yi-34B-Chat-200K面對幾萬字的超長提示詞,10 秒鐘就反饋回來了結果,極大提高大家的工作效率。”

      其次是長文本中“大海撈針”精確度優異,這讓星云愛店的產品可以在諸多文本分析與寫作平臺中獨占鰲頭。學術研究最難的并非找到1萬篇文獻的共同點,而是要在浩如煙海的文字中,找到可能會被前人忽略的關鍵信息。大董說,即使是做詩詞韻律相關的分析,在測試中發現 Yi 大模型都可以準確理解文獻表達的意思,很快抓住重點。30 萬字的處理能力者對于知識庫的分析整理很重要。Yi 大模型在語義理解、摘要總結等精確度等方面是他測試過的各類長文本模型里的領先者。

      此外,不管是服務科研還是做心理咨詢,“靠譜”是最重要的品質。大董說,以心理咨詢場景為例,在線拒答率、回答文案的溫暖程度極大影響用戶體驗。零一萬物的API做到了靠譜且易用,這對一家業務正在持續增長,用戶規模不斷擴大的公司尤為重要。

      而 Yi 大模型API開放平臺的“靠譜易用”,還體現在 API 接入的順滑程度上。星云愛店技術負責人劉亞光說,接入 Yi 大模型 API 代碼修改量極少,幾乎是分分鐘就可以搞定。

      而用戶能擁有上述體驗則要源于零一萬物對 API 的優化,據零一萬物透露,為了提升 API 性能,零一萬物在 API 側進行了推理優化,因此 Yi-34B-Chat 系列 API 具備較快的推理速度,這不僅縮短了處理時間,同時也保持了出色的模型效果。此外,優化的 API 接口顯著降低了模型回復的延遲,進一步提高了用戶體驗的流暢性和響應速度。

      同時,Yi 系列模型 API 與 OpenAI API完全兼容,只需要修改少量代碼,就能平滑遷移。

      當然,目前看來 Yi 大模型 API 到底能不能與 GPT-4 Turbo、Gemini 1.5、Claude 3 這些模型的表現一較高下,還需要更多開發者一起考察。

      據零一萬物技術副總裁及模型訓練 AI Alignment、開放平臺負責人俞濤透露,未來零一萬物將會持續為開發者提供更多更強模型和 AI 開發框架,讓大模型更好地完成落地,包括:

      推出一系列的模型 API,覆蓋更大的參數量、更強的多模態,更專業的代碼/數學推理模型等。

      突破更長的上下文,目標 100萬 tokens;支持更快的推理速度,顯著降低推理成本。

      基于超長上下文能力,構建向量數據庫、RAG、Agent 架構在內的全新開發者 AI 框架。旨在提供更加豐富和靈活的開發工具,以適應多樣化的應用場景。


      雷峰網特約稿件,未經授權禁止轉載。詳情見轉載須知。

      零一萬物 API 上線,用戶反饋多模態中文能力超過 GPT-4V

      分享:
      相關文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 亚洲人精品亚洲人成在线| 色综合色综合久久综合频道| 欧美人禽杂交狂配| 亚洲色偷偷色噜噜狠狠99| 曰批免费视频播放免费直播| 久久99国产精品久久| 南江县| 国产精品一区二区无线| 亚洲无码制服丝袜视频| 三年中文在线观看免费大全| 性色av无码久久一区二区三区| 成人免费亚洲av在线| 极品妇女扒开粉嫩小泬 | 久久久噜久噜久久gif动图 | 伊人久久中文字幕| 日本熟妇人妻右手影院| 国产成人精品无人区一区| 伊人天天久大香线蕉av色| av一区二区三区| 一区二区三区鲁丝不卡| 日韩中文字幕在线一区二区三区| 瓦房店市| 疯狂做受xxxx高潮欧美日本| 亚洲人成人网站| 亚洲精品成人a| 亚洲激情av| 日本天天躁天天搡久久| 亚洲色偷偷色噜噜狠狠99 | 亚洲中文一区二区av| 国产亚洲欧美日韩在线一区二区三区| 欧美激情综合色综合啪啪五月 | 人妻系列无码专区久久五月天| AV在线影院| 亚洲成a人片在线观看日本| 愛爱视频在线3| 嗯91色色| jizz日本版| 色欲人妻综合网| 亚洲综合图| 无码人妻精品一区二区蜜桃91| 国内自拍偷拍|