零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

本文作者：張進

2024-03-19 19:25

導語：長文本、多模態依然是當下大模型公司努力攻堅的領域。

【雷峰網(公眾號：雷峰網)】近日，大模型初創公司零一萬物發布了Yi 大模型 API 開放平臺，為開發者提供通用 Chat、200k 超長上下文、多模態交互等模型。

零一萬物由創新工場董事長兼首席執行官李開復創辦于 2023 年 6 月，六個月后，零一萬物便成功發布了 Yi 系列模型，包含 6B 和 34B 兩個版本，并開源，打破了當時國產開源模型一直難以超過 14B 的現狀。34B也是黃金尺寸的模型，既達到了大模型“涌現”能力的門檻，同時也能在消費級顯卡上訓練，對開發者相對友好。

此后較長一段時間 Yi-34B 在 Hugging Face 英文開源社區平臺躋身前列，一舉打響了零一萬物的模型名聲。

而此次推出 Yi 大模型 API 開放平臺，意味著經過過去一年的籌措與準備，零一萬物已經具備了一個初步的模型產品矩陣，將模型能力完全開放出去供開發者測試、使用。

跟開源一樣，這同樣需要很大的勇氣，是對零一模型能力進一步的測試與考驗，但好在經過前期體驗與一些用戶實測，收獲了諸多好評。在 Yi-34B-Chat-0205、Yi-34B-Chat-200K 之外，零一萬物開放平臺此次同期上新的多模態大模型 Yi-VL-Plus，支持文本、視覺多模態輸入，面向實際場景大幅增強。多位用戶反饋：中文體驗超過 GPT-4V。

開發者作為大模型生態中非常重要的一環，從開源 Yi-34B 模型免費供開發者使用，到今天又推出Yi 大模型 API 開放平臺，可以看到零一萬物非常重視開發者生態的塑造。

Yi 大模型 API 名額目前限量開放，零一萬物會為新用戶免費贈送 60 元，感興趣的開發者不妨多多申請體驗一下。

API 開放平臺：聚焦 200K 長上下文和多模態

據介紹，此次 API 開放平臺提供以下模型，包括：

Yi-34B-Chat-0205：支持通用聊天、問答、對話、寫作、翻譯等功能。

Yi-34B-Chat-200K：200K 上下文，多文檔閱讀理解、超長知識庫構建小能手。

Yi-VL-Plus：多模態模型，支持文本、視覺多模態輸入，中文圖表體驗超過 GPT-4V。

（零一萬物API開放平臺鏈接：https://platform.lingyiwanwu.com/）

AI 科技評論發現，此次零一萬物 API 開放平臺主要聚焦于當下兩個最重要的領域，一是長文本，二是多模態。

大模型早已進入長文本時代，各家大模型都在推自己的長文本能力，Yi-34B-Chat-200K 支持處理約 30 萬個中英文字符，更具象的體現是可以輕松處理整本《哈利·波特與魔法石》小說，適合用于多篇文檔內容理解、海量數據分析挖掘和跨領域知識融合等行業人員。

例如金融分析師可用 Yi-34B-Chat-200K 快速閱讀報告并預測市場趨勢、律師可以用它精準解讀法律條文、科研人員可以用它提取論文要點等。

在“大海撈針”的測評中，Yi-34B-Chat-200K 的性能提高了 10.5%，從 89.3% 提升到 99.8% 。該測試是將一個目標句子（針）放進一個隨機文檔語料庫（大海），然后提出一個只能使用“針”（目標句子）中的信息才能回答的問題來測試模型的回憶能力。

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

Yi-34B-Chat-200K 可以對200多頁的英文長篇小說《Frankentein》進行中文歸納總結和用表格例舉書中人物。

而零一萬物開發的多模態模型 Yi-VL-Plus，可支持文本、視覺多模態輸入，面向實際應用場景大幅增強：

增強Charts, Table, Inforgraphics, Screenshot 識別能力，支持復雜圖表理解、信息提取、問答以及推理。中文圖表體驗超過GPT-4V。

在 Yi-VL 基礎上進一步提高了圖片分辨率，模型支持 1024*1024 分辨率輸入，顯著提高生產力場景中的文字、數字 OCR 的準確性。

保持了 LLM 通用語言、知識、推理、指令跟隨等能力。

在全球多項權威評測榜單中，Yi 大模型表現優異，性能直追 GPT-4。從實際測評結果顯示，很多場景 Yi-VL-Plus 效果超過 GPT-4V。

例如，當我們把下述表格分別給 Yi-VL-Plus 和 ChatGPT 處理，發現兩個模型的處理結果不同：

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

Yi-VL-Plus 得出了正確答案，GPT-4V 沒有，可見 Yi-VL-Plus 對中文復雜表格的信息識別處理準確度高于 GPT-4V：

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

再例如，我們將下述模糊漢字的圖片提交給 Yi-VL-Plus 和 ChatGPT 識別：

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

發現Yi-VL-Plus 回答正確了，ChatGPT 沒能答對：

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

在實際應用場景中的效果：用戶評價較高

據零一萬物透露，此前，Yi 大模型 API 小范圍開放內測，全球已有不少開發者申請使用，并普遍反饋效果超出預期，其中，星云愛店 CTO 大董、技術人負責人劉亞光和測試過零一萬物 API 開放平臺后，也給出了較高評價。

星云愛店是知識探索服務的先行者，該公司的業務包含2C的“學術科研助手”，2B的兒童心理健康診療、青少年科學素養培養三大領域。

大模型爆火后，針對科研學術場景，星云愛店“萬能小in科研助手”可以加載大模型能力，幫助用戶進行深層次文本資料解讀、文獻分析以及創造性寫作；針對青少年科學素養培育計劃，星云可以利用大模型來輔助制定個性化學習計劃，提供學習輔導，評估學習成果，并引導學生舉一反三，創造性提升學習效果。

所以要求大模型同時具備智商IQ和情商 EQ——做研究時大模型要有智商IQ，精確、嚴謹、化繁為簡，而在服務用戶時又有情商EQ，善解人意、無微不至。

星云愛店 CTO 大董參加過諸多一線大模型的測評，但他發現找到雙商兼并的平臺并不容易，他們要求大模型能達到：長文本精確摘要，對話文案專業化、精細化，拒答率低。這次，星云愛店成為零一萬物 Yi 大模型 API 開放平臺邀測的首批用戶。大董說，相比其他大模型，滿分 10 分的話，給 Yi 大模型 API 開放平臺整體評分可達 8.5，屬于他們測試大模型 API 中的頭部玩家。

經過多次測試后，大董發現零一萬物 Yi 大模型 API 開放平臺，相對其他模型有以下優勢：

（1）當執行復雜任務時，拒絕任務率低，完成度好，測試案例如下：

其他模型，被拒率達 40%。

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

切換到零一模型后，任務未發生拒絕執行，且篇幅控制準確，撰寫創業優良，翻譯專業準確。

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

（2）學習專業知識并立即用于解讀，表現優良。有深度、有創意。

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

結合歷史病歷和從圖片信息，零一模型可以較好的完成對青少年心理健康水平解讀。并被中國頂級精神衛生醫院評價為：較準確。

（3）閱讀18萬字的報告集合，未遺漏重點

其他模型（左標黃圖所示）：無地緣政治風險。

零一模型（右圖所示）：英國脫歐導致索尼總部搬遷，導致索尼歐洲業務連續性受影響。

零一萬物 API 上線，用戶反饋多模態中文能力超過 GPT-4V

使用了 Yi 大模型API開放平臺后，現在，星云愛店的業務能力和用戶體驗明顯提升。

首先是復雜場景下多指令理解反饋高效精準。不管是學術研究還是為兒童青少年提供輔導，經常都會有“既要又要還要”的刁鉆需求，比如需要總結一系列文章核心觀點，并按照某一標準排序打分后進行語言翻譯，這是對模型的指令遵循、創意內容生成以及推理速度的綜合考驗。大董說：“Yi-34B-Chat-200K面對幾萬字的超長提示詞，10 秒鐘就反饋回來了結果，極大提高大家的工作效率。”

其次是長文本中“大海撈針”精確度優異，這讓星云愛店的產品可以在諸多文本分析與寫作平臺中獨占鰲頭。學術研究最難的并非找到1萬篇文獻的共同點，而是要在浩如煙海的文字中，找到可能會被前人忽略的關鍵信息。大董說，即使是做詩詞韻律相關的分析，在測試中發現 Yi 大模型都可以準確理解文獻表達的意思，很快抓住重點。30 萬字的處理能力者對于知識庫的分析整理很重要。Yi 大模型在語義理解、摘要總結等精確度等方面是他測試過的各類長文本模型里的領先者。

此外，不管是服務科研還是做心理咨詢，“靠譜”是最重要的品質。大董說，以心理咨詢場景為例，在線拒答率、回答文案的溫暖程度極大影響用戶體驗。零一萬物的API做到了靠譜且易用，這對一家業務正在持續增長，用戶規模不斷擴大的公司尤為重要。

而 Yi 大模型API開放平臺的“靠譜易用”，還體現在 API 接入的順滑程度上。星云愛店技術負責人劉亞光說，接入 Yi 大模型 API 代碼修改量極少，幾乎是分分鐘就可以搞定。

而用戶能擁有上述體驗則要源于零一萬物對 API 的優化，據零一萬物透露，為了提升 API 性能，零一萬物在 API 側進行了推理優化，因此 Yi-34B-Chat 系列 API 具備較快的推理速度，這不僅縮短了處理時間，同時也保持了出色的模型效果。此外，優化的 API 接口顯著降低了模型回復的延遲，進一步提高了用戶體驗的流暢性和響應速度。

同時，Yi 系列模型 API 與 OpenAI API完全兼容，只需要修改少量代碼，就能平滑遷移。

當然，目前看來 Yi 大模型 API 到底能不能與 GPT-4 Turbo、Gemini 1.5、Claude 3 這些模型的表現一較高下，還需要更多開發者一起考察。

據零一萬物技術副總裁及模型訓練 AI Alignment、開放平臺負責人俞濤透露，未來零一萬物將會持續為開發者提供更多更強模型和 AI 開發框架，讓大模型更好地完成落地，包括：

推出一系列的模型 API，覆蓋更大的參數量、更強的多模態，更專業的代碼/數學推理模型等。

突破更長的上下文，目標 100萬 tokens；支持更快的推理速度，顯著降低推理成本。

基于超長上下文能力，構建向量數據庫、RAG、Agent 架構在內的全新開發者 AI 框架。旨在提供更加豐富和靈活的開發工具，以適應多樣化的應用場景。

雷峰網特約稿件，未經授權禁止轉載。詳情見轉載須知。

0人收藏

張進

主筆

發私信

當月熱門文章