0
| 本文作者: 任平 | 2023-09-13 10:01 |
在今年幾乎所有企業都卷入AI大模型這場豪賭時,騰訊健康在做什么?
在西南邊陲的貴州黔南州,與IT伙伴深耕遠程醫療,打通五級行政區劃的分級診療機制;在醫藥醫械流通環節追求降本增效和透明規范的現況下,與物聯網伙伴建立數字鏈路;在國產傳統醫療器械巨頭轉型路上,將AI技術與大數據優勢與體外診斷融合創新,讓智慧大腦進入臨床。
一些聲音認為,騰訊健康的故事沒有新意。當大家都在玩AI大模型時,它還拉著合作伙伴推敲醫療行業的“郁結”。
騰訊健康沒有壓力嗎?
騰訊健康總裁吳文達在和雷峰網(公眾號:雷峰網)聊起時明確表示,他也在使用AI大模型這種新技術,并對其感到興奮。但同時,他也想說明,騰訊整體都對大模型相對克制。“我們更關注如何在真實世界的醫療場景,用起大模型,用好大模型。”
拿醫院來說,院方更在乎數據隱私,騰訊健康完全可以將千億級參數的醫療大模型封裝起來,從而實現醫院本地部署,但會耗費大量的資金和人力資源,因此許多醫院可能無法承擔這些成本。即使能夠承擔,也存在其他現實的限制,例如難以招聘和保留高素質的數據科學員工、承擔后續的維護費用等。
騰訊健康選擇的是另一條路:將大模型這種生產工具封裝在不同的業務和產品中,再輸送給ISV(獨立軟件開發商)這類合作伙伴。
正如去年騰訊從集團層面明確從“集成商”到“被集成者”的戰略轉變:由合作伙伴擔任直接服務客戶的界面,騰訊的自研產品能力作為其中一環嵌入整體解決方案之中。
經過一年的實踐,騰訊依然是讓伙伴“唱主角”,相對應的是,自己在交互體驗和場景挖掘方面有近乎極致的追求。
“這個場景非大模型不可?老年患者該怎么用大模型?大模型的延遲響應控制在多大尺度?具體到某一區域里的醫療機構能否支持接入......”
騰訊在醫療領域的野心,是愿意花費精力、下大注的。
從過去以深度學習為代表的人工智能,到醫療大模型為代表的人工智能,如何為生命健康服務,一直是最性感的課題。
不久前雷峰網對話北京一所三甲醫院院長時,對方談到,目前醫療大模型的應用面臨著兩個根本限制:人類對醫療大模型秉持著比人類更嚴格的錯誤容忍度、人類無法對醫療大模型追責。
這要求企業在打造基礎大模型及行業大模型時,必須做好萬分準備,以“技術底座”、“增程器”、“革自己的命”的標準要求自己。
9月8日,騰訊健康正式公布,基于騰訊自研的混元通用大模型,打造了面向醫療行業的專屬大模型,并對騰訊健康中的智能問答、家庭醫生助手、數智醫療影像平臺、藥物發現平臺等多個AI產品做出了新一輪升級。
騰訊杰出科學家、騰訊天衍實驗室主任鄭冶楓介紹,團隊在打造醫療大模型中分為四步。

騰訊杰出科學家、騰訊天衍實驗室主任鄭冶楓
首先,以自研“混元大模型”為基座模型,目前這一通用大模型達到超千億參數規模和超2萬億tokens預訓練語料,并加入大量醫學專業數據,比如中英文的醫學文獻、百科全書、藥品說明書,以及騰訊醫典上的醫學專家撰寫且多輪校對過的文章等。
第二步,在基座模型基礎上,持續加入天衍實驗室過去這些年來積累的知識圖譜,其中涵蓋285萬醫學實體、1250萬醫學關系等結構化數據。
通俗點說,每個實體代表一個概念,如一種藥或一個疾病;每條關系代表一個知識點,如某種藥能治某種疾病。因此該知識圖譜的覆蓋率和準確率均非常好,基本覆蓋98%的醫學知識,使大模型進一步掌握專業的醫學知識。

騰訊醫療大模型預訓練階段的數據來源
鄭冶楓表示,“以上兩步中提到的無結構和結構化數據,保證了混元大模型也能進行基礎的醫學邏輯推理,但到這只是完成了一半,最終模型是在對話中輸出能力,所以后續著重用了‘問答對’的形式做訓練。”
據悉,問答對這一類型的數據,有三路來源:
一是患者場景,包括線上問診、醫學問答、導診、預問診;
二是醫生場景,包括醫學考題、病歷生成、出院小結、檢查建議、診斷數據和用藥建議;
三是與藥企合作建設的藥品知識庫等,總計約3000萬個問答對。
這是什么概念?打個比方,關于ChatGPT使用了多少對話數據,沒有官方答案,據網傳消息,2020年發表在ACL會議上的一篇論文中,研究者使用了650萬條英文對話數據和300萬條中文對話數據,相比之下騰訊的醫療大模型是其3倍多。這也從側面體現出騰訊健康多年來建設醫療生態的價值。
最后一步,則是引入人類專家完成強化學習訓練。為了增加答案的多樣性,團隊在設計之初規定,大模型可以輸出5種不同的答案,并請專家對這些答案進行準確度、患者關懷等打分(0-9分),最終使用了這些專家打分的數據來訓練一個獎勵模型,并將強化學習機制融入到大模型中。
據悉,騰訊健康所使用的由專家醫生的標注數據達到36萬組,保證了騰訊的醫療大模型在處理醫療需求時更專業、精準,同時也兼顧了患者關懷,更接近人類醫生。
鄭冶楓舉了幾個例子,嘗試說明對比通用大模型,騰訊醫療大模型更懂“醫”:
對“小孩細菌性感染肺炎”的患者主訴,通用大模型會建議到“兒科”或“呼吸科”就診,但是騰訊醫療大模型會更細致地給出“小兒呼吸內科”的推薦。
另一個更直觀的例子是,模擬人類醫生問診。如ChatGTP等通用大模型只會按照患者提問給出對應的回答,并不會主動提出問題,在處理如“打完新冠疫苗第一針第二天得了急性咽喉炎怎么辦?”這種問題時,往往只會一本正經地分析病情,然后建議盡快就醫。
但其實,人類醫生處理類似問題時并不會直接給出答案,而是追問癥狀,進一步排除可能性較低的疾病。騰訊醫療大模型就很好地實現了這一點,通過多輪提問推導出患者的癥結所在。
正如今年世界人工智能大會上,不少人在談及大語言模型時提到,醫療是一個極為嚴肅的領域,需要精準的判斷并給出支撐判斷的證據,不能像通用語言模型那樣給出一個模棱兩可的答案,或者堆砌答案。反而是,這需要醫療大模型在結論精度上進行提升,給出精準的決策及建議。
這半年多以來,隨著大廠博弈、中小企業的入局、以及投資和科研界的落地探討,都一致認為:卷大模型沒有意義,卷應用機會更大。
據不完全統計,目前在醫療領域,從醫學科研、藥物研發、智慧診療、醫療設備運維、醫院管理等,國產大模型產品數量不少于40個。如今,騰訊的醫療大模型也已就位,幾乎可以肯定,醫療診療、健康管理的能力邊界將進一步擴大。
騰訊杰出科學家、騰訊天衍實驗室主任鄭冶楓介紹,騰訊醫療大模型的能力包括,文案生成、智能問答、病歷結構化和檢索、影像報告、輔助診斷等,可嵌入醫療環節全流程。
放在醫療場景里看,則是就診前的智能院務客服、科室導診、醫生推薦、預問診;就診過程中的醫患對話、病歷自動生成;就診完成后的隨訪管理、患者檔案流轉到體檢機構等服務。

騰訊醫療大模型的應用場景
這符合騰訊健康總裁吳文達對大模型的觀點,即“用起來”才能體現醫療大模型的價值。
想象一下,日接診量超5萬人次的醫院,當醫生忙碌或者休息時間,一個“AI護士”就能7x24小時答疑解惑,引導患者正確就醫;
基于大模型的能力,輔診產品學習百萬級醫患對話及3000多疾病推演解析,實時給出有執行依據的輔助診療,自動生成更符合書寫規范的病歷等等。
這是一個雙贏的局面:大模型最直觀的幫助是緩和醫生文書管理的壓力。醫護人員可得以將更多時間用于關愛患者,還能在親自從事護理時獲得更高的成就感。
而對于不太適應數字化操作的用戶,一個實例,上海仁濟醫院已經率先運用騰訊醫療大模型,推出“適老化服務”,打造高度擬人化的虛擬數字形象“小威護士”。
再比如,對于醫療資源不夠充足,全科診療能力受限的基層鄉村醫生,騰訊與中邁醫療從2015年開始,一起將貴州黔南州龍里縣作為試點區域。最近,基于大模型的騰訊導輔診AI,已經成為龍里縣50多家村衛生室、近200位村醫的日常工具,并且被納入貴州省黔南州遠程協作的標準作業規范。
借著微信的連接能力,醫療大模型還會進一步深入基層。
在這次峰會上,騰訊健康披露了全新的產品“家庭醫生助手”,醫療大模型不光可以輔助家庭醫生與居民展開對話,還可以變成醫生隨訪的智能工具,生成不同的分類標簽,幫助家庭醫生分類管理患者。此外還可以將患者檔案進一步擴展到綜合醫院體檢和體檢后的場景中。
不難發現,對于醫療行業而言最大的感受是,如今的醫療大模型技術代表了一種技術的相變:以前,醫療服務被凍結在單個醫療體系里,而現在它已經融化成水,可以流向任何地方。
吳文達指出,醫療健康的數智化升級已從“先行先試”,轉變為“全面擁抱”,人工智能及各類數智化工具的應用將加速普及。
他指出,當前最應該關注的是能帶來醫療行業質變的技術突破,比如X光的發明催生了醫學影像行業、抗生素的發明促進了外科手術普及、人類基因組計劃開啟了基因編輯技術等,“如今大模型技所具有的生成能力,很大程度上將是醫療行業變遷的前兆。”

騰訊健康總裁吳文達
在初見醫療大模型的紅利上,智慧化技術+細分場景服務的組合,帶來的是短時間極強的認知占據,隨之而來是長期對生態發展的奠定。
因此,對于做醫療服務的企業而言,大模型是一個極好的復盤機會。從去年通過多維度調整,騰訊曾明確CSIG(云與智慧產業事業群)搭建的數字化平臺,不會做定制部分,而是提供靈活的平臺能力與標準件,讓交付團隊與客戶內部研發團隊去使用平臺。
透過今年生態大會,我們能明顯看到騰訊健康這一板塊的覆蓋面越來越廣,場景越來越深,能力越來越強,很大程度上將成為醫療行業伙伴破局的“尖刀”。
騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生認為,企服賽道周期比消費互聯網賽道周期長很多,可以堅持十年二十年,但這個領域內的企業客戶是一個一個贏回來的。
騰訊定位為平臺軟件廠商,選擇的路徑就是打造具備技術含量的產品,以產品為載體,凝練行業信任。
站在合作伙伴的視角上,為什么愿意和騰訊健康走在一起?
在此次騰訊全球數字生態大會舉辦之前,雷峰網走訪了一家與騰訊同行八年,只做一件事的合作伙伴:中邁醫療。
騰訊和中邁的合作要追溯于2015年。
這一年,兩家公司選擇在貴州黔南州的龍里縣試點,試試能不能把這個大山里的醫療信息化拉通。
中邁主要負責提供系統建設,包括全場景專科協作、遠程診療、智能導診、云HIS系統、電子病歷等醫療IT系統,以及醫療設備連接集成等。同時,中邁還深度參與了龍里縣的數字化分級診療機制的規劃方,聯合騰訊健康在龍里縣打造“互聯網+醫療健康”的智慧醫療生態。
騰訊則提供醫療AI軟件產品、以及微信公眾號、小程序,會議、直播、文檔、云技術等非醫療業務。因此,騰訊可以把技術產品通過公有云或私有化部署以提供多樣化服務,也可以讓中邁將數據放到云端存儲,并承擔IT基礎運維保障。
中邁在早期嘗試引入美國HIE標準,最終失敗告終。實際上,到目前為止,達到HIS七級(最高級別)的全國只有14家醫院,而達到中國互聯互通五級測評的也只有30家醫院,證明這條路徑在中國難以復制。
而后,在與騰訊的合作中,兩家公司另尋了“區塊鏈+專用醫療終端”的方式,將醫療數據的互聯互通成本降低到10萬以內,使得政策的制定和實施變得更加容易。
在溝通中,中邁創始人林子牛多次強調這一點,“技術模式要可行,成本要能夠讓各方接受,最后才能解決商業模式的問題,更多醫院愿意來買單。”
從2015年以來,從頭建成大范圍的數據互聯互通,兩家企業用了四年,再到建立每級醫療機構執行的常態化的合作機制,又用了三年。直到今年5月,“龍里經驗”升級為“黔南模式”,將進一步在黔南州、貴陽市、畢節市三地推廣數字化分級診療。
最新的進展是,基于大模型的騰訊導輔診AI,已經被納入貴州省黔南州遠程協作的標準作業規范,融入當地多年打造的數字化分級診療體系,嵌入基層醫生診療系統,同時結合專家遠程指導,讓基層醫生“能看病、敢看病”。

中國最基層,村醫帶AI問診、導輔診工具上門看病
從非醫療產品的支持,到如今醫療大模型的嵌入,騰訊健康用八年證明,醫療行業存在一系列重要的基建工作、倫理工作、以及該如何權衡企業利益與社會利益的關系。
回想2018年的生態大會,騰訊曾啟動第三輪組織架構調整,成立云與智慧產業事業群(CSIG),意味著騰訊以此為起點,將自身云計算、大數據、人工智能等技術優勢賦能智慧醫療。這被視為騰訊健康的一次重要轉身。
如今五年過去,騰訊健康業務作為其中重要一環,深度參與了更多企業的數字化轉型中:
愛創科技的溯源技術保障藥械流通安全,并拓展增值服務空間;
邁瑞等醫療器械龍頭的轉型,打通軟硬件一體化運營;
丁香園對醫患群體的服務和連接能力,將為“治病為中心”轉向“以健康為中心”的醫健轉型提供落地場景;
神舟醫療與騰訊為基層醫院提供數字診療聯合方案,促進醫療資源下沉,減少區域間不均衡。
在走向數智醫療星辰大海的路上,他們終將迎來自己的黃金時代。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。