0
| 本文作者: 任平 | 2024-05-07 14:33 |

精準醫療,是以個體化醫療為宗旨的新型醫療模式。它考慮了個體在遺傳、環境和生活方式上的差異,通過基因組、蛋白質組等生命組學技術,結合多維度的生物大數據整合,精確發現疾病的檢測標志物和治療靶點。生物信息學是實現精準醫療有效落地的關鍵因素。然而,生物信息學企業的商業化并非易事。
它要求創業者不僅要掌握前沿的算法技術,還需在市場調研、數據合規性、數據安全、產品用戶體驗等多個維度進行深入的思考與積累。
張鑫磊博士,作為北京攜云啟源科技有限公司(下稱“攜云啟源”)的CEO,正引領企業在這一領域進行探索與實踐。
實際上,這家公司早在2018年成立,卻鮮少對外宣傳。
究其原因,是因為生物信息的商業化落地,絕不僅僅只是數據分析這一個環節,上游的生物樣本庫、專病數據庫如何建立,新發現的分子標志物和靶點怎么和下游的藥械 企業對接,整個過程實則環環相扣。
“真正的價值來自于技術的深耕和閉環的完善。只有當內部的數據流轉和分析能力形成一個高效、安全且符合臨床需求的閉環時,公司才算是邁出了生物信息商業化的第一步。”張鑫磊博士表示。
換句話說,這便是攜云啟源提出的“數據驅動的醫工轉化”模式。從一份血液樣本的管理,到臨床數據的整合,精準醫療數據的產生,再到疾病的檢測,整個流程都要參與進去,做一站式的服務。
張鑫磊博士之所以有如此的戰略眼光,實際上要追溯于他學生時代的研究經歷。
他的學術生涯始于南開大學物理學院生物物理專業,但他很快被生物信息學的魅力所吸引,加入了中國科學院生物物理研究所蔣太交教授團隊。在研究所讀書和工作期間,他參與了多項重要課題,包括基因組和蛋白質組的大數據分析平臺構建,以及流感病毒的監控和演化規律研究。
這些經歷為他日后的創業打下基礎,也悄然塑造了他的科研觀。
“生物信息學不僅是科研手段,我們開發算法更希望能夠解決一些與健康直接相關的實際問題,比如精準醫療和傳染病防控等。”
然而,即便擁有長期的學術熏陶和明確的創業愿景,他的團隊也不得不面對生物信息學創業的多重挑戰。諸如技術門檻高、數據獲取成本高與管理難度大、法規遵從性要求嚴格、市場教育需求迫切,將問題的出發點指向一處:組建一個包含生物學家、數據科學家、軟件工程師的跨學科團隊。
現在,隨著團隊建設、服務閉環和市場條件的逐步具備,攜云啟源已經為多家頂級醫院和國家臨床醫學中心建立了精準醫療數據基礎設施和臨床決策支持系統。在生殖衰老、過敏性疾病、自閉癥、兒童腫瘤等專病方向上,已建立國內最大、最全的樣本和數據庫資源,在數據源頭積累上也打造了難以被替代的競爭壁壘。
張鑫磊透露,作為一家AI醫療初創企業,在很快實現盈虧平衡之后,公司預計今年能實現近千萬元的利潤。但這并非終點,“長期來看,我們希望建立一個數據驅動的轉化生態系統。”
確切來說,這是一個系統工程,需要多方協作,正如攜云啟源上游有用于生物樣本存儲的低溫樣本存儲系統,下游動則有分子診斷和制藥公司協作,在一些專病領域中,也會通過將新標志物或新藥靶點專利授權給第三方機構,聯合開發產品。
術業有專攻,對每一個有共同愿景的合作伙伴保有尊重,已然成了當下攜云啟源的價值觀所在,以及商業模式能夠落地的基礎。
近期,2024年度「第二屆生物信息與轉化醫學大會」落下帷幕。本屆大會以 “人工智能時代的轉化醫學”為主題,由北京攜云啟源科技有限公司承辦,旨在促進臨床工作者與科研工作者的溝通與合作,加大科研單位、臨床醫院及生物醫藥科技企業間的有效聯動。同時,這也是打造數據驅動的醫工轉化生態的一次卓有成效的交流平臺。
借此契機,雷峰網與攜云啟源CEO張鑫磊進行了深入對話,以下為對話全文(經編輯):
雷峰網:世紀初,您本科從物理學轉為生物物理,又在博士選擇了生物信息學專業,為什么二換專業?
張鑫磊:我本科(2002年~2006年)是南開大學物理學院的物理學專業,但我在大二就轉到了生物物理專業。
主要的原因是在大一寒假,我閱讀了羅靜初老師翻譯的《生物信息學概論》,這讓我對計算生物學產生了濃厚的興趣。當時我個人認為,基礎物理學的研究已經達到了一定的高度,想要取得新的突破并不容易。
在生物學領域中,數學以及計算機技術的應用才剛剛起步。為了更加深入地從事這方面的交叉科學研究,我決定在碩士和博士學習期間(2006年~2011年)轉向生物信息學領域。
蔣太交老師2005年從麻省理工學院回國,加入中國科學院生物物理研究所,他是最早一批回國的生物信息學研究者之一。我覺得這是一個很好的機會,便與蔣老師進行了溝通。他也非常鼓勵具有數理專業背景的學生從事生物信息學研究,我就順利地加入了他的實驗室。
雷峰網:過去進行過哪些研究課題,它們如何塑造了您的專業技能和研究視角?
張鑫磊:在生物物理研究所,我參與了眾多課題,大致分為兩類:
一類是與我后來創業密切相關的精準醫療方向,即基因組和蛋白質組的大數據分析平臺的構建以及相關的算法研發。我們實驗室可以算是國內最早將人工智能算法應用于生命組學研究的團隊之一。
另一類是蔣老師團隊的代表性研究工作,即流感病毒的監控和演化規律研究。這部分雖然不是我牽頭的工作,但也積累了很多自主研發算法的經驗,實驗室的研究成果曾被評為“中國科學十大進展”之一,并榮獲中華醫學會的一等獎和二等獎。
通過這些研究我有兩個感悟,一是重視數據、二是重視應用場景。
對于我們這些專注于從事算法研究的人來說,算法本身更像是是一種技能,是相對而言更容易把握的一個環節,但對數據的把握能力往往更加關鍵。
國內真正的AI醫療場景落地,無論是公共衛生領域的傳染病監控,還是醫療領域的多項應用,都需要高質量的數據進行支撐,然而在數據管理基礎設施方面還非常薄弱,數據源頭的質量保障不足,導致后續開發的AI模型如空中樓閣,不能產生實際價值。
另一方面,我們在選擇課題方向時,可以有偏生物學機理機制的研究,也有偏應用的研究。我個人更傾向于開發算法應該能夠解決一些關乎疾病診斷與公共衛生的實際問題,比如精準醫療和傳染病防控等方向,這讓我更能體會到所從事數據和算法工作的目標,在過程中也更容易產生興趣和動力。
雷峰網:什么原因促使您在2018年創立攜云啟源,而非繼續在學術界發展?
張鑫磊:由于家庭的一些綜合原因,我沒有在博士畢業第一時間選擇出國。同時,我認為自己所從事的方向,是有很大的應用需求,所以覺得產學研轉化也是一條值得嘗試的路徑。2011年到2015年,我在中國科學院生物物理研究所工作,任助理研究員,這期間我參與了很多轉化方面的課題,與一些IT企業合作搭建生物信息平臺,嘗試生物信息學來實際應用中的各種可能。
雷峰網:公司自成立以來,有哪些重要發展階段和關鍵項目?
張鑫磊: 主要的里程碑事件包括公司2018年在北京的成立。不過最初的三年 ,我們是一家IVD企業的全資子公司。2021年12月,在母公司股東的支持下,我們進行了一次剝離,開始了獨立運營。我們也迎來了一個快速發展的階段,人員規模從最初的十幾個人開始擴充。公司獨立初始,也遇到了資金短缺的困難,感謝伽利略資本對我們持續的關注,在2022年3月獲得了種子輪融資,使得公司能夠順利啟航。2023年度的第三季度,我們完成了一輪由伽利略資本和零以資本共同領投的天使輪融資。盡管目前整個醫療創投行業,在前幾年的熱潮之后已經有所降溫,但我們依然獲得了新老股東的認可和幫助。
然而,作為一家數據公司,軟件產品本身只是對數據源頭進行質量控制的一個基礎,數據能否產生衍生價值,這才是最關鍵的。
我們參與的重要項目很多,目前已經與八十多家三甲醫院合作,建立了數百項精準醫療信息化系統。其中,我們與中日友好醫院、北京協和醫院、同仁醫院這三家醫院的合作中,更有代表性意義,我們不僅部署了平臺軟件,更從積累的樣本和數據中發掘出了新的疾病檢測分子標志物,這也是“數據驅動的醫工轉化”模式得到的實際應用和驗證。
此外,我們還承擔了一些具有里程碑意義的大型生物信息平臺項目,如“慧眼蛋白質組學大科學設施平臺”重要信息模塊的開發建設。這是由賀福初院士團隊牽頭的蛋白質組學領域的重點項目,平臺在推動基于蛋白質組學的精準醫療落地方面,打下了堅實的基礎。
雷峰網:能詳細介紹下你們的盈利模式和服務內容嗎?當算法、軟件系統以及一站式解決方案在內的服務,提供給臨床客戶時,帶來了哪些實際效果?
張鑫磊: 簡單來說,我們將目前的盈利模式概括為---“精準醫療信息化”。精準醫療數據與傳統的臨床大數據相比,更強調了隊列信息與生命組學數據的整合。
我們的服務是從樣本收集、隊列管理、實驗管理到實驗產生的生命組學數據的全流程管理和挖掘。主要分為兩塊:一是精準醫療數據的管理、二是數據的應用。
數據的管理,這是從“臨床樣本”到“專病隊列”的全生命周期。
在做法上,我們首先建立樣本庫,管理醫院中的血液、尿液、病理切片等生物樣本。然后圍繞特定的專病建立隊列數據庫,進而創建組學數據庫。
在數據不斷積累和挖掘的過程中,可以發現新的分子檢測標志物、數字標志物,和新藥的靶點。進一步就可以進行相關的成果轉化,包括開發試劑盒通過LDT的形式在院內開展檢測項目,申請體外診斷試劑的認證等。
總的來說,我們構建的是一個數據驅動的醫工轉化平臺體系,旨在通過數據管理和挖掘,推動醫療科技成果的實際應用和產業化。
雷峰網:你們為多家頂級醫院建立了精準醫療數據基礎設施和臨床決策支持系統。您能列舉一個最典型的案例嗎?
張鑫磊: 在與北京協和醫院婦科內分泌與輔助生殖中心的合作過程中,非常充分地體現了全生命周期的精準醫療數據管理與應用。
在與我們合作之前,該中心對女性生殖衰老樣本和數據的管理方式較初步,主要基于人工錄入數據表格的形式,效率很低。
經過與臨床醫生有效的溝通,以及持續的迭代開發。我們在中心不僅建立了高效的臨床樣本管理系統、多個跨中心的隊列信息化系統,還建立了用于進行輔助診斷的組學數據應用平臺。
在高質量數據匯集的基礎上,我們還拓展了合作范圍,與藥廠開展聯合研究。
以與揚子江藥業的合作為例,我們利用更年期專病數據庫對一款中成藥進行了療效評估和治療機制研究,為臨床醫生在藥物的合理使用方面提供了重要依據,也為藥廠帶來了新的研究視角和商業機遇。這個案例充分展示了精準醫療數據在有效管理之后,能夠衍生出來的應用價值。
雷峰網:你們什么時候開始向醫院推廣這些服務?
張鑫磊: 2018年和2019年,我們主要還是服務于科研客戶,但開始進行臨床市場的拓展。直到2019年底,我們才有了第一個生物樣本庫的臨床種子客戶。我們也越來越全面地了解了臨床的需求,逐步開始考慮如何規模化地向醫院推廣我們的產品和服務。
雷峰網(公眾號:雷峰網):你們在北京和長沙等地都設有辦公地點,能否說一下不同區域的功能定位?以及能否介紹一下公司團隊構成和專業背景?
張鑫磊: 目前我們在山東設有子公司,在長沙和廣州有分公司。北京的團隊成員構成比較綜合,涵蓋了各個部門,但IT工程師相對較多。此外,由于北京豐富的臨床資源,我們在這里與多個國家臨床醫療中心建立起了具有示范意義的合作。長沙團隊中90%的成員是生物信息工程師,專注于生物信息學算法和產品的研發工作。
CTO黃澤熾是生物學背景出身,憑借在算法方面的扎實基礎,獲得了2018年的全國人工智能金融算法大賽的個人冠軍,他選擇繼續在生物信息與轉化醫學領域深耕,于2019年初加盟了公司,負責團隊的研發工作管理。
生物信息主管蘇明明本科是電子工程專業的,博士畢業于協和醫學院。IT開發主管李紅磊則是從研究生階段才開始接觸生物領域的IT專家,參與了多個國家級生物信息平臺的直接開發工作。我們的技術團隊是一支將信息技術和生物技術充分融合的團隊,這支撐我們能夠在生物信息創業道路上走得更穩健、更長遠的重要基礎。
雷峰網:在國內外,還有哪些公司與你們在業務范圍上有所重疊?
張鑫磊: 這個問題非常好。我認為,我們與國內其他公司最大的區別可能體現在---我們能夠有效提供精準醫療數據的全流程解決方案。
例如,在臨床機構廣泛開展的生物樣本庫平臺建設過程中,有很多家提供低溫存儲解決方案的企業。但是,臨床客戶面臨的進一步問題是,除了購買超低溫冰箱進行樣本存儲外,在投入了大量的人力和物力之后,還需要考慮如何有效地利用這些樣本,發揮進一步的數據價值。
我們提供的不僅僅是基礎設施建設,更重要的是下游價值的實現,包括臨床科研、醫工轉化和輔助診斷等方面。我們現在與低溫存儲的龍頭企業海爾生物也是戰略合作方,在下游的數據管理與利用環節,提供完整的解決方案。
從全行業來說,實現數據驅動的應用轉化,從最初的樣本采集到最終的成果轉化,需要一個系統性的全流程管理。
瑞典私募股權基金Summa Equity收購了三家生信軟件公司:Pierian、Seven Bridges 和 UgenTec,將其整合成了新公司Velsera。
其中Pierian是美國基因組數據三級分析和解讀公司,主要集中在腫瘤方面,提供軟件平臺和知識庫用于出具臨床報告。
Seven Bridges提供了基因組及多組學數據分析管理的平臺。
UgenTec是一家比利時的公司,本質上提供了實驗室信息管理系統LIMS,為實驗室、化驗制造商和儀器合作伙伴帶來樣本流智能管理。
整個并購行為,從業務邏輯上體現了精準醫療數據全鏈條的重要性。如果鏈條中的任何一個環節上的銜接有瑕疵,整個數據的質量和完整性都無法得到保證。
雷峰網:相較而言,你們有哪些獨特優勢?
張鑫磊: 在技術層面,我們擁有強大的原創生物信息學算法和醫學信息學算法研發能力,同時也開發了生物醫藥行業內的首個低代碼軟件框架,這大大提高了我們的產品交付效率。
我們擁有BT+IT(生物技術+信息技術)交叉融合的豐富經驗,我們的IT團隊不僅要熟悉信息技術,還需要深入了解生物醫學和生物信息學的背景知識。
醫院客戶并不過分關注使用哪種IT技術或模型,他們更關心的是產品如何滿足他們的需求,解決實際問題。因此,我們的IT團隊必須深入了解臨床背景,以更高效地支持醫院的實際需求。
除了技術優勢外,我們還有資源優勢。
我們合作的伙伴包括在婦產、兒童、過敏、呼吸等多個領域的國家臨床醫學中心。通過與這些權威醫院的長期合作,以及國家臨床醫學中心的網絡覆蓋能力。在生殖衰老、過敏性疾病、自閉癥、兒童腫瘤等專病方向上,已經建立了國內最大的專病樣本和數據資源平臺。這是多年積累的結果,也是一個重要的先發優勢。
雷峰網:您是如何認識到生信領域背后的巨大市場潛力,并將其轉化為創業機會的?
張鑫磊: 在很多情況下,無論是在科研還是產業領域,生物信息學往往被視為一種工具。在科研中,它被當作數據分析工具使用;在產業中,它被用來提供科研服務。
生物信息學的創業,我認為關鍵在于時機。
在早期,由于數據產生的成本高昂,加上客戶對這一領域的認知并不充分,開展創業的可行性并不大。然而,現在情況已經發生了變化。在過去五年中,數據產生的成本降低了十倍以上,數據量激增。現在,每位患者都可以很方便地進行組學方面的檢測,而且很多檢測被納入到了醫保,因此總體上產生的數據量非常龐大。生物信息學真正獨立產業化的機會已經到來。
另一方面,從政策層面來看,生物安全法和遺傳資源管理條例的出臺,使得對遺傳資源進行高質量管理成為剛性要求。現在,市場和數據成為兩個關鍵點,政策導向促使大家開始重視這一領域。
我們公司一直以業務為導向,專注于做市場認可的事情。與其他很多AI+醫療企業相比,我們在繼續投入研發的同時,已經能夠實現盈虧平衡,并開始產生利潤。我們堅信,只要緊跟市場需求,即使過程中有些困難,也是正確的方向。這是我們一直以來堅持的經營信念。
對于公司的持續發展,我認為AI行業中曇花一現的企業太普遍了。很多企業在獲得高額融資后,長期來看也是難以為繼,根本原因在于缺乏被市場認可的產品,以及持續的盈利能力。
因此,對于想要長期發展的公司來說,關鍵不在于成為一時的焦點或所謂的“獨角獸”,而在于能否持續創造價值。
換句話說,我們是要追求短期的VC投資?還是真正想要建立一個能夠持續數十年、為社會帶來價值的企業?
對于攜云啟源來講,我更希望我們的產品和解決方案應該能夠解決實際問題,為我們的客戶在臨床應用中提供輔助診斷和醫工轉化的實際價值。只有這樣的價值才能支撐公司的長期發展。
否則,如果只是空中樓閣,僅僅賣出一個概念,即使VC提供了資金,但如果找不到持續變現的途徑,或者公司的業務與核心算法和數據并無真正的關聯,那么公司就會陷入一種表面上看起來很好,但長期發展仍然非常迷茫的狀態。最終,這樣的公司可能無法承受市場的檢驗,難以持續下去。
因此,我認為,能夠創造真正價值并得到市場認可,才是公司能夠持續發展的基礎。
雷峰網:當生物信息學與醫療健康領域深度融合時,對于有志于進入這一領域的企業來說,應該如何發揮作用?
張鑫磊: 我認為應該從算法和數據兩個角度來考慮。
首先,生物信息學是一系列通用的方法,但在醫療健康領域,存在許多具體的應用場景,不同的科室,甚至同一科室內的不同病種都需要具體分析和應用。
作為通用方法的生物信息學,在進一步深入到臨床場景中時,也應該注重細分的應用,因為一套標準化的算法很難適配所有的場景。不同的疾病、不同階段的需求都是不同的,從早期檢測到后期預后,需求各有差異。
因此,生物信息學與醫療健康場景的融合是必要的,但要實現良好的融合,就需要更深入地了解醫生的需求,理解不同環節的數據特性,并據此改進我們的方法。這是基礎性的工作。
從企業的角度來說,我們的角色肯定是創造價值,這就需要注重實際應用場景的落地。在落地的過程中,我們既要注重算法的本地化和細分化,也必須建立在數據質量的基礎上。
目前,許多企業和醫療從業者對數據質量的重視還不夠。很多生物樣本在采集后與臨床數據是脫節的,這樣的數據是沒有價值的。因此,我們特別強調要把握數據質量的源頭,這對于做算法的公司來說是至關重要的。
除了細分算法,我們還要提倡建立相關的數據標準,這對整個行業的發展將具有積極的推動意義。然而目前很多從業者,在這方面的意識還是比較淡薄。
雷峰網:鑒于生物信息學領域的快速發展,您預測未來幾年可能會出現哪些創新性的突破?這些潛在的進展將如何影響未來的醫療實踐和科學研究?
張鑫磊: 生物信息學是一個發展非常迅速的技術領域,它也會與數據產生的上游技術和設備緊密相關。
目前,測序成本已經大幅降低,這不僅包括基因組數據,還包括蛋白質組、轉錄組和微生物組數據。隨著數據量的增加,我們將看到更多的應用場景落地,這將涉及到多組學數據的整合,以及多模態數據的融合,包括臨床數據和影像數據等。
這種更高維度、更高質量的數據整合將為精準醫療帶來更多的可能性。
過去,由于測序成本較高,我們可能只關注單一組學的檢測,這實際上是非常有限的。未來的精準醫療將不可避免地涉及到多組學和多模態數據的綜合應用。
其次,在精準醫療數據檢索和產品形態方面,大模型技術的影響也將日益顯著。
我特別強調的一點是,當前醫院在轉化醫學研究方面的趨勢。盡管新技術層出不窮,但臨床科研的趨勢越來越傾向于成果能夠轉化為實際應用,而不僅僅是基礎機制方面的研究。
因此,我們也在與Olink(蛋白組學公司)進行密切的技術合作,構建實驗與計算技術的結合,拓展蛋白質組學層面上的診斷標志物發現。
雷峰網:作為北京攜云啟源科技有限公司的領導者,您對公司的未來發展有何規劃和愿景?同時,您認為公司目前面臨哪些挑戰和待解決的問題?
張鑫磊: 短期內,我們希望盡可能提高在精準醫療信息化領域的綜合市場占有率。
這里所說的“綜合市場”實際上涵蓋了科研、醫療和公共衛生三個方面。我們所指的醫療市場與傳統的醫療信息化有所不同,我們更側重于精準醫療,建立臨床隊列和生命組學數據庫,我們在這一領域的工作已經非常深入。
在科研領域,我們會廣泛參與到十四五期間的生物計算大型信息化設施的建設。在公衛領域,我們關注的是智慧疾控,這不僅僅是記錄疾控系統的檢測結果,而是要利用病原體和宿主的基因序列,結合生物信息學方法,實現對新發和突發傳染病的監控與預測預警。
我們即將推出的基于大模型的精準醫學智能化數據分析平臺,將大大降低生物信息分析和精準醫療應用的門檻,可以實現根據用戶的問題和數據自動從海量的分析工具和數據庫中找到合適的工具和數據完成分析或給出建議。
我們短期的目標是成為精準醫療信息化市場的領導者。我相信只要我們按計劃推進,這個目標是可以實現的。
長期來看,我們希望建立一個數據驅動的醫工轉化生態系統。
我們在多家臨床機構進行了信息化平臺的建設、維護與運營,旨在促進精準醫療數據的轉化應用。這是一個系統工程,需要多方協作,不僅僅是我們一家能夠完成的。上游有低溫存儲、檢測設備方面的合作伙伴參與,下游則有分子診斷和制藥公司與我們協作,我們希望做成一個能夠銜接上下游的關鍵紐帶。
這需要一個廣泛合作的體系來共同完成,這也是我們舉辦本屆“生信與轉化醫學大會”的初衷。
雷峰網:與2023年舉辦的第一屆大會相比,今年的第二屆有哪些不同之處?未來是否有進一步調整?
張鑫磊: 這次大會最大的不同是,我們有大量臨床機構的參與。
從主辦方的角度來看,第一屆主要由中國生物物理學會生物醫學信息分會牽頭,更側重于科研方面的主題報告。
而第二屆大會則由學會、醫科院腫瘤醫院、農工黨北京市委三方聯合主辦,充分體現了生物信息與臨床醫學的融合。
分論壇的設置也不同于以往,不再以單純的技術命名,而是加入了大量臨床相關的關鍵詞,如“傳染病”、“臨床隊列”、“慢病與衰老”等。
未來,我們的主辦方結構將保持不變,生物醫學信息分會將與不同的臨床機構進行合作,面向新的轉化醫學主題。在保持現有規模的情況下我們希望一步一個腳印的穩步發展,爭取辦成業內具備一定影響力和品牌力的大會。
本文作者 吳彤 長期關注人工智能、生命科學和科技一線工作者,歡迎同道微信交流:icedaguniang
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。