0
進入到 2022 年,生物科技領域動態不斷。
僅過半個月,有 4 家生物科技相關公司被同一家企業投資;不僅如此,它所投的項目在《麻省理工科技評論》(MIT Tech Review )的十大突破性發明“AI 新藥發現”板塊占比過半……
這些動態的背后,都離不開一家互聯網巨頭:百度。
對于鮮少關注醫學領域的人來說,很難將百度和生命科學進行聯系,但從其近年來的種種舉措來看,在生命科學領域,百度正“悶聲干大事”。
對外界而言,百度 AI 落地最廣為人知的場景在于自動駕駛領域,即百度 Apollo,但對于百度而言,其 AI 的野心并不止于此——對于生命科學領域,百度同樣想吃下;不僅因為這是一個極具前沿性的方向,而且關系到李彥宏“最初的夢想”。
大約在 20-25 年前,李彥宏就對生物信息學挖掘人體秘密充滿興趣。
早在 90 年代,李彥宏在華爾街時便申請過生物信息研究相關的工作,據說當時已經拿到世界頂尖生命科學研究機構的 Merck(默克集團)的 offer。
不過,在他看來,當時的基因測序技術還非常初級,生物數據量和數據質量也不足以發揮計算的優勢。
“如果那么多從事生命科學的人都不相信計算機能夠對生命科學產生重要影響,那么靠我一個人力量恐怕也很難推動”,李彥宏事后回憶。
后來的事情也不難得知,李彥宏回國創立了百度,而后百度又在 AI 上迅猛發力,并在包括智能駕駛等領域進行落地實踐。
但對李彥宏來說,他始終沒有放下對生命科學的向往。李彥宏曾多次在公開場合提到計算機技術與生命科學相結合的可能性。
在他看來,基因測序是 IT 領域之外另一個高度契合摩爾定律的領域。“每隔 18 個月,計算機的計算能力提升一倍、成本下降了一半,經過幾十年這樣的速度發展,很多原來覺得不可能的事情變可能了”,李彥宏表示。
從基因測序的發展來看,的確如此。十幾年前,基因測序需要花費 10 億、20 億才做出來。如今,每個人的基因測序只需花費 1000 美元左右。
即使當初想投身聲明科學的“夢”被暫時擱置,但在很長一段時間里,李彥宏一直在嘗試推動互聯網技術和生命科學的結合,曾個人捐資 3000 萬元與協和合作抗癌項目;跨界參與完成醫學研究論文等。
2020 年 5月,李彥宏與其它學者共同研究的關于食管鱗狀細胞癌的論文在權威醫學期刊 Cell Research 雜志發表,題為《Whole-genome sequencing of 508 patients identifies key molecular features associated with poor prognosis in esophageal squamous cell carcinoma》。
除了李彥宏親自上陣的種種舉措,百度還在內部設立了一家 VC 基金——百度風投(Baidu Ventures),其中一大重要投資版塊便是生物智能。
據不完全統計,百度風投過往投資的生物計算相關企業超過 50 家,涵蓋 AI 藥物發現、多組學數據、分子影像等諸多領域。
在多年的積累沉淀下,百度在 2020 年 1 月疫情爆發時就能夠在第一時間開放線性時間算法 LinearFold——借助這一算法,疾控部門用 10 小時便完成了四個樣本的全基因組測序。
隨后,百度研究院又推出全球首個專門優化新冠病毒 mRNA 疫苗基因序列的高效算法 LinearDesign,可在 11 分鐘內完成序列設計。
或許是新冠疫情的爆發讓百度更加認識到互聯網技術和生命科學結合的重要性,在 2020 年 8 月,百度研究院宣布成立生物計算實驗室。
百度期望通過 AI 和計算技術,深化學術界和生物制藥企業的合作,探索基因、DNA、RNA、蛋白質分子結構等人類生命密碼,縮短新藥研發周期,降低新藥研發成本,提升藥物和疾病匹配的精準度,發現基因和疾病的關聯關系,從而實現精準醫療。
僅僅過了 1 個月,百度就成立了一家名為 "百圖生科"(英文簡稱為 BioMap)的生命科學平臺公司——李彥宏作為牽頭發起人,擔任該公司的董事長,原百度風投 CEO 劉維擔任 CEO。

雷峰網注:圖為劉維
值得注意的是,百圖生科成立初期,李彥宏并未以個人股東的身份出現。直到 2021 年3月,李彥宏才通過直接和間接方式持有百圖生科 40% 股份,成為名副其實的幕后掌舵人。
這意味著,在扎根互聯網 20 年后,百度正式向生物科學進軍,尋求 AI 落地的另一站,而李彥宏也重新踏上了逐夢之旅。
“這些年,我對挖掘人體數據、探尋疾病規律、找到新藥設計的熱情一如既往”,在 2021 年的生物計算大會上,李彥宏坦言一直在密切關注生物計算行業的變化。
盡管 20 多年前未能圓夢,但隨著生物計算發展十分迅速,產生的大量數據(包括基因組學研究帶來的人體數據、新藥研發過程當中所累積的知識、以及新生的各類機器學習算法等)為認知復雜的生命系統打開了新的大門,也給計算技術帶來了新的用武之地。
知名咨詢公司埃森哲(Accenture)曾在預測報告中指出——到 2026 年,大數據與醫學和制藥領域的機器學習相結合將產生每年 1500 億美元的驚人價值。
可見,生物計算是一個前景遼闊的領地。李彥宏也堅定認為,生物和計算的融合會帶來巨大的突破和進步。因此,百圖生科的業務發展規劃也始終圍繞這個核心展開。
雷峰網了解到,百圖生科的業務發展分為兩個階段——
第一個階段:利用前沿 AI 技術構建完整的生物計算平臺,并與提供新的數據軸和新的數據分析、藥物設計工具的初創企業與研究機構攜手,構建生物計算生態,為生命科學企業和科研用戶提供豐富的工具能力和完整的解決方案,做好服務。
第二個階段:深度參與或主導發起新型精準藥物和精準診斷產品的研發,攜手合作伙伴,為社會貢獻極具創新性的精準生命科學產品。
不僅如此,百圖生科還計劃大力投入關鍵底層數據設備和計算技術的研發,加速高通量類器官芯片、高分辨物質觀測設備、新的組學采集分析設備、蛋白質模擬和生物計算專用芯片的研發。
這并非易事。
僅是 AI 制藥,就需要突破三大技術門檻,包括高性能的生物計算引擎、干濕一體的生物數據生產能力、靶點挖掘 — 藥物設計全流程的閉環能力。
“這是一個新興的行業,沒有一個成熟的解決方案可以直接套用”,百圖生科首席 AI 科學家宋樂說道。
宋樂進一步向雷峰網解釋道,要用 AI 發掘新藥有三個問題需要提前考慮:
一是了解復雜疾病的困難。
二是對多維度、多尺度的數據進行復雜且多樣化的融合處理,包括基因層面的基因測序、表觀組,蛋白質表達、蛋白質代謝,組織層面、機理層面等。
三是行業配合問題。數據分析與實驗往往是兩波人,他們之間的溝通缺乏一個非常高效的系統,將預測、模型輸出和試驗系統進行整合。
不難想見,即使背靠百度這座大山,百圖生科依然步履維艱;畢竟,其要駛入的,是一片無人區。
而百圖生科,僅剛剛開始。
公開資料顯示,百圖生科將與百度底層深度學習算法平臺飛槳建立深度戰略合作,飛槳將為百圖生科提供 AI 底層技術和開發工具。同時,百度作為善于處理海量數據、知識圖譜,具有巨型數據中心布局的 AI 平臺公司,預計也將在底層架構上與百圖生科產生協同。
從全球市場來看,企業耗費巨資建立研發中心的大研發模式已成過去。近年流行的趨勢是 VIC 模式,即 “VC (風險投資)+IP (知識產權)+CRO (研發外包服務)” 相結合的新藥研發模式。
在此模式之上,百圖生科提出了“VIP”模式,即利用資本(Venture)+自行參與打造 IP + 生物計算及智能實驗平臺(Platform)加速藥物和診斷管線的 IP 生成和轉化——這或將成為百圖生科生物計算平臺的核心價值和盈利來源。
雷峰網(公眾號:雷峰網)了解到,百圖生科有獨立的投資部門 BioMap Ventures,其前身是百度風投的生物投資團隊,目前在全球已投資了超過 50 家早期企業。

除了聯合生態合作伙伴,百圖生科還在不斷招兵買馬。成立初期,百圖生科就宣布兩項領軍人才招募計劃,將分別用 100 萬美元年薪及 100 萬人民幣年薪招兵買馬。
值得一提的是,去年加入百圖生科擔任首席 AI 科學家宋樂就是世界知名的機器學習專家,他曾在 CMU 從事生物計算相關的研究,利用機器學習技術對靶點挖掘、藥物設計取得了一系列突破性成果,獲得 NeurIPS、ICML、AISTATS 等主要機器學習會議的最佳論文獎。
2021 年 5 月,百圖生科還推出了“免疫圖譜卓越計劃”。百圖生科提供自身研發的核心生物計算引擎、海量自有數據、10 億元的資金補貼,與生態聯盟合作伙伴共同推動免疫圖譜的繪制,系統探尋癌癥、自免等疾病的復雜免疫規律,進一步提高對應的靶點挖掘和藥物設計效率。
截至 2020 年 7 月底,首批“卓越計劃”就已收到來自中科院、協和、北大、清華、復旦等系統的近百個臨床和研究團隊的申報。
不僅如此,百圖生科目前也在自建實驗室,從而全流程系統化地解決和提高行業的運行效率。
據悉,通過利用自己構建的生物計算平臺和大規模預訓練模型,百圖生科成功將典型蛋白質結構預測時間,從 30 分鐘縮短到 5 分鐘以內。
在不斷地發展布局下,百圖生科在去年 7 月拿到了上億美元 A 輪融資,GGV 紀源資本領投,百度、君聯資本、藍馳創投、真知資本、襄禾資本跟投。據了解,這輪融資還將用于技術研發和人才引進。
如果僅從百圖生科的成立到發展的周期來看,其時間長度僅一年有余,但實際上,百圖生科其實是李彥宏和百度在生命科學領域多年積累的匯聚,是百度 AI 落地的另一站,也是百度開啟生物計算的新通道。
這是一條道阻且長的道路,李彥宏同樣深知,他表示——
“生命科學沒有盡頭,只有盡力”。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。