1

在醫學領域,人工智能應用于哪些領域?
對此,斯坦福大學生物醫學信息學負責人Russ Altman博士認為,“機器學習和神經網絡在發現大型生物數據庫的規律時是非常有用的。”
那么,數據充裕的地方,人工智能才有可能插足。目前,醫學領域中,AI涉足最多的幾個領域包括:
精準醫療:基于“組學(omics)數據”,包括基因組學、基因轉錄組學、蛋白質組學、代謝組學等。
輔助診斷:基于病歷、文獻等醫療大數據。
藥物研發,解決藥品研發周期長成本高的問題。(AI在藥物研發環節能做什么?雷鋒網之前曾有對此的盤點:《AI加速藥物研發過程:從7000874個小時變成幾天》,這里不再贅述)
醫學影像識別:基于大量的影像數據。
除此之外,還有人工智能與可穿戴設結合,進行個人健康數據預測和管控疾病風險。本文主要討論精準醫療、輔助診斷、醫學影像識別三個比較熱門的領域。
隨著基因測序成本呈超摩爾定律的勢態發展,基因行業出現了這種狀況:基因信息冗余、解讀速度跟不上。與數據有關的工作包括:數據庫的搭建,基因數據處理,基因數據的智能化解讀,在這個領域,不同公司切入的角度不同,但終極目標是相同的:讓基因組與表型組/疾病組對話。
在該領域中,夢想最雄偉壯闊的當屬這家公司。
尋找碳基生命的硅基未來。
這是成立半年估值超過10億、躋身獨角獸行列碳云智能打出的口號。這家公司想要涉足組學領域的各個層面:基因組、轉錄組、蛋白組、代謝組、免疫組。
具體來說,碳云智能想要做的事情是:
人體數字化:關于人全局的數據化生命,從靜態到動態數據,再到行為和社交數據等。
人工智能化:解決不同問題的應用,各種各樣的信息化分析。
網絡化:所有數字生命網絡化,形成互聯網體系平臺。
換言之,碳云智能想把人體徹底數據化,這其中,人工智能是其神經系統。而這正是人工智能在醫療領域的終極目標。2017年1月5日,碳云智能發布了覓我平臺,用于獲得人體各方面精確的量化數據,在其發布會上,公司CEO王俊說道“碳云智能未來20年要做的事就是理解生命本身”,也就是說,這個宏偉藍圖的實現可能要等20年的時間。
國內其它初創公司則扎根一個環節,將其AI技術應用于遺傳病診斷、消費級基因檢測服務、腫瘤檢測等領域中。
2016年4月,北京金準基因科技有限公司,發布了遺傳病智能化解讀系統——明鑒系統,該系統的主要操作過程為:
樣本收集,DNA提取和處理,然后測序,或者進行一些實驗操作之后,對詞其數據進行分析,后由專家團隊根據數據分析結果進行疾病關聯性分析,最后出報告進行遺傳咨詢。
在構建過程中的難點是癥狀關聯性分析,核心是數據庫。在數據庫方面,每家公司的打法不同。據雷鋒網所知,金準基因選擇了中文人類表型標準用語聯盟(CHPO);而塞福基因,推出據稱是國內首個聚焦于全基因測序數據實現疾病精準診療的解析工具,用64名博士耗時兩年時間構建了一個疾病、基因、藥物關聯數據庫。
近些年來,國內消費級基因檢測服務也風靡一時,目前基因檢測主要的依據來自于科學研究文獻,但相關知識、數據積累不夠,檢測分析結果跟事實并沒有百分百的對應關系。業內人士曾對雷鋒網說道:
每個公司從自身的算法模型分析數據,不同公司的解讀報告不一樣,相當于看問題的維度不一樣。不同公司的準確性沒法比較,而且其自身本身沒法量化,但我們背后的數據是一樣的,只是解讀的方式不一樣。
2015年,藥明康德旗下明碼生物科技為英國國家基因組計劃提供罕見病及癌癥臨床數據解析服務,明碼生物科技已經可以實現從測序到數據存儲,再到數據解析一站式的服務。
2014年10月成立的奇云諾德,構建了一站式生物信息大數據平臺,包括基因數據發動機、大數據挖掘軟件、數據可視化工具以及訂制化流程。
對于整個基因數據解讀行業來說,目前通用的挑戰如何實現資源共享建立完整的實效性強的中國人基因數據庫,如何制定行業的標準、以及應該投入多少人力財力到基因數據解析工作中等。
2016年底,百度研究院大數據實驗室高級數據科學家沈志勇在介紹百度大腦時說道:
據權威機構預測,2017年數據生成和共享速度將增長至1200.6億GB/月,2020年人類產生復制的醫療數據總量達40萬億GB。
2016年10月,百度發布其“百度醫療大腦”的首個產品化項目,其工作過程具體是這樣的:
“百度醫療大腦”是通過海量醫療數據、專業文獻的采集與分析進行人工智能化的產品設計,模擬醫生問診流程,與用戶多輪交流,依據用戶的癥狀,提出可能出現問題,反復驗證,給出最終建議。在過程中可以收集、匯總、分類、整理病人的癥狀描述,提醒醫生更多可能性,輔助基層醫生完成問診。
在這方面,百度具有兩大優勢:
數據優勢:百度自身擁有龐大的醫療數據庫
技術優勢:可進行細分:如圖像識別、語音識別、機器學習等技術分支。
相對于百度來說,國內其他初創公司在數據來源與發展路徑上均有不同。
2015年成立的公司大數醫達,利用大數據深度學習,整理三甲醫院專家的臨床診斷經驗和治療方案,構建完善的知識圖譜,并對用戶的輸入進行語義分析,輸出相應的第二診療結果。
2016年7月,康夫子也發布了康夫子醫療大腦,其CEO張超在雷鋒網的公開課上介紹其公司做這樣的事情:
讓計算機去閱讀醫療文獻,構建知識庫,賦予這些知識庫一些推理能力,最后達到輔助醫生、患者的目的。在產品維度,分為面向患者和醫生;醫生端分為全科與專科醫生。它們的底層是相似的,都是知識圖譜加推理,不過上層應用有差別。患者偏重邏輯問答,包括患者語言的理解;全科醫生要求知識面,而專科則要求臨床路徑監控,包括醫囑的下達。
成立于2013年的醫渡云則集中做臨床數據挖掘。據稱,其技術優勢是異元異構的醫療數據的集成和后結構化處理能力,以及在疾病診斷的ICD10自動編碼等方面。并且CEO孫喆介紹,未來公司還將擴展至醫學影像數據。
目前整體上,智能診斷還處于初期,目前沒有可以實現大規模商用。
關于智能診斷的挑戰,張超認為:
技術上,我們現階段認為智能診斷的底層核心是知識圖譜,診斷的過程是基于知識圖譜實現的推理過程。知識圖譜的規模從根本上決定了智能診斷的瓶頸。另外就是應用上的挑戰,智能診斷不管服務誰,在應用場景上有很大的差別,要有針對性地提升效果;而在非技術上,重點要讓老百姓及醫療機構認可或理解這套診斷邏輯。
圖像識別是深度學習等人工智能技術最先突破的領域,目前看來醫療影像也會是人工智能與醫療結合中,最可能先發展起來的領域。
相比國外,國內在醫學影像結合人工智能技術方面的熱度似乎更高。對此,雷鋒網曾撰文《國內人工智能+醫療影像公司大盤點:今年又是“元年”? | 2016 影響因子》中提到,從公司的發展路徑看,醫療影像智能診斷的公司大致可以分為兩類:
第一類公司主要以人工智能技術,提供影像分析與診斷服務,其中以DeepCare、推想科技、圖瑪深維、雅森科技等為代表,且一般成立時間較短。
比如,DeepCare主要研發醫療影像檢測、識別、篩查和分析技術,為醫療器械廠商和基層醫療中心提供影像識別服務,對新錄入數據庫的病例,它可以進行算法匹配,尋找出影像數據相似的案例;雅森科技則專注醫療影像分析應用,基于醫療影像定量分析,用數學模型和人工智能技術提高診斷精確性。
第二類公司原先提供醫療影像云服務,而后將服務延伸到智能診斷領域,其中以匯醫慧影、醫眾影像、醫渡云為代表,成立時間一般為二到三年。
比如,匯醫慧影是一個獨立第三方的醫療影像咨詢平臺,早期專注基于云平臺的線上影像中心,從今年開始著重向人工智能領域發力,輔助影像的篩查;醫渡云主要提供醫療大數據和醫療云平臺解決方案,同時利用機器學習的方式,挖掘臨床數據中的文本數據和影像數據。
這一領域目前發展到哪一步了呢?
對于發展狀況,我看來,無論在中國還是美國,在算法和數據上看,這一領域的發展都是在早期。它已經走出了實驗室,但離商業化還有很長的路要走。
對此,DeepCare創始人兼CTO丁鵬博士如是說。他介紹說,“其中最大的難點是:如何進行大批量數據的標注,以及標注質量控制”。而現在的醫療影像幾乎沒有對病灶進行標注,而這種系統性的數據整理過程又十分專業,需要專業醫生配合。
目前來講,眼科醫療領域的人工智能應用相對于其他專科仍處于比較空白的階段。
旨在應用人工智能/模式識別技術開發云端眼科診斷系統的BigVision(比格威醫療科技)CEO陳新建講道。
相對于其他,眼睛的結構比較特殊,不能做CT、MRI,而基于OCT的眼球成像也要精細得多。
人工智能深度神經網絡通過圖像預處理、圖像特征提取和分類等步驟識別醫學影像。通過大量準確標注的眼底照片和醫學數據,對模型進行訓練和測試,并且通過大量醫學知識的學習,最終能夠得出準確識別醫學影像的人工智能模型,從而診斷青光眼、糖尿病視網膜病變、老年性黃斑變性、角膜疾病等眼科疾病。
在該領域,其中,BigVision“目前,我們產品1.0已經開發完成,目前正在幾家大的合作醫院當中試用。”而該領域的另一家公司AicDoc,其算法在有明顯癥狀和無明顯癥狀二分方面準確性與三甲醫院資深眼科醫生持平。
相關文章:
外媒:谷歌風投前CEO創辦1億美元基金,重點關注醫療健康領域
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。