0
| 本文作者: 李雨晨 | 2017-07-12 16:07 | 專題:GAIR 2017 |
2017年7月9日,由中國計算機學會(CCF)主辦,雷鋒網與香港中文大學(深圳)承辦的第二屆CCF-GAIR 2017全球人工智能與機器人峰會進入第三天的議程。在下午的未來醫療專場上,科大訊飛智慧醫療事業部總經理陶曉東發表了主題演講。

雷鋒網了解到,陶曉東在演講中表示,人工智能取代人類工作的說法并不準確,人工智能有所能、有所不能。醫療里面有很多東西不是簡單的科學,有很多東西是個人經驗,沒有辦法表示成一個知識讓機器學習,至少目前的技術水平上是這樣的。
陶曉東認為,通常我們都是片面地去看影像信息,而忽略檢查檢驗的結果,心電圖的信息、體溫信息等等因素,怎么把這些信息和影像信息結合起來,產生最終的診斷結果,我覺得這是現在人工智能的算法發展遇到的挑戰。我們應該更好的利用專家的知識,把機器學習和人工智能建立建立在醫學體系上而不是離散的板塊上,讓這個技術上更有效的解決各種臨床問題,去服務于醫生。
以下是陶曉東的演講全文,雷鋒網做了不改變原意的整理和編輯:
陶曉東:謝謝主持人,謝謝大家!我們聽了田教授非常有干貨的演講,下面我給大家的匯報基于我個人在醫學影像方面的研究經歷,以及在科大訊飛智慧醫療事業部的實踐,總共分為三個部分:一是人工智能的大背景;二是醫學影像解決臨床問題;三是人工智能時代的醫學影像應該是往哪些方向發展。
回顧人工智能的三次浪潮,大家都知道人工智能從1956年開始是經歷了三次高峰,現在正在處在第三次高峰,同時也有兩次冬天。
第一次高峰來源于Perceptron的提出,它解決一些1956年、1957年看來非常難的問題。在這之后,由于計算能力的限制和各種各樣數據的限制,大家覺得70年代能實現的人工智能的技術,并沒有按照大家的希望到來。1980年左右是第一個冬天。
第二個浪潮的來臨是隨著Hopfield網絡&BP算法的提出,大量計算能力和存儲能力得到提升。90年代左右,日本推廣做第五代計算機。但第五代計算機的失敗,把我們引入第二個冬天。
現在我們身處第三次浪潮,它的起點是2009年提出的深度學習的概念,而且深度學習的概念在今天有很多延伸的算法,而且在不同的領域也有成功的案例,包括最近的AlphaGo。有很多新聞媒體說人工智能是不是真的要取代人類30%、50%、70%的工作。從我個人,包括科大訊飛在這個領域做了很多年人工智能的工作,實際上我們應該有一個比較清醒的認識,人工智能有所能、有所不能。圓桌會議上周院長提出區分醫學和醫療,這個觀點我非常同意。醫療里面有很多東西不是簡單的科學,有很多東西是個人經驗,沒有辦法表示成一個知識讓機器學習,至少目前的技術水平上是這樣的。

人工智能發展的三個階段,剛才發布xHealth的時候講到創業圖譜,里面有感知智能、認知智能和運算智能。大家的觀點有可能不同,但是很早以前運算智能已經超過人類,感知智能,包括無人駕駛技術和感知器的技術,計算器可以看到我們看不到的東西。從CT的歷史,我們也簡單回顧一下,核磁成像的發展歷程,我們都可以把它歸為感知智能方面。認知智能更多是我們今天談的人工智能,不光是能看到一些信息,看到一些數據,收集一些數據,并且要基于專家知識的層面上理解思考,做出推理,協助人們做診斷治療。

智慧醫療的“三駕馬車”
大家對智慧醫療都有不同的理解,在我們看來智慧醫療離不開以下幾點。

行業大數據。這個數據一定要標準化、完整、準確,而且一定要和應用相關。如果沒有這些發展,這個數據相對來講用途會小很多。
行業專家。我們需要有行業專家來指導我們在哪些領域、哪些應用上做,哪些應用對行業是有用的,包括剛才田教授講的,我們從臨床應用出發指導醫療技術的發展。另外在專家的指導下建立知識庫,有些知識可以用計算機理解的方式表達出來,有些不可以,我們要把這個東西分清楚。另外應用建立之后,怎么樣驗證它,這需要專家來協助我們做。
核心技術。從技術開發者的角度看,我們需要更多考慮怎么做到智能化。二是實用,三是留存機制,我們要盡可能少的改變行業專家或者醫生的工作流程,真正幫助醫生提高效率、提高工作水平。
在這個水平上有不同的用戶,基于完整數據、行業專家的支持和先進的核心技術,我們可以服務政府機構,去做政策決策。可以服務醫院,做到醫院的運營管理;服務醫生,通常來講我們更為關心,尤其像醫學影像領域,通常來講更多是和醫生打交道,但是這里面又有更多細分。對三甲醫院的頂級醫生來講,這可能是錦上添花的事。基層放射科醫生,每天只看四個片子,經驗比較少,這就是雪中送炭。大家可以上網查各種各樣的信息,管理自己的健康。從體檢角度來講,健康人的一部分醫療影像數據,怎么理解這些影像,從哪個節點開始從健康人變到病人,怎么干預,這是在過去的實踐中總結出來的人工智能推動智慧醫療。
我想稍微回顧從我個人從業經驗還有實踐中總結出來的,醫學影像怎么解決臨床問題,在什么情況下更有效幫助醫生解決臨床需求。
剛才田教授講的影像技術要服務于臨床需求,有各種各樣不同的臨床領域,臨床醫生看到病人要做確定的診斷或者治療計劃,他可能要借助影像手段。這樣,臨床領域的需求會被轉換為影像需求,各種各樣的定量分析、歷史圖像的比較,這是醫生所關注的,而且是他們的專業。而這部分影像需求再傳遞給工程技術人員,包括從事醫學影像方面的技術開發人員。我把臨床醫生、影像醫生、工程技術人員放在不同的層級,因為他們三者的專業知識之間有差別。交流過程中,怎么把臨床醫生的需求轉換為影像需求,怎么把影像需求轉換為工程技術需求,這是怎樣把技術變成服務于臨床應用里面非常重要的點。冠狀動脈的狹窄程度,這決定怎么治療,需不需要放支架還是用藥物治療改變生活習慣。從這個角度,影像需求能夠非常清楚的顯示冠脈,體現斑塊和血管的對比,這樣就可以看到斑塊在血管里面有多大,可以判斷需要采取什么樣的治療手段。接著轉換為技術需求,需要高分辨率的CT成像。在解決成像的問題之后,怎么完成冠狀動脈的分割,冠狀動脈分割之后,怎么做斑塊檢出,這里面有信息化手段。

下面兩部分用CT的發展來回顧我們在感知智能領域做的事情。CT的發展,70年代到90年代,從第一代CT到現在大家用的CT,從單層、重建成像24小時到10毫秒以下,把CT影像從實驗室里的設備搬到臨床可用的設備,這部分是臨床驅動。臨床需求是影像進步的驅動力,它使CT影像更為廣泛應用在臨床里面。90年代之后,如果做影像方面的工作,肯定聽說過Slice War的說法,這里面有更多的臨床需求。16排或者64排一定做不了心臟嗎?不完全是,有各種各樣的方式做。所以臨床應用雖然得到拓展,但是技術需求驅動比臨床需求驅動更明顯一些,從這個角度來講,我們可以看到臨床驅動對技術發展的巨大推動作用。
智能影像應該解決什么問題?
智能影像應該解決什么問題,智能影像的技術,包括模式識別、成像分析,實際上要解決三類問題:
一是醫生沒有時間完成的任務。現在成像越來越容易,分辨率越來越高,醫生要看越來越多的影像,但是醫生需要的不是數據,醫生需要的是信息,怎么把這些信息更好的呈現給醫生?這是智能影像需要解決的問題。這里面需要更多的自動圖像分析工具以及利用人工智能的病灶檢出和分析。
二是幫助醫生進行定量分析。影像科醫生擅長定性分析,看到片子,他在這個片子停留1秒以下就能大致判斷是什么問題,但是醫生需要一些工具做更精準的判斷。定量分析,這是靠眼睛很難做到的,這其中多模態分析,歷史圖像的比較,包括病人人群的分析,不是簡單用眼睛完成的。所以需要田教授講到的圖像分割、圖像配置還有功能圖像分析。現在越來越多,包括核磁里面有很多序列,每個病人都有多個序列,怎么把不同序列得到的圖像放到同一個空間分析,這是影像可以解決的問題。
三是基于圖象識別的智能成像,這兩個步驟很多年前被分開,成像停留在成像,圖像分析是幫助醫生解決臨床問題。這兩個過程,只有結合起來才能更有效的優化系統,幫助醫生提供有效服務。高水平的技師缺乏,尤其是基層醫院,有重復的成像造成影像資源浪費。還有高級成像的功能使用復雜,包括我們的核磁里面有很多參數需要調整,非常多的序列選擇。這些序列和參數,通常給工程技術人才設計,包括你說TR、TE、醫生或者技師很難反應出來把TE改變一下,對圖像質量有什么影響。影像科的醫生有專業知識,從這個角度來講怎么把這些參數用更好的方式呈現給技師,這是智能成像設備需要考慮的問題,也是智能影像可以解決的工作。
下面有些簡單的例子,像CT肺結節的篩查,大家知道體檢是在大量的數據人群里面找少量陽性,怎么幫助醫生把真正沒有陽性,100%確定的數據排出掉,讓醫生從1萬個片子里面找到真正有問題的、需要隨訪的病人,變成1萬個病人里面只需要看5000個片子,這就是50%的選擇。還有三維重建,還有可視化,讓醫生在很短的時間內,不是翻1000張平片,而是從三維圖像里快速找到我要的信息。醫生需要的工具輔助的任務,包括自動的病灶檢出、自動的分析。
像比較小的病灶,剛才田教授講到,現在很多機器學習人工智能的算法是用醫生標注的數據,剛才田教授講到標注的客觀性。當時我們做項目的時候,多發性硬化的標準我們采取傳統算法,讓醫生標注這些記號。因為這個點很小,他們標注的點差別很大,醫生標注之后來訓練我們的模型。我們對醫生的要求很低,只要告訴我這里面有東西,畫一個框,我自己找,這就是把很難的問題進行簡化,把自動的多發性硬化的病灶自動檢出的準確率提高到比醫生還要高。自動檢出的結果和醫生檢出的結果,比兩個醫生的層級都要高。像腦卒中離散的圖像分析,判斷哪部分腦組織已經壞死,這部分是相對比較定量的分析,機器更擅長這一部分。還有三維超聲的情況下怎么精確的測量胎兒的腿骨,從而判斷胎齡。還有冠狀動脈的分割、分析,這里面實際上有很多智能影像可以解決的問題。
第三部分,基于圖像分析的智能成像。高水平技師的缺乏,怎么把相對復雜的成像過程簡單化。更多的智能改變和智能定位讓成像更規范,讓成像質量得到保證。還有智能指控,怎么在病人離開機房的時候,判斷是否需要重新掃描某個序列。標準化、個性化,看似很矛盾的成像,但是標準化是指得到的圖像需要有一個標準化的質量,但是個性化是根據不同的人,根據他的情況,像CT的圖像對于BMI很高和很低的人,它的成像參數有調整、劑量有調整,所以這部分是個性化,通過個性化來實現圖像質量的標準,通過智能的手段來幫助醫生和技師選擇成像的參數,各種各樣的在線幫助,幫助相對沒有經驗的基層醫生成和三甲醫院一樣的影像。
把機器學習和人工智能建立在醫學體系上
人工智能時代,到底醫學影像有什么樣的變化?醫學影像的分析和成像到底有什么變化?我們簡單梳理一下。影像在臨床診斷的過程,左邊是臨床醫生和病人問診的過程,通過臨床信息、病史采集、檢查檢驗的結果,發現需要做影像,這個影像的需求會到影像科,技師通過影像手段呈現出來各種各樣的圖像,影像科的醫生會出影像的報告。影像報告需要和臨床醫生討論,這里面要從影像信息和臨床信息做交換,產生最終的臨床報告。傳統的影像角度里,我們關注的是橙色的Box里的步驟,我只關注order滿足他的影像,到底用什么參數去成像,保證圖像做得好。我輔助放射科的醫生讀片,幫助他更有效的在短時間內出高質量的影像報告。但是智能影像在圓桌會議的時候,大家想把醫療向兩端延伸,我們也需要兩端延伸,首先理解臨床醫生為什么要做這個order,臨床醫生和他溝通的時候,到底怎么把臨床的信息解讀出來,不僅是更高效的影像報告,而且是更高效的臨床報告,對后面的治療有指導意義的臨床報告。所以這里面需要有影像信息和各種各樣其他信息的整合,不光是看影像。
田教授講到影像標準化做得比較好,但是通常我們停留在影像信息上,而忽略其他信息,包括病例信息、檢查檢驗的結果,心電圖的信息,體溫的信息等等,怎么表示這些信息和影像信息結合起來,產生最終的診斷結果。我覺得這是現在人工智能的算法發展遇到的挑戰,怎么把這些信息表示出來,讓計算機在這些信息中學習。

框圖示意,從海量影像數據、大量臨床信息怎么表示出來,用專家的知識通過學習算法,中間的這部分算法不一定非常重要,因為很多算法在不同的應用場景里都有很多不同。左下角的醫生的專業知識,目前大家仍然是用標注的圖像,我最后得到系統的輸出是你告訴我這是肺結節,我找到看到很像,但實際也是肺結節,基于圖像,沒有太大區別。它可能達到95%、90%的檢出率,但是沒有辦法解釋給你聽這為什么是肺結節,他沒有告訴你這個肺應該長成這樣,在CT的影像表現下是這樣。這里面怎么更好的利用專家的知識,而不是把整個機器學習和人工智能建立在離散的板塊上,而是建立在醫學體系上。讓這個技術上更有效的解決各種臨床問題去服務于醫生。
在座的除了專業的攝像師,大概都是用自己的手機在照相,而且成像一樣非常清楚。我們要思考怎么把成像設備的操作簡化到任何一個基層醫生和技師都可以做。另外要將深度學習和人工智能建立在醫學知識的體系上,而不是簡單、離散的訓練數據上。在目前的情況下,一個是自下而上的模型,一個是自上而下的模型,我們仍然需要一些知識體系去把他們更好地結合起來。

另外需要更深入的臨床導向,我們要非常清楚的定義臨床的應用,這部分需要和行業專家和臨床專家磨合,才能做好這部分。只有定義清楚問題,我們才能想到好的方法解決這個問題。怎么把影像和臨床信息結合起來。臨床信息在某種意義更雜亂無章,標準化程度也相對比較低,各個醫院之間的差距比較大,怎么結合這些東西,清洗各種各樣的大數據,在這種基礎上做學習,更好的服務醫生的診斷治療的過程。
我的匯報就到這里。謝謝大家!
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。