<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      AI+ 正文
      發私信給張利
      發送

      0

      康奈爾大學王飛博士:AI處理醫療數據面臨的8大挑戰

      本文作者: 張利 2017-07-26 21:32
      導語:數據質量、數據量、數據標準……

      雷鋒網按:本文轉自HC3i中國數字醫療網,作者王飛博士,他是康奈爾大學威爾醫學院助理教授,IBM沃森研究中心顧問,法國液空集團研究顧問。曾任職于康涅狄格大學以及IBM沃森研究中心。主要研究方向包括數據挖掘,機器學習技術在醫療信息學中的應用。王飛博士已經在相關方向的頂級國際會議和雜志上發表了近190篇學術論文,引用超過5000次,H指數38。

      康奈爾大學王飛博士:AI處理醫療數據面臨的8大挑戰

      隨著國務院發布新一代人工智能發展規劃,“人工智能”這個已經在最近家喻戶曉的名詞再一步被推向了風口浪尖。對于醫療健康這一與人類息息相關的行業來講,一個自然而然的話題便是如何讓人工智能來幫助其發展。

      人工智能的一個核心問題是讓計算機算法從數據中發現有價值的東西。這里的“價值”依具體問題而定。例如對IBM的沃森,價值便是從無數文獻當中總結出來的知識;而對于AlphaGo,價值便是從無數棋譜中總結出來的可以致勝的規則。近些年來也不斷有一些將人工智能技術應用于醫療的嘗試,例如斯坦福的研究員利用神經網絡來分析圖像中的皮膚病變是否有可能是癌癥,Google利用深度學習來通過眼底圖像分析識別病人是否患有糖尿病。

      隨著各種各樣與人工智能相關的技術,例如計算機硬件和軟件的快速發展,我們能夠接觸到合理用的數據越來越多。然而,要將AI應用到醫療數據當中,并從醫療數據中發現真正的價值,我們還需要考慮如下一些問題。

      第一,數據質量

      與很多其他應用領域(例如圖像,語音)的數據不同,醫療數據種類繁雜,標準不統一,并且質量參差不齊。例如電子病歷數據,只有當病人去過醫院或是診所的時候才會有記錄,并且病人通常只有在感覺不適的時候才會去醫院,這就導致了電子病歷天然的不完整性。并且病人并不一定會嚴格尊重遺囑進行檢查或是吃藥,這就造成了電子病歷的不規律性。還有電子病歷在錄入的時候經常會發生錯誤,并且在很多檢查中由于儀器的差別記錄的精度和數值也都不同。在這種情況下,有效的評估數據質量就成為了在挖掘數據價值之前必須要解決的問題,因為在低質量的數據上不大可能挖到有價值的信息。

      第二,數據標準

      不同的國家有不同的語言以及不同的衛生體系,這也就導致了他們醫療數據的標準不同。甚至對于同一個國家,例如美國,也存在著如Epic,Cerner,NextGen等幾套不同的電子病歷系統。通常要從數據中挖掘有效信息的一個前提條件是要有足夠大量的數據。將醫療數據標準化,便是統一不同電子病歷系統,獲得更多病人數據的首要任務。在這方面,OHDSI (ObservationalHealth Data Sciences and Informatics)是一個面向健康數據標準化的國際組織,而我們也已經成立了OHDSI中國工作組,致力于推動中國電子病歷標準化,構建國內的大型觀察性健康醫療數據網絡。

      第三,數據量

      當前的健康醫療數據分析,尤其是在精準醫療的大環境下,大都是基于病人的分析。而全世界也只有七十億人,再細化到每一個國家,每一個地區,甚至每一個醫院,我們能夠利用的數據的樣本量實際非常的少。從這個角度講,與其說健康醫療數據分析是一個大數據問題,倒不如說是個小數據問題。除去電子病歷,有很多其他類型的健康數據,例如通過可穿戴設備或是傳感器采集的數據,就更是小樣本。隨之也出現了一些新的概念,例如N-of-1 Trial研究的就是基于單個患者的多重交叉設計的臨床實驗。如何讓數據分析方法在小樣本下發揮作用,是一個非常重要的問題。

      第四,數據維度和異質性

      由于疾病的機理異常復雜,我們可以用海量的特征和指標刻畫每一個病人的體征,從臨床數據到基因數據,從電子病歷數據到調查問卷數據,從病人本身的數據到環境數據,從結構數據到非結構數據,從文本到圖像等等。在這樣的情況下數據的維度可以成千上萬甚至百萬,并且數據的性質,包括類型,值,特點均不盡相同。而本條也與剛剛提到的第三條緊密相關:因為我們沒有辦法得到足夠多的病人,那我們就需要采集盡可能全面的信息來刻畫描述每一個病人。如何集成這些各種各樣的病人數據來挖掘有效的信息,是對數據分析方法的另一個挑戰。

      第五,數據偏倚以及模型的推廣性

      由于前面所說的種種挑戰,我們通常進行的分析是基于某一特定的病人人群,例如一個醫院或是一個地區。在這些病人的數據上訓練出來的模型只能保證在這些病人,或是與這些病人類似的病人上是有效的。如何增強模型的推廣性與互操作性,使其能夠在不同的人群上面有效,是一個很重要的問題。舉個例子,生成對抗模型(GAN)是最近深度學習領域一個非常流行的樣本生成模型,其主要目的就是通過對抗來生成盡可能“真”的樣本,使得人無法區分哪些樣本是真實的,那些是由GAN生成的。由于病人樣本有限,一個自然的想法便是用GAN來生成虛擬病人。但是由于GAN是根據訓練樣本來生成新的樣本的,其真偽也只能根據訓練樣本來判斷。這樣的話,如果我們用GAN來生成虛擬病人,就會更加增加數據偏倚,而在這些病人上面訓練的模型推廣性就會變的更差。

      第六,模型的可解釋性

      在醫療健康領域,只有模型的準確性是不夠的,模型的可解釋性同樣重要。這是因為醫療健康與每個人的生活息息相關,我們不僅需要知道結論,更需要知道為什么會有這個結論。這樣就使得白盒算法,例如決策樹,再醫療數據分析中的應用就遠多于黑盒算法。而這也對黑盒算法,例如大多數的神經網絡或是深度學習算法提出了挑戰。而可以幫助解釋模型的技術例如可視化,人機交互乃至統計就顯得異常重要。

      第七,模型的適用性

      這也是最容易被大多數計算機行業的從業者,特別是算法設計和開發人員忽視的一點。由于人工智能技術的流行,大家容易追逐技術熱點而忘記了醫學問題本身。例如由于AlphaGo的成功,強化學習變得家喻戶曉。而很多從事醫療健康數據分析的研究人員也都在試圖將強化學習應用于醫學問題當中。然而強化學習的一個必備環節是要與環境進行交互,從而判斷每一步的策略是否能夠對最終的目標產生最大的效果。而這一環節在醫學問題當中是否存在?如何能夠窮盡所有可能的選擇并且判斷一個臨床路徑當中每一步的選擇對最終結果的影響?這些都是需要仔細考慮的問題。

      第八,數據和模型的隱私性

      隱私性是醫療健康數據有別于其他數據的一個重要特點。各個國家都有不同的法案在保護病人數據的隱私,例如美國的HIPAA法案,而衛計委也一再強調在發展健康醫療大數據的同時一定要警惕數據安全,保護患者隱私。因此我們在研究醫療健康數據挖掘算法的同時一定要注意隱私保護。此外,除了保護數據隱私,保護模型的隱私也同樣重要。舉個例子,2014年維斯康辛大學與Marshfield Clinic在計算機安全頂級會議USENIX Security Symposium上發表了一篇文論,討論在精準醫療大環境下藥物基因組學的隱私性研究。該文論指出了通過華法林的計量可以通過逆向工程推斷患者的基因信息。而通過數據擾動等方式保護患者隱私通常會產生嚴重的后果,甚至患者致死。該文章指出,在精準醫療的大環境下這類隱私問題會越來越多。這樣一來,我們不僅要保護數據,同樣要保護數據上建立的模型。而該論文也獲得了當年會議的最佳論文。

      總之,人工智能的時代已經到來,為了擁抱人工智能數據分析一定會帶來一場醫療健康的技術革命。如何正確的挖掘醫療健康數據,從數據中得到有價值的信息,是一個值得每一個從業者仔細考慮的問題。我們相信,人工智能一定會把醫療變得更美好,把每個人變的更健康。

      更多關于雷鋒網人工智能升級傳統行業的文章,請關注雷鋒網AI商業化垂直微信公眾號:AI掘金志(ID:HealthAI)

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

      分享:
      相關文章

      編輯

      我是雷鋒網醫療科技編輯,歡迎與我交流:zhangli@leiphone.com
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 一区二区三国产精华液| 少妇激情精品视频在线| 在线观看国产精品日韩av| 三级国产在线观看| 国产jizzjizz视频| 午夜精品久久久久久久爽| 色综合久久88色综合天天提莫| 亚洲精品色在线网站| 熟女在线国产| 欧美精品一卡| 久久日韩在线观看视频| 一级内射片在线网站观看视频| 久久综合亚洲色一区二区三区| 国产一区二区日韩在线| 少妇高潮灌满白浆毛片免费看| 国产玖玖| 国产97色在线 | 免| 五十路av| 毛片大全真人在线| 日本中文一区二区三区亚洲| 亚洲综合一区二区国产精品| 18禁超污无遮挡无码免费游戏| 国产真实伦在线观看视频| 亚洲熟女综合色一区二区三区| 免费的特黄特色大片| 9久久精品| 久久99精品久久久久久婷婷2021| 4hu44四虎www在线影院麻豆| 91免费精品国偷自产在线在线| 国产精品国产三级国产a| 国产av福利| 亚洲色成人网站www永久| 老熟女AV| 亚洲人成网站在线播放942| AV无码不卡| jizzjizzjizzjizz| 欧美《熟妇做爰》HD| 日韩精品一二三四五区| 无码中文字幕热热久久| 无码精油按摩潮喷在线播放| 日韩大片在线永久免费观看网站|