在這些專(zhuān)科技能上,人工智能已經(jīng)超越醫生

2017-03-13 11:06:42分類(lèi):行業(yè)資訊4467

  

  從2016年開(kāi)始,人工智能威脅醫生的論調不絕于耳。2017年剛開(kāi)年,包括《自然(Nature)》和《美國醫學(xué)協(xié)會(huì )雜志(Journal of the American Medical Association)》在內的幾家核心期刊,就接連刊登了幾起“機器人”醫生打敗人類(lèi)醫生的案例。

  在討論人工智能是否能徹底讓醫生“失業(yè)”之前,我們先來(lái)區分一下“強人工智能”和“弱人工智能”。

  強人工智能是通用型的,在什么場(chǎng)景都能夠隨機解決各種問(wèn)題的智能,能夠在復雜系統內,應對開(kāi)放式問(wèn)題,比如政治問(wèn)題、經(jīng)濟問(wèn)題等。這種智能具有自我意識的,和生物一樣,有生存和安全的需求,因此它們可以自己提出問(wèn)題。

  與之相對,弱人工智能只能在某個(gè)特定場(chǎng)景,并且封閉的系統內,解決某個(gè)特定的問(wèn)題。弱人工智能沒(méi)有自我意識和主觀(guān)能動(dòng)性,需要人類(lèi)對其輸入某一指令才會(huì )運轉。

  不過(guò),連最初提出“強人工智能”概念的約翰·羅杰斯·希爾勒本人都不相信,強人工智能可以實(shí)現。

  日前,在中歐衛生管理與政策中心舉行的第19期衛生政策上海圓桌會(huì )議上,原上海市第一婦嬰保健院院長(cháng)段濤表示,人工智能可能是掀起公立醫院改革的一股意想不到的力量,醫院現在” 最缺的是病理科醫生、影像醫生等,但再過(guò)三五年,這些醫生將一點(diǎn)不缺。”

  皮膚科

  “美國最近科技雜志連著(zhù)發(fā)文章,皮膚科醫生已經(jīng)被人工智能打敗了”,段濤在會(huì )上提到,“皮膚科有了人工智能的診斷,全中國90%的皮膚科醫生可以不需要了,你把照片拍好給它,它診斷水平比90%以上中國皮膚科醫生的水平都要高。”

  段濤指的是,《自然(Nature)》刊發(fā)的皮膚科人機大戰??茖W(xué)家先讓一個(gè)“卷及神經(jīng)網(wǎng)絡(luò )(CNN)”分析學(xué)習了近13萬(wàn)張皮膚病臨床圖片,涵蓋了2023種皮膚疾病。

  21位醫生受邀,與機器人展開(kāi)了兩場(chǎng)針對皮膚癌診斷能力的較量:第一場(chǎng)區分角質(zhì)細胞癌和良性脂溢性角化病;第二場(chǎng)區分惡性黑色素瘤和良性痣。結果,人工智能正確識別良性病變和惡性病變的綜合靈敏度達到91%,打敗了多名皮膚科醫生。

  科學(xué)家表示,正在努力讓這項智能診斷技術(shù)與智能手機兼容,“皮膚科家庭醫生”離我們不遠了。

  其實(shí),以色列公司Emerald Medical Applications已經(jīng)開(kāi)發(fā)了一款運用云人工智能技術(shù)和手機攝像頭檢測黑色素瘤的手機應用,并已在FDA注冊。

  據市場(chǎng)調查公司 IDC 估測,雖然目前只有 1% 的軟件應用有人工智能的特征,但到 2018年,這個(gè)數字預計能達到50%。

  眼科

  不止皮膚科,人工智能在眼科的診斷水平也表現不俗。

  去年11月,谷歌的研究者在《美國醫學(xué)協(xié)會(huì )雜志(Journal of the American Medical Association)》上發(fā)表的一篇文章,稱(chēng)其開(kāi)發(fā)出了一種解讀視網(wǎng)膜照片中,糖尿病性視網(wǎng)膜病變發(fā)病跡象的深度學(xué)習算法,這種算法的水平已經(jīng)達到眼科醫師的診斷水平。

  谷歌請到印度和美國的醫生,共同創(chuàng )建了一個(gè)包含12.8萬(wàn)張圖像的開(kāi)發(fā)數據集,用于訓練這種算法。隨后,谷歌用9,963張圖像作為驗證集,請到8位醫生和算法進(jìn)行PK。

  這場(chǎng)競賽的結果是,人類(lèi)醫生略遜一籌。算法得到的F-Score值(結合靈敏度和特異性的度量,最大值為1)為0.95,而8位眼科醫生F-Score的中位數值是0.91。

  需要明確的是,診斷糖尿病性視網(wǎng)膜病變是一個(gè)多步驟的過(guò)程,2D眼底照片只是其中一部分,某些情況下,醫生需要使用3D成像技術(shù),光學(xué)相干斷層掃描(OCT),詳細檢查視網(wǎng)膜的各個(gè)層。

  國內的Airdoc也開(kāi)發(fā)了一個(gè)功能相同的深度神經(jīng)網(wǎng)絡(luò )。經(jīng)測試,該算法在有明顯癥狀和無(wú)明顯癥狀二分方面的準確性與三甲醫院資深眼科醫生持平,在眼底照片國際標準5分類(lèi)方面的準確性也不遜于專(zhuān)業(yè)眼科醫生。

  影像科和病理科

  微軟研究院曾提出,基于深度學(xué)習的圖像識別技術(shù)的識別精度能夠超過(guò)人類(lèi)。在醫療大數據中,影像數據是相對結構化的數據,因此人工智能在這個(gè)領(lǐng)域的應用最多,技術(shù)成熟度也最高。

  段濤從幾個(gè)投資人處獲悉,“一家人工智能公司,做肺部結節的圖片,就是放射科,他們把全中國最好的幾個(gè)肺部讀片專(zhuān)家的結果作為標準,用人工智能,做了不到兩百個(gè)病人的案例,最終他們得出來(lái)的一個(gè)結論是什么呢?這個(gè)人工智能系統可以達到95%到98%的專(zhuān)家水平。”

  在國外的這個(gè)領(lǐng)域,Enlitic可能是最有名的一家公司,他們致力于用圖像識別算法,在X光、CT掃描、超聲波檢查、MRI等的圖像中做癌癥早曬。據悉,該公司曾在公共數據集上測試其圖像識別算法,通過(guò)肺部CT結果診斷肺癌,結果發(fā)現算法的準確率比放射科專(zhuān)家高出50%以上。

  Enlitic的算法在提高病理診斷的效率和精確性上,也發(fā)揮了顯著(zhù)作用。例如,在乳腺癌前哨淋巴結轉移診斷中,人工智能算法的誤診率為7.5%。公司請到一批病理學(xué)專(zhuān)家對同批切片做診斷,誤診率為3.5%,而當病理學(xué)家運用該算法做輔助診斷時(shí),誤診率被進(jìn)一步降至0.5%。

  國內的人工智能醫療影像公司DeepCare也做過(guò)類(lèi)似的事。他們請了4位分別來(lái)自北京的特級三甲、普通三甲和地方三甲醫院的醫生看70張疑似乳腺癌轉移的片子。4名醫生的年資分別是40年、30年、20驗和10年。同時(shí)參與讀片的還有人工智能機器人。

  70張片子中,有30張是陰性的,40張是陽(yáng)性的。40年經(jīng)驗的醫生對此的診斷準確率達到98%以上,而其他3名醫生的平均準確率在70%。而DeepCare的工智能機器人準確率達到了93%。

  據該公司透露,測試之后的兩個(gè)月,該算法的準確率提升到了95%。

  的確,隨著(zhù)人工智能算法“吃”的數據和學(xué)習的專(zhuān)家意見(jiàn)越來(lái)越多,其在某些特定診療問(wèn)題上的能力終將超越人類(lèi),而這些都屬于弱人工智能范疇。

  但是,在面對生命體這樣一個(gè)復雜的系統時(shí),人類(lèi)全科醫生那樣的,面對開(kāi)放問(wèn)題的綜合處理能力,卻是“機器人”望塵莫及的,應該說(shuō),這樣的強人工智能,至今尚未出現。

  另外,涉及處方權等法律問(wèn)題,以及醫學(xué)人文等感性問(wèn)題時(shí),人工智能系統永遠無(wú)法代替人類(lèi)的角色。

  “你還要那么多醫生干嘛?”

  段濤在演講結束時(shí)表示,“未來(lái)真的不知道會(huì )怎么樣,所以人工智能會(huì )導致我們公立醫院解構和重構非常重要的驅動(dòng)因素。”

上一篇:下一篇: