源起基金關注領域——醫療AI(五)
國泰君安2023年8月研報人工智能研究框架,搭建了詳細的AI知識體系。
AI是研究如何使計算機能夠模擬和執行人類智能任務的科學和技術。通過輸入大量資料數據,讓計算機學習算法,總結出模型,之后再輸入相似樣本時,就可以識別結果。優勢在于模仿人類經驗學習的過程,無需人為制定規則,機器學習等算法和自我迭代是AI區別于傳統計算機能力的主要因素。
根據《AI:現代方法》,AI有七種分類,分別是推理和問題解決、知識表示、規劃和社會智能、感知、機器學習、機器人:運動和操縱,和自然語言處理。
圖|AI的七種分類
算法是最終計算機解決任務的方案
從AI大的子領域來看,常用的算法類型有專家系統、傳統機器學習與深度學習。專家系統就是利用以往知識與經驗制定規則。傳統機器學習通過訓練集,不斷識別特征,不斷建模,最后形成有效的模型,這個過程就叫機器學習,主要運用可解釋的數學公式進行推導預測。深度學習是模擬人腦神經元進行學習與預測,通常不具有可解釋性,但卻能很好的解決問題。
1.專家系統算法:基于以往知識與經驗來制定規則
專家系統是模擬人類專家解決某一類具體問題的AI系統,如疾病診療、機械設計等。將專家掌握的知識抽取出來,利用這些知識,計算機就可以像專家一樣工作了。例如識別垃圾郵件,傳統的方法是制定規則,比如一篇文章中大量出現“免費”“特價”“代理”等等關鍵詞,就把它定義為垃圾郵件,根據設定的規則,電腦去執行預測。
實現專家系統要解決兩個問題,如何表示知識,如何利用知識解決問題。知識表示是將專家的知識梳理出來,并表示成計算機能讀懂的結構。知識表示有很多種方法,最簡單的是寫成“如果...就...”這樣的判斷句,稱為“產生式規則”。利用知識解決問題涉及到推理方法。以診療系統為例,如果患者的表現是打噴嚏和發燒,醫生會基于這些表現,判斷病人可能感冒,而治療感冒的常用藥物是阿司匹林,醫生會告訴病人,吃幾片阿斯匹林,這個過程就是人類的推理過程。計算機醫生會模仿這個過程,首先會將病人發燒和打噴嚏作為前提在知識庫中查找。
圖|用IF語句來舉例理解專家系統
單一的專家系統算法會遇到諸多瓶頸。實踐過程中,有些任務本身的規則很難定義,如圖像識別。圖像識別最基礎的問題是分辨這個圖像是什么,識別圖像的工作極大提升了傳統算法的難度,因為圖像的細節特征太多,編寫規則來進行判斷的難度極大。
2.傳統的機器學習主要運用可解釋的數學公式進行推導運算
機器學習讓計算機從數據中學習而無需使用明確編程的AI技術,將現實中的醫療問題抽象為數學問題,利用現有的醫學數據構建出針對某一醫用場景的模型,而后用該模型解決現實問題。
收集鳶尾花花萼的長度與寬度,來判斷它具體屬于哪一品種,屬于機器學習算法。由于可視化與易推導的需求,此處將數據維度降到2維或3維來說明傳統機器學習的原理。而現實中的數據通常是具有多種特征的,比如鳶尾花的數據集原本有4個特征,應該在一個4維空間對數據進行切分。機器學習背后的數學保證了低維空間的算法推導到高維空間也同樣適用。
圖|傳統的機器學習主要運用可解釋的數學公式進行推導預測
圖|利用機器學習來處理像素點可以實現圖像識別
可以看到在鳶尾花分類任務中的特征都有明確含義,每個數字代表一定含義。在機器學習中,特征可以是很抽象的,在圖像識別領域中,通常將每一個像素點看做一個特征。利用機器學習來處理像素點可以實現圖像識別。在數字識別任務中,將圖像放大,每一個像素由一個方塊表示,方塊顏色的深淺不同就對應著不同的值,所以可以用28*28=784個特征來代表這張圖像,然后將數字按順序排開喂給機器機進行學習,并歸納整理每個位置的值與最終結果的關系。在算法領域中特征可能是不具有含義的,而是抽象的,甚至這個特征與最終結果毫無關系。
圖|傳統機器學習的工作流程
機器學習根據訓練方式,又分監督學習、無監督學習和強化學習,它們都并不是某一種特定的算法,而是一類算法的統稱。
監督學習需要有明確的目標,比如按照“既定規則”來分類、預測某個具體的值。監督學習可以處理回歸和分類兩種任務,具有四個步驟,步驟1是構建問題,選擇模型,步驟2是收集已知數據,步驟3是訓練出理想模型,步驟4是對新用戶進行預測。主流的監督學習算法包括樸素貝葉斯、決策樹、SVM等多種算法,也在逐步豐富中。
圖|監督學習的步驟
圖|主流的監督學習算法
無監督學習是一種機器學習的訓練方式,本質上是一個統計手段,在沒有標簽的數據里可以發現潛在的一些結構。 監督學習目的明確,需要給數據打標簽,可以衡量效果,無監督學習沒有明確目的,不需要給數據打標簽,無法量化效果。
圖|無監督學習案例
強化學習算法的思路非常簡單,以游戲為例,如果在游戲中采取某種策略可以取得較高的得分,那么就進一步強化這種策略,以期繼續取得較好的結果。這種策略與日常生活中的各種績效獎勵非常類似。強化學習和監督學習、無監督學習最大的不同就是不需要大量的“數據喂養”。而是通過自己不停的嘗試來學會某些技能。
圖|強化學習的主流算法包括免模型學習(Model-Free)和有模型學習(Model-Based)
3.深度學習的靈感來自大腦的結構和功能
深度學習的概念源于人工神經網絡,大致是一個用人類的數學知識與計算機算法構建起來的整體架構,再結合盡可能多的訓練數據以及計算機的大規模運算能力去調節內部參數,盡可能逼近問題目標的半理論、半經驗的建模方式。
圖|深度學習就像自來水管系統,不斷調節各個閥門,讓對應出口的流量符合要求
深度學習包括四種典型的算法,卷積神經網絡、循環神經網絡、生成對抗網絡,和深度強化學習。
卷積神經網絡CNN能夠將大數據量的圖片有效的降維成小數據量(并不影響結果),能夠保留圖片的特征,類似人類的視覺原理。現階段常常嵌套在CV技術中,卷積層提取醫學圖像的根本特征,池化層降低圖像的參數維度,全連接層輸出結果,因降維效果顯著被廣泛用于海量各類像素的圖片處理。
循環神經網絡RNN是一種能有效的處理序列數據的算法,比如文章內容、語音音頻、股票價格走勢,可以將前一次的輸出結果帶到下一次輸出結果的隱藏層中,可結合NLP技術使用。該算法適用于患者數據的生命周期管理、長達多年的電子病歷或醫保記錄等序列數據分析場景。
生成對抗網絡GAN是一種無監督算法,能生成出逼真的照片,圖像甚至視頻。
深度強化學習DL用深度學習來對強化學習中的State、Policy進行表示。
智能體為執行某一任務,反復與環境交互后產生數據,獲取獎勵,再利用新數據去修改自身動作決策,經過數次迭代,學會完成任務所需的策略。強調反復訓練而非數據喂養,用于AI醫療機器人中。
Transformer技術框架是深度學習發展到一定階段的產物,標志著“基礎模型”時代的開始。Transformer 模型是一種基于自注意力機制的深度學習模型,主要用于自然語言處理和計算機視覺領域。Transformer作為基礎性模型,為其他模型(GPT、GPT-3、BERT等)的演化提供基本手段。
4.機器學習與深度學習的對比
機器學習與深度學習有著明顯的異同點。在數據準備和預處理方面兩者很相似,都能對數據進行一些操作,如數據清洗、數據標簽、歸一化、去噪、降維。區別是傳統機器學習的特征提取主要依賴人工,針對特定簡單任務時人工提取特征會簡單有效,但是并不能通用,深度學習的特征提取并不依靠人工,而是機器自動提取,所以深度學習的可解釋性很差,雖然能有好的表現,但不知道原理。
圖|深度學習與機器學習在不同階段有不同的異同點
圖|深度學習的優缺點