源起基金關(guān)注領(lǐng)域——醫(yī)療AI(四)
人工智能研究框架國泰君安2023年8月研報人工智能研究框架,搭建了詳細的AI知識體系。
AI是研究如何使計算機能夠模擬和執(zhí)行人類智能任務的科學和技術(shù)。通過輸入大量資料數(shù)據(jù),讓計算機學習算法,總結(jié)出模型,之后再輸入相似樣本時,就可以識別結(jié)果。優(yōu)勢在于模仿人類經(jīng)驗學習的過程,無需人為制定規(guī)則,機器學習等算法和自我迭代是AI區(qū)別于傳統(tǒng)計算機能力的主要因素。
根據(jù)《AI:現(xiàn)代方法》,AI有七種分類,分別是推理和問題解決、知識表示、規(guī)劃和社會智能、感知、機器學習、機器人:運動和操縱,和自然語言處理。
圖|AI的七種分類
三、隨著各類算法的演繹和迭代,AI的子領(lǐng)域明朗化自然語言處理和計算機視覺等是AI技術(shù)的重要子領(lǐng)域。
1.自然語言處理
自然語言處理(Natural Language Processing,NLP)是AI和語言學領(lǐng)域的分支學科,讓計算機和系統(tǒng)能夠從文本和語音信號輸入中獲取有意義的信息,理解人類語言,并作出決策??梢詮姆墙Y(jié)構(gòu)化自然語言中提取信息,處理信息并將其映射到結(jié)構(gòu)化變量?,F(xiàn)有的醫(yī)學信息大多數(shù)以非結(jié)構(gòu)或半結(jié)構(gòu)的形式儲存在醫(yī)療信息系統(tǒng)中,NLP可通過機器翻譯將這些數(shù)據(jù)轉(zhuǎn)化為AI模型可用的結(jié)構(gòu)化數(shù)據(jù)語言,構(gòu)造醫(yī)學詞林,實現(xiàn)人機交互、數(shù)據(jù)管理等。主要有機器翻譯、情感分析和信息抽取幾大基礎任務。
機器翻譯,是指通過特定的計算機程序?qū)⒁环N書寫形式或聲音形式的自然語言,翻譯成另一種書寫形式或聲音形式的自然語言。主要能夠?qū)崿F(xiàn)語音翻譯、圖像翻譯、VR翻譯等。
情感分析,即指通過計算技術(shù)對文本的主客觀性、觀點、情緒、極性的挖掘和分析,對文本的情感傾向做出分類判斷。情感分析在評論機制的App中應用較為廣泛。在互聯(lián)網(wǎng)輿情分析中,尤其是在選舉預測、股票預測等領(lǐng)域,情感分析起著舉足輕重的作用。
信息抽取,指從文本中抽取出特定的事實信息。被抽取出來的信息通常以結(jié)構(gòu)化的形式直接存入數(shù)據(jù)庫,可以供用戶查詢及進一步分析使用,為之后構(gòu)建知識庫、智能問答等提供數(shù)據(jù)支撐。
圖|自然語言處理用于醫(yī)療場景
2.計算機視覺
計算機視覺(Computer vision,CV),是指讓計算機和系統(tǒng)能夠從圖像、視頻和其他視覺輸入中獲取有意義的信息,并根據(jù)該信息采取行動或提供建議。該技術(shù)基于深度學習機器視覺算法的集合,通過構(gòu)造多層神經(jīng)網(wǎng)絡,逐層完成圖像特征的提取,最終將多層級的特征組合,在頂層做出分類。主要有圖像分類、目標檢測、目標分割和實例分割幾大基礎任務。
圖像分類是判斷一張圖片的主要類別,是計算機視覺中最基礎的任務之一。目標檢測是給定一張圖像或是一個視頻幀,讓計算機定位出這個目標的位置并且知道目標物是什么,即輸出目標的Bounding Box(邊框)以及標簽。目標分割是檢測到圖像中的所有目標,解決“每一個像素屬于哪個目標物或場景”的問題,屬于像素級的,需要給出屬于每一類的所有像素點,而不是矩形框。實例分割是目標檢測和目標分割的結(jié)合,相對目標檢測的邊界框,實例分割可精確到物體的邊緣,相對目標分割,實例分割需要標注出圖上同一物體的不同個體。
圖|AI技術(shù)的子領(lǐng)域
圖|計算機視覺用于醫(yī)療影像
四、要解決人類指定的各類任務,先要讓計算機模擬人類的學習機制
人類跟計算機的能力維度各有優(yōu)勢,讓計算機學習和模擬人類解決問題的方法是各類算法的起點。
人類會非常容易的辨別出垃圾郵件與貓狗,但是讓計算機做卻非常困難,因為這與發(fā)明計算機的最初任務有本質(zhì)區(qū)別。比如對1億數(shù)據(jù)進行混合四則運算或大小排序,這些任務讓人類執(zhí)行會非常低效,但計算機卻可以快速完成,而AI要處理的任務與計算機最初的任務恰好相反。
這促使人們思考人類的學習機制,理解人類的學習機制,有助于讓AI有效復刻這種能力機制。嬰兒根本不知道貓狗到可以一眼分辨出貓狗,是一個經(jīng)驗學習過程。首先需要一定的樣本資料,從現(xiàn)實中獲得大量信息,然后大腦將接受的信息進行學習、歸納、整理、總結(jié),最后形成知識與經(jīng)驗。計算機優(yōu)勢是計算能力非常強,可以處理海量數(shù)據(jù)。需要給計算機提供成千上萬的資料數(shù)據(jù)(貓狗照片)讓它進行學習,然后計算機再面對新樣本時才能以較高的準確率進行分辨。
圖|讓計算機模仿人類來解決問題具備理論上的可行性
五、基于AI習得的能力,AI能處理兩大類任務
AI處理的根本任務只有兩類,分類與回歸,人類大腦每日處理的也是分類與回歸問題。分類任務模型輸出是對象的所屬類別,數(shù)據(jù)類型是離散數(shù)據(jù),回歸任務模型輸出的結(jié)果是一個值,數(shù)據(jù)類型是連續(xù)型數(shù)據(jù)。
分類任務有二分類和多分類,二分類任務如貓狗圖像識別,多分類任務場景包括下棋與自動駕駛等場景。在棋盤上可以落子的個數(shù)是有限的,所以每一步阿爾法Go要做的就是根據(jù)當前已落子信息,預測出落子在每個可落子位置的勝率,然后選取勝率最高的位置進行落子。自動駕駛車輛上裝有多個攝像頭和傳感器來時刻監(jiān)視車輛四周的環(huán)境信息,可根據(jù)這些環(huán)境的圖像信息讓它選擇在每種情況下方向盤轉(zhuǎn)動多少角度、油門或剎車踩多深來實現(xiàn)車輛的自動行駛。
以網(wǎng)約車出行預測以及股價預測來說明回歸任務,回歸任務和分類任務并非嚴格區(qū)分。網(wǎng)約車出行預測,可根據(jù)上下車地點、時間、天氣情況、人流密度以及歷史記錄等因素,預測此刻某區(qū)域的網(wǎng)約車訂單數(shù),并以此為依據(jù)進行車輛調(diào)度,保證供需平衡。股價預測可根據(jù)歷史走勢、利弊政策、公司財報等因素對股價進行預測。分類問題在某種程度上可以看做為一個回歸問題,比如可以定義若一支股票漲幅會大于5%,就把它歸為買入類,在-5%至5%之間,就將它歸為持有類,跌幅大于5%的話就將它歸為賣出類。