2020年4月7日 星期二

認知評估之瓶頸 與 AI可能之突破


認知功能評估的瓶頸
以下是我參與認知評估測驗發展與驗證後,從文獻上看到及親身體會到的瓶頸,分成二大類說明:概念與理論層次 以及 測驗發展與驗證層次

概念與理論層次
l   認知領域尚無被視為黃金標準的理論基礎,包括分類架構、定義及機轉。此瓶頸造成學術及臨床上溝通、評估以及介入的混亂。
l   藉由行為觀察理論上可推估個案的認知能力,但實際上難度很高,因行為通常受到眾多因素及多種認知能力交互影響,導致難以回推至個別認知功能的表現。
l   認知行為的評估非認知領域的研究主流,投入者少,認知領域高排名的期刊近年甚少刊載認知行為評估的文獻,故不易有新的突破。

驗發展與驗證層次
l   缺乏黃金效標測驗,導致測驗發展、改良或驗證上,難以檢驗評估工具的效度,即便做因素效度分析,若無外在的黃金效標測驗,仍無法確定測驗中的因素為何。此議題與認知領域尚無被視為黃金標準的理論基礎息息相關。
l   評估結果間的相關性普遍偏低,即使宣稱評估認知能力的測驗,若其測驗任務(如:工作記憶測驗中倒著背誦或重新排序)、施測方式(如:紙筆或電腦化)、計分指標(如:時間或對錯)不同,均造成評估結果之相關信偏低。此瓶頸限制效度的驗證,實證資料驗證結果往往得到不如預期的相關程度。
l   生態效度不佳,標準化情境下的評估內容往往離生活功能太遙遠,導致評估結果無法類推個案於日常生活功能的表現。
一種提高生態效度的方法,即為藉由日常生活功能觀察,然而,此一途徑除了有上述難以推估各向度認知能力的問題外,個案已非常熟習大多數的日常生活功能,故執行上已內化而不需使用大量的認知能力。
而太過刁鑽或太特定的日常生活功能,大多數個案可能不用從事或很少從事,又容易偏離「提高生態效度」的目的。
l   測驗結果易受到練習效應及作答策略影響,造成測驗結果之系統性誤差。尤其作答策略往往造成個案的結果難以比較或解釋,例如:傾向亂猜的個案,其得分可能高於同樣能力,但老實回答不知道的個案。又例如:操作速度快但正確率低的個案,與速度慢但正確率高的個案,此二者之表現優劣難以比較。
l   較複雜的認知功能(如:執行功能)其測驗規則往往較複雜,造成一定比例的個案因為不理解規則而無法評估
l   評估完整性與評估時間長短的兩難

AI可以提供的幫助
(僅先速記,未與上面的瓶頸對照)
l   語音分析。過去研究發現語言表達是認知功能好壞的指標之一,注意力、記憶力或執行功能不佳都可能造成表達不佳。目前認知評估較少藉由語言內容評估認知功能之評估工具,可藉由AI的自然語言分析技術發展之。
l   人體動作與物品偵測。藉由操作認知任務或日常生活活動,評估個案之認知能力,可取代或部分取代治療師的臨床觀察。
l   發展短版測驗。藉由機器學習的算則,找出測驗中部分題目組成短版測驗,降低測驗所需時間,且盡量不犧牲測驗的精準度。
l   腦波訊號、腦影像、穿戴式裝置等巨量資料分析。此為AI於認知領域目前應用較具成效之議題。由於上述資料量巨大,難以完全使用人工的方式分析或解讀,而巨量資料恰好也是能夠讓AI發揮潛力的基礎。
此外,藉由穿戴式裝置取得之資料可來自於個案之自然生活情境,有潛力克服生態效度不佳的瓶頸。
l   探索認知向度間與測驗間的關聯性及架構。藉由廣泛蒐集各個認知向度不同測驗的評估結果,組成巨量資料庫,以探索認知向度間與測驗間的關聯性及架構。