恭宏的部落格: 4月 2020

認知功能評估的瓶頸

以下是我參與認知評估測驗發展與驗證後，從文獻上看到及親身體會到的瓶頸，分成二大類說明：概念與理論層次以及測驗發展與驗證層次

概念與理論層次

l 認知領域尚無被視為黃金標準的理論基礎，包括分類架構、定義及機轉。此瓶頸造成學術及臨床上溝通、評估以及介入的混亂。

l 藉由行為觀察理論上可推估個案的認知能力，但實際上難度很高，因行為通常受到眾多因素及多種認知能力交互影響，導致難以回推至個別認知功能的表現。

l 認知行為的評估非認知領域的研究主流，投入者少，認知領域高排名的期刊近年甚少刊載認知行為評估的文獻，故不易有新的突破。

驗發展與驗證層次

l 缺乏黃金效標測驗，導致測驗發展、改良或驗證上，難以檢驗評估工具的效度，即便做因素效度分析，若無外在的黃金效標測驗，仍無法確定測驗中的因素為何。此議題與認知領域尚無被視為黃金標準的理論基礎息息相關。

l 評估結果間的相關性普遍偏低，即使宣稱評估認知能力的測驗，若其測驗任務（如：工作記憶測驗中倒著背誦或重新排序）、施測方式（如：紙筆或電腦化）、計分指標（如：時間或對錯）不同，均造成評估結果之相關信偏低。此瓶頸限制效度的驗證，實證資料驗證結果往往得到不如預期的相關程度。

l 生態效度不佳，標準化情境下的評估內容往往離生活功能太遙遠，導致評估結果無法類推個案於日常生活功能的表現。
一種提高生態效度的方法，即為藉由日常生活功能觀察，然而，此一途徑除了有上述難以推估各向度認知能力的問題外，個案已非常熟習大多數的日常生活功能，故執行上已內化而不需使用大量的認知能力。
而太過刁鑽或太特定的日常生活功能，大多數個案可能不用從事或很少從事，又容易偏離「提高生態效度」的目的。

l 測驗結果易受到練習效應及作答策略影響，造成測驗結果之系統性誤差。尤其作答策略往往造成個案的結果難以比較或解釋，例如：傾向亂猜的個案，其得分可能高於同樣能力，但老實回答不知道的個案。又例如：操作速度快但正確率低的個案，與速度慢但正確率高的個案，此二者之表現優劣難以比較。

l 較複雜的認知功能（如：執行功能）其測驗規則往往較複雜，造成一定比例的個案因為不理解規則而無法評估。

l 評估完整性與評估時間長短的兩難。

AI可以提供的幫助

（僅先速記，未與上面的瓶頸對照）

l 語音分析。過去研究發現語言表達是認知功能好壞的指標之一，注意力、記憶力或執行功能不佳都可能造成表達不佳。目前認知評估較少藉由語言內容評估認知功能之評估工具，可藉由AI的自然語言分析技術發展之。

l 人體動作與物品偵測。藉由操作認知任務或日常生活活動，評估個案之認知能力，可取代或部分取代治療師的臨床觀察。

l 發展短版測驗。藉由機器學習的算則，找出測驗中部分題目組成短版測驗，降低測驗所需時間，且盡量不犧牲測驗的精準度。

l 腦波訊號、腦影像、穿戴式裝置等巨量資料分析。此為AI於認知領域目前應用較具成效之議題。由於上述資料量巨大，難以完全使用人工的方式分析或解讀，而巨量資料恰好也是能夠讓AI發揮潛力的基礎。
此外，藉由穿戴式裝置取得之資料可來自於個案之自然生活情境，有潛力克服生態效度不佳的瓶頸。

l 探索認知向度間與測驗間的關聯性及架構。藉由廣泛蒐集各個認知向度不同測驗的評估結果，組成巨量資料庫，以探索認知向度間與測驗間的關聯性及架構。

恭宏的部落格

2020年4月7日星期二

認知評估之瓶頸與 AI可能之突破

2020年4月7日 星期二

認知評估之瓶頸 與 AI可能之突破

2020年4月7日星期二

認知評估之瓶頸與 AI可能之突破