2016年10月25日 星期二

CAT模擬分析─能力估計疊代不收斂

「能力估計疊代不收斂」的現象
        使用MAP能力估計法進行多向度CAT模擬分析時,有些受測者作答至某一題時突然出現能力估計疊代無法收斂(即每次疊代後的能力改變量無法小於某一特定的值,如0.001),此時這些受測者之模擬分析將無法繼續。換句話說,若使用此CAT於臨床上,將有些受測者因能力估計不收斂而無法完成CAT

能力估計疊代不收斂的原因有二

  1. 受測者作答反應與IRT模型預期差距太大。例如:模型估計受測者於某一題得0分的機率很低(如0.002),但該受測者實際作答結果竟為0分。
    由於前述期望機率與真實觀察到的作答兩者差距過大,使得MAP能力估計疊代法 (Newton-Raphson)之計算過程中,一階微分(觀察值減去期望值,為能力改變量估計之分子)無法趨近0,進而造成疊代後的能力改變量無法小於某一特定的值(不收斂)。甚至造成能力改變量絕對值成遞增。
  2. 受測者能力分布的變異數過大(相較於題目難度的分布範圍)。此現象將導致能力疊代時,各向度的能力變化程度非常大,而不易收斂。


2種解決辦法,以確保每位受測者都可完成CAT

  1. 增加測驗終止條件:當受測者之能力估計不收斂時,即停止CAT施測。並以【不收斂前一次估計結果當成最終施測結果】。
    例如受測者作答第5題時不收斂,即以作答前4題之能力估計值當作最終CAT施測結果。
  2. 改為使用EAP估計能力,以取代MAP。因為EAP能力估計時無須進行疊代,因此沒有收斂與否之議題。
二種解決方法1、2之缺點及選擇
方法1之缺點:CAT施測結果之信度較差。
方法2之缺點:EAP估計能力法於多向度CAT之效率很低。


若使用MAP估計時,疊代不收斂之人數不多,可考慮採用方法1。因為人數不多,所以對於CAT施測信度之影響不大。
反之,若疊代不收斂之人數多則選擇方法2。

後續應用
FAST CAT模擬分析時,約2%受測者遇到此問題。
未來將採用解決方法1重新分析,並比較方法1個結果是否與原本分析結果差異很大。



(上述內容感謝業太教導)

1 則留言: