9/7主要任務
|
進展與困難
|
背景前言
|
“驗證評估工具之不足”段落如下
Q. 是否需描述國外版結果?
|
9/8主要任務
|
目標
|
流程
|
Q 問題請教 :
問題確認與修改段落
|
背景前言
|
“擬評估之概念之重要性與其評估工具”段落
|
Background
本研究驗證之測驗為弦外之音測驗中文版,此中文版為葉在庭等人根據1994年Francesca Happe發展之弦外之音測驗(strange stories test)翻譯及修改而來。弦外之音測驗中文版目前具有部分心理計量特性之驗證,包括內部一致性、再測信度、與區辨效度。
信度研究部分,葉在庭等人於175位正常人之結果顯示弦外之音測驗中文版之內部一致性信度為α=0.93,三個月後的再測信度為r=0 .90,各題目的再測信度介於r=.90至.97之間;若再將常人分成五組(年輕組、壯年組、中年組、中老年組及老年組),分別分析其內部一致性信度,弦外之音測驗的內部一致性信度介於.89至.98之間,在老年組具有最高的內部一致性信度(.98)。因此其信度方面介於中等至高的範圍。
效度部分,葉在庭等人在15位高功能自閉症與亞斯伯格症候群及32位正常控制組之結果顯示弦外之音測驗中文版自閉症組之弦外之音測驗分數(M = 7.31)顯著低於控制組(M = 8.54)[t (45) =2.81, p = .04],具有區辨效度。
然而,弦外之音測驗中文版使用於思覺失調症患者之心理計量特性目前仍未知,因此本研究特別針對思覺失調症患者做驗證,除再測信度、內部一致性、區辨效度外,也針對最小可偵測差異值、收斂效度、生態效度、評估者間信度部分做驗證,其中再測信度部分將採用ICC而非pearson r做驗證,並加入Bland-Altman分析,以期更全面了解此工具應用特性。
Pearson r V.S.
ICC 整理
Pearson相關係數不適合用來評估信度之原因,在於其是用來評估線性相關之程度而非同意度,相關程度高時同意度可能很低。相關係數反映前測與後測分數關係相近程度,資料點是否在同條直線上,但不考慮斜率。如下圖示紅點與黑點兩者最適直線皆為黑實線,但黑點較接近實線故相關係數較大(r = 0.99 與 0.84) ,然而不論黑點或紅點皆未有位於虛線上者,即皆未達完全同意(complete agreement)。
Pearson r的缺點是可能讓人在解讀時忽略了系統性誤差,高估了數值代表之意義。和Pearson r不同的是,ICC可同時解釋前測與再測之一致性(within-subject change)及組內受試者平均表現隨時間之變化(i.e., systematic change in mean)。ICC經常用來計算兩組以上評估時的相關(通常之情況為超過2位評估者評估一組受試者),雖然ICC並非測量絕對同意度而是相對同意度之方式,但測量同意度時較常使用ICC多過pearson r。
ICC與Pearson相關係數皆受到受試者同質或異質之影響,同質性越高,係數數值越小;此外,極端質也會影響ICC與Pearson係數。因此,在閱讀信度研究或選擇評估工具時,需特別注意參與信度研究之受試者特性。
reference:
Vaz S, Falkmer T, Passmore AE,
Parsons R, Andreou P. The case for using the repeatability coefficient when
calculating test–retest reliability. PloS One. 2013;8:e73990
沒有留言:
張貼留言