KIWI - as a graduate student: 7月 2015

2015年7月30日星期四

其他工具

多項評估工具之battery來評估multidimension的Social cognition是較合適之方式，然而目前仍未有一全面之評估工具，所以單一工具可能都不足夠，

1. 所以能廣納不同種類之心智推理評估工具是最好? 太多評估工具是否會造成焦點之模糊或混亂?

2. 或者其實可以獨立來看，不需計較使用幾種工具，目的只是看現有評估工具中那些較有發展之潛力?

其他測驗:

測驗名稱	是否有中文版	相關中文版介紹
Reading the Mind in the Eyes Test	有台灣兒童版	說明: 由Baron-Cohen等人所設計，主要在測量心智推理能力的社會知覺層面，此測驗相對於其他測量社會認知層面的心智推測能力工具，可能跨文化的適用性較佳。中文版由黃文怡經雙向翻譯而成，此兒童版測驗共包含28題，每題由一眼神部位圖片及4個心理狀態詞彙組成，受試者須由詞彙中選出一合適之詞彙。心理計量特性: 此測驗具有可接受的的信效度，在臨床上可區辨AD兒童及一般兒童，但無法區辨AD及ADHD兒童，因此只適於作為AD的初步篩檢工具，不應只根據此測驗之結果作診斷。思考:仍是外國人之眼部圖片，跨文化適用性待了解。參考: 1. 吳思宜(2011)。電腦輔助訓練軟體對國小亞斯伯格症兒童情緒辨識能力之成效研究。碩士論文。 http://163.21.239.2/cgi-bin/gs32/gsweb.cgi?o=dstdcdr&s=%22GT000G971414%22.id.&#XXXX 2. 黃文怡(2009)。眼神辨識測驗兒童版的信效度研究：探討台灣學童心智推測能力。碩士論文。(無法下載電子全文) http://ndltd.ncl.edu.tw/cgi-bin/gs32/gsweb.cgi/login?o=dnclcdr&s=id=%22097CGU05762004%22.&searchmode=basic
	有中國大陸版	由Baron-cohen等人設計，包含34張眼部區域之圖片，每題由一眼神部位圖片及4個心理狀態詞彙組成。大陸版由汪永光等人翻譯。思考: 心理計量特性未知，且是大陸版參考: 汪永光, 汪凯, 朱春燕, 汪辉(2006)。A study of theory of mind deficit in first-episode schizophrenic patients。中國神經精神疾病雜誌。32:481-486
	論文中有提到，無詳細資料。	參考: 謝文菁(2012)。精神分裂症患者的症狀與認知、情感心智理論能力缺陷之關連性研究。碩士論文。 (限館內使用) http://thesis.lib.cycu.edu.tw/ETD-db/ETD-search-c/view_n_etd?URN=etd-0622112-110159
The Hinting Task	無
The Awareness of Social Inference Test (TASIT)	有	由McDonald, Flanagan, Rollins, Kinch 等人於2003 年提出。施測材料由演員拍攝之短片，每段短片從15-61秒不等（平均約26 秒），受試者須由影片主角之對話、情緒表達、及其他線索推論出主角意圖。測驗目的為測量個體的社會推論行為，即推論之他人情緒以及根據社會線索來評估他人心智狀態和真正意圖的能力，故包含了情緒辨識、社交情境相關的評斷、以及心智推理等。原本是用來測量腦傷患者之社會推論行為，但目前已被其他研究者用於思覺失調症、額顳葉型失智症、阿茲海默症、以及中風的個案身上，被認為是在臨床上敏感的測驗工具。思考: 考量施測時間之限制，適合選有影片之測驗嗎? 目前無詳細資料，尚未知跟原版差異，原版分三部分，至少需施測1小時。參考: 1. http://info.acsite.org/071480/index.php/2013-01-02-03-01-27 2. 林允中(2012)。邊緣性人格疾患患者人際互動下情緒辨識及心智推理之研究。輔仁大學臨床心理系碩士論文。未出版，台北市。全文開放日期2018.7.1 http://scholar.fju.edu.tw/paper/013287.html
Brune Picture Sequencing Task	無
非語言心智推理作業（Non-verbal theory of mind）	有	說明: 測驗心智推理能力之作業，包括十張圖片，詢問受試者：「下面這張圖再說什麼故事？」，分數越高，則表示受試者心智推理能力越好。此外，問題有兩種問法，一為隱式（implicit）問法，另外為顯式（explicit）問法，隱式問法是以開放式的詢問（如：這張圖片有趣的地方是什麼？），而顯式問法則直接請受試者思考圖片人物的動機（如：下面這個人為何要這樣做？）。總共測量時間約30分鐘。心理計量特性: 圖片的計分部分，在175份結果中隨機抽樣40份進行評分者間的信度考驗，發現評分者間的記分一致性高達98%。內部一致性信度分別為 .92、.87，三個月後的再測信度分別為 .86、.88，各題目的再測信度介於.80至.94之間；因此其信度方面介於中等至高的範圍。參考: 葉在庭、花茂棽(2009)。猜猜我在想什麼？--- 中文版心智推理作業的信效度研究及其在老年人的表現初探。中華心理學刊。51(3), 375-395. 題目：這張圖片為什麼有趣？思考: 題目感覺不容易。
初級及次級錯誤信念作業	有	說明: 分為初級錯誤信念及次級錯誤信念，各三大題，加上二題控制題故共八大題，每一大題詢問四小題，分別為（i）錯誤信念（例如：大德認為果汁放在那裡？）（ii）現實問題（例如：果汁現在放在那裡？）（iii）記憶問題（例如：剛開始果汁放在那裡？）及（iv）物理推論問題（例如：果汁可能會弄髒那裡？），共32小題。心理計量特性: 初級、次級錯誤信念的內部一致性信度為 .50（α分別為 .50及.67，各三題），三個月後的再測信度為 .92及 .94，初級及次級錯誤信念的內部一致性信度較低，探討其原因是由於題目數量過少，均為三題。思考:目前已選擇之工具包含弦外之音及失態偵測，皆是評測高階心智推理且屬於語言式心智推理作業，是否不需要再納入較低層級之測驗，如初級及次級錯誤信念作業。參考: 葉在庭、花茂棽(2009)。猜猜我在想什麼？--- 中文版心智推理作業的信效度研究及其在老年人的表現初探。中華心理學刊。51(3), 375-395.
初級及次級錯誤信念作業	有	說明: 研究者參考Wimmer and Perner的“Sally-Ann tests” 及“Ice Cream Van tests”，設計初級及次級錯誤信念作業，初級及次級錯誤信念各包含3段影片，受試者須看完影片後回答問題。每個影片持續時間約100秒。心理計量特性: 此測驗具內容效度，超過90%專家(10位臨床心理畢業生)同意其為一有效評估工具。思考: 題數不高，但相較葉在庭紙本測驗，看影片仍較花時間；心理計量特性較缺乏。參考: 顏慧詩(2009)。輕度阿茲海默症合併妄想症狀有無與心智理論功能之相關探討。碩士論文

2015年7月27日星期一

內部一致性 (信度)

定義: 測驗中的所有項目是否評測到相同之概念或建構，因此和測驗中所有項目間之相關性
          (inter-relatedness)有關。
表示: Cronbach alpha (數值介於0-1),0.7-0.95是較好的數值，一般來說，0.9是最建議之數值，alpha值過高則代表有測驗項目測量到相同東西而顯得多餘。

重要性: 知道測驗之內部一致性可以知道哪些題目要增加或捨棄，可以確保效度。

特性: 測驗中項目彼此愈相關則alpha值越高，但高的alpha值不總是代表高的內部一致性，測驗題目的增加可以提高alpha值。

影響alpha值之因素:
1.測驗長度: 測驗長度太短時，alpha值的價值減低，會造成信度之低估。
2.測驗向度: 測驗項目具多向度，會造成信度之低估。
3.項目間相關性

與unidimensionality之比較:
      內部一致性為unidimensionality之必要而非充分條件，測驗具unidimensionality則題目有內部一致性；但有內部一致性不一定是unidimensionality之測驗。信度之概念假設測驗項目為unidimensional，若有違背，可能造成測驗項目信度之低估。
     藉由因素分析或IRT分析可以確認測驗之dimension，一個multidimensional之測驗alpha值不必然小於unidimensional之測驗，因此alpha值無法純粹代表內部一致性。當測驗包含許多不同概念或建構時，就不適合用alpha值來代表整個測驗，而應分開不同概念之項目來計算。

Reference:
Tavakol M, Dennick R. Making sense of cronbach's alpha. Int J Med Educ. 2011;2:53-55

圖一、此圖展現內部一致性與單向度之關係，具內部一致性不一定為單向度。

Reference:
Gardner, P. Measuring attitudes to science: Unidimensionality and internal consistency revisited. Research in Science Education.1995;25:283-289.

圖二、
reflective model中之項目高度相關，且可互換(interchangeable)，屬於單向度；相反，則稱formative model，例如壓力之測量可藉由詢問不同情境、事件之發生與否，這些事件並不高度相關，因此不適合評量內部一致性。

Reference:
Mokkink LB, Terwee CB, Knol DL, Stratford PW, Alonso J, Patrick DL, et al. The COSMIN checklist for evaluating the methodological quality of studies on measurement properties: A clarification of its content. BMC Medical Research Methodology. 2010;10:22

心得:
之前老師提到若未驗證單向度，則內部一致性之意義有限。由文獻可看出，多向度的測驗在每個向度中仍可看其內部一致性。然而，我所採用之社會認知評估工具，應為單向度較合理，故仍須藉由因素分析等方法來確認其向度。

問題:
1. 弦外之音測驗只有五題，如此少題是否也不適合內部一致性之檢驗?
2. 想請問圖二之checklist中，missing items是指未評到之部分嗎? missing items對心理計量驗證之結果影響會很大嗎?

2015年7月26日星期日

討論紀錄

1. 測驗的施測方式:

優劣比較:

測試方式	優點	缺點
個案自行閱讀紙本	較簡單方便	個案專注度較低，可能分心
治療師朗讀	可讓個案專心	治療師可能影響作答結果
個案朗讀出題目	可讓個案專心又不受治療師影響	個案疲勞，需要個案願意
專人錄音成CD	可讓個案專心又不受治療師影響	選擇合適之專人較不易

要如何選擇合適之方式:

1.目前的比較仍是臆測較多，藉由經驗與實際之測試才能確認最合適之方式，也可做小研究。經由測試結果，可以判斷方式之可行與價值，然而小測試能否概化，有時也需碰運氣。

2.參考設計者、使用者的方式，寫信問研究者選擇之考量與經驗。

p.s.專人錄音不難找，花費不大，然要需能說服其必要性。

2.測驗之題目順序 :

原測驗發展者有考量到題目次序問題，雖然我認為臨床可行性不高，且順序影響不大。但題目順序是否會造成影響，需要一個明確之理由（rationale），如從題目之內容去考量。

而假如想使用隨機順序，對於減少受試者記憶效應的幫助可能不大，卻會徒增困擾。

3. 內部一致性，若是單向度，即可驗證之。相關探討記錄於下篇。

4. 再測信度間隔的選擇考量重要因素後由研究者在合理範圍內自行設定，若被否決則表示考量不周。

5.許多文獻指出使用包含多項評估工具之battery來評估multidimension的Social cognition是較合適之方式，故可再搜尋有無其他中文版測驗。

6.寫作要經大量練習後，才能掌握核心與效率。

2015年7月30日 星期四

其他工具

2015年7月27日 星期一

內部一致性

2015年7月26日 星期日

討論紀錄

2015年7月30日星期四

2015年7月27日星期一

2015年7月26日星期日