第七章 人事測量的關鍵技術:信度
信度是標準化人事測量的基本要求之一。
一、人事測量的可靠性——信度
(一)信度的定義
1、信度主要是指測量結果的可靠性或一致性。
2、卡尺作為一種量具是有一定精度限制的,也就是說,量具本身有誤差,這種誤差是必然的,但卻是有規律的。這種誤差叫做系統誤差。
3、我們每一次測量都可能有操作上的差異,或者由于不可預見的外界因素的影響,從而造成誤差,這些誤差也是難免的,但卻是毫無規律的。這種誤差叫做隨機誤差。
4、在研究信度時,主要應考慮兩方面的問題:一方面是穩定性問題涉及:
(1)測驗分數一致性的程度,即不同時間、不同測驗條件下所得分數之間的一致性有多大;
(2)一個人的獲得分數與“真實分數”之間接近程度如何;
(3)測驗的測量一致性是否可以達到實際應用的程度等問題。
另一方面是影響穩定性的原因,即分數不穩定、不一致的原因:
(1)什么因素造成了這種差異;
(2)這些效應的相對作用如何。
(二)信度的作用
1、信度高低指標通常以相關系數表示,稱為信度系數。信度系數一般是同一樣本所得的兩組資料的相關,在理論上表示為實得分數與真實分數相關的平方:rxx=rxr2=ST2/SX2
其中,rxr=ST/SX有時也稱為信度指數,它是真實分數標準差與實得分數標準差的比率。
2、誤差的大小與測驗的信度有直接關系:兩次測驗分數的差異越大,信度就越低。
3、在人事測量中,對信度系數進行確定通常有以下兩方面的作用:
(1)解釋真實分數與實得分數的相關。應該注意的是,信度系數的分布是從0.00~1.00的正數范圍,代表了從缺乏信度到完全可信的所有狀況。
(2)說明可以接受的信度水準。一般來說,當rxx 小于0.70時,不能用測驗對個人做評價,也不能在團體間作比較;當rxx 大于0.70時,可用于團體間比較;rxx大于0.85時,可用于鑒別個人。
二、如何評估人事測量的信度
(一)重測信度
1、重測信度又稱為穩定性系數,它的計量方法是采用重測法:用同一測驗,在不同時間對同一群體施測兩次,這兩次測量分數的相關系數即為重測系數。根據重測相關系數的高低,可以得知測量結果在經過一段時間之后的穩定程度。重測信度越高,說明測量的結果越一致、越可靠。
2、在評估重測間隔的時間。間隔時間太短,被試對測試題記憶猶新,必然會造成假性高相關;而間隔時間太長,測驗結果又會受應該者的身心特質改變的影響,使相關系數降低。重測間隔時間的長短,必須根據測驗的性質和目的來確定。
3、對于人格測驗,重測間隔在兩周到六個月之間比較合適。
4、在進行重測信度的評估時,還應注意以下兩個重要問題:
(1)重測信度一般只反映由隨機因素導致的變化,而不反映被試行為的長久變化。
(2)不同的行為受隨機誤差影響不同。
(二)復本信度
1、復本信度又稱等值性系數,它是以兩個測驗復本來測量同一個群體,然后求得應試者在這兩個測驗上得分的相關系數。復本信度的高代反映了這兩個測驗復本在內容上的等值性程度。兩個等值的測驗互為復本。
2、計算復本信度的主要目的在于考察兩個測驗復本的題目取樣或內容取樣是否等值。
3、復本信度的主要優點在于:
(1)能夠避免重測信度的一些問題,如記憶效果、練習效應等;
(2)適用于進行長期追蹤研究或調查某些干涉變量對測驗成績影響;
(3)減少了輔導或作弊的可能性。
4、復本信度的缺點:
(1)如果測量的行為易受練習的影響,則復本信度只能減少而不能消除這種影響;
(2)有些測驗的性質會由于重復而發生改變,例如某些問題解決型號的測驗,如果掌握了解題原則,就有可能產生遷移;
(3)有些測驗很難找到合適的復本。
(三)內部一致性信度
重測信度和復本信度分別注重考慮測量跨時間的一致性和跨形式的一致性,而內部一致通過性信度系數主要反映的是測驗內部題目之間的關系,考察測驗的各個題目是否測量了相同的內容或特質。內部一致性信度又分為分半信度和同質性信度。
1、分半信度
(1)分半信度系數是通過將測驗分成兩半,計算這兩半測驗之間的相關性而獲得的信度系數。
(2)一般采用奇偶分半的方法,即將測驗按奇數題和偶數題分成兩半。
2、同質性信度
(1)同質性是指所有測驗題目測量的只是單一特質或內容,表現為所有測驗題目得分的一致性。
(2)同質性信度是指測驗內部的各題目在多大程度上考察了同一內容。同質性也可以作為效度的一種指標。
(四)評分者信度
1、評分者的評判也是誤差的來源之一。
2、評分者信度是指不同評分者對同樣對象進行評定時的一致性。
各種信度系數相應的誤差來源
信度系數類型 誤差方差來源
重測信度 時間取樣
復本信度
(連續施測) 內容取樣
重測復本信度 時間和內容取樣
分半信度 內容取樣
同質性信度 內容的異質性
評分者信度 評分者差異
一般情況下,間隔施測的復本信度值最低;修正后的分半信度值最高。
三、影響信度的因素
對測驗的信度造成影響的因素主要有:樣本團體的性、測驗的長度、測驗難度。
1、樣本團體的性質
樣本團體的性質對信度的影響主要有以下三個方面:
(1)樣本團體的分數分布。任何以相關系數表示的信度系數都會受樣本團體分數頒布的影響。分數分布越廣,信度系數就相對越高,分數分布越窄,信度系數就會越低。
(2)樣本團體的異質性。信度系數還會受到樣本團體異質性的影響。一般來說,取樣團體的異質性越大,信度系數就相對越高。
(3)不同團體間能力水平的差異。測驗所施測的團體的平均能力水平的不同也會對信度產生影響。例,在斯坦福-比奈量表中,不同年齡組的信度從0.83~0.98不等。
2、測驗的長度
一般來說,測驗越長,信度值越高。一方面,測驗越長,題目取樣或內容取樣就越充分,結果就越可靠。
另一方面,較長的測驗也不容易受到猜測的影響。
3、測驗的難度
(1)如果一個測驗的難度太低,測驗分數會非常集中并聚在高分端,即出現天花板效應。或者難度太大,所有分數都集中在低分端,出現地板效應。
(2)當所有被試的平均分為測驗總分的一半(50%),并且分數從零分到滿分分布時,測量的信度最高。
聲明:
(一)由于考試政策等各方面情況的不斷調整與變化,本網站所提供的考試信息僅供參考,請以權威部門公布的正式信息為準。
(二)本網站在文章內容來源出處標注為其他平臺的稿件均為轉載稿,免費轉載出于非商業性學習目的,版權歸原作者所有。如您對內容、版權等問題存在異議請與本站聯系,我們會及時進行處理解決。
相關推薦
2022年浙江自考《當代中國政治制度》復習筆記匯總
09-152023年10月浙江自考傳播學概論復習資料:有限效果論
08-302022年浙江自考中國古代文學史(一)第三編第九章復習資料
10-312023年4月浙江自考外國文學史復習筆記:高爾基
12-26自考輔導資料:2019年10月《美學》知識點-崇高的內涵與特點
09-17自考輔導資料:2021年10月《學前教育史》—論幼稚師范教育
06-05自考輔導資料:2019年10月《美學》知識點-優美及優美的內涵與特點
09-172023年4月浙江自考中外教育簡史復習筆記:西歐中世紀教會學校
12-102022年浙江自考心理學復習筆記:情緒情感的功能
11-032023年4月浙江自考中外教育簡史復習筆記:英國近代教育制度
12-08