智力的科學研究從一開始就與智力的測量緊密地聯系在一起。早在二千多年以前,中國的先哲們就提出了許多測量人的智力以及其他心理特征的思想和方法(劉劭,約168~240)。現代智力測驗的出現只是近一百多年的事。
一、智力測驗概述
心理測驗意指在對心理進行測量時所使用的工具,有時也稱心理量表。通常它是由一組精心設計的測試題目或項目組成,其作用在于抽取一組標準化的行為樣本,通過對這組行為反應的觀察分析,測驗者就可以對引起行為的心理活動做出推論和解釋。心理測驗依其所測的內容和分類的標準不同,種類繁多,如人格測驗、教育測驗和團體測驗等等,智力測驗是心理測驗的一種,也是最早發展的測驗之一。
(一)智力測驗的產生
19世紀中葉,達爾文的進化論激發了人們對智力和心理能力的研究。可以設想,如果生存的重要因素是對環境的適應,那么,在人類進化中,智力必定起著重要作用。高智力的人由于其對環境的優良適應性必定通過自然選擇,被保留下來。根據這種思想,達爾文的表兄弟高爾頓(Francis Galton,1822~1911)對智力進行了第一個系統性研究。他認為,智力水平的高低與神經系統的完整性和功能有效性有關,外部世界的信息是通過我們的感覺到達于大腦的。感覺越敏銳,獲得的信息越多;信息越多,判斷與思維越有用武之地。感覺辨別力"基本上是心智能力中最高的能力"。為此,高爾頓設計了多種測量工具,用于度量人們在各種感覺辨別力上的差異,例如,對聲音的反應時間、命名顏色的速度等等。但以后的研究發現,在簡單的感覺判斷和更復雜的認知能力之間幾乎不存在任何關系。
世界上第一個正式的智力測驗,是由法國心理學家比內和醫生西蒙(Binet &Simon)在1905年編制的。它的產生是為了分辨出不適合在一般學校學習的智力落后兒童,從而給以特殊教青。比內認為,智力是由多種能力組成的,智力測驗必須包含大量不同類型的測驗項目。同時,年齡也是影響測驗結果的一個關鍵因素,最聰明的3歲的孩子也不能與一個智力一般的9歲孩子相提并論。為此,他們提出了"心理年齡"的概念,表示智力水平的辦法是計算智商。
(二)智力測驗的種類
心理測驗本身依據題目形式、編制目的、施測要求、解釋方式等可以劃分為各種不同的類型,這里介紹幾種與智力測驗有關的分類。
1.個別測驗和團體測驗
任何測驗都可以由主試者向一個人單獨施測,也可以同時施測于一組人。根據施測對象的數目,測驗可以劃分為個別測驗和團體測驗。
個別測驗指那種在同一時間內主試者只能對一個受測者進行施測的測驗。如比內量表、韋氏兒童智力量表等大多數兒童智力測驗都屬于個別測驗。個別施測對于某些特殊對象,如幼兒、智力障礙兒童等尤為必要。它耗費的時間和精力較多,測驗程序比較復雜,并且主試者必須進行嚴格的訓練后方能勝任。因此顯得不夠經濟,短時間內不可能獲得大量資料。
團體測驗與個別測驗相反,能夠在同一時間內由一位主試者對多名受測者進行施測,如一般的教育測驗,各種人格量表,以及團體智力測驗等都是集體進行的。團體施測較之個別施測顯然可以節省大量人力與時間,并且可以在短時間內收集大量信息,同時主試者也無須接受嚴格的專業訓練。不過它的缺點也正與個別測驗的優勢相反:主試者無法充分觀察和控制每一位受測者的反應,測量誤差不易控制。
2.文字測驗和非文字測驗
測驗題目可以由各種不同的方式呈現,比如數字、文字、圖形或各種實物都可用以組成題目進行測驗,測驗呈現的方式不同,受測者的作答方式也不一樣。根據這一點,心理測驗可以劃分為文字測驗和非文字測驗。
文字測驗的題目以文字材料組成并呈現,要求受測者用文字或語言的方式作答。文字測驗的實施比較簡便,而且較易于測量人類高層次的心理功能。但是,這類測驗容易受社會文化背景的影響,在跨文化比較研究中應用比較困難。同時,不同的文化程度會影響測驗結果,對于那些在語言文字方面有困難的人和幼小兒童則完全不適用。
題目不以文字表述,受試者不以語言或文字方式作答的測驗稱為非文字測驗。非文字測驗的說明由主試者口頭敘述,測驗題目多屬于圖畫、工具、模型等,對儀器、實物等辨認或操作的操作性測驗,也屬于非文字測驗。這類測驗一般只適用于個別施測,費時費力,且對測驗結果的評分易于受主觀因素的影響,很難達到嚴格的標準化水平。但是由于其材料的特殊性,這類測驗不易受文化因素的影響,可用于廣大文化水平較低者,如學前兒童、文盲等,并且適合于進行跨文化研究。
由于一個人在認知領域的知識往往并不能代替其在操作領域的技能,因此一般的智力測驗同時包含兩類題目,并且將兩部分測驗先分別計分,然后再結合起來進行解釋,效果較好,如韋氏兒童智力量表。
3.速度測驗和難度測驗
速度測驗關注的是回答題目的速度,要求受測者盡快地作答,完成題目越多越好。其目的在于考察受測者在測驗任務上的反應速度。速度測驗一般由比較容易的題目組成,不需要深入思考,只是題量大而時間限制非常嚴格,一般情況下幾乎沒有受測者能夠在允許的時間內完成全部題目。這類測驗以受測者在規定時間里答對的題目數量來區分優劣,常用于測查需要牢固掌握的基礎知識部分。
難度測驗關注的是被試答題的正確性,要求受測者認真思考,準確地回答問題。測驗的構成比較復雜,題目從易到難排列,最難的題目幾乎沒有一個受測者能夠解決。這類測驗可以沒有時間限制或限制得非常寬松,通常以95%的受測者都有可能做完全部題目為前提來規定時間。它旨在測量受測者的解題技巧和解決問題的最高能力水平,以完成的數量和準確性為計分標準。各類學科競賽所用的測驗可謂難度測驗的典型示例。
(三)心理測驗的性質
智力測驗是心理測驗的一種,心理測驗本身所具有的性質,智力測驗都具有,下面簡
要介紹一下心理測驗的基本性質。
1.心理測量的對象是心理特質
心理測量中作為研究對象的心理屬性,稱心理特質,如學習動機、記憶廣度、推理能力和情緒穩定性等等,智力測驗所測量的智力也是一種心理特質。心理特質指的是使一個人對于較廣泛的一類情景穩定地做出同一反應的心理特點,它是建立在對人類大量相似行為進行觀察的基礎之上的一種科學構想,它是心理學家用以描述或解釋行為的工具,不是客觀事物。
2.對心理特質的測量是間接的
心理特質作為一種科學構想本身是抽象的,不可能直接觀察到,因而對它的測量只能是間接的,即從行為樣例中推理得出。盡管對于有些心理特質的測量方法在長時期使用中已經標準化,使用得相當普遍,但至今還沒有對哪一種構想的測量方法得到普遍接受。因此時常有下述情況出現:兩個具有不同理論觀點的測驗編制者,為測量同一種心理特質,使用著不同的間接測量途徑,即選用不同的行為表現進行操作性說明。例如對兒童智力,有人用特定實驗上的反應時長短去測定,有人用非文字智力測驗的得分去測定,也有人認為只有把智力測驗中言語部分和操作部分相結合才是最佳選擇。
3.心理測量具有誤差
任何測量,無論是物理的抑或心理的都會出現誤差。任何測量進行多次,其結果不會完全一致,心理測量的誤差尤為突出。因為心理測量是從對一個行為樣本的觀察中獲得數據,再去推論得出結果,從部分推論整體,用以解釋一個人的心理特質,自然不會百分之百的準確。同時,這有限的觀察數據又是在某一特定時間、地點條件下獲得的,引起誤差的因素多種多樣,即便采取措施也不可能完全避免,從對心理特質的理論說明,到計分、評分和結果解釋各個環節上,都會有誤差出現。因此,只憑一次測驗結果并不能完全準確地反映所要測量的心理特質。要了解一個人如此行為的原因,或進一步由此預測他的未來行為,需要多方面考慮。
4.心理測量工具的適用性與社會文化背景有關
任何心理測驗的適用性都有其特定的范圍,它在測驗編制開始時就已確定,依據測驗的目的,適合于使用該測驗的被試團體稱為目標群體。任何心理測驗也只有當它被應用于它所適用的目標群體時,才能顯示出它的效能。由于人的心理在不同文化、教育和社會環境中有很大差異,如果把一個測驗應用于目標群體之外的個人或團體,那么使用其原有的常模來做評定就很不恰當,會對結果做出既不客觀、又不公正的判斷。由于社會因素的影響,甚至在同一個社會文化團體中,不同性別或不同年齡的受測者對同一個測驗的反應也不一致。因此,我們在選用測驗工具時,除審查測驗本身的質量外,還需要考慮它的適用性特征。
二、心理測驗的技術指標
我們在選擇一個智力測驗來度量智力水平時,首先會考慮到:用這種工具測得的結果準確
嗎?測驗分是否能有效地預測他在現實生活中取得的成就或他的學習成績?每次所測得的結果都一致嗎?測驗結果的一致性和準確性,即測驗的可靠性和有效性,是任何一個良好的測量工具都必須保證的前提,在測量學上稱之為信度和效度。智力測驗與其他測量工具一樣,必須具有一定的信度和效度,才能對人的智力做出客觀、準確的度量,并對測量結果做出合理的解釋。
(一)信度
信度即可靠性,是指多次測驗結果的一致性程度。一個好的測量工具,對同一事物反復多次測量,或由不同的人使用,其測量結果應該保持不變。正如用一個體重計在一天內測量某人的體重,如果每次測量結果相差很大,我們知道人的體重不會產生很大波動的,因此,這個體重計不是一個可靠的測量工具。
任何測驗,它都是只對一個行為樣本進行測量的,這樣以它為基礎所做推論就不可能絕對精確。正如你在一門課程上的多次考試,由于題目不同,每次所得分數也不會完全相同一樣,測量的結果總包含著一定的測量誤差。信度依據誤差大小有程度上的差異,大小介于0與1之間。通常由兩個測量結果的相關系數來表示,稱之為信度系數。根據誤差源的性質,一個測驗的信度可以分為以下幾種。
1.再測信度
再測信度是指測驗結果跨時間的一致性。它是用同一個測驗對同一組人前后進行兩次測量,兩次測驗分數的相關系數就是再測信度。再測信度反映的是兩次測驗結果有無變動,因此又稱穩定性系數。
2.評分者信度
評分者信度是指不同評分者之間在測驗結果計分上的一致性。當測驗結果是由評分者主觀評定時,評分者信度尤為重要。例如在體操比賽中,裁判評分的一致性直接影響著運動員的名次,因此一般都要取消兩極各一個分數后再求平均成績。在心理測驗中,評分者信度的計算,通常是隨機抽取若干份試卷,由至少兩位受過訓練的評分者按計分規則分別判分,然后計算它們的相關。幾個評分者的評分越一致,評分者信度越高。
3. 內部一致性信度
內部一致性信度又稱同質性信度,是指一個測驗或分測驗中各題目所測內容的一致性。智力測驗通常由許多不同的題目構成,內部一致性信度可以通過將測驗題目區分為兩半,比較人們在兩部分上的得分情況獲得。如果測量題目之間具有很高的相關,表示具有高內部一致性,或者說同質性信度很高。一般說來,智力測驗的同質性信度較高。從測量方法上考慮,這樣求得的信度也稱分半信度。
(二)效度
效度是指測量的有效性,即一個測驗對它所要測量的特性準確測量的程度。一個測驗總是為一定的測量目的而設計編制的,并具有一定的操作規則和使用范圍,判斷它的效度高低,首先要看它達到測驗目的的程度,如果能正確地測量出所要測的東西,那么它就是高效度的測量。例如,用英文書寫的算術題測量兒童算術能力,他的成績不佳可能出自算術能力低,也可能出自英文水平差未能理解題意。因此,作為能力測驗便是無效的。同理,智力測驗只能用來度量智力,而不能用它來度量個性,否則也是無效的。
與信度相比,效度是一個更復雜、更重要的概念。心理學家一般將效度進一步分為內容效度、構想效度和預測效度。
1.內容效度
所謂內容效度是指測驗題目對預測的內容或行為范圍取樣的適宜性程度。例如,教師在講課告一段落后要進行考試,而考題不可能包含講過的所有內容,必須從中選出一個有代表性的題目樣本,編制成測驗,然后根據考試分數推斷學生對該范圍內知識技能的掌握情況。如果測驗題目不是該范圍內的有代表性樣本,或者過難或者過易,那么由此做出的推論,其效度必然很差。
2.構想效度
構想是指心理學理論所涉及的抽象而屬假設性質的概念或特質,如智力、焦慮、自我、外向、攻擊性等等。構想效度表示一個測驗是否達到了對某一理論概念或特質的測量。如果一個智力測驗測得的結果與該測驗所依據的智力理論或假設相符合,那么,我們說該測驗具有較高的構想效度。
構想效度的確定通常需要綜合評價各種不同的資料,一般采取兩種途徑:一是考察它與度量同類構想的測驗是否相關,二是考察它是否與不應有關的東西無關。例如,羞怯測驗的分數應與一個人出現在聚會上的次數、團體中的發言多少以及父母和朋友的評價有關,而與度量其他構想的測驗分數,如空間知覺、推論能力等基本無關.
3.預測效度
預測效度又稱效標關聯效度,是指一個測驗對處于特定情景中的個體的行為進行預測的有效性,也就是對我們所感興趣的行為能夠預測到什么程度。在這里,被預測的行為是檢驗測驗效度的標準,簡稱效標。一個心理構想的外部行為表現可能很多,因此,用于檢驗測驗的效標也很多,效標關聯效度也就不止一個。如果一個人在選拔消防員的測驗上得分很低,而他在防止火災和滅火中表現得與真正的消防隊員一樣好,那么,毫無疑問,這個測驗不能用于消防員選拔,它的預測效度太低了。
如果一個測驗是有效的,它必定是可靠的。但反過來,一個測驗具有很高的信度,它并不一定是有效的。比如,如果我們使用一個指標偏高的秤測量體重,盡管每次測量都得到一致的結果,但它并不能準確測出人的體重。
(三)測驗的標準化
除非我們知道參加測驗的都是什么人,以及所有參加測驗的人的得分情況,否則,我們單從一個測驗分數能夠獲得的信息很少。假如你在心理學課的考試中得了80分,那么,這個成績能否說明你學得好呢?顯然,答案是不一定。如果你知道大多數人的成績都沒過70分,或大多數人的成績都在90分以上,那么,你就可以肯定地知道自己考得究竟如何了。在這里,大多數人的得分情況為我們評估成績的好壞提供了評價的基礎或參照系。
在一個測驗正式付諸使用以前,測驗的編制者都要建立常模,以使測驗分數的解釋更加清晰、明確。常模是解釋測驗結果的參照指標,由總體測量結果的統計平均值表示。將測驗施測于一個標準團體,即總體中的一個有代表性的樣本是制定常模的必要條件。參加測驗的每一個人所得原始分都要與常模團體相比較才能做出解釋,即指出該分數在總體上所處的位置。
最常見的兩種常模表示法是百分位系統和標準分數系統。百分位系統,又稱百分制,它是將一組測驗分數分成100等分。一個百分位數反映在標準團體中高于和低于某個分數的人數比例。例如,不管實際的得分是多少,如果某人在測驗中的得分為80百分位數,那就意味著高于這個分數的人只有20%,他處于80%下面人的最前端。標準分數系統是一種更復雜的常模表示方法。由于幾乎所有能力測驗的分數分布都呈正態曲線形式(如圖6.4所示)。標準分數是根據測驗分數的正態性質確定的,每個測驗分數為正態曲線上的一個點,一個分數離中點越遠,獲得這一分數的人數越少,而它所處位置以標準分數來表示,即Z分數=(X-M)/S,其值介于+3和-3之間。
圖6.4 正態分布與智力測驗分敏
大量施測的結果測驗分數呈正態分布形式。大多數人的智商分數落在中央部分,而高低兩個極端則人數很少。該分布的平均數為100,標準差為16(比內量表)或15(韋氏量表)。
應當注意的是,除非標準團體是當前參加測驗總體的有代表性樣本,否則,由常模得出智商分數是不準確的。有些測驗成績會因時代的變遷而有所提高。如果用過去的測驗給現在的人施測,我們會發現大部分人的成績可能超過過去的平均分。在學校里,經常發生用過去幾十年的常模解釋現在的測驗結果,而得出現在的學生更聰明的錯誤結論
三、經典智力測驗
目前,大多數的智力測驗都是根據比內測驗的思想和方法編制的,使用簡短明確的多種題
目,測驗的計分也比較容易。內容方面不包括道德判斷等社會性較強的問題,也不涉及學習新的知識以及太費時間的問題。
(一)斯坦福一比內測驗
比內的智力測驗發表后,美、英、德、日、意等國分別將其翻譯成本國文字并結合各自的國情予以修訂。其中以1916年推孟在美國斯坦福大學修訂的版本最負盛名,稱為斯坦福一比內測驗〈Stanford-Binet Test〉,并廣泛地流行到世界各國。在我國,最早是陸志韋于1924年翻譯并修訂了斯坦福一比內測驗。
斯坦福一比內測驗是一種個別施測的標準化智力測驗,自1916年修訂完成并廣泛使用后,又經過1937年和1960年兩次修訂,內容上作了很多變動,1986年出版最新的第四版。適用于2~18歲的被試。測驗題目經過嚴格的篩選,按從易到難的順序排列在各分測驗中,由受過專門訓練的測試人員對兒童進行單獨測量和計分。目前的版本由15個分測驗構成,代表著4個主要的認知領域:言語推理、抽象或視覺推理、數量推理和短時記憶。在測驗過程中,每一步驟的實施必須遵照標準程序。測驗一般從低于兒童年齡的較容易的題目開始,在兒童不能回答更難的問題時結束。
(二)韋克斯勒智力量表
韋克斯勒智力量表(WechsleE Intelligence Scales)是美國臨床心理學家韋克斯勒
(D.Wechsler)于20世紀中期編制的三種智力量表的總稱,是目前世界上使用最多的智力測量,工具。它包括韋氏成人智力量表(簡稱WAIS),測量16歲以上成人的智力;韋氏兒童智力量表(簡稱WISC),用于6至16歲學齡兒童;韋氏幼兒智力量表(簡稱WPPSI),測量4至6歲半學齡前兒童的智力。這三種量表項目類別相似,只是內容及難度方面存在差異。
韋克斯勒認為:"智力是個人有目的的行動、理智地思考以及有效地應付環境的整體的或綜合的能力。"基于這種認識,他在成人智力量表和兒童智力量表中都設計了11個分測驗,以對智力進行全面考察。這些分測驗分別度量個體的言語能力和操作能力。言語能力的測量包括常識、詞匯、類比、理解、算術和記憶廣度,操作能力包括圖片排列、填圖、積木、譯碼、拼圖等。
韋氏量表的一個重要特點是擯棄了心理年齡的概念,但保留了智商概念。它運用統計方法,以兒童在同一個年齡團體中成績所處的位置確定智商高低。用這種方法確定的智商又稱離差智商。它的另一個顯著特點是,不僅給出了一個人的智商總分,而且還給出了言語和操作兩方面的各個分量表分,使我們可以更加清晰地了解一個人的智力結構,以及他在智力發展上的優勢與弱點,從而對培養和補救提供了科學依據韋氏智力量表也需要進行個別施測。個別施測不僅使測量更加準確,減少干擾,而且可以獲得許多其他信息,如對待測驗結果的態度、情緒表現等等,從而有助于做出更準確的判斷。
(三)團體智力測驗
團體智力測驗最早出現在第一次世界大戰時期。面對150萬應征人伍者,為了適應戰爭的需要,美國陸軍先后研制了甲、乙兩種紙筆型團體智力測驗。團體智力測驗被廣泛用于學校、企業、軍隊等人員選拔和招聘工作中。目前,廣泛應用的團體智力測驗是英國的瑞文標準推理測驗(SPM),由60道題目組成,圖6.5是兩個瑞文標準推理測驗的題目示例。
圖6.5 瑞文標準推理測驗的題目示例
四、智力測驗與性向測驗、成就測驗的關系
智力測驗與性向測驗和成就測驗同屬能力測驗范疇,三者既有相似之處,又有區別。能力測驗是一個概括性名詞,這類測驗主要以應答的速度和正確性為指標判定結果。一般是分數越高或正確答案越多表明能力越強,成就越大。由于對能力的認定與實施目的不同,實際使用時,能力測驗被分為智力測驗(intelligence test)、性向測驗(又稱能力傾向測驗,aptitude test)和成就測驗(achievement test)。
心理測驗最早開始于為篩選學習困難兒童而編制的智力測驗,但由于在理論上至今仍然未能給智力下一個公認的明確定義,因而智力測驗的目標范圍始終存在爭議。但就目前通用的智力測驗而言,一般注重的是表現在認知活動中的穩定的一般能力,如言語能力、數學能力、記憶能力、空間知覺、推理能力等。通用的智力測驗如比內智力量表、韋氏兒童智力量表等,這些都可視為對個體的基本能力素質的考察。
性向測驗泛指用以測量潛在才能的測驗。其目的在于發現兒童的潛在才能,深入了解其長處和發展傾向。如美國大學入學考試用的學能測驗(Scholastic Aptitude Tests,SAT),這一測驗度量的是到大學后學習成功的可能性。潛在才能是指個體未來發展的可能性,即在給予一定的學習機會時可能達到的水平,而不是個體現在已經具有的能力。
成就測驗或稱成績測驗,主要考察受測者在學習和訓練后所具有的知識和技能水平,由于它被廣泛地應用在教育工作中,因此,有時也被稱為教育測驗(educational test)。根據不同的標準,還可以對之進行更為細致的分類。影響成就測驗上成績的不僅是能力,而且包括習得的知識。
聲明:
(一)由于考試政策等各方面情況的不斷調整與變化,本網站所提供的考試信息僅供參考,請以權威部門公布的正式信息為準。
(二)本網站在文章內容來源出處標注為其他平臺的稿件均為轉載稿,免費轉載出于非商業性學習目的,版權歸原作者所有。如您對內容、版權等問題存在異議請與本站聯系,我們會及時進行處理解決。
相關推薦
2022年浙江自考《當代中國政治制度》復習筆記匯總
09-152023年浙江自考西方行政學說史復習資料:西方行政學的產生
03-022022年浙江自考中國古代文學史(一)第三編第九章復習資料
10-312023年10月浙江自考傳播學概論復習資料:有限效果論
08-30自考輔導資料:2021年10月《學前教育史》—論幼稚師范教育
06-052023年4月浙江自考學前教育史復習筆記:古代的胎教
12-312023年4月浙江自考公司法復習筆記第三章(1)
12-282023年10月浙江自考寫作(一)復習資料(17)
08-072023年10月浙江自考網絡操作系統復習資料六
05-192023年4月浙江自考發展經濟學復習資料:發展中國家就業問題
12-27