第十章 智力與智力測(cè)驗(yàn)
一、什么是測(cè)量
心理測(cè)量(psychological assessment)是用來(lái)檢測(cè)人們的能力、行為和個(gè)性特質(zhì)的特殊的測(cè)驗(yàn)程序。心理測(cè)量通常是指對(duì)個(gè)體差異的測(cè)量。
1、測(cè)量的歷史
西方智力測(cè)驗(yàn)發(fā)展中的關(guān)鍵人物是英國(guó)上層社會(huì)的弗朗西斯·高爾頓爵士(Sir Francis Galton)。
《遺傳的天才》測(cè)量的四個(gè)重要思想:第一,智力的差異可以根據(jù)智力的程度來(lái)度量。第二,智力的個(gè)性差異成鐘型曲線,或者稱做正態(tài)分布。第三,智力,或叫做心理能力,可以由客觀測(cè)驗(yàn)測(cè)得,第四,兩套測(cè)試成績(jī)之間的相關(guān)程度可以由相關(guān)的統(tǒng)計(jì)分析來(lái)確定。
有爭(zhēng)議的思想:
* 天才或是出眾的人會(huì)出現(xiàn)在同一個(gè)家族內(nèi),教育對(duì)于智力只有很小的影響。
* 智力上與人的道德價(jià)值相關(guān)
2、正是測(cè)量的基本特點(diǎn)
正式測(cè)量(formal assessment)程序應(yīng)該滿足三方面的要求,即信度、效度和標(biāo)準(zhǔn)化。正式測(cè)量的程序適用于所有的心理測(cè)量。
(1)信度
信度(reliability)是指某一測(cè)量工具能夠得出一致分?jǐn)?shù)的程度。
重測(cè)信度(tet-retest reliability):即對(duì)于同一個(gè)人、同一個(gè)測(cè)驗(yàn),在兩種情況下所測(cè)結(jié)果的相關(guān)程度。
變化了的平行信度(parallel forms):可以減少測(cè)驗(yàn)的練習(xí) 效應(yīng)、對(duì)測(cè)驗(yàn)問(wèn)題的記憶,以及被試力求兩次測(cè)驗(yàn)表現(xiàn)一致的愿望。
內(nèi)部一致性(internal consistency)檢驗(yàn),在可信度較好的測(cè)驗(yàn)中,這兩部分的成績(jī)相當(dāng),這時(shí)可稱為內(nèi)部一致性較好,具有分半信度(split-half reliability)。
不僅測(cè)量工具本身要可信,運(yùn)用工具的方法也要可信,主試必須學(xué)會(huì)以一種可信的方式,采用同一個(gè)區(qū)分系統(tǒng)來(lái)施測(cè)。
(2)效度
測(cè)驗(yàn)的效度(validity)是指測(cè)驗(yàn)?zāi)軌驕y(cè)得的它要測(cè)定的東西的程度。
有效性反映了測(cè)驗(yàn)對(duì)行為或結(jié)果(與測(cè)驗(yàn)?zāi)康幕蛟O(shè)計(jì)相關(guān))進(jìn)行準(zhǔn)確預(yù)測(cè)的能力。有三種重要的效度:表面效度、效標(biāo)效度和結(jié)構(gòu)效度。
如果測(cè)驗(yàn)項(xiàng)目看起來(lái)與感興趣的特性直接相關(guān),那么測(cè)驗(yàn)具有表面效度(face validity)。表面效應(yīng)并不能保證測(cè)量的準(zhǔn)確性。
效標(biāo)效度(criterion validity,也稱為預(yù)測(cè)效度),將某一個(gè)人的測(cè)驗(yàn)成績(jī)與他或她在其他標(biāo)準(zhǔn)(與測(cè)驗(yàn)相關(guān))上的成績(jī)相比較。
一種測(cè)驗(yàn)是否有效的條件是特定的,因此對(duì)一種測(cè)驗(yàn)要考慮基于何種目的它是有效的。
信度是某一測(cè)驗(yàn)與其自身的相關(guān)程度,而效度是測(cè)驗(yàn)與外部的相關(guān)程度。不可信的測(cè)驗(yàn)也沒(méi)有效度,很可能具有較高信度的測(cè)驗(yàn)沒(méi)有效度。
(3)常模和標(biāo)準(zhǔn)化
說(shuō)明你所得分?jǐn)?shù)的意義,你會(huì)將你的成績(jī)統(tǒng)計(jì)常模(norm)做比較。通過(guò)查看測(cè)驗(yàn)的常模,你會(huì)知道分?jǐn)?shù)的大致范圍,以及在你的年齡和性別范圍內(nèi)的平均數(shù)是多少。這會(huì)有助于評(píng)價(jià)你在正態(tài)人群中的相對(duì)位置。常模使一個(gè)人的分?jǐn)?shù)可以同與其年齡、性別和文化相當(dāng)?shù)娜说钠骄窒啾取?/p>
標(biāo)準(zhǔn)化(standardiztion)是指在同一條件下對(duì)所有人、以同樣的方式實(shí)施測(cè)驗(yàn)。
對(duì)任何測(cè)驗(yàn),你應(yīng)該根據(jù)測(cè)驗(yàn)的信度和效度,操作的常模以及測(cè)驗(yàn)環(huán)境的標(biāo)準(zhǔn)化程度等來(lái)評(píng)價(jià)測(cè)驗(yàn)分?jǐn)?shù)。
二、智力測(cè)量
1、智力測(cè)驗(yàn)的起源
智力是一種一般的心理能力,與其他事物一樣,包含推理、計(jì)劃、問(wèn)題解決、抽象思維、理解復(fù)雜思想、快速學(xué)習(xí) 和從經(jīng)驗(yàn)中學(xué)習(xí) 等能力。
1905年,第一次出版了關(guān)于可實(shí)施的智力測(cè)驗(yàn)的出版物。阿爾弗雷德·比奈(Llfred Binet)-西奧菲勒·西蒙(Theophile Simon)量表。
不同年齡的正常兒童的平均分?jǐn)?shù)被計(jì)算出來(lái),測(cè)驗(yàn)的結(jié)果以達(dá)到某一特定分?jǐn)?shù)的正常兒童的平均年齡來(lái)表示,這就稱之為心理年齡(mental age)。
比奈的方法有4個(gè)重要特點(diǎn)。首先,它將測(cè)驗(yàn)的分?jǐn)?shù)解釋為對(duì)當(dāng)前操作的評(píng)估,而不是對(duì)天生智力的測(cè)量。第二,他想使測(cè)驗(yàn)分?jǐn)?shù)應(yīng)用于確認(rèn)需要特殊幫助的孩子,而不是污蔑他們。第三,他強(qiáng)調(diào)訓(xùn)練和機(jī)會(huì)可以影響智力,而且他也在尋找可以幫助弱勢(shì)兒童的方法。最后,他用經(jīng)驗(yàn)編制他的測(cè)驗(yàn)——他收集了數(shù)據(jù)看它是否有效——而不是試圖根據(jù)一種特定的智力理論來(lái)編制。
2、IQ測(cè)驗(yàn)
有兩種個(gè)體施測(cè)的測(cè)驗(yàn)至今還在廣泛應(yīng)用:斯坦福-比奈(Stanford-Binet)和韋克斯勒(Wechsler)測(cè)驗(yàn)。
特曼1916年發(fā)表了比奈測(cè)驗(yàn)的斯坦福版本被稱為斯坦福-比奈測(cè)驗(yàn),在特曼的新測(cè)驗(yàn)中,他提供了智商的概念。
IQ=心理年齡&pide;生理年齡×100
當(dāng)18歲以下的個(gè)體的有效IQ得分為70~75,或者更低,則他們被歸為心理遲滯(mental retardation)。被認(rèn)為是心理遲滯的個(gè)體還必須在適應(yīng)性技能等方面表現(xiàn)出缺陷。
1939年發(fā)表了韋克斯勒-貝爾維尤智力測(cè)驗(yàn)。
WAIS-R中有6個(gè)語(yǔ)詞分測(cè)驗(yàn):知識(shí)、語(yǔ)詞、領(lǐng)悟、計(jì)算、相似和數(shù)字廣度。這些測(cè)驗(yàn)包括書面和口頭表達(dá)兩種。5個(gè)操作分測(cè)驗(yàn)是對(duì)測(cè)驗(yàn)材料的操作。
WAIS-R適于18歲及以上的人群。韋氏兒童智力測(cè)驗(yàn)第三版(Wechsler Intelligence Scale for Children-Third Edition)適于6至17歲的兒童;韋入學(xué)前和初級(jí)智力量表修訂版(Wechsler Preschool and timay Scale of Inteligence-revises, WPPSI-R, Wecher,1989)適于4至6歲半的兒童。
在對(duì)同一被試的不同年齡進(jìn)行施測(cè)時(shí),韋克斯勒量表具有特別的價(jià)值。
三、智力理論
1、智力的心理測(cè)量學(xué)理論
心理測(cè)量學(xué)(psychometrics)是心理學(xué)的一個(gè)領(lǐng)域,主要是對(duì)心理能力進(jìn)行全方位的測(cè)量,包括人格評(píng)定、智力評(píng)估和能力測(cè)量。
查理斯·斯皮爾曼(Charles Spearman)在智力領(lǐng)域中較早地應(yīng)用了因素分析,認(rèn)為存在一般智力因素,或稱為g因素,這是所有智力操作的基礎(chǔ)(Spearman, 1927)。每個(gè)維度還與其特殊智力相關(guān)聯(lián),即斯皮爾曼定義的s。
雷蒙德·卡特爾將一般智力分為兩個(gè)相對(duì)獨(dú)立的成分,他稱之為晶態(tài)智力和液態(tài)智力。晶態(tài)智力(crystallized)包括一個(gè)人所獲得的知識(shí)以及獲得知識(shí)的能力,它由語(yǔ)詞、算術(shù)和一般知識(shí)測(cè)驗(yàn)來(lái)測(cè)定。液態(tài)智力(fluid intelligence)是發(fā)現(xiàn)復(fù)雜關(guān)系和解決問(wèn)題的能力,它由木塊圖、空間視覺等測(cè)驗(yàn)來(lái)測(cè)定,在這些測(cè)驗(yàn)中,所需要的背景信息是很明確的。
晶態(tài)智力使得人們很好地面對(duì)自己的生活和具體問(wèn)題,而液態(tài)智力幫助你處理新的復(fù)雜的問(wèn)題。
吉爾福德定義了智力任務(wù)的三個(gè)特性:內(nèi)容或信息類型、產(chǎn)品或信息表征的形式、操作或心理活動(dòng)表現(xiàn)的類型。
這一模型中有5個(gè)內(nèi)容:視覺、聽覺、符號(hào)、語(yǔ)義和行為;6種產(chǎn)品:?jiǎn)卧?、分類、關(guān)系、系統(tǒng)、轉(zhuǎn)換和提示;5種操作:評(píng)價(jià)、聚合、發(fā)散、記憶和認(rèn)知。每一智力任務(wù)都包含這三個(gè)維度,每一個(gè)內(nèi)容—產(chǎn)品—操作的結(jié)合,代表一個(gè)獨(dú)立的心理能力。吉爾福德的智力概念具有預(yù)測(cè)價(jià)值。
2、兩個(gè)超出IQ概念的理論。
(1)羅伯特·斯騰伯格(Robert Sternberg)提出了智力的三因素理論,認(rèn)為智力包括三個(gè)部分——成分、經(jīng)驗(yàn)和情境,它們都代表有效操作的不同方面。
成分性智力(componential intelligence)是指思維和問(wèn)題解決等所依賴的心理過(guò)程。斯騰伯格認(rèn)為,有三種成分對(duì)信息加工是至關(guān)重要的:(1)知識(shí)獲得成分,可以用于學(xué)習(xí) 新的事實(shí);(2)操作成分,作為問(wèn)題解決的策略和技巧;(3)元認(rèn)知成分,用于選擇策略、監(jiān)控認(rèn)知過(guò)程以達(dá)到成功。
經(jīng)驗(yàn)智力(experiential intelligence)是指人們?cè)趦煞N極端情況下處理問(wèn)題的能力:新異的或常規(guī)的問(wèn)題。
情境智力(contextual intelligence)反映在對(duì)日常事物的處理上。它包括對(duì)新的和不同環(huán)境的適應(yīng),選擇合適的環(huán)境以及有效地改變環(huán)境以適應(yīng)你的需要。情境智力有地被人們稱為小聰明(street smarts)或商業(yè)頭腦(business sense)。沒(méi)有較高IQ值的人,也可以具有較高的情境智力。
斯騰伯格的三因素智力理論認(rèn)為,IQ測(cè)驗(yàn)并不能涵蓋智力行為的全部?jī)?nèi)容。
(2)加德納的8種智力
加德納確定了涵蓋人類經(jīng)驗(yàn)范圍的許多智力。每一種能力依據(jù)某一社會(huì)對(duì)它的需要、獎(jiǎng)賞以及它對(duì)社會(huì)的作用,在不同的人類社會(huì)中的價(jià)值也不同。歸納了8種智力。
加德納的8種智力
* 邏輯——數(shù)學(xué)
* 語(yǔ)言
* 功能主義
* 音樂(lè)
* 空間
* 身體運(yùn)動(dòng)
* 人際間(社交 )
* 內(nèi)心的(自知)
加德納的智力理論認(rèn)為,應(yīng)該對(duì)個(gè)體在許多生活情境下的行為進(jìn)行觀察和評(píng)價(jià),并將傳統(tǒng)的智力測(cè)驗(yàn)視為生活的一個(gè)很小的縮影。
情緒智力(emotional intelligence)可定義為4個(gè)主要成分。
* 準(zhǔn)確和適當(dāng)?shù)刂X、評(píng)價(jià)和表達(dá)情感的能力。
* 運(yùn)用情感、促進(jìn)思考的能力。
* 理解和分析情感、有效地運(yùn)用情感知識(shí)的能力。
* 調(diào)節(jié)情緒,以促進(jìn)情感和智力發(fā)展的能力。
EQ分——情商,對(duì)情感的理解是EQ的一種表現(xiàn)。
測(cè)定EQ:要求被試對(duì)一系列情感問(wèn)題,提出解決辦法。
四、智力的政治
1、 組間比較的歷史
高達(dá)德幫助開創(chuàng)了宣稱一些有色人種先天低等的不幸傳統(tǒng)。
2、遺傳與IQ
某一特質(zhì)的遺傳性評(píng)價(jià),是指基于這一特質(zhì)的得分可歸因于遺傳因素的變異比例。
遺傳性隨年齡而增長(zhǎng);在4~6歲時(shí)遺傳性為40%,到了成年為60%,到了老年為80%!
很可能基因的規(guī)劃使得環(huán)境促進(jìn)了我們的基因特質(zhì),因而使遺傳性變大。
遺傳性是對(duì)于一個(gè)組內(nèi)的估計(jì),它不能用于對(duì)組間比較的解釋,不論在客觀測(cè)驗(yàn)中的組間差異有多大。遺傳估計(jì)只與給定的個(gè)體人群的平均值相關(guān)。即使有高的遺傳性估計(jì),我們也不能確定與個(gè)體IQ或是組的IQ值相關(guān)的特定基因的貢獻(xiàn)。
一般來(lái)說(shuō),不同種族基因的組間差別,比同一組內(nèi)不同個(gè)體的基因差別要小。社會(huì)判斷并不依據(jù)生物的真實(shí)性,只是將皮膚顏色或血液作為種族融合的指標(biāo)
母親對(duì)孩子智力的社會(huì)化貢獻(xiàn)大于父親。
3、環(huán)境與IQ
家庭的社會(huì)經(jīng)濟(jì)狀況和母親的教育水平。
富裕和貧窮能夠影響智力能力,其中對(duì)健康和教育資源的影響是最明顯的。孕期健康狀況不好和出生時(shí)低體重,對(duì)于孩子的心理能力低下是較強(qiáng)的預(yù)測(cè)因子。
單親家庭,會(huì)使他們沒(méi)有時(shí)間和精力陪孩子們玩,這會(huì)對(duì)標(biāo)準(zhǔn)IQ測(cè)驗(yàn)中的操作造成負(fù)面影響。
生活在貧窮條件下的人們是受歧視的,這種社會(huì)恥辱會(huì)對(duì)個(gè)體的自我完善起負(fù)面影響。
造成IQ差異的并不是種族,而是在我們的社會(huì)和大多數(shù)國(guó)家中,與種族有關(guān)的經(jīng)濟(jì)、健康和教育資源。
IQ受環(huán)境影響;但豐富的環(huán)境要保持(美國(guó)領(lǐng)先計(jì)劃研究)。
4、文化與IQ測(cè)驗(yàn)的有效性
對(duì)IQ測(cè)驗(yàn)的一個(gè)普遍的考慮是,它們對(duì)不同文化的人們具有某些偏見。
這種IQ測(cè)量對(duì)于少數(shù)民族而言是無(wú)效而不公平的。但是,即使測(cè)驗(yàn)?zāi)軌蜃龅礁鼮椤拔幕健?,仍存在種族間的差別。
測(cè)驗(yàn)中的成績(jī)受刻板印象威脅(stereotype threat,又稱為定勢(shì)攻擊,stereotype vulnerability)的影響,即某一組人冒著受負(fù)性定勢(shì)影響的威脅。在情境中受到刻板印象威脅影響的人表現(xiàn)會(huì)較差。
當(dāng)黑人學(xué)生相信實(shí)驗(yàn)成績(jī)可以用來(lái)檢驗(yàn)他們的智力時(shí),他們做得較差。
測(cè)驗(yàn)的情境要比測(cè)驗(yàn)的內(nèi)容存在更多的問(wèn)題。重要的是測(cè)驗(yàn)實(shí)施者如何定義情境。人們相信測(cè)驗(yàn)可以測(cè)量智力時(shí),定勢(shì)的知識(shí)才會(huì)影響表現(xiàn)成績(jī)。
五、創(chuàng)造力
創(chuàng)造力(creativity)是指就特定環(huán)境而言,個(gè)體產(chǎn)生新異的和合適的思想和產(chǎn)品的能力。
1、評(píng)價(jià)創(chuàng)造力及其與智力的關(guān)系
發(fā)散思維(pergent thinking),即對(duì)于一個(gè)問(wèn)題可以產(chǎn)生許多不尋常的想法的能力。
發(fā)散思維測(cè)驗(yàn)與IQ測(cè)驗(yàn)的關(guān)系:相關(guān)性很小或中等;如高于120,則其相關(guān)程度下降。原因可能是一定水平的智力會(huì)使人有機(jī)會(huì)進(jìn)行創(chuàng)造,但人們通常不利用他或她自己的這種機(jī)會(huì)。
當(dāng)評(píng)判創(chuàng)造力的等級(jí)時(shí),其一致性相當(dāng)高,人們可以被可靠地確定為訓(xùn)創(chuàng)造力者或低創(chuàng)造力者。
2、特殊創(chuàng)造力與瘋狂
霍華德·加德納創(chuàng)造力的人的生活肖像,他把她叫做E.C.:
E.C.發(fā)現(xiàn)她對(duì)某未知一領(lǐng)域的問(wèn)題有特殊的興趣,這是一個(gè)極度興奮的時(shí)刻。在這一點(diǎn)上E.C.與她的同輩們無(wú)法交 流,她必須獨(dú)自工作。她感到自己正在突破的邊緣,雖然她對(duì)此還不甚了解。奇怪的是,在這個(gè)關(guān)鍵時(shí)刻,E.C.渴望認(rèn)知和情感上的支持,從而使她可以保持她的方向。沒(méi)有這些支持,她可能會(huì)深刻地體會(huì)到某種形式的崩潰。
加德納暗指了一種非常普遍的對(duì)創(chuàng)造者的定勢(shì):他們生活在瘋狂的邊緣,或包括對(duì)瘋狂的體驗(yàn)。
個(gè)體會(huì)乘著癲狂的波浪進(jìn)行大量的工作。如果這個(gè)人有一定的天賦,他的一些工作,并不是全部,就會(huì)很出色,但其比率并不比藝術(shù)家在其他時(shí)候創(chuàng)作的出色作品的比率更高。創(chuàng)造力和瘋狂之間的關(guān)系很小。
有關(guān)特殊創(chuàng)造力的敘述中學(xué)到冒險(xiǎn)的模式,高創(chuàng)造力的個(gè)體愿意走入“未知的領(lǐng)域”準(zhǔn)備模式;高創(chuàng)造力的人通常會(huì)在他們希望有所成就的領(lǐng)域中花費(fèi)很多年來(lái)獲得專業(yè)知識(shí)內(nèi)在動(dòng)機(jī)的模式;高創(chuàng)造力的個(gè)體從事他們的工作,是因?yàn)樗麄兡軓膭?chuàng)造的事物中得到快樂(lè)和滿足。
六、測(cè)量與社會(huì)
爭(zhēng)論的焦點(diǎn)是三個(gè)與倫理有關(guān)的方面:
* 基于測(cè)驗(yàn)的決定的公平性:對(duì)某些測(cè)驗(yàn)者而言,其代價(jià)或負(fù)性后果要高于其他人。
* 測(cè)量用于教育評(píng)價(jià)的可行性:測(cè)驗(yàn)不只是幫助評(píng)價(jià)學(xué)生,它在教育塑造上也起一定的作用。
以測(cè)驗(yàn)分?jǐn)?shù)進(jìn)行個(gè)體分類的寓意:測(cè)驗(yàn)結(jié)果作為不可改變的標(biāo)簽的狀況。