第11 章
第11 章統(tǒng)計數(shù)據是否具有欺編性 203 ?統(tǒng)計數(shù)據是否具有欺騙性
下面的內容有多少能使你信服?
據國際反家庭暴力聯(lián)盟估算,已婚婦女中有超過一半的人(超過2700 萬婦女)在婚姻生活中會遭遇家庭暴力,超過113 的人(超過1800 萬婦女)每年都被丈夫一而再、再而三地毆打。事實表明,在交 通事故中,酒后駕車的男、女司機的比例分別是23 %和9 .6 %??梢?,女性比男性更適合駕駛。
你無須對上面所講的事件記憶深刻。因為它們都在月統(tǒng)計數(shù)據斯編我們!
人們常運用統(tǒng)計數(shù)據來提出證據??赡苣憬洺B牭饺藗冇眠@樣一些話來支持自己的論證:“我能用統(tǒng)計數(shù)據證明這一點?!焙芏鄷r候我們都使用統(tǒng)計數(shù)據(往往是不恰當?shù)厥褂茫﹣韼椭覀冏龀鰶Q定,比如,評估國家的經濟活動和社會發(fā)展、決定保留什么電視節(jié)目、確定投資策略、幫助人們決定該賭什么體育項目、評估人們對性生活的滿意度、預測天氣等。
統(tǒng)計數(shù)據是一種以數(shù)字形式表現(xiàn)出來的證據。這樣的證據可以給人留下深刻的印象,因為數(shù)字使證據看起來非常科學、精確,讓人感覺似乎這就代表著“事實”。然而,統(tǒng)計數(shù)據可以并且經常欺騙大家!表面上它們很有說服力,事實上卻不一定。作為一個批判性思考者,你必須力求查明誤用統(tǒng)計數(shù)據的推理。由于篇幅有限,我們不可能把所有帶欺騙性的統(tǒng)計數(shù)據都列舉出來。然而,這一章將為你提供一些普遍的、廣泛使用的策略,你可以通過這些策略來查明統(tǒng)計數(shù)據的欺騙性。除此之外,這一章還將通過許多最常見的濫用、誤用統(tǒng)計數(shù)據的事例,來提醒你小心統(tǒng)計數(shù)據所提供的證據。
圓批列性問題:統(tǒng)計數(shù)據是否具有欺騙性?
不可知的、有偏見的統(tǒng)計數(shù)據
找出具有欺騙性的統(tǒng)計數(shù)據,首要策略是盡可能多地了解人們如何獲得這些統(tǒng)計數(shù)據。我們能否知道美國的艾滋病患者、墮胎者、盜竊商店者、白領階層犯罪者、公務員、每天飲酒超過三瓶啤酒的人、毆打妻子的人、流浪者以及吸毒者的精確人數(shù)?對此我們表示懷疑。為什么?因為在獲得準確的統(tǒng)計數(shù)據的過程中,由于某些特定原因,將出現(xiàn)各種各樣的干擾,比如,不愿提供真實信息、沒能記錄下事件過程、觀察事件時出現(xiàn)儀器故障或隨機誤差。因此,統(tǒng)計數(shù)據常被看作是“經過訓練的推測”。那些推測很可能相當有用,也可能相當具有欺騙性。你需要時常提醒自己:“作者是如何得出這些估計的呢?"
在關干各種身體不適癥及醫(yī)療不適癥的報告中,普遍存在著誤用數(shù)據的情況,尤其是當某種不適癥被人們關注的時候更容易被誤用。例如,近期一本關于進食障礙的書里寫到,每年有巧萬年輕婦女死于厭食癥。隨后,媒體頻繁地引用這個數(shù)據。這個巨大的數(shù)字使有些人感到不安和恐懼。有人對此進行了更精確的研究,發(fā)現(xiàn)事實是,每年有巧萬婦女遭受進食障礙的痛苦,但是最近一年中僅有54 人因此而喪命。這些事例提醒我們要警惕那些企圖說服我們的、令人印象深刻的數(shù)字,尤其是在很難使用精確的測量方法做統(tǒng)計時更應該注意。
令人圈惑的平均數(shù)
閱讀以下這些句子,看看有什么問題:
( l )當前美國人的收入比以往任何時候都高;美國工人的平均收入是3 . 5 萬美元。
( 2 )目前,工廠造成的空氣污染的平均值低于危險水平。這兩個例子都使用了“平均”這個詞。但是,定義一個平均數(shù)有三種不同的方法,而且在大多數(shù)情況下不同的定義會得到不同的平均數(shù)值。是哪三種方法呢?
第一種方法是將所有的數(shù)據相加,再用所得的和除以數(shù)據的個數(shù),得到的結果就叫做算術平均數(shù)。
第二種方法是按從大到小的順序列出所有數(shù)據,找出位于中間的那個數(shù)。這個數(shù)叫做中數(shù)。一組數(shù)值中有一半數(shù)據大于中數(shù),一半數(shù)據小于中數(shù)。
第三種方法是列出所有數(shù)據,然后將不同的數(shù)值排列歸類。在一組數(shù)據中出現(xiàn)次數(shù)最多的那個數(shù)值叫做眾數(shù)。
作者討論的是算術平均數(shù)、中數(shù)還是眾數(shù),會產生很大的差異。再來分析一下美國人的收入分布狀況。有的人收人極高,如年薪200 萬美元。這樣高的收入將會大大地提高算術平均數(shù)。然而,這些個別的高收入對于中數(shù)或眾數(shù)的影響都很小。因此,如果某人希望使平均收入看起來高一些,算術平均數(shù)可能是最能達到目的的平均數(shù)?,F(xiàn)在你明白,當人們談論收入時,明確他們采用的是何種平均數(shù)有多么重要了吧。
讓我們來仔細看看第二個例子。如果作者所給出的是眾數(shù)或者是中數(shù),都可能使我們得出錯誤的判斷,認為空氣污染的程度還沒有超過安全范圍。例如,即使產生嚴重污染的工廠只是少數(shù),但這些工廠排放的污染物的總和遠遠超過危險水平― 就算把這些污染物分散到整個大氣層里也是相當危險的。在這種情形下,用眾數(shù)或中數(shù)來表示污染值都會非常低,但是算術平均數(shù)卻會非常高。當你看見表示“平均”的數(shù)值時,都應該想想:“采用算術平均數(shù)、中數(shù)或眾數(shù)是否有差別?”為了回答這個問題,請你思考使用不同平均數(shù)的含義會如何改變已知信息的意義。
通常,不只是決定采用哪一種平均數(shù)才重要,決定最小值和最大值之間的間距(即數(shù)據的范圍)、每個數(shù)據出現(xiàn)的頻率(即數(shù)據的分布)也同樣重要。例如,假設你需要一些信息來幫助你決定吃或不吃從鄰近海洋里捕捉到的魚。如果只告訴你那些魚的平均汞含量,你會滿意嗎?顯然,這些信息是不夠的。
我們還想知道汞含量值的范圍,也就是說,汞含量可能達到的最高值和最低值以及不同含量值出現(xiàn)的頻率。因為有可能所算出的平均數(shù)是在“安全”標準內,但是如果有10 %的魚汞含量高于“安全”標準,我想你寧愿不選擇這些魚作為晚餐。讓我們再來分析另一個事例。在這個事例中,掌握數(shù)據的范圍和分布是至關重要的。
美國不是一個過度擁擠的國家。就全國范圍而言,每平方英里’還不到60 人,低于大多數(shù)國家的人口密度。
首先,我們懷疑算術平均數(shù)不能代表人口密度。雖然這里用算術平均數(shù)取得的人口密度可能非常低,但是,眾所周知,美國的一些地區(qū),如東北部人口密度非常高。因此,雖然美國的平均人口密度并不高,但事實上美國的一些地區(qū)是過度擁擠的??梢姡斈憧吹狡骄鶖?shù)時,問問自己:“我是否需要了解數(shù)據的范圍和分布情況?"
結論與證據不相符合
有些人在表達他們的觀點時常常使我們感到疑惑,因為他們所宣稱的已經被證明的問題與他們使用的統(tǒng)計數(shù)據所證明的問題大相徑庭。看起來這些統(tǒng)計數(shù)據似乎能證明作者的觀點,實際上卻不能!這里我們向你介紹兩種判斷這種欺騙的策略。一種策略是,不去著作著鐘契籠計數(shù)據,并問自己:“哪種統(tǒng)計數(shù)據有助于證明作者的結論?”然后,將所需要的統(tǒng)計數(shù)據與作者給出的統(tǒng)計數(shù)據進行比較。如果這兩種數(shù)據不匹配,你就可能找出了一個, l 平方英里約為259 平方會里― 譯者注
統(tǒng)計數(shù)據上的謊言。下面的例子將為你提供應用這種策略的機會。一家汽車銷售公司宣稱其所推出的某款新型汽車是一個巨大的成功,因為每100 個購買該款汽車的人里,只有5 個人向代理商投訴這款車的性能不夠好。“95 %的買主都對這款車感到滿意,”推銷員說,“證明這是款非常好的車?!?/p>
汽車經銷商是怎樣得出95 %的買主都感到滿意這個結論的呢?他本應該在購買這款車的所有買主中隨機抽取一大批人并詢問他們:“你對你的新車滿意嗎?”但是,他沒有那樣做,他僅僅聽到了那些提出投訴的買主的意見,并由此提出了一個未經證實的假設― 所有沒有投訴的買主對這款車都感到滿意。由此,經銷商通過這一個事實(少數(shù)買主投訴)而得出另一個結論(多數(shù)買主滿意)。從這個事例學到的重要教訓就是,我們要仔細地注意統(tǒng)計數(shù)據的措辭和結淪的措辭,看兩者說明的是不是同一件事。如果兩者不一致,那么作者就可能在運用統(tǒng)計數(shù)據說謊。哪種統(tǒng)計數(shù)據給出的證據能支持我們想得出的結論呢?我們常常為此感到頭疼。讓我們來看一種更為有效的策略。不要著作者提出的結論,而是子鵡呻查作者所使用的統(tǒng)計數(shù)據,然后問問自己:“由這些統(tǒng)計數(shù)據得出什么結論是恰當?shù)哪兀俊苯酉聛?,把你得出的結論與作者的結論進行比較。
請你試著用這種策略來審查下面這個例子。
據說,差不多有114 的精神治療師對他們的未成年患者有虐待行為。一名臨床 心理學家就此問題對國內一些著名的心理學工作者進行了調查。在參加這次調查的90 名心理學工作者中,有24 % 的人表示他們知道一些關于臨床 醫(yī)學工作者虐待患者的事??赐赀@段話,你是否得出了這樣的結論:差不多有114 的臨床
第11 章統(tǒng)計數(shù)據是否具有欺編性 200 ?醫(yī)學工作者聲稱他們知道一些臨床 醫(yī)學工作者虐待未成年患者的事例。你發(fā)現(xiàn)統(tǒng)計數(shù)據所證明的結論與作者給出的結論的區(qū)別了嗎?如果你已經發(fā)現(xiàn)了它們的區(qū)別,說明你已經發(fā)現(xiàn)這個作者是如何運用統(tǒng)計數(shù)據來撒謊了。
現(xiàn)在,用下面的例子進行練習 。
1995 年,一名報刊專欄作家對一些女性讀者進行了訪問,詢問她們:“你情愿被丈夫緊緊抱住并溫 柔體貼地對待,而忘掉‘行動’嗎?”這名作家報告說,接受訪問的女性中有72 %的人對這個問題回答了“是”。所以她得出這樣的結論:“這次調查表明,相當多的婦女對性生活不感興趣?!?/p>
你發(fā)現(xiàn)這名作者是如何在提供一個事實時得出另一個結論的馮?你是否認為,如果這名專欄作家的問題是:“你喜歡過性生活瑪?”所得的結果將會與這次調查的結果不同。
借助遺漏的信息撒謊
由于統(tǒng)計數(shù)據的不完善,我們常常被它欺騙。因此,進一步發(fā)現(xiàn)統(tǒng)計數(shù)據有紙漏的有效策略就是思考這樣的問題:“在你判斷出統(tǒng)計數(shù)據的影響之前,你還需要哪些進一步的信息?”讓我們通過下面這兩個例子來說明問這個問題的作用。
1 一股犯罪浪潮襲擊了我市。去年殺人犯的比例增加了67 %。2 .與其他近距離接觸的運動相比,拳擊運動的危險性更小。紐約一項歷時30 年的關于運動引起死亡的調查顯示,在這期間,棒球運動中死亡了43 人,在死亡率方面超過了足球(22 人)和拳擊(21 人)。
一開始,67 %這個數(shù)字會給你留下相當深刻的印象。但是請注意,這里有信息被忽略了,即計算出這個百分比的基礎― 絕對數(shù)值。同樣是增加67 % ,從300 個增加到500 個與從3 個增加到5個,哪個更令我們警覺呢?在第二個例子中,我們知道絕對數(shù)值,但不知道百分比。難道我們不需要了解這些絕對數(shù)值轉化成百分比對運動員意味著什么嗎?畢竟,從事棒球運動的人要比從事拳擊運動的人多得多。
當你遇到令人印象深刻或震撼人心的數(shù)字或百分比時,千萬要小自。你可能需要獲得一些其他信息來判斷這些數(shù)字何以能令人印象深刻。
另一種可能被忽略的信息是相關比較。一個行之有效的方法就是問問自己:“與… … 相比會怎樣呢?"
下面的每個描述都說明,如果進行比較的話,統(tǒng)計數(shù)據會更有意義:
1 .費滋牌阿司匹林產生作用的速度要快50 %。
2 .用于艾滋病研究的經費遠遠高于其所需要的數(shù)目。去年,政府在艾滋病研究項目上的投入超過了12 億美元。3 .大學學歷意味著高收入。20 閱年春季的一項調查發(fā)現(xiàn),擁有學士學位的工人平均年收入為3 . 5 萬美元。
經過提示再來看第一個描述,難道你不認為應該知道費滋牌阿司匹林產生作用的速度為什么快50 %嗎?與那些沒有效果的阿司匹林相比,還是與以前的費滋牌阿司匹林相比?同理,對第二個描述,難道你不想知道往年用于艾滋病研究的經費,或者用于其他疾病的經費,或者政府在與健康有關的研究項目上所投入的資金的總和嗎?再來看第三個描述,如果把這個平均收人與那些同樣高智商卻沒有上過大學的人的平均收入相比,結果又會怎樣呢?
當你遇到統(tǒng)計數(shù)據時,一定要想想:“有沒有什么相關信息被忽略了?"
危險的統(tǒng)計數(shù)據與遺漏的信息
" A 藥可將你患結腸癌的幾率減少5 %。”
“研究表明,乳房X 線透視 可使50 歲以上的老年婦女死于乳腺癌的幾率減少10 %。”
統(tǒng)計數(shù)據在討論某些問題,尤其是關于健康危險的問題時,普遍的作用是報告某種干預能使危險減少的效果。這類報告可能具有欺騙性。相同危險減少的比例既可以用“相對的”術語報告也可以用“絕對的”術語報告,這之間的差別可能極大地影響我們對危險減少的真實程度的知覺。
想像一下,一個心臟有問題的60 歲老人在與醫(yī)生討論某項有益的治療,這項治療可以使他避免心臟病發(fā)作的可能性。醫(yī)生采用統(tǒng)計數(shù)據來評價三種治療方案:
( l )治療方案x 將使心臟病發(fā)作的可能性減少20 %。( 2)治療方案Y 將使這種風險減少1 %。
( 3 )采用治療方案Z , 5 年之內,96 %的男性可以避免心臟病發(fā)作,而不接受治療的男性中有95 %的人將發(fā)病。
這位老人應該選擇哪一種治療方案呢?我們認為他會選擇第一種。但是事實上,這些描述針對的是同一種方案的治療效果,它們只是以不同的語言來描述心臟病發(fā)作的風險。第一種評價描述的是相對減少的危險性(20 % )。假設每100 個心臟病患者中本來有5個人發(fā)病,如果采用這種治療方案發(fā)作的人減少為4 個,相對原來的5 個人就減少了1 / 5 ,或者說20 %。從5 %減少到4 %的絕對變化只有1 % ,也就是第二種評價的意思。并且,病情好轉的人數(shù)從95 人增加到%人的變化比例也只有1 % ,即第三種評價的意思。由此可見,從相對的角度來描述風險減少的比例,比起從絕對的角度來描述,風險減少的幅度比真實值更大;使用相對值來表示某種治療方案的效果時,人們也更樂意接受該方案??赡苷缒闼谕哪菢樱t(yī)藥公司在他們的藥品廣告中通常使用相對值來介紹藥品的效果,媒體也傾向于報道那些相對值。
使用相對值類數(shù)據來描述風險減少可能具有欺騙性。當你遇到使用這些統(tǒng)計數(shù)據的論證時,一定要想一想,如果使用絕對值會出現(xiàn)什么不同,數(shù)據給人的印象是否也不及先前那樣深刻。
總結
本章我們著重講了一些幫助你發(fā)現(xiàn)人們運用統(tǒng)計數(shù)據“撒謊”的策略。在本章開頭,我們提到了關于家庭暴力和進食障礙的描述,現(xiàn)在,我們希望你能找出其中的統(tǒng)計數(shù)據上的問題。提示:“超過2700 萬”這個數(shù)據是從哪里得來的?如果你打算比較男性和女性的駕駛能力,相對于統(tǒng)計數(shù)據所提供的證據,難道你不認為應該更關注每公里所發(fā)生的交 通事故的數(shù)量嗎?
1 .盡可能地找出你所知道的這些統(tǒng)計數(shù)據是如何得出來的。問問自己:“作者是怎么知道的呢?"
2 .注意作者所使用的平均數(shù)的類型。
3 .小心證據和結論不相符合。
4 .不看作者的統(tǒng)計數(shù)據。將你認為所需要的統(tǒng)計數(shù)據與作者實際給出的數(shù)據進行比較。
5 .根據作者給出的統(tǒng)計數(shù)據,得出你自己的結論。如果與作者的結論不匹配,說明可能有什么地方出錯了。
6 .看看哪些信息被遺漏了。特別要小心那些易使人誤解的數(shù)字、百分比以及類比。
練習
找出下面每個練習 中使用不恰當?shù)淖C據。
練習 l
該是讓那些主張“不斷增稅,不斷花錢”的政治家離開國會的時候了,只有這樣,國會才能開展減少美國公民稅務負擔的工作。現(xiàn)在,一個典型的美國家庭要向聯(lián)邦、州及地方繳納自己收入的27 .3 %作為稅金。事實上,在1998 年,平均每個家庭繳納的聯(lián)邦所得稅超過5 萬美元。
練習 2
星期五下午,當我們乘車經過高速公路時,朋友搖著頭感嘆道:“開車已經不安全了?!比欢聦嵣鲜?,如今在美國開車要比60年前安全得多。1984 年,每10 萬人里有18 . 4 人死于交 通事故,而1970 年和1950 年分別
是25 . 8 人和233 人。如今,當你開車行駛在路上比你待在家里剪辦公室里安全得多。一年中有12 %的美國人由于家庭的事故而接受治療,5 %的人在工作中受傷,而僅有2 . 2 %的人在交 通事故中受傷。
練習 3
珍妮弗:律師們純粹是在盜竊保險公司的錢。據我所知,去年律師們忙于醫(yī)療事故的案子,僅從獲勝的案子里就平均獲得了20萬美元的賠償。
安東尼:可是,我認為那筆錢是他們應得的。醫(yī)生們越來越粗心了。在過去的3 年里,病人因眼科手術起訴醫(yī)生的案子增加了25%。
珍妮弗:噢,醫(yī)生們出了毛病,這真令人擔心。我在某處讀到,我們國家每4 個人里就有3 個人知道醫(yī)生被起訴的事例。如果我知道病人起訴我的可能性為75 %的話,我絕對不會當醫(yī)生。
安東尼:我想你說得對,由于巨額保費的壓力,我們真的該為失去好醫(yī)生而擔心了。我的醫(yī)生告訴我,他的保險稅率在過去2 年里已增加了20 %。
珍妮弗:你的觀點很對。想想看,我在費城報紙上看到了一則由200 名醫(yī)生簽名的要求禁止對醫(yī)療事故征收意外開支準備金的聯(lián)合申請。
安東尼:珍尼弗,現(xiàn)在我承認,對醫(yī)療事故征收意外開支準備金是不合理的。畢竟,我們所引用的統(tǒng)計數(shù)據有60 %都是支持這個結論的.
第11 章統(tǒng)計數(shù)據是否具有欺編性 215 ?抽樣回答一練習 1
結論:國會的改革是必要的,只有刀以羊才能減輕美國人的稅務負擔。理由:美國家庭的稅務負擔太重了。一個典型的美國家庭向聯(lián)邦、州及地方政府繳納收人的27 . 3 %作為稅金,每家平均繳納5 萬美元聯(lián)邦所得稅。
美國家庭的稅務負擔真的過重了嗎?我們應該警惕“典型的”和“平均”這兩個詞,這可能是在欺騙我們。我們需要知道這里采用的是哪種平均數(shù),是算術平均數(shù)、中數(shù)還是眾數(shù)?例如,假設采用的是算術平均數(shù),由于那些特別富裕的家庭繳納的稅金非常多,算術平均數(shù)就可能因這部分稅金而明顯增加。例如,隨著收人超過100 萬美元的家庭越來越多,將會使算術平均數(shù)急劇增加。中數(shù)則會是一個比較小的數(shù)字。例如,在19 %年,家庭所得稅的算術平均數(shù)是48 165 美元,而中數(shù)則只有35 536 美元。這里還有一組很重要的對比數(shù)字被忽略了。例如,與前些年的稅率相比,現(xiàn)在的稅率是多還是少?可能實際上現(xiàn)在的稅率已經減少了。
練習 2
結論:如今在美國開車與60 年前相比更安全了。