2013年3月20日 星期三

數字不說謊, 說謊者玩弄數字


一條簡單不過的算術「四則題」, 原來在過去的十多年中, 已有過無數的討論, 究竟答案應該是 那個, 相信至今仍未有「盟主」能「一統江湖」, 定下結論。

數目字的計算, 其實絕對不應有無稜兩可, 一就是一、二就是二。問題就是, 不同的人對那條 「四則題」有不同的解讀、不同的演譯, 那就出現不同的答案了。好彩老闆計數出糧、或是飲 茶埋單找數時, 都有一個很清晰的計算法, 否則就肯定天下大亂了。

但是, 在日常生活中, 我們不難會接觸到一些所謂「調查報告」、或「統計結果」等, 都聲稱是 通過分析背後的一大堆數據, 而得出結果的。有時, 調查統計所用到的「術語」, 好像是不想讓 一 般市民大眾能夠明白, 常令人摸不著頭腦, 但有些卻有極富彈性, 「講咗等於冇講」。

首先, 所謂「統計、調查」, 是有關測定、收集、整理、歸納、及分析那些反映客觀規律的數 據, 並不是、也不能用來作為「證明」甚麼的依據。「統計結果」只反映事物的相關性, 並不 能用作為準確「預測」的方法。但是, 如何收集、如何歸納、及如何分析, 全都有相當大的迴 旋空間或自由度, 亦即是說, 完全可以將整個過程倒轉, 根據一個已既定、或是心目中的結論, 然後決定如設計問卷、如何挑選調查對象等。例如, 問卷中在對某項事的態度, 只有「反對」 及「無意見」兩個選擇, 就很明顯不夠客觀了。

當然, 這是一個極端的假設。但是, 即使是客觀上隨機所獲得的數據, 如何分析、或如何「包 裝」那些數據, 仍然可以因人而異、因「目的」而異。

據說在1987, 當時的港英政府, 曾就香港市民對「直選」當時的「立法局」議員的時間表的意見, 做過一次民意調查, 所收集到的數據是: 35%接受調查的市民, 贊成翌年1988年實行「直選」、其餘的由1989年到1996年的8, 每年都得到若干百份比的市民的贊成。如果單從數字上來看, 1989年到1996年的8年的總「贊成率」, 100%-35%=65%, 而平均每年只得約8%的「贊成率」, 對比起來, 1988年的35%, 顯然是「贏到開巷」, 應該是「最高票數」的當選者。但是, 在公佈的結果是: 《有65%的接受調查者, 「不贊成」1988年實行「直選」, 而「贊成」其他年份的, 平均不到10%》。

馬克吐溫(Mark Tawin) 曾有話: “Figures don’t lie, but liars figure”, 姑且意譯作「數字不說謊, 說謊者玩弄數字」。

沒有留言:

張貼留言