close
【此書的3大重點】
- 看到任何數據時都先抱持懷疑的態度,要去想說這個數據可能怎麼來的?測試的群體是誰?有沒有可能有選擇性表述?
- 我們說兩者有相關性,但不等於兩者有因果關係,很多媒體會把研究結果解釋成有因果關係,因為這樣觀眾才會看,這點要小心!
- 確認偏誤這個概念很有趣,也是人性的一環,指的是人們在看數據時,會尋找支持自有定見的數據,像我找全球暖化的資料,就會鎖定近期溫度較過去高的數據
看到數據時必須自問
- 政治候選人在競選廣告中有哪些話沒說出來
- 記者用的是精準樣本數據,還是他只是拿出支持他報導的數據
- 醫生說你的病是因某種行為而起,還是指兩者有關聯而已
- 行銷人員在產品包裝上強調哪些重點,為什麼要凸顯這些數據
- 為什麼有些是用圓餅圖,卻用柱狀圖顯示其他數據
各大章節重點摘要
- 抽樣:
- 錯誤的樣本抽樣可能會得出糟糕的結果
- 什麼樣的數據最適合回答問題?如太空梭因誤判O型環耐溫情況而墜毀的例子
- 當心自行提報的數據,人們不會永遠誠實,人的記憶更是不完美,如93%的人都自認為是優於一般水準的駕駛者
- 加總、平均、離群值:
- 平均值的優勢在於考慮了數據當中的所有數值,並簡化成一個數值,但要避免離群值
- 在美國,市長平均年薪是八萬,副市長是十萬,會有這樣的結果也是因為抽樣集合的差異
- 很多報導之所以有新聞價值,是因為他們和離群值有關
- 如果排除一個數值會大幅改變你的結論,那麼這個數值就非常可能是離群值
- 區別相關性和因果關係:
- 有相關性不等於兩者是因果關係,相關性的報導民眾不愛看,所以才會充斥很多因果關係的報導
- 媒體會說「戴眼鏡=高智商」,但實際研究中寫的是,在學校多讀幾年書,會和視力有關係(相關性)
- 遺漏變數的存在,是相關性不等於因果關係的主要原因之一,如星巴克並不是帶動附近房價上漲的主因
- 看到某某有相關時,注意是源自於某個遺漏變數,還是只是巧合
- 人會想要找出因果關係,是和「確認偏誤」有關,指的是人會傾向找能支持自己定見的數據,不是在找答案,而是在找「特定的」答案
- 錯誤表述和錯誤解讀:
- 簡報採用累積性的數據,是商業界的常用手段,如整年的銷量是每季加起來,!Q1到Q4一定愈來愈高
- 餐廳的菜單若有附上餐點照片,銷量會提高30%;專家在廣告中講話會讓我們對產品更有信心
- 好好檢視X軸和Y軸,轉個方向就可以說出不同故事
- 選擇性表述
- 例子-8成推薦嬰兒食品的醫師推薦OO奶粉,其實是推薦嬰兒食品中的醫師內之8成,,並非8成的小兒科醫師都推薦OO奶粉,這就是選擇性表述
- 採櫻桃也是選擇性表述的另一種說法-取最好的,其他不要
- 台灣很多新聞也是選擇性表述,媒體選擇對自己有利的片段去報導,柯P被抹黑的很多例子都是這樣,如「鄉下就應該有鄉下的樣子」
- 成為有實力的數據使用者,懂得辨識數據
- 確認事實是正確的。檢視試算表的公式、數值小數點
- 瞭解數據來自何方。如各家不同民調,背後一定會有支持的候選人
- 注意報導暗示因果關係,但有可能只是具有相關性
統計專有名詞
- 外在效度:指從樣本中得到的結論,可以擴大到什麼程度,以得出關於母體有意義的結論
- 假陽性:統計預測的是不成立的結果。如健康人的診斷試驗結果為不正常情況
- 遺漏變數:某個變數在某個關係中發揮作用,但是被忽略。是相關性不等於因果關係的重要原因之一
- 代理變數:如果當一個變項無法被「測量」時,研究者通常會尋找一個「可以被測量」的相近變項當作代理變數。例如 "慾望度"這個概念要怎麼測量? 有人就想到以「每日購買東西數量」當作慾望度這個變項的代理變項‵,或者以「每人平均所得」來成為「國家發展度」的代理變項
全站熱搜
留言列表