Table of Contents
作者
查爾斯惠倫 (Charles Wheelan),
芝加哥公共政策博士,年度最佳教授,
是一位自稱討厭微積分,卻喜歡統計的作者。
為什麼學統計
Charles分享學統計的好處 :
- 將巨量的資料作出摘要
- 做出較好的決定
- 解答重要社會問題
- 辨識出能提升每一件事效果的模式
- 揪出作弊、犯罪
- 評估政策、計畫、其他創新的效用
另外在投資領域上,統計的思維也非常實用,像是投資迷思提到的平均報酬10%不是真的10%,就是運用統計知識去了解真相。用一句話來形容統計的用途,統計是用來描述與比較、推論、評估風險及事件的機率,是一種用已知推論未知的技能,
而談到統計及機率的應用,從早期賭場到保險業、企業的風險評估,都有他的存在,甚至到Netflix的推薦影片,都是它的應用。
但作者也提醒,數學是精確的學問,而使用統計來描述複雜的現象卻是不精確,會留下許多遮蔽事實的空間。他提起馬克·吐溫的一句名言作為借鏡 : 「謊言有三種,謊言、該死的謊言、還有統計」,來提醒大家,在解讀數據的時候,務必要謹慎再謹慎。
描述性統計
什麼是描述性統計,就是指我們用來形容原始數據的數字與計算的一種描述,像是平均數、中位數、標準差、百分比等等。
這裡的重點是,何種描述性統計有助於回答我們本身的問題才重要,這邊說個故事來幫助理解 :
有十個男士走進一間酒吧的櫃台喝酒,他們都是上班族,年薪是50萬,所以我們知道他們平均年薪是50萬元,幾分鐘後,恰巧比爾·蓋茲也來到酒吧喝酒,假設他的年薪是10億元好了,你會形容這櫃台上的男士們平均年收入高達9千多萬唷...
這樣…適合嗎?
是的,不太合適,我們可能用中位數來表示更適當,「中位數」是將一個分配區分配成兩半的那個點,代表一半觀察值在它上方、有一半觀察值在它下方,如此一來,像比爾蓋茲來到櫃檯時,這十一個人年收入的中位數依舊是50萬元,而能比較明確描述多數人的實際薪資。
所以,聰明的觀眾們,你們只要舉一反三,就會知道為什麼股票的平均報酬10%不是真的10%,因為裡面含有重大偏離報酬的數值,而把”平均數”拉高了。叮!叮! 有沒有感覺認知提升啦!!
所以,這段是要說明,好的描述性統計更能幫助我們理解事情的真相,反之,不好的描述性統計,更可能會誤導我們的決策,讓我們做的跟想的結果是不一致的。
精確性與正確性的差別,很重要
之前就有提到過巴菲特在投資上的建議 : 「寧可約略的正確好過精確的錯誤」。來表示精確性與正確性的差異別。
舉個例子 : 有天,有個路人來問路,說著我聽不太懂的外語,但我隱約聽到幾個關鍵字,”永康牛肉麵”,我就跟他指了個方向,說走路的話,離這裡200多公尺的路程就會到。事後幾分鐘,我突然想起來,我好像指錯方向了QQ。這就是我很精確地表達距離,但一點意義都沒有。
而真實發生的現場,我其實是跟對方說進前面那個巷子,經過兩個十字路口,再向左轉,你就會看到牛肉麵的牌子了。這是表達實際正確的方向,儘管沒有精確的量測單位。
因此精確性與正確性千萬不要混淆,再怎麼精確也是無法取代正確性的
而精確性可能帶來一種錯誤的確定感,因而掩蓋其不正確性
統計上的奇蹟仙丹 : 迴歸分析
這裡我想特別提到作者下了一個聳動標題,被稱為奇蹟仙丹的迴歸分析,作者用了一個案例來介紹迴歸分析的厲害之處 :
工作壓力會不會致人於死? 會的,有強力的證據顯示高壓工作會導致早死,尤其是因心臟病發作而死。
這是一個英國的白廳實驗,研究人員發現英國公務階層裡對自己工作沒有控制權的公務員的死亡率,比有較多決定權的公務員罹患心臟病的比率較高,說明工作壓力是指被告知做甚麼卻無權決定如何做或何時做所帶來的壓力。
但是,較低層的人比較可能有吸菸習慣,也可能影發心臟病的問題,那該怎麼確認是吸菸問題還是工作壓力影響的呢? 這時就輪到迴歸分析登場,迴歸分析的核心觀念是要找出兩個變數之間線性關係的「最佳適配」。
簡易的表達方程式像是 :

(圖示是用身高體重來舉例)
心臟病機率 = 常數 + a*(低控制權) + b*(抽菸)
所以在控制住其他影響心臟病的風險因素後,觀察低控制權的的發生心臟病的可能性是有明顯正向關聯的。
實際的統計研究是更加複雜,這裡只是要表達迴歸分析的概念,作者在尾聲做了一個有趣的結論,他告誡自己的孩子,在所有條件相同時,最好不要做一隻地位低的狒狒,哈哈。
而我從迴歸分析的理解中,我意識到在投資上,降息或減稅之類的政策,或多或少一定會影響股市,但不會是單純的二分法,不應該只用縱向的時間去判斷是會漲或會跌,而是多了程度上的區別,應該考慮其他的變數也同時在影響著股市,如此一來,思考的廣度也會增加。
結論
作者在書中也把統計中重要的概念,如蘋果比橘子的誤導、相關性、機率、垃圾進垃圾出、中央極限定理、統計推論、迴歸分析、方案評估等等,依依做了精闢的介紹,看得十分過癮,
仔細想想,以前蒐集資訊困難,只有紙本沒有個人電腦,如何分析研究一百萬筆信用交易情形?,且資料延遲性且不正確的問題,套用作者提到的評論家詹姆斯·索羅斯的觀察:「華盛頓是在黑暗中做決策」,而現在,資訊爆炸,面臨的問題已經不同了,是要在一堆資訊中,找出有社會意義的答案以及避免濫用。
而在投資的領域,學習利用統計的思維,能更正確地看待數據與投資之間的關係,並小心謹慎的協助我們正確判斷,也知曉了有很多潛在的陷阱也會誤導我們的決策。記住一點,公式不會告訴我們哪種資料的使用方式是妥當的,哪種不是,精確的數學無法取代正確的判斷力
最後用作者的一段話作為結尾 :
「讓我們用一些字詞的關聯來結束這本書 : 火、刀、汽車、除毛霜。這些東西每一樣都有一個目的,都讓我們生活得更好,而當濫用時每一樣也都會引發嚴重的問題。」