非凡主播朱楚文在女人迷的特企專欄!將為你帶來一系列精彩的大數據追蹤報導,一週兩篇,一篇採訪,一篇分析台灣現況,讓你快速了解大數據的操作!上週報導回顧:大數據創業缺的不是創意專訪大數據權威教授麥爾·荀伯格

「電影魔球告訴我們一件事:一般人最容易記住的事情,通常是特殊事件,而非常態。」(麻省理工教授谷泰格,2013)

一頭花白髮,卻有結實的體魄,出現在我眼前的麻省理工電機系教授約翰.谷泰格,看起來就像美國電影中描繪的熱情球迷。我是在2013年訪問谷泰格,當時的他,才剛因發表大數據預測運動比賽結果的電腦程式,被ESPN大力報導,成為美國運動界關注焦點。有趣的是,這位有點年紀的教授,在被我問到,「你真的發明靠『算』,就能贏的方法嗎?」,居然露出青少年才有的陽光笑容,得意的說是。

本身就是棒球迷的他,因為受不了電視球評常預估錯誤,決定靠拿手的統計學,記錄所有球員打擊率、上場得分率等總計約 15個變數,排列組合成一個勝利方程式。沒想到,這個程式居然改寫了美國運動比賽的命運。(推薦閱讀:魔球:一個 Hack Everything 的故事


 

大數據預測比賽結果:95%正確!

谷泰格:「我們設計了非常簡單的電腦程式,變數只有兩樣東西:一堆照片(例如投球),以及球隊多少局比賽順利得分。接著,我們蒐集數據,進行統計分析,依此建立出簡單的球隊經理決策預測模型。令我們很驚訝的是,依照這個模型,預估出的比賽結果居然95%正確!換句話說,儘管球隊經理口口聲聲說做決定的思考過程有多複雜,事實上卻非常簡單。」

怎麼會發生這樣的情況?谷泰格解釋:「球隊經理最常用的兩項評估標準:得分率和投手三振率,在我們的分析模型中,顯示對比賽結果一點也不重要。大部分人都說重要,依此調度投手的兩項標準,在數據中顯示,不是影響比賽結果最重要的關鍵。」

原來問題出在決策的基準錯誤。然而,即便是人和機器,取得資訊的來源都是棒球比賽,基準怎麼會差這麼多?谷泰格:「電影魔球告訴我們一件事:一般人最容易記住的事情,通常是特殊事件,而非常態。因此,假使你常依據『記憶』做決策,那決策的基準將會是一些罕見案例,不過一般事件才是決策的關鍵來源。」

 
 
 

人腦其實不擅於記憶

聽到這裡,我忍不住在採訪中倒抽一口氣。數不清有多少時候,我都是憑記憶做決策,難道生活中一些難以控制的挫折感,都是因為錯誤基準形成的偏頗決策而起?

這讓我想到 google 前資訊長梅瑞爾,寫得一本暢銷書「google 時代一定要會的整理術」,也提到我們的大腦是讓我們無法有效整理生活的最大阻礙之一:因為它不擅於記憶瑣碎的事物,也不擅於做決定。我們常以為自己記得,記對了,但很可能記錯了:這個風險是,如果我們下決定是用腦袋中資訊做判斷,錯誤的資訊恐怕只會衍伸出錯誤的決定。(推薦閱讀:加強記憶的色彩筆記法

屏除人腦的情感和記憶對客觀事實的干擾,谷泰格把自己完全交給大數據,從中發掘事實真相。谷泰格:「大部分模型會失敗,都是因把主觀判斷放入其中,造成只看到設計者覺得重要的影響結果。相反的,我的哲學是讓數據自己說話:盡可能減少比賽知識對於預測模型的干擾,用精密機器盡可能挖掘出超級多、更多的數據,但絕不試圖引導方向,只是單純去看數據告訴我們什麼故事。」

靠著讓大數據自己說故事,谷泰格做得「或許大球隊會願意多花兩千美元用電腦幫助決策」創業夢,迅速被洋基隊青睞而實現。洋基也因此開始積極培育資訊工程師,甚至新經理吉拉第也是資工系畢業,更發現,原來一年中有一半的錢,都付給受傷無法貢獻的球員,如何讓這些球員避免受傷,也成為谷泰格的下一個挑戰。

如今,在台灣還用「人」管理球隊之時,美國大多數的球隊都採用大數據管理。這股魔球科技熱潮,從棒球延燒到 NBA,谷泰格的研究更獲得 ESPN 報導,讓這年近半百的教授,回頭嚐到被兒子崇拜的幸福滋味。

 
 
 

大數據淘金夢:垃圾變黃金

訪問完,我睜得大大的眼睛有點酸澀,但心裡充滿激動。從沒想過運動也能算,而且算得這麼精準,甚至算出創業夢。

大數據能給我們的,或許就是一次次垃圾變黃金的機會,考驗我們能否獨具慧眼,又是否畫地自限?我也很佩服谷泰格追求答案的勇氣,就是因為好奇,因為想要知道「到底誰預測準呢」,這個有點童趣的小動機,讓他發現了另一個可能。他的思考,除了證明我們應該要開始學著紀錄、學著相信資料、學著讓數據說話、甚至學著整理數據,也逼著我們凝視自身的限制。

人類永遠都是充滿限制又充滿無限可能,我們記憶力可能不好,我們體力可能有限,但是我們總會尋求不斷打破限制的機會,最常用的管道就是科技。只是,大多時候,我們寧可用錯誤和費時的方式過日子,只因不想要改變,所以不去看那些限制,或許我們都應該要常常正視自己的生活,試著去想像,怎麼讓科技改善我們的生活!

對我來說,打破限制最重要的,首先就是承認限制的存在:如同谷泰格赤裸裸地揭露,你以為你很聰明、記憶力很好嗎?你可能已經犯錯了還不知道呢!這也讓我再次想到 google 前資訊長書中提到的:限制分兩種,真實的限制和假想的限制。真實的限制是我們遇到的實際難題:假想限制是我們預設可能會遇到的困難。要讓自己不斷進步的方法,就是只解決真實的限制,轉頭忽略假想限制—想清楚最糟情況會如何,別讓非理性的恐懼左右。(推薦給你:學會 70/20/10 法則,建立說 Yes 的企業文化

谷泰格教授用大數據突破了他的限制,成功算出球隊輸贏,完成了創業夢。或許,大數據要教導我們的,就是用數據事實告訴我們限制在哪,然後不再害怕這些限制。魔球科技的時代,下一個要突破的限制又是什麼呢?