(一百四十二)高階數據的發展
歸途的航班上,遠飛半遮半掩地向諸人講述了傑森.巴斯的邀請。大家聽了羣情激昂,紛紛咒罵起巴斯來。
“這個傑森居然要勾結小老闆,攪亂聯盟的公平環境,真是罪無可赦!”波什憤憤不平。
“可是,巴斯家族人才濟濟,他真的這麼有把握能繼承湖人隊嗎?”比盧普斯想得比較遠,他考慮問題的角度就獨特了一些。
“別人自己家的事情,湖人誰來繼承,我們就不要操心了。”遠飛笑道:“不管如何,我們現在纔是衛冕冠軍,湖人只是季後賽圈外球隊。應該擔心的是他們而不是我們。”
“傑森這話說得真是自大,可我喜歡。”姚明也笑了起來。
“這傢伙還是科比.布萊恩特的鐵粉,他覺得布萊恩特比我強?有趣。”麥迪也笑了,巴斯的話挑起了他的鬥志。
“巴斯覺得布萊恩特會成爲喬丹那樣的人物,圍繞他去建隊還能打造出王朝。當然了,我不這樣想,我們火箭可不答應啊。”遠飛在這種時候當然要給予麥迪以支持。
“傑森,你覺得怎麼比較布萊恩特、特雷西或者艾弗森這樣的超級巨星?”波什突然問道。
“唔,這個問題說起來可就廣泛了。如果說談歷史地位肯定是先考量榮譽了,特雷西這種一年就包攬了MVP,總冠軍和FMVP的大滿貫巨星肯定是會大大加分。畢竟喬丹以後能做到這件事的只有他和奧尼爾鄧肯了,而那兩位都是能衝擊歷史前十位置的。如果特雷西今天突然宣佈退役,我想他差不多也能排到歷史前四十吧。”遠飛想了想回答道。
“不不,我想問的是,數據能體現球員在球場上的價值嗎?總不能說誰得分多誰就厲害吧?”波什補充道。
“噢,那你得先知道數據做什麼的。理想的數據是能體現一切球場上發生的行爲。可受限於統計能力和分析能力,當前的數據顯然不是萬能的,有很多無法進行具體統計的數據。但好在對於籃球的數據分析仍在不斷髮展進步,總會有一些更好的統計標準不斷涌現出來。”遠飛道:“之前寫過很多球評的那個約翰.霍林格剛剛發明了一項進階數據(簡稱爲PER,通常翻譯爲效率值),這項統計就能比較好的表現出一名球員的綜合實力。”
“什麼是進階數據?什麼又是per呢?”波什一臉懵逼了。
“進階數據()就是在基礎數據的基礎上整合出的一些數據。像上次我給你們講過的籃板率就是在籃板球數量基礎上演化出的進階數據,它比籃板球數量能更好地體現球員搶籃板的能力。”遠飛講起籃球理論又滔滔不絕了,“而效率值是用來反映球員和這個年代的平均實力比是什麼樣的。這項統計的計算方法非常複雜我就不細說了,反正包括了得分、助攻、進攻籃板、防守籃板、搶斷等正面數據,也包括了打鐵、失誤等負面數據,最後把這些統一成爲一個值。而聯盟的平均值是15,也就是說高於15的就是不錯的球員,高於20的就算球星了,高於25差不多就是超級球星了。”
“這個東西不錯,簡單易懂啊。那咱們隊的人誰排在前面呢?應該是特雷西吧?”波什問道:“布萊恩特、艾弗森又有多少?他們仨誰高一些呢?”
“飛機上不能上網啊......這樣等回去我查詢一下統計再告訴你。”遠飛尷尬地說:“另一項不錯的統計叫做勝利貢獻值(,簡稱爲WS),這項數據同樣是將各種基礎數據運算後,最終將每個人對球隊贏球的貢獻大致模擬成一個數,比如說我們現在是49勝,咱們隊球員的WS相加就在49上下。假如說姚的WS是10,也就是說如果姚一場不打,我們大概就是39勝的水平。”
“那這可麻煩了,39勝連季後賽都很難進去了。”波什皺起了眉頭。
“當然不能完全這麼算。因爲姚一直在場,並且有球權,所以打出了很好的數據。假如姚不能打,大普頂上首發。因爲大普的進攻技術沒有姚那麼好,即使你的出場時間不變,但你會獲得更多的球權,也會導致你的PER和WS變得更好。”遠飛分析道:“效率值和勝利貢獻值當然不是完美的,它們是在特定戰術環境下做出的統計。當然它們比起以前的基礎數據統計已經是邁進了一大步了。”
“原來是這樣,這些進階數據也不是特別好用。”波什似乎有些失望,“那它們有什麼明顯的缺點呢?”
“先說說效率值吧,最大的毛病是它和球權,尤其是出手權關聯太大了。在計算公式中它對於打鐵的懲罰比較輕而對於出手投中球的加成很高,這導致一些投籃能力一般但出手很多的球員在這項統計中佔有優勢,而投籃很準但出手比較少的球員則佔據劣勢。也就是說,這玩意還是比較適合那些所謂的數據刷子,能力一般拿球就投的那種球員。”遠飛道:“另一個主要的缺點是效率值不能體現防守能力,有一些防守很棒但投籃很少的角色球員,PER不僅達不到平均值15,甚至會跌到10以下。但其實他們都是聯盟中非常優秀的人才。”
“唔......這樣啊。”
“小的毛病更多了,比如說助攻的加成比例是2/3,我是不知道爲什麼助攻就定爲2/3。一次糟糕的傳球由於接球人技術好勉強投進了,和一次妙傳導致接球人輕鬆扣籃,兩者在加成上是一樣的,這就是當前數據分析的瓶頸了,沒辦法具體量化一個進球中多個人的貢獻。”遠飛繼續講道:“再比如說蓋帽後的貢獻比例要乘以後場籃板率,這個想法是好的,但不夠客觀。蓋帽後也不是每個球都形成籃板球了,比如說你一次蓋帽對手出界,雖然球權還是對方的,但進攻時間所剩無幾,其實就是相當於防下來了。所以效率值對蓋帽統計的認可度有點低。”
“不行了,我已經聽糊塗了。”波什道:“WS能不能簡單一點?”
“抱歉,勝利貢獻值的算法比效率值還複雜,它起源是從棒球界的數據專家比爾.詹姆斯的算法中升級來的。WS的主要缺點是有幾個計算環節是通過球隊的整體數據去算的,這樣不能很好地考慮到主力和替補的區分。畢竟帶着好的隊友和較差的隊友是不同的。相對而言,在強隊打首發且非常健康的球星計算WS是比較有利的。”
“好吧,我徹底放棄跟着你學數據分析了......這玩意越研究越難啊。”波什苦着臉道。
“對於你來說,學會用就行了。沒必要深入研究這個數據是怎麼來的,算法是什麼樣的。能查到就行啊。”遠飛想了想道:“其實我主張球員要學一點數據,這樣便於針對自身條件進行提高。人的精力是有限的,把有限的精力投入到更有效的訓練項目上。”
波什眼前一亮,“好的!”(。)