預(yù)測世界杯新工具——大數(shù)據(jù)
最近,有報(bào)道稱,一些公司利用大數(shù)據(jù)成功地預(yù)測了世界杯8分之1決賽的結(jié)果。不少人提出疑惑:若大數(shù)據(jù)預(yù)測世界杯靠譜,那誰會(huì)樂翻天?
一、有公司聲稱場場預(yù)測準(zhǔn)確
近日,對于利用大數(shù)據(jù)預(yù)測世界杯的報(bào)道屢見不鮮。 有公司聲稱他們利用大數(shù)據(jù)預(yù)測世界杯的結(jié)果準(zhǔn)確率貌似很高。
例如谷歌。其產(chǎn)品營銷經(jīng)理本杰明·貝托謝姆(Benjamin Bechtolsheim)周三在一篇博客中表示,到目前為止,谷歌的云計(jì)算平臺(tái)已成功預(yù)測了世界杯16強(qiáng)比賽每場比賽的勝利者。注意:是16強(qiáng)(即8分之1決賽)比賽勝利者。
谷歌稱,他們使用了來自O(shè)pta Sports的數(shù)據(jù),評估了每個(gè)職業(yè)足球聯(lián)盟過去多個(gè)賽季的情況,以及世界杯小組賽期間的統(tǒng)計(jì)數(shù)據(jù)。這一系統(tǒng)還使用了由BigQuery工程師喬丹·提加尼(Jordan Tigani)開發(fā)的實(shí)力排行榜系統(tǒng),同時(shí)考慮了觀眾熱情程度數(shù)據(jù),以計(jì)算主隊(duì)優(yōu)勢。
不過,谷歌也承認(rèn),他們并不是唯一做出完美預(yù)測的公司,而世界杯16強(qiáng)比賽中也沒有冷門出現(xiàn)?!皼]有冷門出現(xiàn)”這很關(guān)鍵。當(dāng)然,如果實(shí)力均衡,也不算什么冷門,那要預(yù)測準(zhǔn)確也不容易。
其實(shí),剛看了下百度的8分之1決賽的預(yù)測,也全部命中。這說明,谷歌還真不是謙虛。因?yàn)橄胂耄喝舸髷?shù)據(jù)預(yù)測世界杯之類的球賽結(jié)果非常準(zhǔn)確的話,那么誰會(huì)樂翻天?至少體彩參與者會(huì)!
二、說全都能預(yù)測準(zhǔn)確不會(huì)靠譜
問題,對于預(yù)測,無論用不用大數(shù)據(jù),多數(shù)情況下都不能保證百分之百的準(zhǔn)確度。如果都能準(zhǔn)確預(yù)測,那么體彩、股票、基金甚至戰(zhàn)爭,都可能有人大賺特賺。
即使是利用大數(shù)據(jù)準(zhǔn)確預(yù)測的典型案例中,也難覓百分之百準(zhǔn)確率的。例如,微軟紐約研究院經(jīng)濟(jì)學(xué)家 David Rothschild 通過大數(shù)據(jù)分析,成功預(yù)測了2014年奧斯卡24項(xiàng)獎(jiǎng)項(xiàng)中的21項(xiàng),還有3項(xiàng)沒預(yù)測對。
同樣是他,成功預(yù)測了 2013 年奧斯卡的獲獎(jiǎng)名單,他以 24 個(gè)中預(yù)測對了 19個(gè)。在 2012 年美國總統(tǒng)大選中,David Rothschild 正確預(yù)測了 51 個(gè)選區(qū)中 50 個(gè)地區(qū)的選舉結(jié)果,也還有1個(gè)沒預(yù)測對。
所以,不想妄想利用大數(shù)據(jù)就能做到觀測百發(fā)百中。然而,預(yù)測跑的是概率。利用大數(shù)據(jù)預(yù)測比不利用大數(shù)據(jù)預(yù)測準(zhǔn)確度要高。只是,對于足球而言,要看是否有其他偶然因素,例如傷病、運(yùn)氣及誤判等因素。
三、說預(yù)測完全不靠譜也不靠譜
這樣說來,大數(shù)據(jù)預(yù)測世界杯之類的比賽結(jié)果還是很有價(jià)值的。有些大數(shù)據(jù)的分析依賴于海量的數(shù)據(jù),預(yù)測的結(jié)果可能也會(huì)相對更精準(zhǔn),甚至超出你的預(yù)測結(jié)果。至少,大數(shù)據(jù)預(yù)測世界杯要比大嘴烏鴉貝利、章魚保羅、熊貓寶寶及烏賊劉要靠譜得多。
據(jù)了解,除了谷歌及百度在預(yù)測世界杯,還有高盛、德銀及科隆體育等機(jī)構(gòu),甚至還有科學(xué)家霍金。
霍金的許多關(guān)于足球的預(yù)測還挺有數(shù)據(jù)感,例如:提到點(diǎn)球大戰(zhàn),霍金認(rèn)為助跑必須不少于三步,如果速度上不去,進(jìn)球幾率只有58%。瞄準(zhǔn)上角的點(diǎn)球有84%的命中率,金發(fā)和禿頭的球員射中的概率達(dá)到更高的84%,前鋒的進(jìn)球概率超過80%,中場與后衛(wèi)遞減。
說到這里,我們不妨看看谷歌及百度對于4分之1決賽結(jié)果的預(yù)測:
谷歌預(yù)測的結(jié)果是——巴西對哥倫比亞:巴西勝概率為71%;法國對德國:法國勝概率為69%;荷蘭對哥斯達(dá)黎加:荷蘭勝概率為68%;阿根廷對比利時(shí):阿根廷勝概率為81%?! “俣阮A(yù)測的結(jié)果是——巴西對哥倫比亞:巴西勝概率為71%;法國對德國:德國勝概率為58%;荷蘭對哥斯達(dá)黎加:荷蘭勝概率為82%;阿根廷對比利時(shí):阿根廷勝概率為63%。
好吧,這樣PK一下,谷歌與百度在法國對德國比賽的結(jié)果預(yù)測是相反的。它們二者至少有一方4分之1決賽預(yù)測準(zhǔn)確度將最多是75%。
不過,所有的預(yù)測不能單獨(dú)看8分之1決賽或4分之1決賽的準(zhǔn)確度,甚至不能僅看這一次世界杯的準(zhǔn)確度,要在更大范圍里觀察預(yù)測結(jié)果。
其實(shí),最令人吃驚的是,霍金曾經(jīng)預(yù)測過:“世界將在兩百年之后滅亡”,這個(gè)預(yù)測結(jié)果可能比任何一場比賽的結(jié)果要更讓你揪心吧!
作者:陳永東,中國十大IT博主,新媒體研究者
原創(chuàng)文章,作者:王琪,如若轉(zhuǎn)載,請注明出處:http://bcouya.cn/blog/archives/8885