sub newsletter

從兩個(gè)數(shù)據(jù)看微博活躍度

U4672P2DT20110106233914

活躍用戶數(shù)是衡量互聯(lián)網(wǎng)公司價(jià)值最重要的標(biāo)準(zhǔn)之一。微博在這幾年的發(fā)展中,其活躍度一直是數(shù)據(jù)研究機(jī)構(gòu)的研究對(duì)象,最近香港大學(xué)公布了一份關(guān)于微博用戶數(shù)據(jù)的報(bào)告,這份報(bào)告對(duì)微博注冊(cè)用戶判定以及后續(xù)媒體的解讀與我們通過(guò)微博官方授權(quán)接口抓取的數(shù)據(jù)有比較大的差異。根據(jù)我們的數(shù)據(jù),這份報(bào)告至少存在兩處嚴(yán)重的缺陷:

首先,微博自從2年前就不公布注冊(cè)用戶數(shù),因?yàn)樽?cè)用戶中存在僵尸和垃圾用戶,雖然我們也不能拿到全部信息,但是根據(jù)我們獲得的授權(quán)數(shù)據(jù)測(cè)算,微博的總注冊(cè)用戶早已超過(guò)10億,其中新浪凍結(jié)的垃圾粉就有幾億(新浪凍結(jié)垃圾用戶,但是并不刪除賬號(hào)),港大教授用的連續(xù)用戶ID遍歷的抓站方式,會(huì)導(dǎo)致抓到的很多是新浪已經(jīng)凍結(jié)(不能登錄,不能發(fā)言)的賬號(hào),但官方數(shù)據(jù)接口會(huì)告知我們這些合作伙伴用戶屬性(是真實(shí)用戶,還是凍結(jié)用戶,還是實(shí)名用戶)——也就是只有官方合作伙伴,才知道哪些用戶是有價(jià)值值得分析的用戶哪些不是,也才能進(jìn)行更科學(xué)的數(shù)據(jù)分析。

其次,香港大學(xué)那份報(bào)告公布的原創(chuàng)和轉(zhuǎn)發(fā)用戶的比例是1:20,這個(gè)數(shù)據(jù)明顯失準(zhǔn)。根據(jù)我們從官方數(shù)據(jù)接口獲得的數(shù)據(jù)統(tǒng)計(jì),原創(chuàng)和轉(zhuǎn)發(fā)的比例在不同月份會(huì)有所不同,但過(guò)去半年內(nèi)從來(lái)沒(méi)有低于1:3。

之所以得出不準(zhǔn)確的結(jié)論,是因?yàn)橥ㄟ^(guò)抓站獲取的數(shù)據(jù)本身就有問(wèn)題,首先這些抓站用戶不排垃圾,另外更重要的一點(diǎn),為了防止抓取核心用戶數(shù)據(jù),對(duì)于識(shí)別的第三方抓站行為,站方會(huì)送一些混淆數(shù)據(jù)出去。因此港大很有可能是他們通過(guò)抓站方式獲取的數(shù)據(jù)中,獲取的數(shù)據(jù)從一開(kāi)始就是不精確的。

博瑞創(chuàng)科通過(guò)對(duì)微博官方授權(quán)數(shù)據(jù)接口獲得的數(shù)據(jù)進(jìn)行分析,針對(duì)以上兩個(gè)數(shù)據(jù)得出了以下結(jié)論。

每月發(fā)布微博用戶人數(shù)約在4500萬(wàn)—5500萬(wàn)。2014年3月我們監(jiān)測(cè)到的數(shù)據(jù)中,在月活躍用戶中發(fā)布原創(chuàng)微博的用戶比例在35–40%左右,以此折算大約在4500萬(wàn)–5500萬(wàn)用戶每月發(fā)布過(guò)原創(chuàng)微博。社交平臺(tái)的用戶行為通常都遵循“二八定律”,即20%的人產(chǎn)生內(nèi)容,80%的人閱讀、消費(fèi)信息。即使是Twitter這樣的平臺(tái),其大部分內(nèi)容(75%)也是被5%的活躍用戶產(chǎn)生,從這個(gè)數(shù)據(jù)來(lái)看,微博的原創(chuàng)用戶比例要遠(yuǎn)高于Twitter。3月微博的原創(chuàng)用戶占比明顯高于行業(yè)平均水平,這與馬航事件、文章出軌等熱點(diǎn)事件的刺激不無(wú)關(guān)系。

29%的原創(chuàng)用戶發(fā)布的微博被轉(zhuǎn)發(fā)、57%的原創(chuàng)用戶發(fā)布的微博被評(píng)論。文章發(fā)表聲明的單條微博互動(dòng)量超過(guò)400萬(wàn),大家覺(jué)得微博的互動(dòng)量是很高的,但是數(shù)據(jù)告訴我們并非如此。我們的監(jiān)測(cè)結(jié)果表明,只有29%的原創(chuàng)用戶發(fā)布的微博被轉(zhuǎn)發(fā)、57%的原創(chuàng)用戶發(fā)布的微博被評(píng)論。與文章的聲明形成強(qiáng)烈一個(gè)強(qiáng)大的反差,這說(shuō)明微博傳播一直存在金字塔效應(yīng),大量的互動(dòng)都集中在“塔尖”的明星名人、意見(jiàn)領(lǐng)袖,數(shù)量巨大的“塔腰”和“塔基”用戶發(fā)布的微博,互動(dòng)量與“塔尖”用戶存在比較明顯的差距。這既是微博傳播的優(yōu)勢(shì),同時(shí)也是問(wèn)題。要想進(jìn)一步提高微博的活躍度,需要為“塔腰”和“塔基”用戶帶來(lái)更高的互動(dòng)量,才能刺激他們發(fā)布高質(zhì)量的原創(chuàng)微博。

我們也注意到,微博也在做出一些改變,正在通過(guò)扶植中小V計(jì)劃對(duì)“塔腰”的用戶做出一系列的扶植計(jì)劃,同時(shí)推薦機(jī)制的形成也將對(duì)“塔基”部分的用戶在信息生產(chǎn)和傳播產(chǎn)生催化作用。針對(duì)這個(gè)話題,我們會(huì)過(guò)一段時(shí)間發(fā)布專(zhuān)門(mén)的研究報(bào)告。

作為微博官方的數(shù)據(jù)合作伙伴,一些第三方發(fā)布的微博用戶數(shù)據(jù)經(jīng)常會(huì)對(duì)我們的客戶甚至是整個(gè)行業(yè)造成困擾。如上所述,微博一直在對(duì)各種抓站行為進(jìn)行限制,甚至對(duì)識(shí)別出的抓站行為故意提供錯(cuò)誤數(shù)據(jù),以便保證數(shù)據(jù)的權(quán)威性并保護(hù)合作伙伴的利益。在國(guó)外,對(duì)網(wǎng)站的數(shù)據(jù)分析也需要首先與官方簽署合作協(xié)議,通過(guò)官方提供的數(shù)據(jù)接口獲取數(shù)據(jù),我們看到的關(guān)于twitter、Facebook等社交網(wǎng)站的用戶數(shù)據(jù)信息,都是通過(guò)這種方式進(jìn)行研究得出的。

來(lái)源:微博風(fēng)云

原創(chuàng)文章,作者:王琪,如若轉(zhuǎn)載,請(qǐng)注明出處:http://bcouya.cn/blog/archives/8326

China-PRNewsire-300-300