sub newsletter

從兩個(gè)數(shù)據(jù)看微博活躍度

U4672P2DT20110106233914

活躍用戶數(shù)是衡量互聯(lián)網(wǎng)公司價(jià)值最重要的標(biāo)準(zhǔn)之一。微博在這幾年的發(fā)展中,其活躍度一直是數(shù)據(jù)研究機(jī)構(gòu)的研究對象,最近香港大學(xué)公布了一份關(guān)于微博用戶數(shù)據(jù)的報(bào)告,這份報(bào)告對微博注冊用戶判定以及后續(xù)媒體的解讀與我們通過微博官方授權(quán)接口抓取的數(shù)據(jù)有比較大的差異。根據(jù)我們的數(shù)據(jù),這份報(bào)告至少存在兩處嚴(yán)重的缺陷:

首先,微博自從2年前就不公布注冊用戶數(shù),因?yàn)樽杂脩糁写嬖诮┦屠脩簦m然我們也不能拿到全部信息,但是根據(jù)我們獲得的授權(quán)數(shù)據(jù)測算,微博的總注冊用戶早已超過10億,其中新浪凍結(jié)的垃圾粉就有幾億(新浪凍結(jié)垃圾用戶,但是并不刪除賬號(hào)),港大教授用的連續(xù)用戶ID遍歷的抓站方式,會(huì)導(dǎo)致抓到的很多是新浪已經(jīng)凍結(jié)(不能登錄,不能發(fā)言)的賬號(hào),但官方數(shù)據(jù)接口會(huì)告知我們這些合作伙伴用戶屬性(是真實(shí)用戶,還是凍結(jié)用戶,還是實(shí)名用戶)——也就是只有官方合作伙伴,才知道哪些用戶是有價(jià)值值得分析的用戶哪些不是,也才能進(jìn)行更科學(xué)的數(shù)據(jù)分析。

其次,香港大學(xué)那份報(bào)告公布的原創(chuàng)和轉(zhuǎn)發(fā)用戶的比例是1:20,這個(gè)數(shù)據(jù)明顯失準(zhǔn)。根據(jù)我們從官方數(shù)據(jù)接口獲得的數(shù)據(jù)統(tǒng)計(jì),原創(chuàng)和轉(zhuǎn)發(fā)的比例在不同月份會(huì)有所不同,但過去半年內(nèi)從來沒有低于1:3。

之所以得出不準(zhǔn)確的結(jié)論,是因?yàn)橥ㄟ^抓站獲取的數(shù)據(jù)本身就有問題,首先這些抓站用戶不排垃圾,另外更重要的一點(diǎn),為了防止抓取核心用戶數(shù)據(jù),對于識(shí)別的第三方抓站行為,站方會(huì)送一些混淆數(shù)據(jù)出去。因此港大很有可能是他們通過抓站方式獲取的數(shù)據(jù)中,獲取的數(shù)據(jù)從一開始就是不精確的。

博瑞創(chuàng)科通過對微博官方授權(quán)數(shù)據(jù)接口獲得的數(shù)據(jù)進(jìn)行分析,針對以上兩個(gè)數(shù)據(jù)得出了以下結(jié)論。

每月發(fā)布微博用戶人數(shù)約在4500萬—5500萬。2014年3月我們監(jiān)測到的數(shù)據(jù)中,在月活躍用戶中發(fā)布原創(chuàng)微博的用戶比例在35–40%左右,以此折算大約在4500萬–5500萬用戶每月發(fā)布過原創(chuàng)微博。社交平臺(tái)的用戶行為通常都遵循“二八定律”,即20%的人產(chǎn)生內(nèi)容,80%的人閱讀、消費(fèi)信息。即使是Twitter這樣的平臺(tái),其大部分內(nèi)容(75%)也是被5%的活躍用戶產(chǎn)生,從這個(gè)數(shù)據(jù)來看,微博的原創(chuàng)用戶比例要遠(yuǎn)高于Twitter。3月微博的原創(chuàng)用戶占比明顯高于行業(yè)平均水平,這與馬航事件、文章出軌等熱點(diǎn)事件的刺激不無關(guān)系。

29%的原創(chuàng)用戶發(fā)布的微博被轉(zhuǎn)發(fā)、57%的原創(chuàng)用戶發(fā)布的微博被評論。文章發(fā)表聲明的單條微博互動(dòng)量超過400萬,大家覺得微博的互動(dòng)量是很高的,但是數(shù)據(jù)告訴我們并非如此。我們的監(jiān)測結(jié)果表明,只有29%的原創(chuàng)用戶發(fā)布的微博被轉(zhuǎn)發(fā)、57%的原創(chuàng)用戶發(fā)布的微博被評論。與文章的聲明形成強(qiáng)烈一個(gè)強(qiáng)大的反差,這說明微博傳播一直存在金字塔效應(yīng),大量的互動(dòng)都集中在“塔尖”的明星名人、意見領(lǐng)袖,數(shù)量巨大的“塔腰”和“塔基”用戶發(fā)布的微博,互動(dòng)量與“塔尖”用戶存在比較明顯的差距。這既是微博傳播的優(yōu)勢,同時(shí)也是問題。要想進(jìn)一步提高微博的活躍度,需要為“塔腰”和“塔基”用戶帶來更高的互動(dòng)量,才能刺激他們發(fā)布高質(zhì)量的原創(chuàng)微博。

我們也注意到,微博也在做出一些改變,正在通過扶植中小V計(jì)劃對“塔腰”的用戶做出一系列的扶植計(jì)劃,同時(shí)推薦機(jī)制的形成也將對“塔基”部分的用戶在信息生產(chǎn)和傳播產(chǎn)生催化作用。針對這個(gè)話題,我們會(huì)過一段時(shí)間發(fā)布專門的研究報(bào)告。

作為微博官方的數(shù)據(jù)合作伙伴,一些第三方發(fā)布的微博用戶數(shù)據(jù)經(jīng)常會(huì)對我們的客戶甚至是整個(gè)行業(yè)造成困擾。如上所述,微博一直在對各種抓站行為進(jìn)行限制,甚至對識(shí)別出的抓站行為故意提供錯(cuò)誤數(shù)據(jù),以便保證數(shù)據(jù)的權(quán)威性并保護(hù)合作伙伴的利益。在國外,對網(wǎng)站的數(shù)據(jù)分析也需要首先與官方簽署合作協(xié)議,通過官方提供的數(shù)據(jù)接口獲取數(shù)據(jù),我們看到的關(guān)于twitter、Facebook等社交網(wǎng)站的用戶數(shù)據(jù)信息,都是通過這種方式進(jìn)行研究得出的。

來源:微博風(fēng)云

原創(chuàng)文章,作者:王琪,如若轉(zhuǎn)載,請注明出處:http://www.ibiyou.cn/blog/archives/8326

China-PRNewsire-300-300