主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol

大河奔流 导读 复 116 阅 123012

全看 分页 树展 一览 主题

2011-09-20 18:05:38
3568193 复 3568015
Adol
Adol`23680`/bbsIMG/face/0000.gif`70`2492`3304`33832`从三品:银青光禄大夫|云麾将军`2008-04-05 20:52:28`
从我自己的数据里,这个还没法做到 5

对于楼层,我没有收集944名用户以外的信息,对于收藏数量,可能也需要实际访问帖子才能看到。这样在时间上会很长,而且相当于爬下来了所有的帖子内容,不仅对服务器的负担比较大,而且采集行为本身也比只收集帖子的非内容数据(帖号、发帖时间等)更敏感。

或许可以考虑先在花的基础上进行一下筛选,挑选得花比较多的帖子来进一步分析收藏量、宝推量等内容。

另一个问题就是,收藏和宝推的分析,可能一主题为单位比较好


2011-09-20 18:05:38

全看 分页 树展 一览 主题