西西河

主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol

共:💬117 🌺1730 新:
全看分页树展 · 主题 跟帖
家园 从我自己的数据里,这个还没法做到

对于楼层,我没有收集944名用户以外的信息,对于收藏数量,可能也需要实际访问帖子才能看到。这样在时间上会很长,而且相当于爬下来了所有的帖子内容,不仅对服务器的负担比较大,而且采集行为本身也比只收集帖子的非内容数据(帖号、发帖时间等)更敏感。

或许可以考虑先在花的基础上进行一下筛选,挑选得花比较多的帖子来进一步分析收藏量、宝推量等内容。

另一个问题就是,收藏和宝推的分析,可能一主题为单位比较好

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河