西西河

主题:【原创】哎呀,妈呀,被举报了!(0) -- 奔波儿

共:💬36 🌺338 🌵1 新:
全看树展主题 · 分页 下页
家园 【原创】哎呀,妈呀,被举报了!(0)

终于收集齐了101个案例,先谢谢所有为该数据作出贡献的“举报”人、“违规”或者“未违规”者和监察,当然还少不了幕后大佬---“一直在改”,没有你们,这篇灌水文就是无源之水、无本之木。

作为一个公共论坛,西西河进入无政府状态有日子了,其后果有目共睹,这里也不需多言。

点看全图
外链图片需谨慎,可能会被源头改

所谓“大乱然后有大治”,看到满地的鸡毛,大家最终达成共识,自发重新启动了监察推选程序。效果很快就彰显出来,似乎还不错。至于说,能持续多久嘛?呵呵,谨慎不乐观。但不管怎么说,“一直在改”的这个“自组织”试验进行得还是很顺利的。

一个月下来,至今天为止(2018/05/16),一共出现了111个案例。因为轻信“一直在改”写的“以下为最近被处理的被举报帖(50个)”(实际,最多只会显示最近的30个帖子),漏记了前10个案例。不过,这也足够进行分析了,正好练习一下机器学习。

1.致被举报对象

关键词(Tags): #胡说九道通宝推:旧时月色,笑不拾,夜如何其,道可道,桥上,唐家山,决不倒戈,mezhan,三笑,史文恭,方恨少,青颍路,
家园 【原创】(1)致被举报对象

常言道:“人在江湖飘,早晚要挨刀”。只要你不是榆木嘎达,或者只会哼哈的将军,随便发个言,总会有人不爽,毕竟,林子大了,什么鸟都有。那种“誓死捍卫你说话的权利”的讨论氛围早已黄鹤一去不复返,会有回来的那一天吗?是不会呢,还是不会呢?继续谨慎不乐观。

当然,如果你是学泼妇骂街、或者一天到晚把生殖器挂在嘴边,被人举报,进入小黑屋,也算是种瓜得瓜,种豆得豆。好汉做事,好汉当嘛。关几天,出来,接着玩嘛。实在玩不起的话,那就“走好,不送!”。

被举报了,别怕,只要你不属于那些骂街的ID,建议还是相信监察和制度,毕竟,所有监察都是大家一票一票选出来的,这在一定程度上保证了那些立场偏激的ID不容易进入监察队伍;其次,六个监察中,只有一半以上的监察判你违规,才可能受罚。

“可能”,这个可能性有多高呢?对于受争议的帖子,被判“违规”的概率只有34%。。

如果,你坚信自己的帖子人蓄无害,和五毛、美分、左呀、右呀啥的都不搭界,那在被举报的时候,不但不应该发慌,反而应该高兴才对。这说明,你被人“恶意举报”了,被判“违规”的概率是很低的,而一旦最后结局是“不违规”,那你不但不会有任何损失,举报你的ID还会受罚,被扣除铢钱48枚。而判罚结果与最终结果不一致的监察,也会受罚,将被扣除铢钱6枚。不过,“一直在改”乱发货币,早就搞得通货膨胀。

另外,监察不可能同时给出判罚,毕竟人家都是有家小要养活的人,只能在工作生活之余,给大家做贡献。这就给大家一个小空子可以钻。每一个监察给出判罚后,你的信箱就会收到一个短信提示。如果你已经有三个监察判你“违规”,这个时候,你要不想受罚,就必须采取行动——修改一下你的帖子。当然,你会被扣去一点小小的铢钱。那反正也不是比特币,用不着心疼,和气生财嘛。

点看全图
外链图片需谨慎,可能会被源头改

就算最后被受罚,也不必学窦娥姐姐或者孟姜妹妹,搞得动静太大,会吓着花花草草的。所谓“红尘炼心”,蹲小黑屋也是一种修行,多少牛人大拿都是从小黑屋里走出来的。司马老师说过“盖西伯拘而演《周易》;仲尼厄而作《春秋》;屈原放逐,乃赋《离骚》;左丘失明,厥有《国语》;孙子膑脚,《兵法》修列;不韦迁蜀,世传《吕览》;韩非囚秦,《说难》、《孤愤》。《诗》三百篇,大氐贤圣发愤之所为作也。”

其实,受处罚帖子,绝大多数都没有被真正删除,只是大家想看的话,花上点银子罢了。如果你的宏文真的是惊天地泣鬼神,一定会有无数粉丝迷妹纷至沓来顶礼膜拜的,对你的敬仰之情将如滔滔江水绵绵不绝,又如那黄河泛滥一发而不可收拾的,至于那几铢钱,算个毛!(哇,我没有踏到某派的尾巴上吧?)

点看全图
外链图片需谨慎,可能会被源头改

最后,让俺们再次念诵一下伟大的“Littles三原则”

1. 西西河是铁手开的。

2. 违反河规是处分的结果而非原因。

3. 在河里混,需要正确而有技巧的立场。

(2)判罚结果之初步分析

通宝推:江南愿,故乡在喀什,wage,万年看客,桥上,mezhan,迷途笨狼,天河行,三笑,敬畏生命,青颍路,陈王奋起,
家园 【原创】(2)判罚结果之初步分析

当监察对帖子进行评判时,有5个选项,分别是'不违规', '难以判断', '违规', '短封', '加重封'。六个监察全部作出判罚以后,系统会生成最后的结果,也是这五种之一。其中,第一项自然是“不违规”,3至5项则属于“违规”,程度由轻到重。第二项呢,适用于难以做出判断的帖子,举报人和被举报对象均无损失,毕竟世上有很多事情,没有绝对的对或者错。俺家邻居的狗剩娃儿一天到晚非黑即白,他肯定没有见过既黑又白的滚滚殿下。

点看全图
外链图片需谨慎,可能会被源头改

先瞅瞅这101个案例的最终判罚结果之统计分布:

点看全图
外链图片需谨慎,可能会被源头改

“不违规”的帖子最多,有45个,占比44.6%;其次,是“短封”,有41个,占比40.6%;“违规”和“加重封”分别为5个和7个,“难以判断”则居于末席,仅有3个。当然,这只是最终的判罚结果而已。感觉上,“短封”的占比过高,在进行深入分析前,有些出乎意料。

再看看这一个月来,各项判罚的比例变化。

点看全图
外链图片需谨慎,可能会被源头改

可以明显看出,绝大部分时候,特别是中后期,“不违规”的判罚占大多数。前期阶段,被投诉帖子主要是一些不易引起争议的帖子(例如P大师的帖子),而随着时间推移,这类帖子虽然有,但容易引发争议的帖子逐渐成为主流。这说明,在众人特别是监察的努力下,论坛的状态逐渐趋于正常。

既然要做数据分析,就要先将已有信息数字化。可以将这5类判罚分别编号,即0(不违规), 1(难以判断), 2(违规), 3(短封), 4(加重封)。

虽然有6个监察,但系统判断最终结果是根据5类判罚的个数分布来作出判断的。

此处,输入的数据为X_i(i=0,1,2,3,4),每个X_i代表第i类判罚的个数,且sum{X_i}=6。假定系统的判断机制为G,则有G(X)=Y,Y为最终的判罚结果,一共有5种结局(即0~4)。请问,输入数据一共有多少种?

答案是210。不过,这只是理论答案,在实际操作中,我们只得到了60种输入数据。其中,出现次数最多的分布是40200,即6个监察输入的结果是4个不违规,2个违规;排第二的是30201,即3个不违规,2个违规,1个加重封。不过,这两种输入数据的输出结果均为0。

有没有6个监察完全一致的判罚?答案是有,虽然理论上应该有5种,但实际只出现了“60000”,“00600”和“00006”,分别各有一个案例。

“60000”说明众监察一致认为被投诉帖子是无辜的!可没法子,就算是人蓄无害的小白兔一样会被人惦记,这就是当前的环境。

“00006”则说明诸位监察均下了重手,一看受罚的帖子(点击者扣3铢钱),哦,原来是这位,拉出来,走几步。缺少铢钱的ID,如果大家遇到这类帖子,走过路过,不要错过,强烈建议“也举报”一把,包赚不赔,而且还为净化河道作出您的一份贡献。

(3)铁手在搞什么鬼?

通宝推:jellobean,故乡在喀什,万年看客,桥上,mezhan,青颍路,
家园 【原创】(3)铁手在搞什么鬼?

大家都知道,这个判罚系统是由“一直在改”弄出来的。刚出来的时候,估计用的是简单的线性加权公式,结果问题不少,比如:5个监察的判罚是“不违规”,1个监察则给出了“加重封”,最终结果成了“短封”,这明显是不合理的。记得当时,让大家很是抗议了一番。“一直在改”也虚心接受大家的意见,改动了一通,大家的牢骚渐渐也就少了。背后到底是个什么机制呢?

换言之,G(X)=Y所暗含的G到底是个啥东东?

既然已经知道了X,又知道了Y,就不怕这个G不出来。

先来个最简单的感知器(Perceptron),能出结果,但训练数据和测试数据都有错误,分别为1.25%和9.52%。

换一个,来个流行款的CNN(卷积神经网络),把“tensorflow”这把大牛刀也加上,效果不错,训练数据和测试数据均为100%的正确率。不过,没必要搞这么复杂,而且不好解释。

来个简单的,逻辑回归(Logistic Regression)和支持向量机(SVM),训练数据的误差很小,接近0,但测试数据的误差率还是不佳。看来单层分析的效果不怎么样。

还是用多层分析,比如决策树(Decison Tree),结果不错。无论是训练还是测试数据均达到0误差。上张图。

点看全图
外链图片需谨慎,可能会被源头改

从上面这张图可以看出,在6个监察给出判罚以后,如果“不违规”的次数>=3,则帖子“不违规”。看来这个规矩一直没改。

反之,如果“不违规“的次数<3,则很有可能被判违规,唯一可以逃出樊笼的机会就是”难以判断“,不过,希望比较渺茫。

不过,这张图也反映出铁手的这个判罚系统依旧存在不合理的地方,比如,被投诉贴有太多机会,落入”短封“的陷阱,这明显是不合理的。正常的情况下,应该是“违规”>“短封”>“加重封”。我一直怀疑,铁手在其判罚系统中设有一个调解阈值,乱世用重典,太平岁月,则宽大为怀。

(4)监察业绩之KPI

通宝推:jellobean,故乡在喀什,万年看客,桥上,mezhan,三笑,胡一刀,
家园 我肯定被你黑得最惨!
家园 老兄竟然还在

几年不怎么来了,惊见还有一些老朋友没走,甚慰。

家园 呵呵

一直都在。

家园 又申请做监察了,欢迎认证会员组团申请、投票!

趁着被黑之前搭便车做个小广告,打个时间差。

家园 【原创】(4)监察业绩之KPI

子曾经曰过“不在其位,不谋其政”。但不干活,并不代表不能批评指点一下干活的。君不见,最喜欢口沫横飞指手画脚的家伙们一个个大概也许可能不一定都是隆中卧龙、山中宰相,但可以肯定的是,弄个键盘政治局的常委当当应该不在话下的。

首先,咱们还是得拍一下监察的马屁。监察这活儿,干过的都知道,费力而不讨好,没有一派公心,是做不来的。记得最开始的一期,有十几个ID主动站出来为大家做事情,可几年下来,还有几人?个中原因,此处也不多言。反正,肯站出来的为大家做事情的,就是好样的,值得大大地表扬一番!如果有虚拟奖章啥的,建议一直在改可以发几个。

人生在世,上有父母,下有妻儿,先得忙完“柴米油盐酱醋茶”,才能折腾“琴棋书画诗酒花”。因此,监察们只可能也应该仅在自己的空余时间出来干活,真正的工作和生活永远是第一位的,这种虚拟世界的鸡毛蒜皮放上一放,天也不会塌下来。

先看看,监察们的工作量记录,如下图所示:

点看全图
外链图片需谨慎,可能会被源头改

横坐标为判罚帖子的编号,从1到101,纵坐标为九个监察的累计工作量。因为监察上任的时间略有不同,所以每个人开始干活的时间是不一样的,比如上任较早的,早早就脱离0状态,而履新较晚的,则要稍后才打破0判罚记录。此后呢,如果某位监察的曲线变成水平线,说明这段时间其人比较忙,无暇参与判罚。还有一种情况,比如俺曾经遇见过的,如果被投诉贴与自己存在关联性,为避嫌,就不去判罚,或者呢,剩下的都是无关痛痒的口水贴或者转载贴,置之不理也并非是坏事。

记得某监察曾经自鸣得意一把,居然号称要在一致率(Consistency Rate)上超越“一直在改”的91/109,胆子够肥的!虽然“一致率”没有任何实际意义,但看上一看,也无妨。见下图

点看全图
外链图片需谨慎,可能会被源头改

起初,被投诉帖子以骂人贴居多,判罚起来没啥异议,大家容易取得一致。但随着论坛的环境改善,被投诉帖子中容易引起争议的比例就上升了,比如P大师的这个帖子,其编码为30003,即3个监察认为“不违规”,3个监察主张“加重封”,严重的两极分裂。私下认为,所谓论坛,应该尽可能鼓励不同意见的存在才对,争议的存在才能体现论坛的价值。争议帖子越多,则论坛的环境越好,监察的一致率自然也就下降了。在理想环境下,如果没有污言秽语的腌臜贴或者被恶意举报的小白兔,监察的理论一致率应该是50%。希望,在大家的共同努力之下,这美好的一天能够早日到来。

(5)铁面杀手 vs. 老好人儿

通宝推:jellobean,故乡在喀什,三笑,青颍路,万年看客,桥上,川普,mezhan,
家园 身正不怕影子斜!我要看血淋淋的真相!

呱呱!

天大地大!

冬瓜,西瓜和傻瓜!

喵--啊!

-----

我喜欢看动画片。

家园 支持一下这个不一致率

我也曾提到过一次这个一致率的不以为然。越是有争议,说明坛子越热闹,话题越吸引人,甚至到因为观点的冲突而被举报就到了最高境界了,前提是作者还没有口出不逊,因为脏话口水而呛起来。

据此就要建议一下前贴(3)奔波儿关于那个判罚函数的了,当督察出现两极分裂时,应该直接取不违规作为结论。因为这样的不一致判罚是个强烈信号说明话题不是因为违规而被举报,肯定是因为争议太强导致。当然“一直在改”可以自己当最后把关。

另外,这个一致性的图看不懂。

通宝推:海上金流彩云乱,
家园 【原创】(5)铁面杀手 vs. 老好人儿

一样的文字,不同的人解读,感受会截然相反。比如,那堂上挂的是张旭写的条幅,在有的人看来,那是价值连城的无价之宝;可是,如果落到花差花差小宝的眼里,不过是鬼画桃符,当个擦屁股纸都嫌硌得慌。

同样,在进行判罚的时候,特别是针对内容有争议的帖子时,每个监察因为思想立场以及所处环境的差异,自然会产生不同的观点,而每个人的执法尺度也是不一样的,或者宽松如海,或者严苛如刀。奔波儿发的鸡汤文曾经曰过“世界之所以美丽,就在于千差万别”,非黑即白的世界是恐怖的。可是呢?学过信号分析的一定会杠一下——“白噪声可是囊括了所有的频率,白色也是赤橙黄绿蓝靛紫的大合集”。(没人当你是哑巴!!!关门,放狗!!!)

点看全图
外链图片需谨慎,可能会被源头改

那么,九位监察之中,谁是“铁面杀手”?WHO是“老好人儿”呢?参见下图:

点看全图
外链图片需谨慎,可能会被源头改

(不好意思,为了维护安定团结的大好局面,我把九位监察的ID列了个表,然后随机打乱先后次序,编了个字母编号。当然,这个秘密也不是不可以猜出来的,有362,880种组合方式。)

0,1,2,3,4分别代表'不违规', '难以判断', '违规', '短封', '加重封'。这九张图是每个监察给出的判罚分布图。

从总体上而言,大部分监察还是比较宽松的,特别是A、I两位监察。D监察呢,“违规”的判罚给得比较多一点点。但H监察则是带着杀气,九成以上是“违规”(打倒!!!!)。B监察则是雨露均沾,0~4,均有顾及。这里,有一个因素没有考虑,就是监察对某些帖子的偏好,比如某位监察偏好判罚骂人贴,且对那些累教不改的泼皮牛二一律痛下杀手,对别的帖子就睁一眼闭一眼。其实,这也没啥不好的。“水至清则无鱼”,当然,这是在清除腌臜泼才的前提下。

那么,监察之间有没有拉帮结派呢?最简单的方法,就是将九个监察对历次投诉的判罚结果(如果未参与,则该次判罚为-1)列成一个101X9的矩阵,然后做相关性分析就可以了。如果某两位的相关系数接近1.0,则两人有结党营私的嫌疑;如果是接近-1.0,则两人是不世出的仇敌。结果何如呢?参见下图:

点看全图
外链图片需谨慎,可能会被源头改

监察间的相关系数最大值为0.46,最小值为-0.40,在正负0.5之间,且绝大多数都是在0.0上下分布。这个结果说明,监察之间不存在相互勾结的情况,总体而言,针对被投诉贴,他们的观点是有差异的,所以我们才有这张彩色的马赛克图可以看。相关度最高的监察是B和G,0.46的相关系数远小于1.0,更何况,他们的判罚分布图也没有任何相似之处。

有鉴于此,可以得到一个结论:大家选出的监察是值得信赖的。再次,感谢他们的辛勤工作!其次,也希望有更多的认证会员能够参与到监察队伍中,自己去亲身感受一下其中的酸甜苦辣。

(6)盛夏时节,兔鼠出没

通宝推:江南愿,木木3,jdrlgd,决不倒戈,万年看客,西电鲁丁,疯雨后,笑不拾,wage,陈王奋起,桥上,川普,三笑,盲人摸象,mezhan,
家园 看来大家都不愿承认自己“难以判断”

所以把机会留给其他监察,结果有被举报的老挂那

这也是一种老好人呀

家园 有的时候是有人不喜欢罚自己喜欢的人的违规帖。

所以连简单明了的是否全文文摘,都不判。

结果,每次想去判罚,还要翻好几页才能看到没提交过意见的。

家园 一直在改还没修改这个?很久前我就建议只给监察看他没判的帖

判过没判过也没标记区分一下,全靠监察自己记

显示已经判过的贴有啥用呢,也没机会改判

全看树展主题 · 分页 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河