西西河

主题:【原创】横看成岭侧成峰 -- 今昔

共:💬18 🌺19 新:
全看树展主题 · 分页 下页
家园 【原创】横看成岭侧成峰

老规矩,挂羊头卖狗肉

基于模糊逻辑的论坛禁言管理系统

随着论坛注册人员的增加,在论坛管理这个问题上,特别是对于禁止发言的处理,存在着一些需要改进和规范的方面。例如,不同管理成员对于相同现象的处理尺度不一,处罚程度的掌握因人而易;对于处罚操作缺乏直观的,定量的数据支持;一些时候存在漏判的问题等等。这些问题,对于保护遵守论坛规定用户的权利,有着一些负面的影响。同时助长了某些用户无视现有论坛规定的行为。

以上现象,部分原因在于,论坛管理人员执行禁言操作的依据是用户的发言,然而由于自然语言的模糊性,很难运用二元逻辑进行量化:即对于大部分的问题贴,很难以是否违反规定判断来进行判断。而且在很多情况下,一些帖子是处于违规与没有违规之间的灰色地带。这就必然造成了,对于不同的管理人员,对于相同的帖子是否违反规定的判定不同的现象。

此外,由于论坛的用户处于各个国家,论坛是一个24小时的活动场所,然而管理人员的时间有限,因此对于某一用户的累计违反规定的言论,很难做到一个定量的统计。所以在处理的尺度上,很难保持一个统一的尺度。并且对于禁言的上诉,和其他用户的质询,缺乏相应数据的支持。这也在某种程度上,打击了管理人员执行论坛管理操作的积极性。

论坛的管理系统,本质上是一个非线形的控制系统,很难建立相应的数学模型。因此,本文试图运用模糊控制的原理,建立一套适合的禁言管理系统。以帮助论坛的管理人员减轻工作量,创造一个良好的工作环境。同时为铁手以及其他论坛用户建立一个简单直观的统计系统。

一、背景知识介绍

模糊逻辑是1965年美国工程师扎得(Lotfi Zadeh),在其改进计算机程序的“模糊集合理论”中提出的一个概念。

1.1 模糊逻辑简介

1.1.1 经典二值逻辑:

在经典二值(布尔)逻辑体系中:所有的分类都被假定为有明确的边界;任一被讨论的对象:要么属于这一类,要么不属于这一类;一个命题不是真即是伪,不存在亦真亦伪或非真非伪的情况。

经典(二值)逻辑的数学基础:通过常规集合来工作的。

-----常规集合:集合中的对象关系被严格划分为0或1,不存在介于两者之间的对象。(1---完全属于这个集合;0---完全不属于这个集合)

对应于“论坛的帖子是否违反规定”这个命题,结论就是非真即伪,不存在打擦边球的情况-而这恰恰是大多数违反论坛规定帖子的现状。

1.1.2.模糊逻辑:

它是对经典二值逻辑的补充。对二值逻辑的扩充。关键的概念是: 渐变的隶属关系。一个集合可以有部分属于它的元素;(渐变)。被讨论的对象可不同程度的属于某一类的;一个命题可能亦此亦彼,存在着部分真、部分伪。在模糊逻辑中,利用隶属度来描述对象属于某一类的程度。

模糊逻辑的数学基础:通过模糊集合来工作的。

-----模糊集合:允许在一个集合部分隶属。对象在模糊集合中的隶属度:可为从0-1之间的任何值。即可以从“不隶属”到“隶属”逐步过渡。

对应于论坛的帖子是否违反规定这个命题,结论可以是违反规定的程度如何,可以给出一个违反规定程度的定量分析。

模糊逻辑是通过模仿人的思维方式来表示和分析不确定、不精确信息的方法和工具。是一种精确解决不确定、不精确信息的方法。模糊逻辑本身并不模糊。模糊逻辑并不是“模糊的”逻辑,而是用来对“模糊”进行处理,从而达到消除“模糊”的逻辑。

1.2.模糊逻辑与专家系统

专家系统是一种信息系统。专家系统中的知识库中的知识由专家提供。其中罗列了大量的规则和事实。专家系统可分为:传统专家系统;模糊专家系统。

1.2.1.传统专家系统:

*如果前提是真,则规则被激活;

*规则要么被激活,要么不被激活;

*对一组输入仅有一个规则被激活,且这个规则将完全控制该专家系统的输出。

1.2.2.模糊专家系统:

*如果前提是非零值,即某种程度的真,则规则即被激活;

*规则可以不同程度地被激活;

*通常对于给出的一组输入,可有不止一个规则被激活。其专家系统的输出可能是几条规则结果的合成。

1.3.模糊逻辑控制系统的构成

在模糊逻辑控制中,工作过程分为三个阶段:

---->“模糊化”---->“模糊逻辑推理”---->“解模糊化”

1.3.1.“模糊化”:

输入/输出变量按各自的分类被安排成不同的隶属度。如温度输入,根据其高低被安排成冷、凉、暖、热等。

1.3.2.“模糊逻辑推理”:

输入变量被加到一个“if-then”的控制规则的集合中。按各种控制规则进行推理,将结果合成在一起,产生一个“模糊逻辑推理输出”集合。

1.3.3.“解模糊化”(解模糊判决):

对模糊逻辑推理输出进行解模糊判决。即在一个输出范围内,找到一个被认为最具有代表性的、可直接驱动控制装置的确定的输出控制值。

1.4、模糊逻辑技术的优越性

1.简化设计

2.提高性能

3.加快开发周期

4.减少编码,降低成本

5.提高系统可靠性


本帖一共被 1 帖 引用 (帖内工具实现)
家园 【续】只缘身在此山中

二 论坛禁言管理系统的初步设计

这里,依据模糊逻辑控制中,工作过程的不同阶段,系统由三个主要部分构成:

2.1.“模糊化”:

作为 禁止发言 的依据,这里主要依据相应ID在某一时间段内违反规定帖子的数量和程度。

这里假设决策的时间依据为三天。在实际操作中,可以选择一天,三天,一周,或者一个月。

出现频率设定为五级,列表如下:

出现频率 次数

很断续(VD) 1

断续(D) 2

中(M) 3

频繁(C) 4-5

很频繁(VC) >5

关于统计次数的问题,如果考虑马甲作乱的问题,可以设计为:对于来自同一IP的违规贴,视为同一用户ID进行统计,其处理结果对该IP的所有违规贴的马甲生效。

对于违反规定程度的界定,这里也分为五级:

情节 描述

轻(L) 暂缺

中轻(ML) 暂缺

中(M) 暂缺

中重(MH) 暂缺

重(H) 暂缺

由于大家的标准各不相同,因此这里对于情节的界定,还需要管理成员讨论出一个可以取得共识的标准出来,这里暂缺。

由于在进行模糊逻辑推理的时候,对与违反规定的程度需要一个唯一的输入,然而如果在某一时间段内,某一个用户有不止一个违规帖被记录,有很多方法计算这些违规帖的总的违规程度。这里只介绍三种比较简单的方法供选择:

例1:某用户在三天内有3次违规帖被记录,分别为轻(L),中轻(ML)中重(MH),对于出现频率来说为中(M),而违规程度可以采取以下方法进行判定:

1. 取最大值,结论为中重(MH)

2. 取平均值,每个违规帖的取值如下

情节 中心值 范围

轻(L) 0.1 [ 0 — 0.2 [

中轻(ML) 0.3 [ 0.2 — 0.

中(M) 0.5 [ 0.4 — 0.

中重(MH) 0.7 [ 0.6 — 0.8 [

重(H) 0.9 [ 0.8 — 1]

结果 = ( 轻(L) + 中轻(ML)+ 中重(MH) ) / 3

= ( 0.1 + 0.3 + 0.7 )/ 3

= 0.367

查表后,0.2 <= 0.367 < 0.4,结论为中轻(ML)。

3. 取最大值和平均值的加权平均,这里假设权值分别为0.5, 0.5

结果 = 0.5 * 中重(MH) + 0.5 * ( 轻(L) + 中轻(ML)+ 中重(MH) ) / 3

= 0.5 * 0.7 + 0.5 * 0.367

= 0.5335

查表后,0.4 <= 0.5335 < 0.6,结论为中(M)。

设计到具体的程序实现,这里提出一个可供选择的方案供铁手参考:

对于每一个帖子,对于有管理权限的用户,在工具栏中增加一个 评价 的选项。如果点击的话,将弹出一个管理窗口如下。

1.界定: 提供不同的原因供选择 ( 暂缺 )

2.情节: 轻(L) 中轻(ML) 中(M) 中重(MH) 重(H)

3:摘录: 提供一个空白窗口,由管理人员拷贝相应的违规的言论作为保存。

如果有不止一位管理人员评价了同一个帖子,有两种方案可供选择:

1. 当有已经有管理人员对某个帖子进行评价以后,该帖被设为不可评价。只记录第一个评价。

2. 而参照上面例1介绍的方法,产生一个计算结果。

2.2.“模糊逻辑推理”:

输入变量被加到一个“if 现象 and 出现次数 then 处理方式”的控制规则的集合中。按各种控制规则进行推理,将结果合成在一起,产生一个“模糊逻辑推理输出”集合。

这里假设处理方式分为7级, 分别为 很轻(VL)轻(L)中轻(ML)中(M)中重(MH)重(H)很重(VH)。

由于现象和出现次数各有五级,因此不同的组合方式共有25种,对应不同的组合,可以提供不同的处理建议。这里示例如下,以供参考:

现象 出现次数 处理方式

轻(L) 很间断(VD) 很轻(VL)

轻(L) 间断(D) 很轻(VL)

轻(L) 中(M) 很轻(VL)

轻(L) 频繁(C) 轻(L)

轻(L) 很频繁(VC) 中轻(ML)

中轻(ML) 很间断(VD) 很轻(VL)

中轻(ML) 间断(D) 很轻(VL)

中轻(ML) 中(M) 轻(L)

中轻(ML) 频繁(C) 中轻(ML)

中轻(ML) 很频繁(VC) 中(M)

中(M) 很间断(VD) 很轻(VL)

中(M) 间断(D) 中轻(ML)

中(M) 中(M) 中轻(ML)

中(M) 频繁(C) 中(M)

中(M) 很频繁(VC) 中重(MH)

中重(MH) 很间断(VD) 中轻(ML)

中重(MH) 间断(D) 中(M)

中重(MH) 中(M) 中重(MH)

中重(MH) 频繁(C) 重(H)

中重(MH) 很频繁(VC) 很重(VH)

重(H) 很间断(VD) 中(M)

重(H) 间断(D) 中重(MH)

重(H) 中(M) 重(H)

重(H) 频繁(C) 很重(VH)

重(H) 很频繁(VC) 很重(VH)

2.3.“解模糊化”(解模糊判决):

对模糊逻辑推理输出进行解模糊判决。即在一个输出范围内,找到一个被认为最具有代表性的、可直接驱动控制装置的确定的输出控制值。

这里示例如下以供参考:

结论 处理方式

很轻(VL) 短消息提示

轻(L) 禁言24小时

中轻(ML) 禁言48小时

中(M) 禁言72小时

中重(MH) 禁言96小时

重(H) 禁言120小时

很重(VH) 永久封

对于短消息提示,考虑到一些用户可能会予以忽略,可以做如下处理:

由系统在发出短消息提示以后,自动锁定该用户的发言权。如果该用户希望解除锁定,必须点击随短消息提示发送的连接,以解除发言权的锁定。

这里提供一个示例供大家参考:

尊敬的西西河网友:

您好!

在 某月某日 至 某月某日 期间,您的以下发言被认为与西西河现有规定不符:

帖子题目一 (附超连接)

帖子题目一 (附超连接)

因此您的发言权已被暂时终止,请点击 这里 以重新激活您的发言权。

良好的论坛环境,需要你我大家的共同努力。

感谢您对我们工作的理解和支持,也祝您在西西河过的愉快。

此致

敬礼

西西河系统

(注:此邮件由系统自动发送,请不要回复此邮件。如有疑问,请前往公告建议版面提出您的意见和建议。谢谢!)

以上方法,也可以运用于禁言的处理操作。即禁言时间由用户点击随短消息提示发送的确认连接开始计算。

示例:

尊敬的西西河网友:

您好!

在 某月某日 至 某月某日 期间,您的以下发言被认为与西西河现有规定不符:

帖子题目一 (附超连接)

帖子题目一 (附超连接)

因此您的发言权已被暂时终止XX小时,请点击 这里 以启动恢复您发言权的倒计时。

良好的论坛环境,需要你我大家的共同努力。

感谢您对我们工作的理解和支持,也祝您在西西河过的愉快。

此致

敬礼

西西河系统

(注:此邮件由系统自动发送,请不要回复此邮件。如有疑问,请前往公告建议版面提出您的意见和建议。谢谢!)

至于永久封的决定,将先执行禁言120小时,同时短消息提示铁手,由铁手考察后,进行手工操作。

2.4. 规则的细调:

考虑对重复违规现象应该加重处罚的原则,可以增加一个附加部分予以实现。根据历史记录,可以适当的调整处理方式。例如,如某一用户在三个月内已经被禁言一次,则再次处罚时,处理方式调高一档进行处理。如某一用户注册时间超过6个月,而从来没有违规,则首次违规时降低一档进行处理。

至于如何增加这些补充方式,就要看铁手的想法了。然而具体到实现上来说,由于系统构建的模块化,相对还是比较容易的。

对于每一个处罚的决定,将由系统自动产生。由系统发送短消息给被禁言的用户,并提供相应违规贴的连接作为禁言的依据。

同时在论坛首页的被短封者版面内,张贴被短封的用户名,短封时间,违规贴的汇总和连接,以回应其他用户的查询和质疑。

三 结论

以上介绍了模糊逻辑的基本知识,以及一个基于模糊逻辑的论坛禁言管理系统的基本组成部分。

相对于现有的执行流程,该系统具有以下优点:充分考虑的自然语言的模糊性,可以采用定量的方法分析违规的言论;处理结论由系统执行,有效的避免的管理人员与被处理用户之间的矛盾;对于违规用户的处理,基于统计结果,并且提供相应的帖子连接,有效的避免了某些用户利用管理人员的遗忘而钻空子的行为,使得处理的过程更加科学和有序。

该系统可以部分替代当前的举报系统,同时也可以结合青史版面正在试行的青司马制度,以完善论坛的禁言管理制度。

不过同时我们还是应该注意到,一个有序的论坛讨论秩序,最终还是需要依靠管理人员的工作。然而一套科学的管理系统和流程,可以大大减轻管理人员的工作量与无谓的重复劳动。而这,也正是当今信息科学进步的目标所在。

文章仓促而成,多有不足,欢迎大家批评指正。

家园 顶一下

好像老票提过一个类似的自动(封ID)程序。

其实我还是比较相信人的操作,虽然是搞电脑的,但觉得电脑很多复杂情况下无法做出合适的判断。

最好是让电脑提供资料--比如某ID(一定时期内)的被砸蛋数,被删贴和被短封次数的统计--显示在管理版内,再由管理人员做出操作。

我觉着西西河的处理还是应该从宽,宁可放过,不要冤枉。对短封要慎重,对永久封更是应该慎之又慎。

另外,借这个地方向今昔道个谦。希望你看了短信,能原谅我这个“狗咬吕洞宾”的地主

家园 顶一个

好建议,俺选修的模糊数学都还给老师了。

家园 花顶一个

首先,非常赞成科学化思路的论坛管理,可以最大限度的避免人为管理的感性弱点;

其次,实现过程里可能会有一些操作上的问题,比如模糊化控制里面阶段性的区分度问题,可能还是要依赖人为判断,这个需要注意;

第三...我承认我没全看懂(没有学过模糊数学,我是文科差等生..),汗死! 如果马鹿说她看懂了我就更汗了...唉。

第四,还是支持此类行为,花今昔老兄一个,辛苦了!

家园 【文摘】啊呸, 偶学过模糊数学
家园 花2, 偶不看理论, 直接看操作流程
家园 理论跟上了,呵呵……好象少两段?缺#2、#3……

家园 完了,我成了最笨的了,55555555
家园 好象没少,不过编号有点乱

家园 我是说,苏老先生写了四句,您也得四段儿啊!

家园 汗,幸亏不是&quot;君不见黄河之水天上来&quot;

恭喜:意外获得【西西河通宝】一枚

家园 这个我要花点时间学习。
家园 类似 WIKI 机器人的东东?
家园 机器人,六条腿的,俺们这嘎瘩有人在搞

WIKI的,没研究过

全看树展主题 · 分页 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河