西西河

主题:【原创】遗憾的是,封IP并不可行,而通过浏览器也没法分辩马甲 -- 铁手

共:💬26 🌺362 新:
分页树展主题 · 全看 下页
  • 家园 【原创】遗憾的是,封IP并不可行,而通过浏览器也没法分辩马甲

    最近看到两个用户的发言,很明显的人工智能八股文体,有河友建议封IP,但是遗憾的是,封IP并不是现实可行的方案。

    我不是专家,只是因为网站的功能考虑,故曾经作过一些调研,以下内容欢迎批评指正。

    有很多情况下,需要知道访问用户的唯一性,比如一个人登录访问,和不登录访问,用不同浏览器访问,等等,都应该算作是一个人,而不能因为访问方式的不同而被当作是不同的人。这种区别能力对网络广告很重要,一方面可以让广告保持一致性,另外一方面做广告的希望对一个用户支付一个费用,而不是对一个用户因为访问方式当作不同的人而支付多个费用。

    网站试图通过用户访问信息来判断两个访问者之间是否有重叠,目前来看主要是通过两个方式。一个是用户的IP地址。另外一个则是网站通过放置并维护在用户设备上的跟踪信息。

    IP地址相当于访问者的定位信息,但是相同的IP不代表相同的用户,不同的IP也不代表就一定是不同的用户。

    多数情况下,访问者的IP地址是由互联网接入商动态分配的。IP地址的资源有限,但是访问用户数量可能超过这个有效资源,好在有相当一部分用户只是偶尔使用,那么在他们不用的时候,他们所分配到的IP地址就可能分配给别的人。

    也有人使用代理访问,那么就有很多人使用相同的代理IP。

    也有可能比如为保证网络访问的隐私,会使用 Tor ,于是每次都可能不同的IP。

    以上因素,导致同一个用户大概率不会有固定的IP地址,也就不可能通过屏蔽IP来屏蔽一个用户及其相关的马甲。

    另外一种考虑,则是在访问者的设备中存放某种标记信息,在每次访问时获取这个信息,然后通过这个信息来就可以确认访问者的唯一性。

    这通常是通过 cookie 来实现。在这种情况下,同一个浏览器的访问,无论IP怎么变化,无论是否使用代理,Tor,标记信息不会变。

    问题在于,访问用户可以删除或修改这个标记信息,也就导致这个信息未毕可靠。

    真正可能鉴别不同用户是否来自同一个设备,恐怕只能在APP中获得网卡 MAC 地址实现。这个地址是唯一的,作假伪造的可能性比较小。

    通宝推:一双草鞋,凤城,桥上,绿色蔬菜我的爱,梓童,翼德,方平,

    本帖一共被 1 帖 引用 (帖内工具实现)
    • 家园 新兵营

      记得以前好像有新兵营机制,限制了新注册ID随便回帖,只有发过一定主贴才能获得回帖资格,感觉是个极好的机制,当时西河的内容质量极高。

    • 家园 路由器和一些vpn软件都能伪装mac

      方平网友说得很精辟,不宜【单纯凭借技术路线,来解决管理问题】。

      雪夜灯光网友的白名单也是个好主意。

      • 家园 任何事都是相对而言

        绝对意义上的有与没,不可能没有成本因素。 方平用NSA与国安做例子,不是很恰当,因为西西河除了很多副国级😂之外,从哪里角度说都没有值得任何势力下大本钱的动机。但不代表数据收集不存在,也不是西西河管理范围内的事。技术上的后门是多层次多维度的,除非是脸书或微博那样的级别,一般小网站自己能掌控的部分是很有限的。

        所以方平说的大家是个透明人是有一个级别前提的,否则大数据都是噪音,但某些言论会提高级别,成本保证下当然查下去不是难事,同时还要考虑是机构对机构,还是机构对个人,回报在哪里。一般这种事的例子就是那个车辆防盗的道理,比如每辆车都停在路边,如果你的车上有警报,偷车贼从成本效率角度考虑,会去对没有警报的车子下手而不碰你的车。但如果你的车是法拉利,可以在黑市卖高价,偷车集团有计划针对性下手,装多少警报也是没用。

        所以你是不是一台法拉利的决定权在于你在网上说了什么,这些肯定是被收集的,不用怀疑。 但说的会不会引起针对性的关注,才是决定你是不是法拉利的因素。所以万事最后都是个绩效比KPI,技术手段在这个年代已经不是瓶颈了,资源才是。

        回到西西河上,如方平说的,西西河的这些言论是个什么级别呢。我们一般人除非是处于那个位置上的,不容易做出公平判读,也不了解这个尺度在不同时期与大环境下的松紧程度,资源的倾斜程度,也就决定了对法拉利定义的下限。是草木皆兵,还是宽松无所顾忌,很大程度上是西西河大多数人靠看帖发帖,与观察河里反应方向来判断并不断矫正的。

        绝大多数人应该是不去触及各种底线的,但这个底线是会随着时间随着大环境不断变迁的,今天的敌人明天就可能是老朋友,今天的大V明天就可能会被围殴,这些都是这些“底线”的动态划分在河里的反映。马甲也好,言语冲突也好,从这个意义上说都是某种戏,类似达雅有次说过的,这些过激的行为的作用是划定了西西河在一定时间段内的底线区间,做为一个动态的发帖指南存在吧。

        至于是否西西河里的风向就代表了国内还是海外的舆情,甚至有带路作用,这个恐怕就言过其实了。很久以前也许是有过的,不过随着很多舆论领袖们的退出,西西河已经很久“不做大哥了”😂,至少这几年仅仅是个小众怀旧的存在,更多的是对国内媒体的简单回声,偶尔寥寥无几的海华会顶着钢盔参与一下,但多数基本是国内微博微信的主流声音,从广度到深度上都与早年的西西河不可同日而语了。即使这样,我们这个楼仍然还在探讨的是如何封堵😁,其实今天一些所谓的“不当言论”最多就是个别ID的个人素养格局甚至性格局限的成分,既上不了纲又上不了线,下着大棋打着嘴仗,从哪个视角看都入不了大数据的法眼,当不了法拉利😂。

        所以总结的话,西西河治理的重点不在于保护大家不被中美喝茶这种个人问题,说了过头的话需要担心的也不是被相关部门查的担心,而在于保护西西河不被墙的这个底线。而真正的困难在于这个底线的含糊不清与动态剧变,同时新来的人不理解这个道理而不明就里的一些跨线行为,然后因为无法判明对方动机,而引起的其他个体保卫西西河的过激反应。所谓的“说的不能做,做的不能说”这样的一个经典困局,甚至很久以来大家都习惯这个局面而没有去思考很多次的网站改革的目的与问题真正来源在哪里。

        比如很久以前的实践有效的新兵营设计,其实是不错的解决了这个问题的。说白了,没读过一年以上帖子的新来ID,多数恐怕都不理解河里许多ID互动的真实含义,为什么一个貌似平和的发言会引来问候家人,相反一个貌似突兀的发言会引来花草无数,一个深受国内环境逻辑影响却没有明确画出条条框框的网站,必然会引起各种误会,猜忌与奇怪反应,陷于混乱也就正常了,你好我好大家好也就仅仅成为一句口号。

        当然我不是建议重造新兵营,甚至增加认证的意思。相反,与其躲避难题不如直面问题,既然无法静态的规定条条框框,不如就以微博微信的框框为指南,比如放开转贴,围绕着国内的舆论热点走,这样可以直接减少各种跨线的焦虑,同时评论区也需要管理,不能出现“亮点在评论区”现象,跨线言论不需要问候家人,直接删帖没商量。降低工作量的话,增加一部分久经考验ID的权限,看到不妥的就删帖,不需要经过花草或举报过程,删帖意向够了数就自动消失,不需要理由,比如三个高级ID决定删帖,就删了。

        删帖比待认可的优点在于,减少发帖焦虑,包括待认可接受广大投花认可的流程的时耗,对于有时效的新闻比如最近的以巴事件,今天的新闻转天发出来经常时过境迁了,我好几次想横跳都赶不上趟😂。另外,待认可经过很多人阅读,影响已经产生,发不出来也等于发出来了。 唯一区别是发出来的帖子放在那里成了一个历史记录,而且一段时间后政治气候变迁,不合适公开广为传阅的,再去删还麻烦。不如废弃认可,发出来后反应不好,随时想删就几个有权限的就直接删了,省的给西西河留后患。

        想到哪里就说到哪里,保护这个网站环境是大多数人的愿望,不应该是铁手一个人在战斗😂,集思广益吧。

        通宝推:一双草鞋,
    • 家园 多限制一下发帖数量怎么样?

      我就讨厌某些发帖多的,其实全都是一个意思,巧言令色者鲜仁矣。

    • 家园 请教怎么用远程检验真实 MAC 地址?

      真正可能鉴别不同用户是否来自同一个设备,恐怕只能在APP中获得网卡 MAC 地址实现。这个地址是唯一的,作假伪造的可能性比较小。

      楼下方平说的改动 MAC 是通过用户界面。实际上不论 苹果,Windows 还是 Linux 都可以随便改。

      我好奇的是你怎么在服务器端口得到用户的 MAC 地址。MAC 是二级地址,一般只存在于 TCP 层面。而且一般不会被放到 HTTP Request 里面去。用户和服务器之间隔着不知道多少节点。服务器最多只能拿到末端节点的 MAC,初始端的 MAC 一般都在网关的后面。难道现在的浏览器都送 MAC 了吗?

      • 家园 我前帖中说的是『APP』,浏览器目前没有可能性

        或者说,目前,通过浏览器,无论使用什么样的技巧,充其量只能达到一定百分比的可确定性,但那是大公司如GOOGLE之类才能有力量干的事情。

        通过APP,则有可能获得所使用设备(手机、平板)的唯一确定信息,以前有MAC,也有IMEI。IMEI可以唯一确定手机,但现在看来操作系统也都不直接提供了。虽然如此,操作系统还是可以提供可以唯一确认的信息,比如通过如上信息做个转换,可以唯一但不暴露原始信息。

        从理论上讲,如果APP程序里可以获得这个信息,那么浏览器本身也应该可以获得这个“唯一”信息,只是可能因为隐私的关系所以不提供,也有可能有安全考虑,比如万一伪造信息送给服务器呢。自己的APP没有必要自己骗自己。

      • 家园 自己的app就可以不用http
    • 家园 还是以为3年前的版本最好

      爱咋咋地

    • 家园 这个问题确实难处理

      这几天看美国抖主“大头鹰”的直播切片,那里出现与他对线的各色人等真是让人大开眼界,彻底刷新了我的认知--原来社会上还有这样的人?然而仔细观察后,从他们的具体表现来看确实有一部分人在故意胡搅蛮缠,而另外一些人真的是认知水平低。

      河里也有同样的情况,对于这些负能量确实没有什么好办法。好在从目前来看,至少整体形势还是可控状态,还是有些河友愿意站出来和负能量斗争的。虽然大部分人不愿意出面与这些负面因素作斗争,但是毕竟大家心里还是有数的。

      试图通过技术手段解决这个问题难度相当大,即使花费极大的时间和精力,收效却非常少。我同意方平网友的建议,这里其实是你本人所有的网站,平时可以顺其自然,关键时刻可以主动杀伐,乾纲独断。

    • 家园 我总是能给你出个能实操的主意。

      反过来想:干嘛盯着马甲,水军,AI呢?

      咱们搞一个“非马甲,非水军,非AI”的正常ID认证,不就得了。

      利用数据库里面,屏蔽和驱订的数据,可以直接统计出来。

      得罪人的事,干起来容易逼人跳墙。

      咱们干奉承人的事:

      尊敬的“方平”:

      经过认证,您被认定为:“非马甲,非水军,非AI‘的正常河友。

      你发帖不再需要认可。

      违规必究!

      处罚包括禁言和终止”正常河友“的待遇。

      通宝推:广宽,独立寒秋HK,strain2,方恨少,翼德,绿色蔬菜我的爱,毛毛球,外俗内正,孟词宗,雨楼,jent,凤城,方平,
      • 家园 以前的西西河就是这样啊

        改了一圈回到起始而已,主打仍然是一个认证。 小团体当然问题会少,但水至清则无鱼才是一直在改试图摆脱的困境吧,否则不要太简单。

        许多有类似困境的网站一开始往往会走这个“熟人圈子”的路线,类似认证,一个拉一个的建设社区,符合六度空间原理,也符合东方社会的熟人引荐的传统,其实西方高层也是这个玩法。总之,只要不介意人数多寡,引荐制有其优越性。

        问题往往发生在从小团体走向大社会这个阶段,一做大这个制度就无法实践,因为效率太低,人之间的trust是个时间函数,快速增发显然是无法使用这个办法的。铁手的努力很大程度是这个矛盾,一个天然土壤只适合小团体的社区,如何可以同时扩大范围与降低门槛得以成长为一个大型社区,像天涯像红迪像脸书,估计也是所有做论坛的梦想。

        西西河的一个历史传统是斗争性很强,这里的原因终归离不开一个国内环境面对海外环境的现实,也就是说与中国对外的现状有着很大关系,但因为社会制度的不同,信仰体系的不同,类似绿教,始终存在着一个内部环境面对外部环境的冲突为主的内在因素,这是斗争性的原始来源。因此也决定了西西河无法也没有技术手段可以完美解决成为类似天涯或红迪那样在一个单一环境下的操作逻辑。

        但不是说西西河就没有办法独创出一条自己的路,这恐怕也是铁手作为一个技术宅一直没有放弃的原因。毕竟运作良好的话,好处也是很明显的,可以成为中外的一个良性循环,在中外沟通上带来更多正能量。 但这需要更大的格局,更大的视野,不能局限在把网站设计成针对个人境遇不同的原因造成的口舌之争的控制上,那些从来不是主流也不会对任何事有决定性影响,个人在历史在国运上的作用太卑微了,不论每个ID后面是马甲还是AI,是副国级还是网络大V,进入这个环境里ID的意义很小,更不再存在以前西西河ID人设可以成长进入商业环境的那种环境。 萨苏,马前卒等传说都是过去时了,以后不会再重现那种光环。

        不破不立,西西河适合重回初心,摆脱历史辉煌的包袱,以平常心做平常事。现在是互联网元年之后的二十年,许多设计都是很成熟了,比如亚马逊,淘宝,那种产品推荐设计。在西西河这个环境下,既然ID的属性比帖子的属性更重要,虽然这是个特殊国情,但是不如就把ID的推荐与鉴别当作主体,而不是把内容的相关性当作主体去设计。

        具体的说,与其在认证鉴别上大费周章,那么直接利用社交网优势,让每个读者都可以对每个ID去打星,去投票,说白了就是干脆就是对人不对事,扔掉那个对事不对人的牌坊,或许不但解决了读者的问题,还让网站设计更合理。

        当然这里说的对人不对事,需要在规范下,不是口水模式。比如可以在每个ID下设计几个属性,也不定只用左右去简单划杠,还有许多其他的,比如海华还是国内,AI还是文笔,带货还是口号,喜欢干架还是与人为善,等等好多可以让读者投票累积的特性,就是说把人设具体话,规范化,制度化。把推荐制度从花草宝为基础,过度到以ID属性之间的推荐,虽然内容可能风马牛不相及,但其实河里很久就有这个氛围,大家喜欢看自己认可的人的帖子并互动,每个读者对每个ID其实都有多多少少的人设判断,那么无非就是网站把这个过程制度化,规范化,自动化了,省却了很多“打左灯向右转,说一套做一套”给大家带来的困惑与效率低下。

        说到底,西西河的国特情决定了西西河是以人为本,以三观为本,在三观差距太大的个体之间如何建立一个共生环境,以达到潜移默化的互相影响的目的的网站。你好我好大家好做为一个原则是这种环境下运行的一个模式,但不幸的是这个模式在实践中遇到的挑战是前无古人的,另外这个原则的实践所系要的强大人格影响力,目测西西河中也无人可以承担。

        另一个途径则是面对这个世界人性的现实,每个人都有温良恭俭让的一面,也都是丑陋的一面,而让个体尽量发挥好的善良的一面缩小丑陋的一面,则无疑是一个社区的功能,不但可以做到甚至也可以使用技术手段做到,也就是大家常说的制度设计问题。

        抛砖引玉吧,如何把西西河建设在人性的基础上,不断扩大影响与沟通效率,其中有着许多超越一个网站的思索与话题。

        通宝推:夜如何其,
      • 家园 对啊,先把大家都肯定的正常河友赋予正常权限发帖

        其他的非正常河友的发言标上非正常认证文章,大家戴上有色眼镜看就行了。

      • 家园 这是极好的主意。

        逆向思维的好例子。

      • 家园 这是正的方法, -- 有补充

        正面清单嘛,不搞负面清单。

        作者 对本帖的 补充(1)
        家园 其实铁手搞负面清单,或解决什么特定问题,往往是把 -- 补充帖

        全体河友纳入考量范畴,要人人过关,写帖子像写申请打报告似的,系统越搞越复杂。

分页树展主题 · 全看 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河