西西河

主题:【文摘】什么是敏感词?如何过滤?google的做法 -- 老卢

共:💬1 🌺1 新:
全看分页树展 · 主题
家园 【文摘】什么是敏感词?如何过滤?google的做法

摘自纽约时报对google的报道。

。。。。

美国的网络公司在刚来中国的时候,都希望政府能够提供一份官方的黑名单,以及需要审查的敏感词。他们很快发现这样的清单根本不存在。取而代之,政府只是要求公司模糊地去进行自我规范。所以公司必须要参透中国的政治,从而自己了解什么东西政府会不喜欢。去年网上曾经流传着一个清单,据传是政府给博客公司的黑名单。事实上,这份黑名单是中国一家博客公司的一位年轻总裁自己整理的。每一次政府要求清理一个帖子,他就留意哪些内容是政府针对的。过了一段时间,他就开发出了自己的黑名单,让自己的公司以后免遭斥责。

政府的监控虽然很全面,但也有不灵的时候。某一天可能某个被禁的站点又突然看得到了,多数是由于路由器超出负载,或者政府突然决定容忍这个网站。第二天,或许这个网站就又消失了。总的来说,网民的举动都是很小心的。他们很少触及政府的戒条。在中国有许多不能够跨越的界限,大家不用经常谈论这个,但每个生活在其中,了解中国文化的人都或多或少的理解这些界限。这也正是美国公司对中国的环境感到困惑的原因。什么是被允许的?什么是被禁止的?。。。。

对比美国人经历的彷徨,当我问起中国的商人,政府的审查制度对于公司到底难不难操作。"我告诉你,绝对不会比在美国提交财政报表难。"。。。。

。。。。BRIN(google 总裁)的小组要接受一个挑战:如何决定哪些网站要屏蔽?中国政府不会给他们一个黑名单。所以谷歌的技术人员就借助高科技手段。他们在中国境内设置了一台计算机,然后设置程序让该机访问国外站点,一个接一个地试。如果有站点被屏蔽了,就意味着政府把它视为非法---这个网站就被加进谷歌的黑名单。

关键词(Tags): #敏感词#过滤
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河