西西河

主题:关于《字表》我也不得不说几句 -- 类反词典

共:💬38 🌺88 新:
分页树展主题 · 全看首页 上页
/ 3
下页 末页
          • 家园 我已经说得很明白

            但是如果你连这最后的遮羞布都不要了,连cooked data都不给,这能说明什么问题呢?

            难道不给定量数据还能出更好的结果?如果你连最后的遮羞布都不要了,我耐若何?

      • -- 系统屏蔽 --。
      • 家园 我不大相信他们有这样的材料

        由于“王宁”这个名字太平凡,用“王宁”+“北京师范大学”在万方找到80多篇论文,其中绝大多数是没有任何定量研究的。我认为比较有价值的一篇是《3500个常用汉字理据测查》。这是一篇硕士论文,数据充分,结论也不错。如果他们能有3-5篇这样的论文覆盖字表的大多数修改内容,我也就不说什么了。不过这是唯一的一篇,但作者的导师不是王宁。不知道是否是隔代弟子。在此姑且仍算作他们的成果,因为里面引用了王宁的理论。

        另一个可以使用定量分析的非常好的题材《外国留学生错讹字的理论分析》,但通篇没有看到任何相关的定量数据。根据其内容分析,他们还是收集了大量原始数据的。但为何就不把定量数据拿出来?这个要是有定量数据,是可以对字表修改有很大支持的。

        王教授牵头发表的论文《论母语与母语安全》,同样这个如果用一些定量数据进行支持,可以是非常好的论文,而且可以对字表修改提供强有力的支持。但很遗憾,仍然没有见到任何有意义的定量数据。

        他们的纲领性文件是《再论汉字规范的科学性与社会性——关于制订规范汉字表的思考与建议》,同样没有任何定量数据支持。

        以上数据肯定非常不全面,因为(1)“王宁”的平凡性;(2)我和这个专业完全不搭界。但是以上例子仍然说明,他们根本缺乏定量研究的意识。

          • -- 系统屏蔽 --。
          • 家园 这个你说对了

            这些专家的专业原本就不需要定量分析这样的研究方法

            王宁教授是章黄学派第四代传人,搞训诂学出身的。

              • -- 系统屏蔽 --。
              • 家园 对不起,我不懂训诂学。只知道这个名词

                做个文抄公:(中文Wiki)

                训诂学(“诂”音“gǔ”,同“古”)是中国传统研究古书中词义的学科,是中国传统的语文学——小学的一个分支。训诂学也在译解古代词义的同时,也分析古代书籍中的语法、修辞现象。他从语言的角度研究古代文献,帮助人们阅读古典文献。

                所谓“训诂”,也叫“训故”、“故训”、“古训”、“解故”、“解诂”,用通俗的语言解释词义叫“训”;用当代的话解释古代的语言叫“诂”。“训诂”连用,最早见于春秋时期鲁国人毛亨注释《诗经》的书,书名叫《诗故训传》,“故”、“训”、“传”是三种注解古文的方法。训诂合用始见于汉朝的典籍。

    • 家园 提议由大众决定是否需要改;由专家决定怎么改

      可以模仿陪审团制度

      普罗大众宣判现行字表是否必须修正

      如必须修改,有大众和专家互动确定修改原则

      专家的工作在于根据修改原则,提出修改意见,并阐述理由

    • 家园 这些砖家叫兽与民科的区别实在不大啊!
    • 家园 字频表是有的

      报告也不是没有

      但不够详细, 太不主动

      改动的文字, 里面还是有名堂

      "囧"没有也很正常吧?

      • 家园 我没有看到专家使用的字频表

        这个如果使用了,必须作为标准的附件,否则有什么作用?还得列出字频表是以什么数据统计的,进行了什么样的清洗操作,等等。再说,作为专门研究这个的,字频表这些工具,应当是有多个的,不同的数据库、不同的统计方法,获得的表是有差异的。这些差异有什么意义,该如何加权、取舍,都是必须说明的。但我们何尝看到一丝这样的信息?

        再说了,字频表、词频表是任何一个人都想到的的东西,也是现在计算机可以快速统计的东西。作为专家,如果仅仅使用这些工具,那还要专家干什么?开发和使用更高级、更专业的工具是专家的职责。但现在我们不仅没有看到这些工具,连基本的字频表、词频表都看不到。

        最后说一下这些所谓姓名用字。现在中国似乎没有任何“人名用字标准”,所以理论上任何GBK中的字都可以作为人名用字。但现在被他们这么一规定,其潜在的意思就是,以后我们只能用这几千个字取名字了??取名选字为什么要收到他们的这个限制?这我第一个要反对。我的名字有一个字不在表中,即使这个表的以后扩充四级五级,我的这个字也不大可能在其中。那以后我的名字竟然是非法的了?!

        这个表既然把“通用”二字放在开头,就只应当管通用的事,名字这种专用场合关你什么事?你管那么多干什么?

        • 家园 语料库本身无法作为附件

          我的看法是: 字表提供了一些解释, 但远远不够. 这个意见其实和你没什么分歧.

          • 家园 语料库没有任何意义

            我也没有要求把语料库作为附件。我要求的是把从语料库里面提取出来的数据作为附件。语委自己有语料库,那个所谓的“平衡语料库”就是。这个是公开发卖的,好像研究机构价是6万元,有手工标注的部分3万元。还有其它一些数据,也是差不多的价。语料库这种操作方式是可以接受的,但为制定这个字表提取出的数据必须公开。最简单的字频表、词频表如果都没有,如何让人相信他们是在做实事?何况这个字表项目肯定是国家或部委项目,经费是纳税人的钱,这些成果理论上都是全民所有的。

    • 家园 送花得宝

      惊喜:所有加你为好友的,在本帖先送花者得【通宝】一枚

      鲜花已经成功送出。

      此次送花为【有效送花赞扬,涨乐善、声望】

分页树展主题 · 全看首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河