西西河

主题:【原创】查字典漫想 -- 抱朴仙人

共:💬37 🌺46 新:
全看分页树展 · 主题 跟帖
家园 同意仙兄观点,汉字编码的确是个大问题

也稍微留心过汉字编码的问题。其实无论是拼音检字还是部首检字,都是对汉字进行归类编码。如仙兄所说,拼音检字,容易出现不会念的字就查不到的问题,这说明拼音式编码有其缺陷;同样的,部首检字,容易出现不知部首而查不到的问题,说明部首检字也是有问题的。

两大主流检字方式都有问题,汉字编码之难可见一斑。仙兄举例如“凹凸”,也曾困扰过我。此外,“卡”字笔顺又是什么?按先上后下,先左后右的笔顺,得出的结果如果在手机中按T9笔画输入,肯定是错的(T9对不对这里先不研究);再有“○”,这唯一一个绝无横、竖、点、撇、捺、折(严格意义上的)成分的规范汉字,即便归入一笔之字,部首究竟是个啥也还是让人挠头。即便是拼音搜字,也容易出现问题。比如“拎”,我一直见字生义地读为“līng”,后来打不出这字,才知道该念“līn”——手边暂缺字典,如果有错,也望指教——诸如此类,问题多多。

究竟有没有一种方便高效、一目了然、无漏无重的编码方案呢?从所谓“万码奔腾”就能看出,这个要求实在是太难实现了。古人造字,本就不拘一格,比如“彦”,底下为什么连来三撇?“巡”,这并列三折又是怎么个讲究?一撇一捺既可为“八”、“入”又可为“人”,是何居心?等等等等,不一而足。

难啊。

不过也赞同仙兄见解,拼音检字似乎更有前途。我从来是拼音输入打字,具体来说就是智能ABC。无论是智能ABC、微软拼音还是紫光输入法——我只用过这三个拼音输入法——都有个特点,就是支持词组联想式输入。而词组输入,往往直接输入简略拼法即可,不仅大大减少输入字符数量(缩短编码码长),同时还极大地降低了重码率。以此来看,以词组,甚至更长的常用语文单位(比如“中华人民共和国财政部”、“我们一定要紧密团结在以”)作为编码单位,也是一条可以探究的路子。

饶是如此,仍然不能改变拼音检字的固有问题。汉字,无非有形有声有义,倘若形声皆无妙计,难道只能在“义”字上做文章了?粗粗一想,更是难如登天。

算了,不胡说八道了,还是献花吧:)

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河