西西河

主题:【笑话】误读 -- 清嘴小麻籽

共:💬11 🌺33 新:
全看分页树展 · 主题 跟帖
家园 这不是个小问题,而是。。。

在计算机自然语言处理这个学科里边,人们试图让机器,能够自动地理解用各种文字书写而成的各类文档。比如自动的文摘生成,自动的文档归类,自动的文档索引,自动的文档搜索,乃至于自动的文档书写。。。

自然,也有计算机中文自然语言处理这个小学科里边的小学科。

但是,与其他欧洲语言不一样的是,中文的自动处理的第一关,就是自动的分词。也就是,没有错误地把一句中文里边的各个词语给分割出来。在各种欧洲语言中,那是很简单的,空格嘛。中文里边呢?

于是,不得不绞尽脑汁地去寻找适合计算机的句读词读方法。

不过总算还好,人们有方法,有办法,虽然不能百分之一百满意,却也估摸着能够用了。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河