西西河

主题:扯一扯汉语的“稠密性”和精确度 -- 石头布

共:💬196 🌺697 🌵8 新:
分页树展主题 · 全看
/ 14
下页 末页
  • 家园 扯一扯汉语的“稠密性”和精确度

    本人的专业和语言学相去甚远,题目还有点大,所以只能扯一扯,扯不好大家包涵。所谓“稠密性”是我虎躯一震杜撰的一个量度,跟信息密度不一样。打一个比方说,如果你要表达的意思是海里的鱼,而语言是渔网的话,这个量度就对应渔网的网眼大小。

    有人说,有些英语能表达的东西用汉语表达不了,却也没见举个例子出来。我这里倒有一个反例。比如说一老外早上起来,听见窗外树上鸟叫,他说there is a bird in the tree, 但是可能错了,因为他不确定是一只鸟还是多只,也不知道是在一棵树上还是多棵树,或许应该说there are birds in a tree (or trees), 或许他说话这会儿,鸟早飞走了, 所以应该说there was, 又或者。。。。 总之,除非他到窗户外面用显微镜调查研究一番,这句话总归是要犯错的。那么,能不能砍去这些具体而微的修饰,直接表达一个抽象的意象,“管他娘数量的鸟在管他娘的时间在管他娘数量的树上”? 对不起,用英语你表达不了,要说话就非得提及这些细节不可。而汉语描述这个意象就很简单,四个字: 树上有鸟。

    我觉着这个例子比较典型地体现了汉英两个语言的一些特点。至少说明,如果“管他娘”那句话里的意思是条鱼的话,英语这个渔网的网眼有点太大,抓不到这条鱼。我希望有人找到一条汉语这个渔网抓不到的鱼,但是别举南美洲的昆虫名字之类的汉语没有对应词的例子,原因是下面要扯的两种语言的非一一对应性。

    如果客观世界和人类思维的总和,可以用一个二维平面来表达的话,语言可以被比拟为一个二维坐标系。如果汉语是直角坐标系,用x, y 来描述一个点的话,英语可以是极坐标系,使用距离r和角度a。 它们是机制迥然不同的系统。和大千世界相比,语言总是“稀疏”的,不可能描述所有的东西,所以我们不妨假定坐标系的坐标只能是整数。所以,它们是稀疏的“网”。不同坐标系之间是可以转换的,比如从直角坐标转换为极坐标,r=sqrt(x^2+y^2), a = arctan (x/y), 这个叫做汉译英。反过来,x=r cos(a), y=r sin(a), 这个叫做英译汉。需要注意的是,由于坐标只能是整数,无论汉译英还是英译汉,都不可能完全准确。比如英文的一个点: r=10, a= 45°, 翻成汉语,要严密一点,你只能很罗嗦地说, 7<x <8, 7 <y <8,而且x, y都很接近7。如果要简洁地按照“地道”的直角坐标说话,就是 x=7, y=7, 而这又很不精确。

    反之,把极坐标转化成直角坐标时,也有同样的问题。所以经常有人说,把英文译成中文时,难以精确和简洁,这并不是中文的问题。事实上反过来汉译英的时候也是一样。

    不同坐标系还有不同的专长。比如极坐标表达圆时出奇地效率高,r=R, 就完了,用直角坐标就麻烦些。反过来如果要表达长方形,那是直角坐标占优,极坐标就繁琐多了。而且由于坐标只能是整数,极坐标画的长方形是带波纹的,直角坐标画的圆还是带锯齿的,但求神似罢了,呵呵。

    语言就是不同民族在各自的生产活动中发展起来的,服务于这些活动的符号系统。可以说极坐标就是人们在画圆圆的生涯中发展出来的坐标系,直角坐标就是爱画框框的人搞的。现代的科学,法律之类的东西,很多概念是西方人在最近几百年发展起来的,他们的语言是伴随着这些东西的发展而发展的,两者之间的适应性无疑更高一些,就是说,这些科学论文和法律文本,都类似于圆,用直角坐标不如极坐标顺手。当然汉语也在不断发展和学习,这方面日本人对中文做了不小的贡献,现在中文已经比晚清严复时画圆画的好多了。反过来,如果把中国道家的那些炼精化气的经书翻译成英文的话,译者就得体会一下用极坐标画长方形的痛苦了。

    前面我们假定两个坐标系的坐标都是整数。或许我们可以把汉语这个坐标系的坐标间距缩小到0.5.,理由是在开头举的那个例子,说明汉语的“网眼”要小一些。这个例子说明“管他娘”的那个极具一般性的概念英语表达不了,而英语能表达的所有特异性,汉语都能表达,比如,除了“树上有鸟”,你也可以说“五十秒之前那棵歪脖老槐树上有三只长尾巴喜鹊”等等。汉语有一种自由度,你可以“丰俭由人”,就是可以在一般性和特异性之间自由自在地穿梭,不受任何约束。如果知道得多,还话痨,可以走特异性路线,提及很多细节。如果知道的少,或者故作高深,可以走一般性路线,简约而模糊。两者在汉语里都是合法的范式。而英语则不然,不提及细节你是说不成话的。连下雨都得有主语,it rains. 所以,有人说汉语不精确,写论文的话,水平低的人用中文写可以蒙混过关,用英文写就露馅。 确实如此,但并不是汉语不精确,而是汉语的更大的自由度被人利用了而已。

    语言往往是思维的辅助工具,思考有时就是在脑子里自言自语,所以语言对思维方式也是有影响的。那么汉语更大的自由度是不是带给中国人的思维更大的自由呢?我不敢妄言。这是正面的影响。负面的影响就是汉语的这个自由度“帮助”中国人忽略细节,这个已经被很多人提及过了。

    回到题目上来。我们举了一个例子,说明汉语的“稠密性”更大。(当然英语的海量词汇使它在表达特异性时有优势)。同时我们通过直角坐标和极坐标的比喻,说明表达的精确性是相对的, 无论哪两种语言互译,译文永远不如原文精确和简洁。

    通宝推:diamond,支持中文,林风清逸,wlr,朱测,汉服骑射,履虎尾,铁手,五峰,桥上,

    本帖一共被 1 帖 引用 (帖内工具实现)
    • 家园 我总结一下楼主的观点

      有一对标准来评判语言,即精确性和模糊性。

      在精确性上,汉语英语相当,模糊性上,英语不如。

      或者说,汉语能达到英语的精确,但英语永远达不到汉语的模糊。

    • 家园 学人所长,分享创造

      抱歉楼好像有点歪,但顾不上了。

      所有文明面对的都是同一个客观世界,彼此之间产生不同的偶然性大于必然性,大家的难度从根本上说是一样的。

      语言就是一个很好的例子。以掌握日常用语所使用的词汇来说,中国的小学生平均要比其他拼音文字国家的小学生多花2-3年的时间才能掌握。那么对于扫盲来说,中文有优势?

      但是,在掌握日常用语所使用基本字词之后,中文学生的阅读理解的范围扩大和能力的提高的速度是拼音文字国家孩子难望项背的。拉丁语系国家的孩子在阅读能力上是不断要接受挑战的,坡度虽缓而长度增加。早轻松则晚受累,总难度系数不存在显著差异--因为思想内容没有显著差异。

      事情到此为止了吗? 别急,还有。中文在常用字词以上的部分进一步学习的难度再次陡然提高。不信可以自己去看看,中国受教育成人平均识字水平与常用汉字量的距离是相当近的,与拼音文字人群比是颇为羞涩的。为什么?中文转而先是在排列组合上用力,然后是在指代,会意等语义外延上下功夫。

      那中文从发展初期就是如此吗?抱歉,很可能不是如此。古文中有大量的字我们今天都不再用。早期语言发展很可能也是像拼音文字发展那样使用创制新字的方法来扩展对客观世界的覆盖的。但是,幸也不幸,方块字比拼音文字显然先遇到造字瓶颈,那么很可能也是最先开始了尝试复杂和更为复杂的语言逻辑的。(历史上拼音文字可能是造字瓶颈后采取的另外一条发展路径,但此仍为假说。)这个尝试的成功也让中文越来越灵活,对新字的需求也在客观上下降了。(多音复用一定意义上也和此逻辑相通)

      到这里,我们不得不再向上一步,考虑语法的影响。中文字词尺度上的灵活性与语法上的高度灵活性应该是有内在逻辑联系的。但是,灵活的语法也就是松散的语法,中文语法的严格性低大概也是相当出名的一点。即便是在白话文革命之后,这一点依然很突出。随着现代科学技术的引入,随着与其他语言的相互交流,目前中文已经逐渐形成一套在科学体系内运用的比较严格的中文专业语言子系统--这套子系统看起来与一般白话文没有大的差异,一般受教育者也可以读,但未必能真的‘懂’,更不太可能会正确恰当的使用--其主要是构建于中文本身丰富的逻辑内涵能力之上的。

      与中文对照,拼音文字在语汇发展上的方法是相对简单,但没有天然量的限制,只有脑力上的局限。这个背景与其相对严格的语法也是有一定关系的,因为语法参与了相当大语义的表达,而中文相对较少,转而对上下文的依赖增加。这样一来造成拼音你文字体系下一般教育与专业教育的最大差别就是词汇上的差异。(在中文,则是字都认识,逻辑不通--的确有很多‘会意’逻辑的现象发生。手边的例子就是隔壁热议的中国好声音里卷珠帘这一类所谓中国风流行歌曲。白话文词汇,仿古文堆砌;字词都是常人,(逻辑)意义完全不管,以松散中文语法为障眼摇身一变--呵呵,就天才少年了。)

      拉丁语系在新词汇方面也有应对超长复杂词义的办法,目前最普遍的就是缩写法-比如大家都喜欢举的LASER。这个办法到目前看还撑的下去。中文方面,对文化的积极态度稍有松懈,挖掘自身潜力的余地就有些捉襟见肘,直接借用的现象就越来越多。很难评判这是好是坏,只是能看得到这是随社会历史而变化的--laser放到今天是不会有激光的,那时大家会觉得镭射相当信达雅了。

      同样,中文最早的创字的手法已经久已不用,但是就此放弃了吗?当然不是,前面举过化学元素的例子,其中绝大部分都是创制的新汉字,没有‘镭’会有‘镭射’?(当然这个译法的硬伤也在这里)

      还有,话再说回来,大家常说,激光好过laser,因为不懂的人看到激光会领会到一点意思,而laser什么都不是。Really? 看到激光真能领会到什么吗?您看到‘三光’是什么感觉?我个人是相当的怀疑这一点,更不论‘镭射’了。在我看来,特别是随着科学的进一步发展,这与拉丁语系使用的缩写法基本没有差异,激光就是受激辐射光放大的择其紧要的缩写/简称。

      然后。。。再等等,除了中文和拉丁语系就没有其他文明其他语言的贡献吗?中文中有多少外来语已经不需要扫盲,拉丁语系来自近东,阿拉伯的影响更无可计数--打了那么多年仗没有相互交流是simple,sometimes。。。(谈必中文与拉丁语系是我们这个历史时代偶然性阶段性事件。)目前中西方通用的数字书写方案不还是阿拉伯数字吗? (虽然离原来的阿拉伯数字已有距离,但中西方都还有雅量承认其源头,不像我们有些朋友那么小气。)

      希望强调一下我们的逻辑出发点。所有这些所谓某个语言的特征都是通过比较得到的,是相对的,不存在比较之前就具有的特征。要是还不服气,

      那是很莫名其妙的。

      因此不要再盲目的搞那些简单化的逻辑,动不动就梁山泊英雄排座次的节奏,除了我祖宗第一,就是你祖宗傻X。。。抱歉,我最近好像管不太住嘴,对事不对人,对事不对人。。。

      (话也说清楚,在这里对事不对人,某个地方还是对事又对人,XX狗毕竟是另外一个层次,这个要有科学态度。。。)

      再向后看,以后会发生什么?以后什么都会发生。就像一个地方的车牌,看上去没有几位,车多了号牌用完了怎么办?总归会有办法,总归也就那么几种办法。语言中各要素部分担当的转达语义的任务会越来越重,除了意义的外延,还有语言结构的复杂化。没人敢再说世界上语言归为一类这样的话,但各种语言使用的发展方法与发展逻辑大概十之八九会差不多。即便有创新,应该也会很快传到其他语言那里。但也别指望过程多理性,偶然性的斑斓色彩闪耀瞎眼,比如daqi和long time no see。相对的,在科学领域和书面领域要好一些。

      文明积累的难度是一样的,由于方法不同导致各有各的难处,各有各的得意--表现多样性与内在一致性的辩证统一。不要只看和尚吃肉,不看和尚挨打,Every dog has its day. 至于到不到罗马/北京,那要看个人努力。

      学人所长,分享创造,那么此帖善莫大焉。

      (匆忙就笔,挂一漏万,错误难免,仅求达意而非周到,欢迎批评,再次对楼主感谢并歉意中。。。)

      又及:写完之后,修改多次,大多是由于写的快了,语义不周到,再读一遍就发现可能有歧义--中文语法的灵活性就在你不经意之间埋伏下来。。。

      通宝推:wlr,易水,
      • 家园 花赞时得了通宝,不得不回了

        稠密性之对立是稀疏性,到底是稠了好还是希了好?

        按照精细化的要求是稠了好,可是孟子说了:苛政猛于虎。

        老子说:法网恢恢,疏而不漏!

        • 家园 所谓稠密稀疏的概念,并不存在

          只有实践需要,语言没有什么根本性认知规律意识规律上的差异--none。想证明那个层次上的不同语言差异都不知道自己在说什么。

          也许是我写的比较客气,让很多人看了还不明白。其实想表达的意思就是,所谓‘稀疏稠密’,就是闭门造车。

      • 家园 举个例子吧

        中文已经逐渐形成一套在科学体系内运用的比较严格的中文专业语言子系统

        另外,杜牧有一句诗是卷上珠帘总不如。

        • 家园 堆砌一说,便是此意--或者叫‘词语搅拌’

          这里不是谈出处,也不是要求不得越前人语汇之雷池,说的是这种庸俗‘骈体’。

          毫无实际内容的词汇堆砌,更确切说这是‘词语搅拌’。

          逻辑上是以商业化为目的的庸俗文学模仿。审美上显然是超女的对仗,语言及审美对社会变迁的反映是极其深刻的。

          • 家园 没看懂。。。
            • 家园 中文语法松散,会意很多,这是产生”玄妙“之感的物质基础

              所谓”搅拌“, 其实就是随意的排列组合,任何新的排列组合在语法的弱检验下都会产生新的会意联想。但这究竟是文字游戏,还是哲学意境新探索的”有效“手段? 这个就只有具体情况具体分析了。

              任何灵活性都会产生类似效果。近一个世纪以来,中国语言,中国文化,中国社会制度在与其他文化实践的比较中往往头脑无法清醒,至少一个原因就在于没有从广义文化环境的背景上理解自己的历史与他人的努力。 中外之辨陷入空洞乏味,甚至自欺欺人。

              需要这一代和下一代中国知识分子端正态度,开阔视野,兼容并蓄,融会贯通。 这需要时间。但努力不能停滞;否则过去和今日的痛苦,后人复哀后人会继续不断的成为中国历史的常态。

        • 家园 On top of head--举两个小例子

          都是工程技术界的,

          1.结构工程中常用的字:‘砼’,如,钢筋砼建筑

          2.电气工程中的,变频调速器(VFD,或VVVF)

          不要放狗,说说啥意义?

          科技论文通过句式选择,逻辑关系,段落组织等方面的规范性避免各种歧义是有一定之规的。当然,作者的中文功底和业务水平在这里起重要作用。

          就科技论文来说,交流比较成熟的学科领域,同样内容文章,规范中文所用字数是一般要少于使用英语等拉丁语系语言,比例也是大致不变的。这个比例在非科学技术领域内也存在,基本也是中文要少一些,但比例是不同的。

          另外,工程技术界的中文规范使用标准是相对成熟一些的,一个原因是中外的距离不大,中国领先的领域,如土木工程类别,中文成熟度最高。中国不领先的领域就要差一点--比如上面电器领域的那个词汇属于凤毛麟角。自然科学领域一方面由于知识更新变化更快,另一方面也是中外距离较大,所以中文使用的成熟度不高也是现实--可能还会进一步降低。(从河里很多人感叹的英文优势你可以分析河友的大致专业分布

          这是我为什么强调语言是与创造性是直接关联的生命体,不仅在于超女,卷珠帘,更在于我们这些书生分分秒秒的工作,无论是读论文,还是思索,任何新的想法本质上都是在创造中文的新天地。

          答案:

          1. 砼 (tong) 二声,即“混凝土”。亦可读为“混凝土”。新创汉字,仅为土木工程界所用。

          2. 变频调速器,或简称变频器,是实现同步电机高效起动的革命性控制器件。最初由英国人发明,在日本得到实质性突破和发展,并开始推广使用。在未来广泛进入生活的电动化浪潮中,这是最为关键的器件之一。最终是由中文定名的;被广泛接受并确定下来。

    • 家园 【讨论】所謂的外行討論

      外行當然可以討論這么“高端”的問題。可是,至少討論有些邏輯性吧。

      樓主的第一個例證就舉錯了。你起床聽到窗外有鳥,怎么知道一定在樹上?所以,最直接的反應和表達是 “birds singsing !”

      如果你窗外的確有顆巨大的樹,所以判斷烏兒一定存在于樹上,那也簡單: birds singing in the tree !

      用這個簡單的反例來告訴樓主,你的出發點和討論語言的思維結構恐怕都有問題!

    • 家园 语言和生活实践是完全不能分的

      有什么样的实践就产生什么样的语言,语言在这种意义上是单调的过程量,是路径相关的,不可逆的。

      目前谈语言倾向于其超脱实践过程的工具性,只谓信息交流工具,这样自然而然的缺省逻辑就是一种语言要有‘全能’的功能,这显然是不可能的。从这种意义上说,所谓翻译不过是用某些语义在一种语言中的外延去尽可能‘多’而‘好’的覆盖另一种语言表达的语义外延。但是终究不可能替代一种语言中从不存在,毫无关联的生活,思想体验。唯一解决的办法,就不能只是语言交流,而必须是生活的交融,混合在一起,语言各自借鉴,相互审视,共同发展,或许就直接借用,相互融合。英语的广泛传播归根结底的直接原因就是与几乎所有的语言都进行交流交融,乃至毫不扭捏的借用--借用语言的同时也在借用思想,借用历史,借用创造。

      最简单的例子,各种语言各擅胜场,意大利语中食品用语的丰富程度是出名的,大量拉丁语系语言普遍借用。中文食品表达也是很多其他语言挠头的事情,最后只好直接借用。类似的各种语言几乎都有其独特的地方,而潜力不足的语言被淘汰的也已几不可数。所以归根结底,语言的生命力决定于其深度,决定于其实践者的思想活动深度,广度,创造性和理解力--从贩夫走卒到知识分子,毫无疑问后者的工作-不管哪个学科-更是语言发展更为重要的推动力。思考停止,语言之死就是时间问题。

      换言之,翻译越‘神’,某种意义上说,会进一步挖掘原有语言的历史经历的深度,但也会加强原有语言的交融‘惰性’(这就是个例子,如用英文表达这里是inertia,而inertia的中译是‘惯性’。写‘惯性’这里就没人能理解我的意思了--真实的语义以中文传达是在‘惯性’与‘惰性’之间的。)

      现实中这些因素都是历史的一部分,都会最终融入语言的历史经历。意外随处可见,谁能想到这几年进入美式英文最成功的中文词汇是:daqi(大气)?

      -- shengqi知道了会非常‘生气’的

      • 家园 因此学习一门语言的最终途径是生活与思想方式的改变

        反过来也成立,没有对某个语言的文化,思想的浸淫,就不会完整的掌握这门语言。

        例外的是,拿来主义,比如朝鲜越南把中文文字拿去,作为解释自己文化的符号,或者新加波,印度的英文,都是语言异化的结果,不完全符合上面这个规律。

        但是语言在沟通中起到的作用,仍然不仅限于符号与语义,更重要的还代表着思维方式上的一个共同的基础,有生活实践方面的,更多的还存在于认知上面。

        比如E文中的deja vu, 就是一个认知体验,中文中没有对应的词至少说明类似体验不普遍,那么其相关的一些知识与说词就无从谈起。中文中也有许多成语在E文中找不到对应的,于是直接影响了中国知识分子在E文语境下的表达自己思想深度的能力。

        虽然现代社会的信息高度流通与语言中词汇,语义互相转译借鉴很普遍了,但是根据特定语言的文化基础来评判其他语言的优劣是不能说明楼主的结论的。比如现代数学本身是个从拉丁语言中产生的,用中文去表达与使用自然有很大的劣势,甚至现代科学体系在西方有很长的历史,本身就代表着西方语言的深度之一,拿中文去比较信息量,稠密性,这些引进的概念,是不可能得出什么有意义的结论的。

        • 家园 对于科学思想的表达,这东西要两说

          说科学产生与于西方,从而拉丁语系有优势。追究起来这话前后也都是有问题的。

          科学的发展从来是不分国家民族界限的,每个文明都有自己的贡献。我们就从语言来看,中文数字全部是单音节,各位觉得比起拉丁语系的多音节来说哪个更符合科学的‘利益’,更具有科学思想呢?

          这算原生的例子,我们再看后来学习来的知识。化学元素是学习来的,中文依然全部用单音节,拉丁语系呢? 哪个更具有科学意识? 这不是某个译者的一时之选,是属于中文內禀的精神。

          其他的,随着技术进步,大量拉丁语系需要缩写应对的含义中文处理起来简单的多--但中文早晚也是要学习这种缩写的方法,这才是科学

          我个人也听到过很多关于科学表达上的语言评论,但我不认为有质的差异,这也说明科学是普遍的,不像包子,没见过你死活不知道是什么。英文可以接收baozi,我们也不需要过于难为情于‘粉丝’--虽然我本人还是多少有一点

          • 家园 中文科技词汇也有其优势

            我觉得很多科技词汇没有好的翻译,那是因为用得还不够多。用的人多了,次数多了,自然而然就会进化成比较顺溜的形式。

            说到这里,不得不提一下的是,中文科技词汇有它无与伦比的优点。这个把所有其他外语捆一块儿都比不上:我们翻译一个外来词,总是尽量做到信达雅,而不是完全使用音译。这样做的好处是一望即知。比如laser,大陆翻成激光,香港翻成镭射,现在还是激光用得更多些吧?一看就能脑补个八九不离十。很多科技词汇也是如此。比如现在神经科学上面用得很多的光敏通道蛋白,中国人看完这个词,哪怕不是这个专业的,都差不多知道这是怎么回事了。英语语呢?channelrhodopsin,您不好好学习一下定义怎么都不可能知道是什么玩意。这还算是好的,还有大量的名词用人名命名的呢,更摸不着头脑。中文名词印象中有时候直接用人名,有时候意译成相关词汇,例子想不起来了。

            这样做的结果是,看大部分的中文科技文献,不需要科班出身也能看得懂。英文的呢,您需要抱着本科技词汇字典,否则想都不要想。所以我们民科多啊,这个门槛实在是太低了。往好处想,民科就是对科学感兴趣,懂一点不完全懂的状态,好好引导,离全民科学素质提升也就不远了。

            要说还是科研实力不如人,没有话语权。如果有一天,我们的科学研究超过了英文世界,把nature,cell和science全部改成用中文发表的,一定可以省去可怜的研究生们大量的时间。

            还有呢,翻译家们这个“所见即所得”的习惯还用在了翻译电影片名上,所以中文版片名老是剧透,河里还是哪里有篇文章提到过这个。比如人家叫 the spiral, the ring virus, the ring, 看了都不知道是恐怖片名,中文非要叫午夜凶铃。我现在看见这四个字就恨不得要做噩梦。

            回错了,本来是要回楼上的,既来之则安之吧。

分页树展主题 · 全看
/ 14
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河