西西河

主题:【原创】《读书的目的是抵达一个人de涌现时刻》 -- Ace

共:💬7 🌺51 新:
全看树展主题 · 分页
家园 【原创】《读书的目的是抵达一个人de涌现时刻》

《读书的目的是抵达一个人de涌现时刻》

ACE

导言:

读书到底有没有用?

现在一批包括樊登读书的樊登在内的一批人在网上表达年轻人读书太多,应该早点进入社会。樊登读书的樊登都在说读书太多无用。这对吗?

https://user.guancha.cn/main/content?id=1008128&s=zwyess

宋代大儒朱熹说:格物致知。为什么王阳明大师觉得自己被这句话给忽悠了。

为什么习大大在全军高级参谋长会议上,花了20分钟滔滔不绝语重心长的反复问这些军队“智囊”们,你们现在还经常读书吗?

为什么我知道的大企业的老板都会经常亲自主持“高级干部读书班”?为什么成功的老板就怕自己的高级干部不经常读书?

为什么中华文明的核心传承之一是“万般皆下品,唯有读书高”,我大中华儿女不管留居神州还是散布全世界各个角落,中华文明的明显特征之一就是“特别爱读书”?

正文:

本文开头我介绍一个人工智能研究的最新发现:人工智能里的「涌现现象(emergence)」。

什么是涌现现象?这个词的定义是这样的:涌现(英语:emergence)或称创发、突现、呈展、演生,是一种现象,为许多小实体相互作用后产生了大实体,而这个大实体展现了组成它的小实体所不具有的特性。(源自维基百科 https://zh.wikipedia.org/wiki/%25E6%25B6%258C%25E7%258E%25B0 )

涌现现象就是一些简单普通甚至是无意义的操作,在相互作用之后,产生了具有极大意义的行为。例如说山顶的雪化成水,水顺着河流流向大海,海水蒸发成水蒸汽进入了大气,而大气又把水气运到了山顶。看似每个环节都很简单,然而他们聚合在一起,却形成了人们赖以生存的水循环系统。

这就是说,当孤立的每个能力被以某种方式突然组织起来的时候,却爆发出很强大的能力。

在物理、生物、和计算机科学领域里,涌现已经被谈论了很长时间。而在大型自然语言处理(NLP)模型中,涌现现象被科学家们非常直观的观测到了。在LaMDA、GPT-3、Gophper等语言模型中,我们观测到,当训练数据量超过某个阈值的时候,模型的精度突然会暴增。在训练量较小的时候,其结果与随机结果(瞎蒙)差不多,但是当训练量超过某个阈值的时候,精确度突然大幅提升。

点看全图

chatGPT3.5用超大模型(1750亿条数据)进行训练,结果产生了涌现的现象,不仅可以在SAT考试中击败大部分人类,甚至一下子就从“连字游戏软件”晋升成为了未来产业的焦点,投资的热点,甚至是AI灭绝人类论现在开始被一群人类智者开始非常严肃的讨论了。

一、读书要一直读到涌现现象发生,读书的意义和价值才能迸发出来。

人工智能的发展,尤其是ChatGPT3.5以后的人工智能发展展示了一个重要发现:一个好的模型也需要(超)大量数据进行训练。

上帝给了我们每个人一个860亿个左右神经元构成的大脑,有人说一个人的一生目前只能用10%我们的大脑的潜力,也有说6%和4%的。为了挖掘我们大脑的智慧潜力,我们只有通过大量的读书阅读和实践来对我们的大脑进行超大数据训练,当这个训练的数据量超越某个限度之后,我们的人脑就会出现“涌现”现象——涌现时刻之后的人从此以后就在智慧的层面“登堂入室”,他就会变成一个“智者”。成为智者之后继续读书和实践,对这个智者来说就不仅仅是简单知识的累积,而是会不断在他的大脑里发生触类旁通的新知识快速产生,他的能力会以明显高于常人的斜率快速提升。

实践是训练人脑里神经网络的一种有效方式,但人的生命有限,一个实践从分析决策到终于可以总结成败得失之间的时间周期太长了(几个月、几年、甚至几十年一辈子),所以单靠实践来训练人脑的效率实在是太慢了。实践这种最朴素的人脑训练模式用来教人干农活、教人唱歌跳舞、甚至教人娶妻生孩子是可以的,但从事企业运作和军事指挥等这些复杂的脑力劳动就不可能。不读兵书可以当土匪,不读兵书不可能做军队将领。

好的书籍是作者长时间实践活动的得失总结和成败反思,是非常优秀的被标注过的训练数据集。因为生活工作整体而言是平淡单调重复的,我们的生活工作实践里有太多的日常重复,所以虽然我们的日常实践活动很多,但它们里面有价值的数据却并不多。重复的数据并不能给我们带来新知识和新技能。经典好书,畅销书就是大家认可(标著为“好”)的干货满满的数据集合。天文、地理、历史、人物传记、技术、管理、经济、法律、哲学等等好书不断输入我们的大脑进行对大脑的数据训练(类似我们训练ChatGPT模型),当训练数据量达到一定量的时候我们的大脑神经网络模型也会发生“涌现”的现象,突然间你读书感觉就有了“融会贯通”的感觉。

我还记得我的涌现时刻发生的那个下午。我读到《中庸》里“自诚明,谓之性;自明诚,谓之教。诚则明矣,明则诚矣”“唯天下至诚,为能尽其性;能尽其性,则能尽人之性” “诚则形,形则著,著则明,明则动,动则变,变则化。唯天下至诚为能化”时候,突然一瞬间浑身发热,一股强烈的电流直冲我的手指末梢,一下子我竟然泪流满面,情绪激动一时不能自己,对着那本小薄书呆坐了良久之后身体才能动。从此以后,在不同学科之间的阅读各种书籍之间变得交相辉映——我经常读着书A,结合读过的书E、书F和我自己的经历,我想明白了另外一件事情X。《道德经》里老子总结这个现象是:为学日益,为道日损,损之又损,以至于无为,无为无不为。

我认为读书的目的就是读各种各类的书,一直读到你的“涌现时刻”出现。在此之前,你就是要坚持大量各门各类的读书,多读各学科名著,避免读书方向狭隘让自己陷入“过拟合”的窘境。“过拟合”浪费一个人的精力和时间。

读书到自己的涌现时刻后,读书就变成你的爱好了。一个人涌现时刻之后的阅读会带来比之前阅读更加大的收获和愉悦感,读书学以致用的强烈快感开始自我不断强化。从此以后读书就不再是一个人大脑的负担,读书变成类似加油站(充电站)对一辆燃油车(电动车)的关系——你越是跑得里程多,你就越是要经常去加油站。你越是经常去加油站加油,你跑得里程就越是多。

二、为什么社会流行“读书无用论”?

因为一个人读书在越过他的“涌现时刻”之前,读书的确是一项非常枯燥无味的活动,读书活动违背人的进化属性。

百万年的人类进化过程中,人这种动物大部分时间都在游山玩水、晚上吃饱了就围着篝火唱歌跳舞,这些活动已经深刻的影响了我们的基因遗传活动,我们的大脑为此进行了专门的进化。

所以游山玩水和唱歌跳舞“非常符合人的(本)性”,我们会感觉做这些事情非常的愉快、放松、不累。抖音微信短视频就是迎合了人类的这种进化属性,看视频比阅读哪怕是144个字的微博都更加令人不累。

文字出现不过几千年的历史,由于读书活动出现时间太短,人脑还来不及针对读书发生进化,所以人脑一直是勉为其难的处理读书活动。读书是所有人类活动中最消耗脑力,同时也是最令人头痛的活动。如果一个人没切实感受到巨大的读书收益,他不可能养成读书的习惯。也许脑机接口是人类对读书活动的一个救赎,但这也只能解决知识传承的问题,一个人的大脑思维模型训练的好不好,目前看没有比读书更高效的训练大脑智慧的方式了——实践活动的效率太低只能算是大脑训练的第二高效的方式。

光有脑机接口而读书不足,就好似一台286老式计算机配置了一个2TB的固态硬盘,也没啥用。

提出读书无用论的人,他们只把读书和应试教育联系在一起,是因为他们只看到了部分真相。

如果我们把读书比做一把锤子。在学校读书本身的确是不能够处理很多实际问题,学校里读书的目的主要是应付考试。读书这把锤子,学生们此时在实践中找不到任何有价值的钉子来锤,只有老师给你的这把锤子专门设计的“模拟钉子(试题)”可以锤。如果目光短浅,读书为了考试看起来的确是“没有实际意义”。

而且最近几十年由于学校教育领域的学术僵化之风盛行,当学生离开学校的时候,他们会发现他们在学校做的锤子几乎在现实世界中没有可锤的“真钉子”。他们需要跟着入职后公司安排的工作导师学习如何工作,跟着导师重新打造一把可以在工作中锤真实钉子的锤子。

上述问题当然是真实的,需要从两个维度来审视。

一方面,我们的高校教育系统要深刻反思为什么我们的高校教育距离社会实际需求那么远,我们的本科教学为什么僵化了?是不是一部分老师远离实践和懒惰导致的呢?他们远离不断发展的社会工作一线,他们在备好一门几门课之后就在本科生教育方面的朝前探索方面停滞不前,每学期机械的重复自己的经典课程目的是拿工资,然后把自己的大部分精力投入到写Paper发论文评职称中去了?我们是不是可以学淘宝Taobao网请本科生的用人单位(买家)对高校老师(卖家)就本科生在入职工作后的表现进行打分评估呢?然后用这个评分的统计结果来替代50%的教授评定打分。一个不能教出大量优质本科生的副教授不可以被评为正教授,只会发论文的副教授不可以被评为正教授。

另外一个方面,我们要清楚的意识到:一个人想要让他的读书活动产生巨大收益,他的读书活动要能够真正处理和应对现实生活工作中的问题,他必须要读书够多以达到他自己的“涌现时刻”。只有读书抵达他的“涌现时刻”之后,他手里读书这把锤子才能在现实世界里找到很多真实的钉子来锤,他的读书活动才能产生巨大的收益,然后这个人就自然会养成爱读书的人生习惯——你越是跑得里程多,你就越是要经常去加油站。你越是经常去加油站加油,你跑得里程就越是多。

中国自古社会上就有一些目光短浅的有影响力的人大声忽悠“读书无用”。也正因为早知道会有如此现象,中国古人先哲留下了一系列的名言金句来激励中华儿女们去读书:“书中自有颜如玉,书中自有黄金屋”;“万般皆下品,唯有读书高”。

有些太复杂的事情你必须是“因为相信,所以看见”。如果我们相信我们中华古代先贤不会欺骗我们,那么我们就要坚持读书,领袖在陕北下乡的时候拼命夜夜点煤油灯读书的时候,他并不知道他日后要成为复兴之君。这是因为他相信“万般皆下品,唯有读书高”,所以他能够看见。

读万卷书,行万里路。东哥鼓励我们不仅要读有字之书,还要读无字之书。

本文的目的是指出了我们读书活动的具体目标是抵达你的“涌现时刻”。

三、应试教育的意义不容忽视

应试教育只是一个人生阶段,我们要正确认识这个阶段考试的意义和价值。

在学校读书与参加考试,这几乎就是你的人生中全部带有“人工标注正确与否”的规模数据训练了。每天的课堂讨论和随堂测试、期中考试、期末考试,每一轮对人大脑的训练周期很短,这对人脑来说是非常高效的智力训练。

一个人毕业离开学校之后,这种带有“人工标注(老师评判)”的训练(考试)活动就结束了。进入社会之后,你的每个思考、每个行为都不会很快获得正确与否的反馈,即便是经历几个月、几年你都未必获得正确与否的反馈,这对你的智慧提升绝对是非常不利的。所以大部分人智慧提升最快的阶段就是在学校的时候。离开学校之后,大多数人的智慧提升速度就明显变慢,甚至会被你周围错误的数据标注带着误入人生的歧途。

中华智慧认为人如果经常有良师益友乃人生最大的幸事,因为他们可以陪伴你一生中帮你“标注”你的言行是否正确——这种标注结果如果能够经受时间的考验,这绝对是对一个人智慧高效的训练方式。

磨刀不误砍柴工。我们要正确理解学校里读书为了考试,这是历经千百年时间考验的对一个人智慧提升的最高效模式。攻击应试教育制度的人只是因为一叶障目不见泰山,他们只看见考试题没有实践意义却没看到考试题不过是打磨大脑智慧的磨刀石而已。刀要先磨好,然后再去砍柴。

四、如何判断一个人是否通过“涌现时刻”?

没有通过“涌现时刻”的人总在回忆往昔和做重复性遗传活动。很多人大学毕业之后读书就很少了。他们可以是口齿伶俐、反应机敏,但知识杂七杂八塞满了他们的脑袋却没有融会贯通,所以支离破碎知识似乎方方面面什么都懂一些,知识没有脉络不成体系,所以他们主动讲不出来。饭桌上有人在高谈阔论,他们就不屑的表示“其实这我也知道”,你让他们先讲他们是讲不出来的。这些人聚会主要是在回忆共同的往昔,这对他们来说很有意思,因为他们就只能谈这些,已经重复了无数次依然乐此不疲。

我见过一些小姐姐一副好皮囊但是脑袋空空,她们见面也是一起回忆往昔、回忆今天上午逛街的所见所闻,几个人一起反刍“大家的历史共同事件”,一辈子乐此不疲。大家聚会就聊明星八卦、刷剧、打游戏或者唱卡拉OK,周末有空就是做重复性遗传活动——逛街、爬山、逛菜市场、给花草浇水打理。

通过“涌现时刻”的人不喜欢做回忆往昔和重复性遗传活动。他们见面就喜欢谈谈历史新观点、聊最新的科技趋势、谈地缘政治新格局、说宏观经济和微观经济的新趋势、甚至聊脑科学和遗传基因的最新进展,总之就是聊最近脑子里“涌现”的新知识和新想法。我认为这样的朋友结交越多越好。

孔子也这么认为:益者三友,友直、友亮、友多闻。

“友亮”的就是通过“涌现时刻”的朋友。

引文:

1、《涌现 / Emergence》https://zhuanlan.zhihu.com/p/625300269#:~:text=涌现%20(英语:emergence)或称%20创发%20、%20突现%20、%20呈展%20、,理论中起着核心作用%E3%80%82%20例如,%20生物学%20中的%20生命%20现象是%20化学%20的一个涌现%E3%80%82

2、《量变引起质变:聊聊大模型中的“涌现”现象》 https://zhuanlan.zhihu.com/p/615135292

通宝推:wlr,林三,小泽珍珠,jent,exprade,夜如何其,唐家山,川普,大眼,大眼,大眼,
家园 有意思的讨论

读书如果要有用,那么大数量,涉猎广以及精选书目这三者缺一不可。

这样读书就很难以兴趣为指引,只能靠功利驱动。

但是如果是以功利为目的话,大量读书以外的活动都能更直接有效的达到目标,不必非读书不可。

我个人觉得读书还是顺其自然就好,能吸收多少是多少,强扭的瓜不甜。

家园 为什么读书见仁见智。

涌现时刻之后读书就像开燃油车一定会经常去加油站。

涌现时刻之后的读书活动能产生巨大的收益,然后这个人就自然会养成爱读书的人生习惯——你越是跑得里程多,你就越是要经常去加油站。你越是经常去加油站加油,你跑得里程就越是多。

涌现时刻时候的人,爱读书就是顺其自然。哈哈

家园 读书当然重要,但更重要的其实还是书背后的人

以及人的思想。

所以,包含理论和情感的书一般来说是用处最大的,历史类的书籍如果只有简单历史记录则价值也相对较小。而技艺类的书价值相对最小,比如你不能通过看书就成为钢琴师。

另外本人对大模型是否真的有”涌现“表示怀疑。涌现通常指一个系统出现了不能用原系统的子系统解释的现象,而虽然大模型学习用的数据量是有限的,但它的问题空间本来就是所有的人类语言组成的无限空间,很难说哪些是”涌现“出来的。举个简单的例子:

学习数据中有一条:小明的爸爸是大明。

那么系统可以合理地得出下面的结论:小明的妈妈妈是大红,大红的丈夫是大明。

但实际上”大红“这个人很可能是不存在的,然而上面这个结论在逻辑上是正确的。实际上把”大红“替换成任何名字在逻辑上都是正确的。但看到”大红“出现并不意味着它就是”涌现“出来的,实际仍然是”前提包含了结论“。所以chatGPT很多时候真的是在”一本正经的胡说八道“。

举个例子:前不久美国有个律师打官司用了chatGPT,然而法官发现律师给出的6个案例竟然都是虚构的(chatGPT还假模假式的给出了引用)。

GPT-4考90分全假!30年资深律师用ChatGPT打官司,6个虚假案例成笑柄

家园 很不错的探讨,只强调一点

chatgpt与广义的LLM到现在除了单纯蛮力算力之外,真正让人眼睛一亮的地方是数据的强调,小模型与小算力,但是数据好同样可以得到超一流的表现,模型技术反而没有什么护城河,这是两几个月的反馈。

算力与芯片似乎是差距,各种华为封锁都是新闻热点,但是真正的差距,这里要强调是数据,这个才是硬伤,但也是依赖大量人工的地方,没有捷径,人力为胜,不过指导思想是有一说一,这个比人力优势还难,再推就推到文化了。

中国人够聪明够卷,就是太TM急功近利,什么事都是耽误在这个没耐心没长性上,没长性基础上的各种总结抄近道都是扯谈,除非上面有人,华尔街有人。话说到此为止。

家园 可惜我书读的还是少。

沉迷于浅浮的事物,忙碌奔波。

我本来是该能打通那堵墙的。

家园 涌现其实就是太极图模型里的转势

并不是所有人都会涌现,也不是所有的量变就一定质变,而是需要有融会贯通的过程。

全看树展主题 · 分页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河