西西河

主题:【原创】一次生物学主题讨论:分赃,个人主义者,和从整体出发 -- 柠檬籽儿

共:💬13 🌺11 新:
全看分页树展 · 主题
家园 【原创】一次生物学主题讨论:分赃,个人主义者,和从整体出发

柠檬籽儿按:

今天整理文件夹,又找到了两年前我们讨论组的导言和总结报告。两年过去了,我们重新审视那时的观点,感觉尽管不是很成熟,但是还是很好玩的。

【导言】

讨论主题:分赃,个人主义者,和从整体出发――我们如何向生命学科引入系统的观点和分析方法

召集人:NewSword

Section执委:Toptip

地点:

时间:

预备知识与摘要:

耀东、富贵、和吉仔是三合会铜锣湾分会下的一个少年黑帮,耀东是大哥。耀东做事有原则,不做白粉仔,只做盗版光盘的生意。尽管是出来混的,耀东也喜欢有空读读书。在不砍人的时候,耀东在学习数学。原因是,数学是要用的。尽管大家义气深重,平时总是相约着去占地盘、看场子,然而每月分红的时候,富贵和吉仔两个家伙却总是唧唧歪歪。WHY?不患寡而患不均也!尽管耀东哥记录了每次买卖的详细收入,但是却发现分配起来真的很烦哩!“干!”耀东下定决心在下个月底到来之前,解决这个问题,要不然组织真有散的那一天。

出更的排期和收入是这样

耀东 富贵 吉仔 油麻地 旺脚

1 1 1 100 100

1 1 0 8 1

1 0 1 28 80

0 1 1 1 17

1 0 0 13 16

0 1 0 1 9

0 0 1 2 24

0 0 0 0 0

问题是,怎么分???

……

实验生物学领域中探索的人们往往在身旁的人大谈网络啊系统啊的时候心里颇不以为然。这并非是他们的错,他们也重视这些fashion的概念,然而这些单词就像滴油漂浮在水面,任人怎么搅拌,也不肯再向心里渗透丝毫半点。因为这些在他们的生活中毫无用处。Tom陈就是这样,昨天他在报纸上读到三合会黑帮因分赃不均街头混战时,摇头叹气之余不禁仔细看了看警方收缴的这张分配单,让他感到兴奋的是,最近他在做的一件工作就是通过实验得到这样的一张表格(regulatory DNA顺式单元的组合对基因表达的影响,并且在不同细胞或组织中,这些单元又怎样影响了基因的表达?)。“是呀!这怎么好分配呢?”显然,仔细观察这些数据,Tom发现这三个小孩合作赚钱之间存在着非线性的关系。是谁讲过黑道兄弟们都是个人主义者来着?是啊,他们注重的就是怎么分钱,这好象体现了他们在团伙中的价值。可是,Tom细细想来,我不也是在努力地做实验出数据为这些cis-modules的个体价值打分么?先不去想这种个人至上对否,当下的问题是,怎么打分?

……

三合会分会老大强哥最近不爽。手下几个小弟为分钱,整天在门外喊“芥兰劈芥兰,劈死无相干”。象什么样子,传到新X安那里还混个P呀。耀东也不见了,听说念什么远程教育了。“干!乌鸦擦白灰呀!”强哥想,要是能搞掂几个仔的分配到也是件不错的事,至少几个不会整天打来打去,能正经做事。但是,问题的关键是,为什么油麻地和旺脚的收入有不一样哩?如果几个仔没有吃黑钱,强哥到真想知道几个小子之间到底形成了一种什么关系,而且,在不同的地方,这些关系又怎样影响了生意?

……

【讨论组九月八日报告】

讨论主题:分赃,个人主义者,和从整体出发――我们如何向生命学科引入系统的观点和分析方法

主题召集人:NewSword

Section执委:Toptip

如果我们面临的一个研究对象太复杂,那么我们就拆开它,“拆”这个过程非常关键,如果你的“拆”是可逆的,那么分别研究拆后获得的单元特性并收集信息,这些信息可以逆推回整体,并作出关于整体的预测。然而,面对一个未曾了解的研究对象,获得“拆”的信息也是非常困难的。所以通过简单观察获取信息便可以将其拆分为几个较为独立的亚单元结构的研究对象可以说是一个简单系统了。而对于一个复杂系统,内部充满了未知的不确定的动态的相互作用,我们又如何深入了解这个系统的内在运行规律呢?我们了解其内部运行机制的目的在于预测以及改造,这是我们做事的指导思想的核心。那么,预测一个系统的行为,就意味着我们必须在系统的整体水平上来描述系统的整体行为,并能够解释驱动这种行为的直接原因。

其实,在实际的操作中,费劲心思来合理地拆开一个系统的Investigator已经濒临灭绝了,这一方面是因为对研究速度的要求,另一方面也是因为具有指导意义的信息实在太少,不如一下砸碎了事。

生物学中可以操作的系统研究一般集中于genetic regulatory networks,和signal transduction networks。要想在这些领域里从还原论中脱身,首先一步是研究对象从 单个的蛋白或DNA单元向蛋白之间的interactions或cis-modular interactions转变。也就是说,从点的理解,到线的理解。研究重点从某种蛋白参与XX生理功能,到某种关系决定了XX生命层次的具体行为。尽管举步维艰,但更加贴近自然。

有同学也有不解,因为仿佛还原观点尽管简单,但产生一个“合理”解释的效率高,并且在整个还原性理解内部是“自恰”的。然而,抛开这些好处不提,其最大的缺点就是没用。从这些对实验数据的解释得出的指导进一步实验的方针总是不能有效继续下去,不是什么地方错了,就是发现未来工作量趋于无限大。

在理解“拆”的作用时,三合会的例子是一个非常典型的“容易通过观察就分解”的系统。你看老大分配的时候,总是能够正确的将每个人完整地保存在某种组合之下,而不会只分一条腿或一只耳朵什么di。这说明,我在举例的时候就做了手脚,使大家潜意识里觉得系统的正确拆分是理所当然的。然而,在更加复杂的系统里,如何定义并评价一个单元对系统输出所做的贡献?并且这种评价机制(比如讨论中提到的Shapley n人合作分配原则)是合理的吗?在生物学研究中,蛋白质之间信号的传递可能是比较容易正确拆分吧?因为尽管是复合物与复合物之间的对话和关系决定了信号的传输,然而,蛋白的分布毕竟是离散的,不至于将不同蛋白的序列也混淆掉。然而,genetic regulatory network就没有这么幸运了,分析一条Eukaryotic Class II Promoter时大家总会发现,潜在的TF结合位点在DNA上的分布是那么地令人头痛!一簇一簇的分布,位点与位点重叠,真个是你中有我,我中有你,达到水乳交融的军民关系! (有谁想试着拆拆看?)那么如何降低研究的复杂性?如果不用“砸”的办法,这似乎就是个死结了…可是如果有用到“砸”碎方法,那么如何考量其中牵掣重重的复杂关系?如何透过这些不自然的处理来获取相互作用的变化信息?

如果试图这样钻进复杂的蛛网般关系回路里,真恐怕要有超人的能力,要具备有惊人的计算统筹规划合并能力的高速处理器一样的脑子,不过即便这样恐怕还是不够,因为这里牵掣到的绝对是无穷多个NP问题。那么换一种角度,我只要理解所有关系的集合在“砸”过程中发生如何的变化就好。这样理解的结果,我同样可以得知整个调控网络的内部运转结构,并且获得的整体信息可以支持我们进行顺式控制的人工设计。

在本次讨论组活动中,大家主要就如何对所研究题目进行整体性分析,以及如何系统的理解研究对象进行了激烈的讨论。NewSword同时举出了两个生物学研究中的有代表性的例子来说明不同的思路(希望获取什么层次的信息)指导下,采用的不同数据处理方法所获得的截然不同的结果。并且基于这些例子,我们现在已经可以看到谈论系统/网络/综合/涌现已经不再是在哲学高度空洞地泛泛而谈,并且,基于这些思想,我们已经触及到了更实际的层面―控制回路的设计。

问题是,

[1]如果不引进数学方法,能否系统地理解生物学系统?

[2]如何引入数学方法?

[3]统计学算法建模和压缩算法建模那一种更加适用于生物学研究?

[4]基于整体地理解生物学系统,如何进行实验设计以及数据处理?

元宝推荐:不爱吱声,
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河