当体察万物,格物致知之时,你心中是否感悟到大自然无处不在的秩序感?
浩瀚群星,季节往复,日落日出,云卷云舒。手掌上的纹理,落叶的叶脉,飘舞的雪花,课本上的原子分子结构,物种之树的分叉,甚至身边每个人的面孔上,我们都看到了某种同义反复,出现在不同的层级与现象上。这给了我们深沉的秩序感,因此,大自然既熟悉又陌生。
在透彻地理解达尔文演化论之后,我最大胆的猜想就是:
有差异的复制,是演化的本源,是万物的源头。
小到大分子、DNA、细胞,大到宇宙的产生,都与此有关。
圈量子引力论创始人 李·斯莫林 认为:
那些被称为黑洞的奇点实际上是子代宇宙的诞生地,它们的基本物理常数较之其亲代宇宙中的物理常数,会随机出现轻微的差别。所以,根据斯莫林的假说,宇宙的繁殖,既有复制也有突变,这正是达尔文演化论必须具备的两个根本特征。如果某个宇宙的物理常数恰好可以促进黑洞的发生发展,那么它就会因此拥有更多的后代,而这些后代还会有更多的后代,以此类推。
无疑,这就是演化。但是在这个假说中,不存在会收割宇宙生命的死神。宇宙的起始与终结都自有其时,不过有些宇宙会拥有更多后代。
根据这一观点,我们现在生活在一个拥有黑洞的宇宙中,这并非纯粹巧合,也非绝对的逻辑必然。它更像是有条件的渐进必然,就像我们在很多演化过程的描述中都能找到的那样。
简而言之,斯莫林认为在制造黑洞 — 也就是繁殖子宇宙 — 的比赛中,我们所在的宇宙应该会表现得非常优秀,这也是为什么我们会身处其中的原因,因为只有这一类宇宙才会生生不息,世代持续,直到我们自己出现在其中。
由是观之,演化这个机制,揭示了大自然既复杂又有序的源头。
然而,此刻我们探讨演化论,并不是为了仅仅得到这些知识,而是为了师法造化,获得能改变自己看待世界之方式的当下上手的工具,我称之为 模型 。前面铺陈了那么多,我们也渐入佳境,接近了这个模型。
首先,我们再仔细推敲一下我在最开始总结的演化之简单公式:
对具有表现功能的数据结构进行有随机性误差的复制。
经过筛选,一些复制品能更好地适应环境。
此处 “具有表现功能的数据结构” 乃是演化之核心,它是演化发生的物质载体。数据的表现功能将在自然选择中被检验,从而决定该数据是否得以存续。没有这些数据及其功能,演化就无处发生,也无法保留演化中获得的点滴进步,它就像我们前面提到的游戏存档文件,它是生命能够从无机物中自举起来的关键。
以软件编程来做类比,“具有表现功能的数据结构” 是指可以作为代码来运行的字符串,这是高级编程语言中都有的功能。
比如,C语言中可以使用 \(System()\)函数来代码的方式运行字符串变量。Python语言中,可以使用 \(eval()\) 或 \(exec()\) 函数来执行。Java语言中,可以使用 \(Complier API\) 来动态编译和执行源代码字符串。
如果以图灵机的视角来看,这是一种 自指 的能力。
生命演化中,由于 “具有表现功能的数据结构” 如此精妙,为了突显之,我从现在开始称之为 算子。
下面我们界定一下算子的含义。
算子的字面意思,是具备计算功能的数据单元。
算子必须同时具备两项本质属性:数据,及其表现功能。
算子是数据。它像字符一样以排列组合来聚集,不同的组合是不同的数据集合。
算子表现出功能。算子的不同的集合体现出不同的能力。这种由数据到能力的映射,是天然发生的,是算子能够成为算子,而不仅仅是数据的关键。
算子的本质能力在于自发地产生变化,它是变化的发生器。产生变化之能力越强大,算子越是合格。
在生命演化中,算子是指遗传物质。遗传物质是生命功能的表达符号。它既能各自能表达为蛋白质,又具备由部分组合成为整体,由简单叠加为复杂的能力,这就像用字符写就诗篇一样。
2017年的一个实验可以说明可以明确说明DNA作为遗传物质所具备的数据本质。科学家将一幅奔驰骏马的照片转化成数字格式,通过基因编辑技术将这些信息注入一个大肠杆菌的DNA分子中。之后,植入该信息的细菌进行了自我繁殖,在复制后的众多新的细菌体内都能找到这幅奔驰骏马照片的数字信息,而且与原始文件令人惊叹的高度一致。
由于DNA的复制需要酶,而这些酶本身的生成也是编码在DNA上的,这就又有了先有鸡还是先有蛋的问题,所以最初的算子应该不是DNA,而是那些可以自我复制的更早的数据载体。
最初的算子可能是原始核糖体,然后是RNA,目前DNA扮演着这个角色。RNA可以自我催化与复制,但是RNA是单链,长度较短,不如DNA稳定和容量大,所以RNA充当了上一代算子的角色。
DNA 和 RNA 与蛋白质的关系是,DNA 可以通过转录过程产生 RNA,RNA 可以通过翻译过程指导蛋白质的合成。这个过程叫做中心法则。
DNA是由多个基因组成的序列。基因本质上是单个蛋白质分子的氨基酸编码及其控制程序,是一队ACGT的字符序列。每个基因中,大约3%的字符描述蛋白质的分子结构,另外的字符基本上是控制蛋白质何时生成、如何组装、如何切换不同组分的编码。蛋白质在构造生物的机体与新陈代谢中发挥着关键作用,不同的蛋白质有完全不同的生理功能。经由蛋白质,基因具备了“表现功能”。
为了简化,算子既是指基因这样的具有表现功能的基本数据单元,也指代它们的集合,比如整个DNA。
基本数据单元及其组合,这二者在大自然中常常难以严格区分。许多基本数据单元都可以再细分为更基本的数据之组合。
DNA可以分为基因,基因可以再分为每三个字符为一组的字符串的集合,这样的三联编码决定了一个氨基酸。自然界中发现了五百多种氨基酸,但是生命中大约只用到其中二十几种氨基酸。因为基因中每个字符有四种选择,所以三联编码可以表达64个类型,绰绰有余,还可以提供启动终止等等控制编码。双联编码只能表达16种类型。在几亿年前的演化历中,曾经有一次从双联编码向三联编码的升级,发生在二叠纪大灭绝的同时,这次升级可谓是天翻地覆。
大自然中的DNA中也许并不是严格地按照基因来区分段落的,控制一种蛋白质的字符可以出现在DNA中多个不连续的位置。DNA像一条长链一样转录为RNA,RNA长链在核糖体中翻译为肽链,肽链会在空间中发生折叠而表现出三维立体结构,此时肽链上原先不同位置的氨基酸由于折叠而聚拢衔接在一起,构成蛋白质分子的空间结构。可以想象DNA是按照序列打印的长条纸片,纸片上的内容是打印好了的,但是纸片需要折叠出形状之后才会有具体的功能。可以说,DNA虽然本身是一条二维长链,干的却是构造三维立体结构的活儿。
所以,基因是为了研究的方便而人为设定的DNA区段,它既是数据,也是数据的组合。
算子也是竞争上岗的,是演化的产物。
地球生命以碳为核心骨架,这本身就是地球环境的一种选择。
碳基分子的活性保证了各种化学反应的可能性。碳原子有四个自由电子,它失去电子与得到电子的能力相当,可以形成非常多样的化合物,比如氨基酸和核酸,其总数远超一千万种。这些化合物为生命机能提供了充分的组合可能性。另外,地球上碳含量充沛,广泛存在于地表环境中。
碳基分子如此丰富,是因为它能形成碳—碳键和碳—氢键。碳与碳之间既能形成单键,也能形成双键和三键,既能成链,也能成环,甚至可以成球,这使得碳骨架在几何空间上几乎可以无限延伸。
其他的四价元素,比如硅、硫、磷等各有特点,但是也有各自的问题。比如硅同氧的结合力很强,能承受几百度高温,在地表环境中过于稳定,不利于生命化学反应的发生。当然,这并非否定了硅基生命的可能性,在全新的组合方式下 — 不以大分子以及化学反应来组合,而以结构与导电性来组合 — 则硅未尝不能成为新的生命根基。集成芯片都是基于硅制造的,它们有可能代表未来的硅基生命。
所以,在自然界中,碳构成了DNA的骨架,成为生命的基底物质。
在DNA出现之前,大自然也曾尝试过不同的方式装配具备表现功能的数据。目前至少有三种关于的生命起源的假说,“化学进化说”、“RNA世界说” 和 “原始核糖体说”。
化学进化说认为,生命起源于原始地球条件下从无机到有机、由简单到复杂的一系列化学过程。在这个过程中,无机物质在能量的作用下,生成了氨基酸、核苷酸等。这些有机物质又进一步组合成了生命物质,如蛋白质和核酸。最后,这些生命物质形成了具有自我复制和新陈代谢能力的原始生命体,如原始细胞。这个说法太笼统,等于什么都没说。
RNA世界说认为,最早的核糖体是基于RNA的。RNA是一种既能携带遗传信息,又能催化反应的分子,因此它可以实现自我复制。后来,RNA进化出了制造氨基酸的能力,具备了功能表达,从而开启了生命的源头。
在2000年左右,以色列女科学家 阿达·约纳特 认为在最开始时,RNA和氨基酸同时存在,它们协作完成了氨基酸的复制。她提出了一个原始核糖体的分子模型,由两条相近的L形RNA组成,分别长60和61个核苷酸。这个大分子结构被称为 “原始的核糖体”,约纳特认为它是生命演化的源头。约纳特因此获得了2009年诺贝尔化学奖。
几年后,科学家们逐渐注意到了一个惊人的事实。在原核生物、真核细胞甚至线粒体中核糖体的核心位置处,都存在一种几乎完全一致的口袋状RNA分子结构,被称为PTC。由转运RNA搭载而来的氨基酸分子在此汇聚,合成为蛋白质。该结构的形状在所有生命物种中都几乎完全相同,这表明该结构是极其重要的。该一致性也暗示了演化的源头所在,即氨基酸装配蛋白质的核糖体工厂。它还保留了最初的构造形式,而它在生命演化的漫长历史中几乎没有变化,它是生命构造的核心装置。
在那四十亿年前,原始核糖体所制造的肽链一定具有某种用处,也就是具备表现功能,否则这种分子机器的持续存在就不具备演化上的优势了。科学家提出了几个假设:也许这些肽能够螯合某些金属离子,防止这些金属离子破坏RNA。或者它可能帮助形成早期的生物分子区室,以将RNA和肽聚集在一起,等等。
那么之后,DNA如何取代RNA成为算子的呢?
DNA是双螺旋大分子,无催化能力,不能自己复制自己,较为稳定,适合长期保存大量信息。RNA是单链,比DNA短,有催化能力,可以自己复制自己,适合临时保存少量信息。从RNA到DNA,有几种可能的演化路径:
RNA演化出一种可以将RNA转化为DNA的酶,这样就可以利用DNA的稳定性,同时保留RNA的催化能力。
RNA演化出一种可以将RNA信息复制到DNA的酶,然后将DNA信息复制回RNA,这样既可以增加信息的保真度,又减少了突变的风险。
RNA演化出一种可以将RNA和DNA链接起来的酶,形成RNA-DNA杂合链,这样就可以结合两者的优点,又避免两者的缺点。
这些机制都需要特定条件才能成立,它们还没有得到实验的验证,只是推测。
我们事后观察,发现大自然会选择具有最多样的表现功能又兼顾稳定性的数据载体,来作为算子。如果某些星球上,由于环境差异,存在着不以DNA作为遗传物质的生命形式,我是不会太意外的。
同理,既然算子本身都可以推陈出新,那么我们也没有必要认定只有一种算子才是合理的。其实,不同的事物在不同的层面上有不同的算子,这是合理的推测。