-- 作者:luantan100
-- 发布时间:4/25/2005 11:04:00 PM
--
《中华新医学》2005,6(7):832-834 基因四进位制与广义信息进位制定律 邓 宇 100016 清华大学第一附属医院 当我们把事和物同信息、符号联系起来时,碰到的信息会越来越大,宛如原子弹级的信息大爆炸。如果在这种联系过程中,只用我们的手指头,那么数到“十”这个数,我们也就悬崖到头,无法再数下去了,即使象古代墨西哥尤里卡坦的玛雅人把脚趾也用上,也只不过就能数到二十。当我们把生命、基因同信息联系起来时,碰到的问题就会更大。我们显然知道,数是可以从0,1,…无穷无尽地写下去的,因此,我们必须把数的概念从实物的世界中解放出来,抽象地研究如何表示它们,如何对它们进行运算——这就是数学这样的学科。这是从小到大、从简单到复杂,从局部到整体的与生命科学相比而言,相对容易的发现、发明的科学革命历史进程。 生命、基因正相反,他是从巨到大,从大还没有到小,…!从复杂的混沌,没能到简单的非线性(如,再简单不过的一元的非线性决定论动力学迭代式,生成、输出难料的复杂混沌分形的乱果(表面化的非决定论、假随机的结果));从无穷无尽向 …,2,1,0的倒序写下去——近代生命科学,基因学科的时髦主流——实验的生物信息学。现在,正是我们必须把生命、基因的概念从实物的、归纳的另一个世界中解放革命出来,抽象地、理论地研究它们,即如何表示它们,如何对它们进行运算,想象、预测,开拓他们的时候了。这也有赖广义信息的守恒定律、信息的化学变化、信息的运算律,信息是事物现象属性标识的集合——信息新实质定义[1~13]等新广义信息论的前瞻铺垫。这就是已不算新鲜但还稚嫩的理论生物学,及新生的理论生命信息学——演绎的广义基因信息论,广义抽象,基因的数学、符号学、信息学。从0,1,…;A,G,T,C向AA,AG,…,AAA,AAG,…,AAA…A(n个),CCC…C(n位),类似无穷无尽经典数学的发现历程前行。 1 基因进位制 基因四进制 基因组份的基本单元碱基,核酸有4个:A,G,T,C。以他们为基,相当于1,2,3,4或A,B,C,D的4进位制。这4个核酸组成了他们的“个位”信息符——第1位,n=1。这里特别关注碱基的纵向长单链基因字符系的排布规律,是我们理论生物信息论的突破口之一,这是与已很明确的横向短碱基对AT,GC的重要区别。 当基因信息符或语义元超过4个,第5个时,逢4进一,进位到第2位(相当于十进制的十位):有AA,AG,AT,AC;GA,GG,…,CC。4×4=16个两两的排列组合,两位的基因核酸,即基因组在第2位有16个可能的基因符的排列组合。基因4进制的头两位共有4+16=20个信息符,n=2。 当基因信息符超过20个时,接着“逢四进一”向第三位进位:AAA,AAG,…,CCC。三位基因核酸共有4×4×4=64个组员,n=3。…。 在第4位,有AAAA,AAAG,AAAT,AAAC,AAGA,…,GAAA,…,CCCT,CCCC。第4位基因小组有44=256个核酸字符组成。 在第n位时,有4n个位元AA…A,AA…G,…,T…A…G…C,CC…C └ n ┘ └ n ┘ └──n──┘└n个┘ └──────── 4n 个 ────────┘ 2 广义信息进位制 2.1符号进位制——k进制 固定一种符号序列,命或定义其为A,B,C,…,K,有k个符号,并构成符号系的第1位。“逢k进一”,构造出,第2位,第3位,….,第n位。与数系的进位制类似,有符号二进位制,三进制,四进制,五进制(五行)等。符号的二进制有序列,个位A,B。三进制:A,B,C系列等(基因纵、横的综合)。 2.2 语义进位制 若有基本语义元a1,a2,a3,…,ai,…ak,k个。则有语义元k阶进位制,“逢k进1位”,从第一位到第N位有语义序列 a1,a2,a3,…,ai,…ak,a1a1, a1a2,…,aiaj,…,akak, a1a1a1,…, akak ak,… └─第1位─┘ └── 第2位 ──┘└─第3位─┘ … 2.3 数系进位制 最常见和常用,如自然数、实数等数学数系中的二进制、十进制、十二进制、十六进制、六十进制,还有效率高的三进制等,大家很熟悉,不一一列举了。 2.4 基因进位制 即基因的四个基本单元A,G,T,C,构造出基因的四进制Quaternary system。物理进位,化学进位制。上述进位制多是物理性的,类似数系的进位制——广义符号进位制,多是简单的加法样运算或物理合成,合并。广义语义进位制可以有化学样的语义合成“化合”。 2.5 广义信息进位制 包括广义语义进位制、广义符号进位制等。有了信息进位制对“语义秩序定量法”也带来益处。符号序列可以有多种排列组合方式,固定一种或命或定义符号序列A1,A2,A3,…,AK,有k个基,则广义进位制,或信息k进位制,有:A1,A2,…,AK,A1A1, A1A2,…,AK AK,…,A1A2…AK(n位),… 一般来说,如果采用k进位制,就在下角处注k.例如AGC(k)表示AGC是在k进位制中的数符。规则律:在k进位制中,一定有:1.它有k个不同的信息(字符)基符号,即:A1,A2,A3,…,AK;2.它是“逢k进一”,即每位计满k后向高位进一,一个k进制正整符号L总可以写成 L=An×kn-1+An-1×kn-2+…+A1×k+A0。例如ATGCGT(4)=A×45+T×44+G×43+C×42+G×4+T×40。 一个k进位制的符号就是各位符号与k的方幂的乘积的和,其中幂指数等于相差符号所在位数(从右往左数)减1。 数学数系的进位制,与符号,基因的进位制正是“信息守恒定律[1,2,6,7]”的体现转换。就连原来不守恒的paradox霍金量子旧黑洞论,也被修正的霍金新黑洞实质“信息守恒”自己更正,黑洞信息都守恒,广义信息更守恒、不灭。 正象《中国新闻周刊》文章所说:“(旧的霍金黑洞论)这种理论从诞生之初就遇到了麻烦:它同很多科学家坚持的“信息守恒定律”互为矛盾。这一度被人们称为“黑洞悖论””。 “如同19世纪的科学家断定了能量守恒定律一样,20世纪的许多科学家提出了信息守恒一说——假如这个说法成立,那么“信息守恒定律”无疑将成为科学界最为重要的定律,也许比物质、能量守恒定律的意义更为深远。霍金的黑洞理论引起的激烈争执就是“信息”在黑洞中是否能够保存、守恒”。但他:Hawking不知是否已经意识到。在他的黑洞之外的“生命科学”的黑洞中,信息也正被撕碎,(被整理)被释放出:新生命的生物信息(理论),to be preserved,理论DAN信息论正在顽强坚韧地破土、发芽。自然科学、社会学,生命科学,人本文化的“信息守恒定律”——新的广义信息论已经启动[8~13]。 基因进位制的创立,为基因之迷的解惑提供了新的思路和方向,扩展开拓了生命科学,基因、蛋白组新领域。它是生命信息论的新思维,揭示基因奥秘的革命。它可以对基因组进行新的计量,新前景,新演绎。是解开基因编码迷团,理论基因符、基因词、基因句、基因段、…基因序列新途径的突破,新的期待。是非共识、预见外、计划外、不跟风的基础研究,“源头创新”,原始创造,开启了方便之门,如基因碱基序列分布轨迹的正弦、余弦的三角函数周期拟合等(将发表)。Gene bank要忙了,新活已经来了——理论基因学、理论生物信息论! 参考文献 1. 邓宇,生物-非生物界的信息守恒律与双大超循环世界图景,数理医药学杂志,2000,13(1):88~89 2. 邓宇,信息守恒的证明,中华医药杂志,2004, 4(6):36 3. 邓宇,量子论新诠释的数字实验模拟,中华医学研究,2004,64(3):30~31 4. 邓宇,信息的化学变化,中华医药杂志,2004,4(6):576 5. 邓宇,信息的数理新定义与广义信息运算,中华中西医学杂志,2004,2(7):115~116 6. 邓宇,信息守恒律与信息实质定义,中华医学荟萃,2003,3(4):1~2 7. 邓宇,信息-能量-物质的转换大守恒大统一,中华中西医学杂志,2004,2(9):116~118 8. 邓宇,被遗忘的中医哲学观第三元素:相似观分形论,中华医学荟萃杂志,2003,3(8):78~80 9. 邓宇,生命起源进化的高概率事件,数理医药学杂志,2001,14(5):446~447 10. 邓宇,“细胞群-自身调节-体液-神经协同”的经络实质模型:细胞社会学经络,中华医药学杂志,2003,2(8):23~25 11. 邓宇,生物信号转导的数理化质变模型,中华医药学杂志,2003,2(4):97~99 12. 邓宇,中医气的现代实质与气的定量:气集、气元,数理医药学杂志,2003,16(4):346~347 13. 邓宇,医院盈亏分析两点法的特点与对策,中华现代医院管理杂志,2004,2(5):64~65
|