大约两年前,根据中国古老的八卦二进制系统和现代镜像学说,我开发编制了新型的基因密码表。它的基本原理是:古典镜像学说认为,数值2的镜像值是(-2),零(0)的镜像值还是零(0)。而在八卦系统里,数值0的镜像值是1(反之亦然,譬如,1的镜像值是0而不是(-1))。如此,一个数值的镜像值如何,取决于维度。譬如,三维数值2镜像值是5、即:010的镜像值是101;而三维数值零(000)的镜像值是7(111)、四维数值零(0000)的镜像值是15(1111),等等。
把该二进制镜像数值系统纳入基因密码ACGT系统、根据各密码势能从弱到强的基因对排列,就有:
其中,A:二进制数值00(十进制0);其镜像即基因对为T:二进制数值11(十进制3)。
同理,C:二进制数值01(十进制1);其镜像即基因对位G:二进制数值10(十进制2)。
据美国卫生部新冠病毒基因库发布的统计,截止2021-02-20,新冠病毒基因突变数量最高者为【C>T】和【A>G】,它们的共同点是突变前后的数值差都是【2】(10),即:
突变【C>T】:3(11)-1(01)=2(10)、
突变【A>G】:2(10)-0(00)=2(10)。
这个正值或许就是病毒突变导致能量变化和导致传播力增强的一个代表性数值标识。
该二进制镜像基因密码排列及其功能,与中国古代的【阴阳五行】思路完全一致。图示如下:
其基因成对可为阴阳五行的【相冲】、其突变可为【相生】;相生相冲逆行者为阴阳镜像。譬如,若把A和G对应八卦的【阴】,那么,C和T就对应【阳】。如此,C>T突变为阳、而T>C突变为阴;它们的势能变化数值可能一样,但功能方向相反,因而,表现为同能量数值的传播力和破坏力的不同。
根据以上基本框架,可以获得新的基因密码表(附后)及每个密码子的赋值,即:
AAA可表达为:00 00 00,十进制为0,
AAC可表达为:00 00 01,十进制为1,
AAG可表达为:00 00 10,十进制为2,
AAT可表达为:00 00 11,十进制为3,
ATT可表达为:00 11 11,十进制为15;
CAA可表达为:01 00 00,十进制为16,
CTT可表达为:01 11 11,十进制为31;
GAA可表达为:10 00 00,十进制为32,
GTT可表达为:10 11 11,十进制为47;
TAA可表达为:11 00 00,十进制为48,
TTT可表达为:11 11 11,十进制为63。
这样,每个基因突变就可表达为:Allele-Gap (Ref, Alt)=Alt(value)-Ref(value),即:
等位差(Ref,Alt)=Alt – Ref。
其中,Ref为原本基因密码,Alt为突变后基因密码;它们对应的赋值的数值差为等位差。
举例:发生在英国的新冠病毒S-基因的突变中,有一个是:A23063T、N501Y,密码子表达为:AAC>TAC。见上,AAC的数值为1(000001)、TAC的数值为49(110001),其等位差为49-1=48,记录表达为:【N501Y:48(1,49)】。
同理,发生在英国的B.1.1.7.的各个突变都可用二进制镜像数值表达,譬如:
简析:
S-基因的突变A570D和突变P681H的等差值都是(-4),然而,它们的二进制数位不同,前者是(37,33)而后者是(21,27);鉴于前者密码子表达为更强势能,故而前者的(-4)表达的是更强的负能量功能的获得。综合看,该S-基因突变等位差的合计为60、属正能量功能获得。这或许可以看作该突变增强了病毒的传播力。它们的二进制标识可用来作为计算机芯片设计参考。
值得特殊关照的是ORF1ab的突变。它有两个等差值相同但互为镜像的突变:T761I【8(5,13)】和I2230T【-8(13,5)】。两者的数字相同为8、但正负数值不是简单的【互相抵消】,而可能是在转录复制中【左右夹攻】地突破受体ACE2的互补防御功能、为突变A1708D【-4(37,33)】能更少能量消耗地实行侵入和破坏的功能而提供条件。
同理对其它突变做出二进制镜像的分析。由此可得到该B.1.1.7.的基因突变总分为100,应该属于较为明显的功能获得之类的突变,表现为较为明显的传播力、破坏力和适应性的增强。
根据前述二进制密码表赋值,可以建立一个坐标,Ref和Alt分别为X和Y轴,等差值为Z轴。这样,上述突变的图景就可一目了然。譬如:
一目了然:突变A570D和突变P681H等位差相同但数位不同、表达的是势能不同。同理,突变T761I和突变I2230T的等位差同数反向,但势能不同因而不是【彼此抵消】。
实际上,鉴于密码子有64个,如此,基于二进制镜像的等位差坐标就可覆盖所有突变可能(见附后坐标图示),即:64*64=4096个不同势能的突变。换句话说,所有突变都可用坐标数位赋予的数值表达,即前述的方式 allele-gap(Ref, Alt)来表达。譬如,随机拿出坐标赋值及其表达的突变:
5(2,7) = AAG>ACT,-18(57,39)=TGC>GCT,63(0,63)=AAA>TTT;
5(22,27)=CCG>CGT,-18(22,4)=CCG>ACA,-63(63,0)=TTT>AAA,
进一步细分:每个密码子有三个单个基因,也可用坐标赋值表达,只是需要增加维度。譬如:
5(2,7) = AAG>ACT中的【AAT】有两个【A】和【ACT】中有一个A,可分别表达为:
5(2,7,0,0):【AAG】的首个A;新维度首个0为Ref(突变前),第二个0表示密码子首个基因。
5(2,7,0,1):【AAG】的第二个A;新维度首个0为Ref(突变前),1表示密码子第二个基因。
5(2,7,0,2):【AAG】的G;新维度首个0为Ref(突变前),2表示密码子第三个基因。
同理:
5(2,7,1,0):【ACT】的A;新维度1为Alt(突变后),之后的0表示密码子首个基因。
每个密码子有三个基因,如是,基于二进制镜像的密码子的单个基因突变,就有(64*3)^2=36,864个不同突变可能。譬如,【-31(37,6,0,2)】和【-31(37,6,1,1)】,分别表示突变【GCC>ACG】的突变前密码子的第三个基因C和突变后密码子的第二个基因C,都是【C】但数位不同即势能不同。
这样,用数值替代字母符号 Ref>Alt,更便于用计算机做观察、统计和分析。若能与量子计算结合(譬如用量子比特表达上述二进制镜像坐标表达的突变等位差),那么,基因学观察统计分析就可获得空前发展。当然,鉴于基因密码子突变共有4096个可能,也可用更简便的【等位差(0…4095)】(allele-gap(0…4095))来表达各个突变;其代价是不能直接反映镜像突变及其势能功能的状态。
附议:二进制镜像密码表的更多用途。
美国卫生部NIH有个新冠病毒基因突变信息库:
Mutations in SARS-CoV-2 SRA Data
https://www.ncbi.nlm.nih.gov/labs/virus/vssi/#/scov2_snp
截止2021-02-22,该信息库发表的案例有454,464个;按基因密码子出现事件频率计共有4777个。以此原始数据为根据,按前述二进制镜像密码子表格记录,可得到各个密码子在突变中的出现频率比例,
并可得到单个基础基因的突变前后出现频率的合计得分,图示如下:
左图为八卦二进制镜像方式的密码子各基础基因的突变出现频率比例,数字1、2和3分别为第一、第二和第三个基础基因。右图为各基础基因出现频率的合计得分。
可以看到,基础基因C和G的突变频率得分明显较低,说明它们处于较为稳定的状态,或说它们具有强化适应性而使得病毒保持稳定的功能。而A和T的突变频率得分明显较高,说明它们处于较为活跃状态,或说它们具有强化适应性而使得病毒趋向稳定的功能。不少研究论文显示,新冠病毒突变中,特别高频的就是C>T和A>G,这用上述八卦二进制镜像密码表方法可得到直接表达。
中国大陆军医陈薇团队的新冠疫苗专利技术说明与上述内容完全相符。譬如:
专利编号:CN111218459A。
申请人和注册日期:陈薇等,2020-03-18。
注册单位:中国人民解放军军事科学院军事医学研究院,康希诺生物股份公司。
https://patents.google.com/patent/CN111218459A/en
一种以人复制缺陷腺病毒为载体的重组新型冠状病毒疫苗。
……在此情况下,同时将高频密码子和低频密码子均匀分布于S蛋白基因。同时考虑到提高mRNA中GC含量,有助于增强mRNA的稳定性,我们适当地提高了S蛋白基因的GC含量,并将G、C核苷酸在整个GP基因中尽可能均衡分布。#
该疫苗主要发明人陈薇说,他们的那个疫苗可覆盖新冠病毒的所有已知突变,且在2020年02月26日投入生产。最近,在国内外推广中,中国大陆官方再次说明该疫苗可覆盖所有已知突变。
开发疫苗的前提是拥有相关病毒,覆盖已知突变的条件是拥有足够大规模的和不同的基因突变毒株;按常规,疫苗开发到投入生产需要半年到数年。对比前述美国卫生部发布的新冠病毒基因突变数据看(蛋白变异案例454,464个,同类密码子突变出现合计4,777个),该疫苗投入生产前半年即2019年08月之际,中国大陆拥有不同突变的新冠病毒毒株至少近10万个,否则,不可能覆盖所有已知突变、且难以获得C和G两个基础基因含量及其分布可增强病毒基因稳定性的信息并投入疫苗开发。然而,当时,中国还没爆发足够大规模的疫情来提供足够规模的病毒基因样本;不过,在实验室人工条件下,那完全可以做到。
注:军医陈薇的启示。
中国军医陈薇关于他们疫苗设计中的基础基因CG出现频率及其数量和均衡分布,提供了独特角度来观察新冠病毒来源、甚至可说明那是来自实验室人工合成。下面图表是相关不同样本的S-基因的基础基因出现频率的比对:
其中,
NC-45512 是国际学界通用的和来自武汉疫情初期病号的病毒的基础样本。
CW-PATENT是军医陈薇团队用基因编辑技术开发的新冠疫苗。
WIV1是武汉实验室石正丽团队与美国合作者达萨克等人合作开发的人工嵌合体新冠病毒系列之一。
RaTG13是云南蝙蝠携带病毒,据中国武汉实验室说,因相似度96%而成为新冠病毒来源。
Bat Yunnan-2012/2014分别为RaTG13前后一年即2012和2014年采集的云南蝙蝠携带病毒样本。
可看到,2012/2014年采集的蝙蝠病毒样本的CG基础基因出现频率和长度与其它样本之间有明显差异;若RaTG13来自自然界,那么,它应该与同一地点和前后相差不过一年的云南蝙蝠病毒彼此具有高度相似,可却没有。同时,其它几个样本则是频率和长度都彼此高度相似(而基因序列更新版比对的多出15BP的变异序列几乎完全一样),如此在不同生命体、不同时间地点发生高度一致的基因变异的故事,在自然界随机变异中是不会发生的。
那说明,跟疫苗来自人工合成一样,WIV1和RaTG13也是来自人工合成嵌合体。鉴于RaTG13携带病毒不传人而WIV1可直接传人,由此可见,导致本次疫情的病毒元凶就是WIV1新冠病毒系列产品。实际上,五年前,即2016年三月,美国国家科学院刊物就发文警告说,人工合成嵌合体WIV1新冠病毒可直接传人而不需要中间宿主,因而,防治不力,就可导致全球范围的规模疫情和严重经济损失、乃至改变现有生活方式。如今,该警告成为全球面临的严酷现实。(注完)。
预估该病毒突变趋势。
基于以上数据做进一步考察,可预估该病毒突变趋势。譬如,假设上述数据中的各个基础基因再次发生A>G和C>T的等位基因突变,利用前述等位差公式计算,得到下面图表:
图表: SARS-2 密码子突变的趋势
很明显,从活跃程度看,密码子的第一基础基因幅度最低、第三基础基因的幅度最高。C>T突变比A>G突变要活跃得多,且C>T突变等位差多为正值、A>G突变等位差多为负值,C>T突变等位差的绝对值明显大于A>G。这些信息说明,新冠病毒突变过程远没结束,且可能还要延续大约一年左右;其中,C>T突变已经担当了并还将继续担当主要角色。
值得注意的是,在中国大陆,基因编辑非常流行,且国家管理框架说基因编辑没有伦理问题和安全问题、没外来基因就可按非基改的常规育种管理。在那种条件下,不仅基因编辑婴儿问世了,且许多基因编辑食品作物以常规育种名义铺开上市已经多年。如此,在中国大陆,搞搞基因编辑病毒试验,不过是【小菜一碟】;陈薇团队早就有足够规模的病毒突变样本也不是新鲜事。
人类受体ACE2基因组突变也需要足够关注。下面是美国卫生部于2021-03-07颁布的人类受体基因突变数据库的标题和链接:
ACE2, Gene ID: 59272, updated on 7-Mar-2021,
https://www.ncbi.nlm.nih.gov/gene/59272/ ,
Go to Variation Viewer for ACE2 variants,
https://www.ncbi.nlm.nih.gov/variation/view/?assm=GCF_000001405.25&q=ACE2[gene]
用前述二进制镜像密码子表格方法整理该数据,可得到密码子各基础基因出现频率得分:
A: Ref:10; Alt:06; total score:16;
C: Ref:10; Alt:03; total score:13;
G: Ref:07; Alt:11; total score:18;
T: Ref:02; Alt:09; total score:11.
按前述预测方法,可得到受体ACE2突变趋势估算图景,如下:
图表:人类受体ACE2基因突变趋势。
该预测说明,C>T and A>G 两个突变还是活跃、但不如病毒突变那么活跃。总得分说明,基础基因展示的是彼此平衡或彼此镜像的变异形态(-6和6、-14和14)。
该人类ACE2 突变数据库规模很小,但足以说明它的变异很有意义,然而,到目前,还没有足够的研究来说明它的突变和病毒突变的互动关系及其成因到底如何。
就中国大陆中科院等相关开发者论文所说,在他们多年开发的品种的基因变异中,C>T突变出现频率明显最高,且往往是他们搞开发的一个主要靶子。无独有偶,巴西等国家学界调研统计说明,在基因编辑作业的很容易出现脱靶、而脱靶出现频率最高者就是C>T等位基因突变。
以上各领域出现的高频C>T突变吻合现象,无疑,提出了基因编辑工具及其CAS蛋白残留的潜在功能和作用方面的安全问题。换句话说,要有效防治疫情扩散和复发,必须考虑严管严限基因编辑作业,譬如,除了严禁用于人类遗传,还应考虑严禁其用于食品作物和饲料作物。
参考阅读:
A Total Binary Mirror Image Codon Table---- for the DNA Day.
By Zhiyan-Le, 2019, 04-16.
https://sites.google.com/site/zhiyanpage2/2019/new-issues/zy9417-tbm-eng
表一:基于二进制镜像的基因密码子表格:
表二:基于二进制镜像的基因突变密码子等位差坐标及赋值。
注:表格中红色数值为负值。
注:正负绝对值相等者为镜像。譬如,5 和 -5 表示势能相同但功能方向相反、并非互相抵消。