前言:
此刻同学们对“对应分析方法与什么有关”大约比较关注,同学们都需要学习一些“对应分析方法与什么有关”的相关内容。那么小编在网络上收集了一些对于“对应分析方法与什么有关””的相关知识,希望朋友们能喜欢,我们一起来学习一下吧!在阅读此文前,麻烦各位看官点击一下“关注”,感谢大家的支持。
文 | 林深时见鹿
编辑 | 安珈一
前言
蛋白质编码基因中的大部分氨基酸由一个以上的密码子编码,这些密码子被称为同义密码子。在各种基因组中,同义密码子的使用频率不均匀,同义密码子的使用是物种特异性的。
在某些基因组中,一组密码子被最频繁地用于编码特定的氨基酸,而这种密码子使用偏好在各种生物中存在,从原核生物到单细胞和多细胞真核生物。
突变压力和自然选择被确定为导致SCU偏好的两个主要进化力量。SCU偏好可以归因于各种因素,这些因素因物种而异。在原核生物单细胞生物中,选择性和突变压力共同决定了SCU,而在多细胞真核生物中,转录选择推动密码子使用。
突变压力和自然选择被确定为驱动SCU偏好的两个主要进化力量,在某些真核生物中,SCU偏好和最优密码子的使用常常受到某些未知的选择性力量的影响。研究密码子使用模式和影响其多样性的各种因素,为理解基因组的演化和生物体的环境适应提供了基础。
材料与方法
对完整编码序列进行了检查,以确保在序列开头和结尾处存在适当的起始和终止密码子,以确保其完整性。为避免抽样误差导致统计波动,最终的数据集仅包含具有超过300个核苷酸的序列。
为了通过避免氨基酸组成的影响来对SCU进行归一化,计算了每个信息性密码子的相对SCU,RSCU值被认为与基因长度无关。RSCU值被定义为一个密码子的观察频率与该特定密码子的期望频率的比值,假设所有编码相同氨基酸的同义密码子被等量使用。如果RSCU值大于1,则表示对该特定密码子存在偏好,如果RSCU值接近0,则表示缺乏偏好。
SCUB的程度通常通过有效密码子数来量化,该值与基因长度无关,是基因表达水平的指标。ENC不受氨基酸组成的限制,取值范围为20到61。如果偏好极端,ENC将为20,即只有一个密码子用于编码一个氨基酸,如果所有编码特定氨基酸的同义密码子被等量使用,则ENC将为61,即没有偏好。
如果一个基因的ENC值小于35,则认为偏好较高,如果ENC值超过50,则认为偏好较低。总体和局部的GC组成在排除终止密码子后进行计算。使用GC3来计算预期的ENC值,假设不存在选择。将ENC绘制成GC3的图表,以通过基因沿着预期的ENC曲线的分散来可视化主要进化力量对SCUB的影响。对所选线粒体基因组的所有PCG计算了ENC值和GC3值,并绘制了ENC-vs-GC3图。
使用第一和第二密码子位置的累积GC含量和第三密码子位置的GC组成导出中性性绘图,以了解GC组成对密码子使用的影响。如果回归线的斜率接近0,则突变压力对SCUB的影响较小;如果斜率接近1,则影响较大。
为了检测DNA链中A ≈ T和G ≈ C的偏差,开发了平衡法则2偏差图。在PR2偏差图中,仅绘制了四重简并氨基酸的第三密码子位置。
分析方法与结果
使用卡方检验对一个具有自由度的2×2矩阵进行潜在最优密码子的识别。通过选择在对应分析的第一个轴的左右极端分组的基因的10%,开发了一个2×2矩阵的两个数据集。
在2×2矩阵的第一行中给出了两个数据集中密码子的观察频率,第二行中给出了该密码子的所有同义替代物的总数。显著性水平在P < 0.05处测量。
计算密码子适应性指数以了解分析的线粒体基因组对高表达基因中提及的密码子子集的偏好程度。CAI值的范围从0到1,接近1的值表示较高的密码子使用偏好和基因表达水平。
对RSCU执行对应分析以识别SCU的变化,避免了氨基酸组成的影响。COA将变化分割为一定数量的正交轴。
第一个轴解释了大部分变化,每个后续轴解释的方差逐渐减少。COA将每个CDS视为一个59维向量,每个维度由特定信息性密码子的RSCU值定义。
对RSCU值进行聚类分析,以显示密码子偏好与其他因素之间的关联。在聚类分析中,生成了一个矩阵,其中行和列分别对应于所选物种和同义密码子的汇总RSCU值。使用无加权成对平均聚类法基于RSCU值的变化对所选物种进行分组,距离以欧氏距离表示。
对各种密码子使用指数与其他重要参数之间的所有相关分析使用了非参数Spearman秩相关方法,因为它对两个变量之间的概率关系没有任何假设。
使用PAST软件版本2.12进行Spearman秩相关分析和聚类分析。使用CodonW估算了ENC、芳香性和GRAVY得分。
使用MEGA 5.2.2计算了总体和局部核苷酸组成。使用DAMBE版本5.3.31.41计算了RSCU值。使用ACUA 1.042计算了CAI值。
在分析的线粒体基因组中,总体和静默位点的碱基组成之间存在复杂的相关性。在Sagitta nagae中观察到T和GC3、C和T3之间的显著正相关性。
在Paraspadella gotoi中发现C和A3,T和G3之间的正相关性,在S. enflata中发现A和G3,T和GC3,G和A3,C和T3之间的正相关性。这些异质性核苷酸含量之间的正相关可能表明了自然选择对指导这些属于箭虫类动物门的物种的密码子使用的影响。
密码子结尾偏好分析
组成约束引起的突变压力在驱动这些物种的密码子使用中的贡献。在Asterina pectinifera中,G和T3之间存在正相关性,表明选择G和T3可能是塑造A. pectinifera中SCUB的一个重要因素。
在其他的基因组中,所有的相关性都暗示了组成约束有利于突变压力在形成SCUB方面的影响。在Balognoglossus carnosus中,可能由于组成约束,没有正相关的异质核苷酸含量,也没有负相关的同质核苷酸含量。
在Katharina tunicata中,异质核苷酸含量与同质核苷酸含量之间存在正相关性,表明选择压力在形成密码子使用中起着重要作用。在Lumbricus terrestris和Terebratulina retusa中,异质核苷酸含量之间没有正相关,同质核苷酸含量之间没有负相关,表明可能突变压力在这些生物体的SCUB中起着重要作用。
对总体和链特异性密码子使用进行了分析。在任何一个基因组中都没有观察到显著的链特异性密码子使用偏倚。在棘皮动物门的A. pectinifera和半索动物门的B. carnosus中,A和C结尾的密码子被发现最常用,而在节肢动物门的D. pulex和软体动物门的K. tunicata中,T结尾的密码子被最常用。
在环节动物门的L. terrestris中,大多数优选密码子是A/T结尾的,而在腕足动物门的T. retusa中,A/C结尾的密码子最常用。在所有代表性的箭虫类动物门物种中,A/T结尾的密码子经常使用,其中T结尾的密码子比A结尾的密码子更常用。
在S. enflata中未能找到潜在的最优密码子,而在所有其他物种中都存在最优密码子。潜在最优密码子的频率在不同基因组中有所变化,即A. pectinifera有23个密码子,B. carnosus有12个密码子,D. pulex有8个密码子,K. tunicata有18个密码子,L. terrestris有1个密码子,P. gotoi有9个密码子,S. nagae有5个密码子,S. cephaloptera有10个密码子,T. retusa有8个密码子。在A. pectinifera中,T结尾、A结尾、G结尾和C结尾的密码子是最常见的。
在B. carnosus中,T结尾、C结尾、A结尾和G结尾的密码子被检测到。在D. pulex中,T结尾、C结尾和A结尾的密码子,在K. tunicata中,T结尾、A结尾、G结尾和C结尾的密码子被使用。T. retusa有A结尾、T结尾、G结尾和C结尾的密码子。在箭虫类动物门中,以下比例的密码子被发现:P. gotoi中有T结尾、A结尾、C结尾和G结尾;S. cephaloptera中有A结尾、T结尾、C结尾和G结尾;S. enflata中有C结尾、A结尾、G结尾和T结尾;S. nagae中有A结尾、T结尾、G结尾和C结尾。
GC组成与密码子使用
在箭虫类动物门的代表物种S. enflata中,大多数PCGs被发现显著位于预期的GC3曲线以下。当PCGs在预期的GC3曲线显著下方分布时,表示可能有选择的影响。
然而,在其他属于箭虫类动物门的物种,如S. nagae、S. decipiens和S. cephaloptera中,大多数PCGs被分布在预期的GC3曲线上方或接近其下方,表明GC组成约束在驱动SCUB方面具有明显影响。与此形成对比的是,P. gotoi中的一个基因显著位于预期的GC3曲线以下,表明该基因可能受到选择的影响。
在腕足动物门的T. retusa中,所有的PCGs都显著位于预期的GC3曲线以下,表明GC3组成约束在密码子使用中影响较小。在Echinodermata、Hemichordata、Arthropoda和Annelida中,大多数PCGs都远远位于预期的GC3曲线下方,这表明选择或其他未知的选择压力在塑造SCUB中起着重要作用。
为了进一步确认GC组成约束对密码子使用偏好的影响,绘制了中性性绘图。它显示了静默位点上的GC含量与第一和第二密码子位置的累积GC含量之间的正相关关系。
大多数基因组中没有发现这样的相关性,这可能表明GC3组成约束在D. pulex中是塑造SCUB的一个重要因素。所选箭虫类动物门物种的ENC值在37.17到50.49之间变化,平均值为45.28,标准差为5.13。
GC3值的范围为26.35到35.17,平均值为26.35,标准差为8.27。这确认了属于箭虫类动物门的所选物种之间的密码子使用的异质性。在其他物种中,GC3值从23.68到41.79不等,平均值为34.88,标准差为6.04,而ENC值从40.94到50.88,平均值为46.29,标准差为3.99。
这些结果表明所选门类中其他代表性物种的密码子使用存在异质性。GC含量的分析显示,在所有分析的线粒体基因组中,平均GC1、GC2和GC3含量都较低。此外,平均GC3含量显著低于GC1和GC2。选择压力抵消突变压力可能是GC含量分布狭窄的背后因素。
为了分析SCUB是否受限于极端偏倚的PCGs,使用PR2偏倚图分析了四密码子氨基酸家族中嘌呤和嘧啶之间的关系。在箭虫类动物门和其他分析的基因组中,嘌呤和嘧啶之间存在复杂的关联。PR2偏倚图的分析显示,A和T的含量相对于G和C的含量被更多地使用。此外,在大多数PCGs中发现了C和G之间以及A和T之间的显著的组成差异。
COA-RSCU分析和选择性力量
通过COA-RSCU进行了分析以确定主要影响SCUB的因素。使用Spearman秩相关方法分析了密码子使用指数与COA轴之间的相关性。轴1和轴2占据了总变化的大部分。轴1可以被认为是一个主要的解释轴,因为它在所有选择的物种中都占了40%以上的变化。在Echinodermata中的A. pectinifera中,轴1与A3、C3和GC3呈显著负相关,与T3和G3呈显著正相关。
在A. pectinifera的线粒体基因组中,静默位点的组成可能在塑造SCUB方面起着关键作用。在Hemichordata中的B. carnosus中,轴1与CAI呈显著负相关,与ENC和GRAVY分数呈显著正相关。这表明基因表达水平在B. carnosus中驱动SCUB方面可能起着关键作用。
在Arthropoda中的D. pulex中,A3和C3与轴1之间存在显著的正相关和负相关,表明A和C在第三密码子位置可能在D. pulex中形成SCUB方面起着贡献。
所有静默位点在K. tunicata中与轴1之间存在显著的相关性,表明核苷酸组成约束在塑造SCUB方面起着明显作用。在Annelida中的L. terrestris、Chaetognatha中的S. nagae、S. cephaloptera和Brachiopoda中的T. retusa中,任何密码子使用指数与轴1之间都没有相关性,表明在这些生物体的线粒体基因组中,其他未知的选择性因素在塑造SCU的变化方面发挥了作用。
在Chaetognatha的S. decipiens中,轴1与A3呈显著负相关,与T3和芳香度呈显著正相关,表明它们在CUB方面起着作用。在S. enflata中,轴1与所有静默位点均显著相关,表明由于组成约束引起的突变压力可能起到了作用。在Chaetognatha的P. gotoi中,轴1与ENC之间存在显著的负相关。这表明基因表达水平可能影响P. gotoi线粒体基因组中的密码子使用。
聚类分析得到了两个簇,一个上部簇和一个下部簇,基于RSCU值的变化。上部簇包括了来自Chaetognatha、Mollusca和Arthropoda的所有选择物种,而下部的次要簇包括了来自Annelida、Echinodermata、Brachiopoda和Hemichordata的物种。
这种分组表明,与所选的原口动物物种相比,箭虫类动物门中PCGs的RSCU值的变化更类似于节肢动物门中PCGs的变化。在所分析的线粒体基因组中,突变压力、自然选择和其他未知的选择性因素以不同的强度作用。通常使用“强烈”、“中等”和“较弱”等术语来表示在任何选定的线粒体基因组中,突变压力和选择压力的强度会有显著的变化。
未知选择性力量的影响
自然选择和突变压力被认为是物种特异性SCU背后的两个主要力量。17,36密码子使用分析揭示,在箭虫类动物门代表性物种中,选择或突变压力的影响并不是绝对的。在P. gotoi中,有一个基因,即NADH6,在预期的GC3曲线之下,表明选择可能影响该特定基因的密码子使用,因为选择可能在高度偏倚的基因中占主导地位。
所有其他基因都位于GC3曲线上或接近该曲线。然而,在其他的箭虫类动物门物种,如S. nagae和S. cephaloptera中,轴1与任何密码子使用指数都没有相关性,大多数基因位于远离GC3曲线的位置,表明在其线粒体基因组中驱动SCUB的明显影响除了选择和突变压力之外还有其他未知的选择性力量。
在S. decipiens中,轴1与静默基础内容的显著相关性以及基因在GC3曲线上方或接近其下方的分组表明,由于组成约束引起的突变压力在驱动S. decipiens中的SCUB方面起到了作用。在S. enflata的线粒体基因组中,尽管大多数基因都远远低于预期的GC3曲线,但轴1与所有静默基础内容都显著相关,表明组成约束可能起到了作用。
在S. enflata中观察到异质核苷酸含量之间的正相关。这表明在驱动S. enflata的SCUB方面,可能存在某些未知的选择性力量。
确认箭虫类动物门代表性物种中与密码子使用相关的趋势并不一致和绝对,这些发现得到了基因组理论的支持,即密码子使用是物种特异性的。认为箭虫类动物门线粒体基因组中的SCU变异并不完全受GC3组成和选择压力的支配。
在所选的箭虫类动物门中,GC12与GC3之间的没有相关性表明,由于GC组成约束引起的突变压力在这些物种的线粒体基因组中的SCUB方面明显不太重要。分析显示,在形成属于箭虫类动物门的物种的线粒体基因组中的PCGs的密码子使用方面,存在某些其他未知的选择性力量。
未知的选择性力量作用在mRNA水平上。15 mRNA序列既包含合成蛋白质所需的信息,也包含调控表达所需的信息。大多数基序是mRNA的二级结构。
尽管这些mRNA二级结构的功能意义尚未完全理解,15但一些研究已经报道这些结构会干扰翻译过程,44,45并且这些结构的稳定性高于预期。46–48如果高度稳定的mRNA二级结构干扰翻译过程,显然,选择性力量将会反对这种稳定的二级结构。
结论
在Echinodermata中的A. pectinifera和Hemichordata中的B. carnosus中,有利于突变压力的组成约束和选择性的翻译准确性发现在塑造SCUB方面发挥了主要作用。
在Brachiopoda中的T. retusa的线粒体基因组中,除了突变压力,选择可能是关键力量之一,因为几乎所有基因都位于预期的GC3曲线之下,轴1与静默基础内容以及GC3与GC12之间没有相关性。在Mollusca中的K. tunicata、Arthropoda中的D. pulex和Annelida。
参考文献
【1】彭竹青,《162种线虫线粒体基因组的特征分析及系统发育研究》,重庆师范大学,2020年。
【2】冯茜莉,王慧慧,《同义密码子通过精微翻译选择机制实现对基因的表达调控》,微生物学报,2022年。
【3】唐晓芬,陈莉,冯玉韬,《密码子使用偏性量化方法研究综述》,基因组学与应用生物学,2013年。
【4】赵泽春,《同义密码子使用偏嗜性的统计分析》,数学杂志,2011年。
【5】李永香,李宏,《不同基因组中同义密码子重复序列的分析与比较》,内蒙古大学学报,2006年。
标签: #对应分析方法与什么有关 #异或运算加密解密