前言:
如今你们对“序列匹配算法哪年出现”大概比较关注,看官们都需要了解一些“序列匹配算法哪年出现”的相关知识。那么小编也在网上收集了一些关于“序列匹配算法哪年出现””的相关内容,希望咱们能喜欢,朋友们快快来了解一下吧!科技日报记者 张佳星
“新冠病毒是否由美国公司制造”连日来引发激烈讨论,讨论的源头是一篇学术论文——
研究者进行了新冠病毒序列研究,结果在一连串的线索指引下发现了一个让人大跌眼镜的巧合:新冠病毒关键位置上一段19个核苷酸的序列,6年前已经被美国医药企业莫德纳公司写入了专利。
客观来讲,“新冠病毒的关键序列被美国药企写入专利”与“新冠病毒由该企业制造”是两个完全不同的问题。究竟该如何看待这两个问题?为了搞清楚来龙去脉,让我们先跟随论文,复盘一下学者们的发现,再听专家解读。
“找不同”游戏中出现了刺眼的12个核苷酸
为找到新冠病毒的特异之处,很多学者采用对比的方法。
论文研究者将新冠病毒与同它最像的病毒(一种名为RaTG13的蝙蝠冠状病毒)对比,它们的相似性高达96.3%。如果把两个序列放一起,一打眼看不出来不同。但论文研究者做了细致的分析,就像玩“找不同”游戏,圈出不同之处。
他们惊奇地发现,几乎没有超过连续3个核苷酸的不同,这就好比两片沙漠,可能这里多了一个沙丘,那里冒出几个土堆,但并没有出现什么高楼大厦的。
但唯独有一处出现了意外,新冠病毒序列在一个关键位置出现了一段12个核苷酸的插入序列,而蝙蝠冠状病毒中却没有。
在大同小异的衬托下,独一处的12个核苷酸差异显得尤为刺眼,如同沙漠中出现了一座摩天大楼。研究者们决定查查它。这个时候他们并不知道能够查到什么。
令研究者们认为新冠病毒这段序列“甚为罕见”的3大巧合
这段违反常态的连续12个核苷酸突变到底怎么回事?
带着这个问题,研究者做了两方面的分析:功能分析、序列分析。
功能分析是想了解这段序列在新冠病毒的“生命历程”中发挥什么作用。研究者找到了这段序列翻译的对应蛋白。结果发现,它翻译的蛋白碰巧很关键。
首先位置关键:碰巧在新冠病毒入侵人体最关键的S蛋白上;其次功能关键,它编码的酶切位点,碰巧可以利用人体内的弗林蛋白酶将自身切割,助力病毒融合进入人类细胞。此前不少研究表明,这一酶切位点与新冠病毒的感染能力相关。
序列分析则是想了解这段序列有没有在其他地方出现过,如果有,那可能提示这段序列的来源。通过通用的序列检索方法,研究者发现这段序列的互补匹配序列巧合地出现在了莫德纳公司2016年申请的人工合成序列专利中,匹配长度从12延长到19个。与此同时,这段序列又比较少见,只在一些细菌的基因组中存在,而在其他物种中极少出现,尤其蝙蝠等可能的宿主动物中完全没有。
综上,这段序列牵出了至少3个巧合:
序列恰巧出现在新冠病毒的关键位置、发挥关键作用;序列恰巧出现在美国莫德纳公司(而不是其他公司)的专利中;序列又恰巧在绝大多数物种中都没有。
论文第一作者美国俄勒冈大学学者巴拉·安巴蒂近日接受《中国日报》采访时表示:这篇文章经过了同行评议,发表是为了激发讨论。团队更关心能不能通过实验证明病毒序列与人工设计序列重组是可行的。
听听专家怎么说
带着这篇论文,科技日报记者独家采访了一位分子病毒学专家,请他答疑释惑。
论文研究者发现新冠病毒存在与蝙蝠冠状病毒不同的12个核苷酸长度的插入片段,为什么值得关注?
“论文中提到的两个病毒的核酸序列存在1100多个核苷酸不同,它们是均匀分布在30000多个核苷酸中的。”该专家解释,理论上讲,连续变异越长越少,序列比对也证明了这一点。也就是说,单个变异最多,两个连在一起的变异便少了,三个连在一起的就更少了,超过三个的几乎没有。因此连续的12个变异确实非常出乎意料。
仅有19个核苷酸相同,相较于基因组数万、数亿的体量是不是微不足道?
“这19个核苷酸是连续的,连续相同是具有高度特异性的。”专家解释,连续的长度每增加一个核苷酸,匹配的几率就会指数倍下降。19个连续的核苷酸,理论上说只有4(核苷酸有4种)的19次方分之一的概率能找到完全一样的序列。一个人工合成的长达19个碱基的特异序列,出现在一个病毒基因组的关键位点并发生非常关键的作用,这种巧合实在罕见,且难以理解。
这19个核苷酸是不是新冠病毒的关键序列?
“其所在的位置非常关键,功能也十分关键。”该专家说,这也是科学界公认的重要位点,新冠病毒为什么这么厉害,与这个位点有着直接的关系。
新冠病毒是由该企业制造的吗?
从专利来看,序列设计是为了修复肿瘤中的错配,因为肿瘤扩增过程中,如果错配加重,其恶化的速度和程度将更快,修复错配将有助于肿瘤治疗。至于这段序列是如何准确、高效进入到新冠病毒基因组的关键位点中,目前的判断大多仍处于猜测阶段。是纯属巧合还是有意为之,需要更深入广泛地调查和证明。
编辑:张爽
审核:王小龙
标签: #序列匹配算法哪年出现