龙空技术网

完整糖肽鉴定软件pGlyco2.0——背景、原理介绍与初步测评

高博士讲科普 47

前言:

现时兄弟们对“fdr算法”大约比较关切,兄弟们都想要知道一些“fdr算法”的相关文章。那么小编同时在网摘上汇集了一些对于“fdr算法””的相关内容,希望兄弟们能喜欢,看官们快快来了解一下吧!

pGlyco2.0是复旦大学生物医学研究院和化学系教授杨芃原团队、中国科学院计算技术研究所研究员贺思敏团队以及国家蛋白质科学中心(上海)研究员黄超兰团队合作发的一款高通量完整糖肽鉴定软件,发表在去年的《Nature Communications》上。完整糖肽的高通量鉴定软件开发目前是一个热点,国内外都开发了不少相关软件,商业化的软件也有几款,但是目前的各个软件各有长短,质量和应用性都不令人满意,很多软件都早已不更新,目前尚没有一个像Macot、Sequest之类的被广泛接受的软件或者方法。完整糖肽软件的高通量鉴定依然处于火热的方法学开发阶段。

什么是完整糖肽?

我们知道,蛋白翻译后修饰中,糖基化是独一无二的,其他的修饰诸如磷酸化、乙酰化、甲基化等,都是一个固定的化学基团,比如磷酸根、乙酰基团等连接在蛋白上,但是对于糖基化来说,糖链本身就是一个复杂多变的生物分子,其序列变化繁多,且糖链上面还有磺酰化等修饰,所以,糖基化修饰没有固定的分子量,这对于质谱解析蛋白糖基化构成了巨大的挑战。

长期以来,采用的是糖链与蛋白分离的方法,将糖链释放出来单独研究糖链,至于蛋白部分,N-糖肽在被PNGase F酶切掉糖链时,天冬酰胺会变成天冬氨酸,增加一个Da的分子量(在重水中反应增加3Da),以此来识别N-糖基化位点。至于O-糖基化,由于位点密度高、化学释放糖链时反应剧烈,氨基酸上回发生多种变化,目前O位点鉴定尚不成熟。

但是上面的糖链和位点分开研究的策略丢失了位点特异性信息,毕竟,发挥功能的是糖链,而不是位点。重复一遍,发挥功能的是糖链,而不是位点。所以,完整糖肽的策略就是不分开糖链与肽段,将完整的糖肽进行碎裂。但是,糖肽进行CID或者HCD碎裂时,糖链部分优先碎裂,肽部分碎裂不充分,这导致糖肽二级谱图的解析困难。

下图是使用QE+ CE27时血清糖肽二级谱图,可以看出低分子量区有着极高丰度的氧鎓离子,也就是糖链的碎片峰。而b y离子丰度很低。

解决办法可以是采用ETD,糖链不碎裂而肽碎裂,然后与HCD谱图结合起来解析,但是需要两次进样。Fusion上的EThcD可以自动联合,但是对于N糖肽来说,需要的电荷至少为4,这是很难做到的。

一个可行的办法是,采用Stepped CE的方法,也就是一次碎裂中apply不同的碎裂能,实现糖链和肽段的双重充分碎裂。pGlyco2.0采用的就是这种方法。

pGlyco1.0采用的是HCD-pd-CID或者MS3的方法,也就是HCD碎一次,CID和MS3各来一次,这种方法也行,但是速度太慢了。

pGlyco2.0采用了SteppedCE方法,也就是用CE20 30 40这三个能量各打一次,不过,Thermo仪器上三个能量的滞留时间似乎是不可调的。荷兰的Wuhrer教授用布鲁克的Q-TOF的Stepped CE中的不同step的碎裂能时间可调的特性,实现了糖肽的充分碎裂。这个以后再探讨。

pGlyco2.0采用了这种方法后,实现了糖肽的较好的碎裂。此外,pGlyco2.0另一大亮点是采用了高准确度的FDR算法,从肽骨架、糖链和糖肽三个层次综合控制FDR【pGlyco的FDR算法研究一直走在同行的前列,事实上,完整糖肽鉴定软件的开发中,FDR控制算法的设计是重中之重】。

pGlyco对糖肽谱图的解析思路并不复杂,首先,需要有一个糖库,糖链数据库比较著名的有GlycomeDB,不过现在已经改名为GlyTouCan了。目前pGlyco内置了人和老鼠的糖链数据库。不支持自己添加糖链数据库。然后你需要有一个蛋白数据库。软件会对一张谱图分别进行肽段by离子的匹配以及糖库的匹配,最后进行打分和FDR控制。

初步测评结果:

pGlyco2目前已经更新了多个版本,原始文献中给出的版本和现在的版本在界面上有很大不同。我尝试使用了QE(没有使用stepped CE)的糖肽数据进行了测试,有意思的是,当时使用文献中给出的地址下载的版本鉴定到了800条左右糖肽(包含部分O-糖肽),当下载了新版的pGlyco2.1重新对同一个Raw检索时,鉴定数目为:0。也就是说,同样一个Raw文件,使用旧版本可以鉴定到800条糖肽,而使用新版本一条都鉴定不到(我尝试了多次,确保参数没有设置错误)。而使用GPQuest的结果则在2000以上。

由于算法不同且碎裂能模式不同,采用的样品处理策略也不同,pGlyco和GPQuest的结果没有可比性,这里的结果当然不能说哪个软件好哪个不好。但是pGlyco前后版本的巨大差异……只能理解为新版本上其算法可能有了改变吧。

参考文献:

pGlyco 2.0 enables precision N-glycoproteomics with comprehensive quality control and one-step mass spectrometry for intact glycopeptide identification

链接:

标签: #fdr算法