前言:
目前各位老铁们对“r语言及bioconductor在基因组分析中的应用”大致比较注重,各位老铁们都想要分析一些“r语言及bioconductor在基因组分析中的应用”的相关资讯。那么小编也在网上网罗了一些关于“r语言及bioconductor在基因组分析中的应用””的相关内容,希望姐妹们能喜欢,大家一起来了解一下吧!来 源:田仁伟,张少谦,太鹤蓓,张雅婷,陈明竹,罗 超,吴文丽,吴 宁.非特异性间质性肺炎关键基因与免疫细胞浸润分析及中药预测 [J]. 中草药, 2023, 54(15):4934-4947.
非特异性间质性肺炎(NSIP)属于间质性肺炎的一种,于2002年被单独列出作为一种疾病[1]。NSIP临床特征无明显特异性,多以咳嗽和呼吸困难为主,少数病例会出现发热、疲劳和体质量下降等症状[2-3],故容易造成误诊。目前对于NSIP的发病机制并不明确,但已有研究表明炎症诱导及部分免疫细胞浸润在其发展过程中起到重要作用[4],与肺部胶原纤维沉着致肺间质增厚一起作为NSIP 2个已知的主要病理改变。故挖掘其关键基因、生物学过程、相关通路和免疫细胞浸润情况有较大意义。
目前对于NSIP的治疗方法多以激素和免疫抑制剂为主,但其副作用较大,治疗效果仍不理想[5],故不良反应较少的中药或许会成为其新的治疗思路。本研究主要探讨与NSIP主要病理变化的发生机制相关的基因或通路,分析其免疫浸润模式中突出表现的细胞,以及针对关键基因预测靶向中药,以期为NSIP的临床诊断和治疗提供理论基础。
1 资料与方法1.1 数据获取
在GEO数据库[6](GEO DataSet,)中以“nonspecific interstitial pneumonia、non-specific interstitial pneumonia、NSIP”作为检索词,将种属设置为“human sapiens”进行检索,选择结果中2018年1月以后发表的基因芯片GSE110147为研究对象,其中包括10个NSIP患者肺组织样本和11个正常组织样本。GSE101286为2017年发表芯片,且质量较好,用于验证关键基因的差异表达,研究技术路线见图1。
1.2 数据预处理
运用R Studio调用“Bioconductor”“affyPLM”等相关拓展包对GSE110147表达谱芯片进行质量评估,绘制芯片相对对数表达(relative log expression,RLE)箱线图、相对标准差(normalized unscaled standard errors,NUSE)箱线图。
1.3 数据处理及差异基因筛选
基于“limma”拓展包对NSIP和正常组织基因数据中的探针进行归一化处理,并且对数据进行τ检验和贝叶斯检验,当1个基因对应多个探针时取其平均值,箱线图检验其标准化和分组间聚类情况。对标准化后的GSE110147芯片表达谱进行差异分析。差异表达基因(differentially expressed genes,DEGs)以log2(fold change, FC) 的绝对值>2和P<0.01为筛选条件,以log2FC的正负代表该基因上调或是下调。
1.4 差异基因蛋白质相互作用(protein-protein interaction,PPI)网络构建及关键基因筛选
将获得的DEGs以medium confidence>0.4为筛选条件,利用STRING数据库[7](. org/)进行PPI分析,再将得到的PPI互作网络导入Cytoscape软件(Version 3.9.1),利用CytoHubba插件中的度(degree)值对节点进行排名,筛选获得关键基因(hub gene)。
1.5 关键基因验证
将基因芯片GSE101286按照“1.2”和“1.3”项下方法进行处理得到各基因的表达情况,再从中将分析获得的关键基因在基因芯片GSE101286表达矩阵中进行提取,并通过R语言对所得结果进行可视化分析,验证关键基因在2个基因芯片中表达趋势是否一致。
1.6 基因本体(gene ontology,GO)功能富集分析和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析
将得到的关键基因以阈值P<0.05通过Cytoscape软件的GlueGO插件进行GO功能富集分析;再基于R Studio和“clusterProfiler”“org.Hs.eg. db”“ggplot2”“pathview”等扩展包,设定阈值P<0.05,进行KEGG通路富集分析,并且将排名前2的通路进行基因定位展示。
1.7 免疫细胞浸润分析
将所获得的DEGs基于CIBERSORT算法,以阈值P<0.05进行22种免疫细胞浸润分析,其中包括CD8+ T淋巴细胞、M1巨噬细胞、活化的自然杀伤细胞等免疫细胞。
1.8 相关中药预测
将关键基因输入到Coremine Medical数据库[8]()中,下载该基因的相关中药信息,以P<0.05为条件得到潜在治疗中药。将结果导入Cytoscape软件中进行可视化分析,并筛选出对应2个关键基因及以上的关键中药,再通过《中药大辞典》《中国药典》《中华本草》等分析其性味归经和功能主治,最后通过查阅文献找出关键中药。
1.9 关键中药与对应基因分子对接验证
对得到的关键中药进行分析并查找其主要成分,在PubChem()平台下载主要成分的3D结构,从PDB()数据库下载药物候选靶蛋白的3D结构,通过PyMOL2.4.0进行处理,再通过AutoDock vina进行分子对接。对接结果用自由结合能判定优劣,当自由结合能≤−5.0 kJ/mol,表示化合物与靶蛋白之间有良好的相互作用关系,结合能越低,对接模块越稳定,二者相互作用的可能性越大,选择自由结合能最低的对接结果进行可视化展示。
2 结果2.1 芯片质量分析
对GSE110147基因芯片进行质量分析,结果显示所得RLE箱线图各个样本中位数在同一条水平线上,整体表达水平基本趋于一致。NUSE相较于RLE则更为敏感,可以进一步剔除降解严重的不可靠样本,NUSE箱线图结果显示,整体表达水平同样接近一致,则所有数据可纳入研究,见图2。
2.2 DEGs获得
通过R包对GSE110147基因芯片分析结果显示,标准化后样本表达基线一致,共筛选得到407个DEGs(上调基因273个,下调基因134个),并以火山图及热图展示排名前100的DEGs,见图3。
2.3 PPI网络构建及关键基因获得
对所得DEGs构建PPI网络,其中共有297个节点,节点间共1160个相互作用关系。根据度值评分排序,选出前15个基因,分别为含WD重复域蛋白36(WDR36)、ATP结合盒转运蛋白E1(ABCE1)、SKIV2L2、核糖体蛋白S13(RPS13)、90 kDa热休克蛋白αA1(HSP90AA1)、真核翻译起始因子3a(EIF3A)、POLR2B、SNORD34、真核翻译起始因子5B(EIF5B)、DEAD框肽21(DDX21)、GTP结合蛋白4(GTPBP4)、染色体结构维持蛋白3(SMC3)、核仁pre-rRNA加工蛋白同系物(ESF1)、核仁素(NCL)、谷氨酰脯氨酰tRNA合成酶(EPRS),其中RPS13和SNORD34为下调基因,其余为上调基因,见图4和表1。
2.4 关键基因验证结果
将关键基因在基因芯片GSE101286进行验证后发现,除基因POLR2B、SNORD34和DDX21以外12个基因所得验证结果与上述结果一致(P<0.05),见图5。
2.5 GO功能富集和KEGG通路分析
关键基因的GO分析显示,主要富集的生物过程(biological process,BP)为蛋白质复性、翻译过程、高尔基组织、细胞骨架依赖型细胞内转运、水解酶活性;细胞成分(cellular component,CC)为剪接复合体、染色体着丝粒区域、核斑点;分子功能(molecular function,MF)为退火活性、微管蛋白结合、RNA结合。KEGG通路分析共获得13条富集通路,其中核心靶点与RNA剪接体通路、内质网蛋白质加工通路联系最为密切,除此之外还与黏着斑激酶信号通路、癌症中蛋白多糖变化等存在联系,见图6、7。
2.6 免疫细胞浸润
通过CIBERSORT算法所得结果(图8)显示,与正常组织相比,NSIP患者组织中CD8+T细胞(Tcells CD8)浸润水平显著降低,浆细胞(plasma cells)、活化的NK细胞(NK cells activated)和M1巨噬细胞(macrophages M1)表达水平均较低;NSIP患者组织中静息的CD4+记忆T细胞(T cells CD4 memory resting)浸润水平显著升高,幼稚B细胞(B cells naive)、活化的CD4+记忆T细胞(T cells CD4 memory activated)、单核细胞(monocytes)、M0巨噬细胞(macrophages M0)、M2巨噬细胞(macrophages M2)、活化的树突状细胞(dendritic cells activated)、肥大细胞(dendritic cells activated)和嗜酸性粒细胞(eosinophils)的表达水平也较高。
而记忆B细胞(B cells memory)、幼稚CD4+T细胞(T cells CD4 naive)、滤泡辅助性T细胞(T cells follicular helper)、调节性T细胞(T cells regulatory,Tregs)、静息的NK细胞(NK cells resting)、中性粒细胞(neutrophils)表达水平差异不显著。
同时将差异最为显著的CD8+T细胞、静息的CD4+记忆T细胞与15个关键基因进行关联性分析,发现除RPS13和SNORD34外,其余13个基因与CD8+T细胞呈现负相关性,与静息的CD4+记忆T细胞呈现正相关性,见图9(P<0.05、r>0.3有相关性,P<0.05、r>0.8为显著相关)。
2.7 中药预测分析
通过关键基因共筛选到18味中药,分别为冬菇、玉米须、向日葵花、松叶、松香、松节油、松花粉、石刁柏、芒果核、落葵、雷公藤、葵花盘、浮小麦、茯神、茯苓、北豆根、板栗和浙贝母,其中四气五味主要集中于平、温、甘和苦,归经以肝、脾、心、肾和肺为主,功能主治偏重清热利湿、利尿消肿。通过查阅文献验证后雷公藤与茯苓治疗潜力较大,见图10和表2,性味归经统计分析见图11。
2.8 关键中药分子对接验证
通过查阅文献以及口服生物利用度(oral bioavailability,OB)、类药性(drug-likeness,DL),分析关键中药雷公藤和茯苓主要活性物质,并从中选择5种主要活性物质与对应基因转录蛋白进行分子对接,得到其优势构象和自由结合能。结果表明,主要活性物质与其对应的基因转录蛋白的自由结合能均小于−5.0 kJ/mol,并且每个有效成分均可以通过氢键作用于其对应的蛋白氨基酸残基,见表3和图12、13。结果证明雷公藤与茯苓的主要活性物质与其对应蛋白的相互作用可能性较大,有潜在作用价值。
3 讨论
NSIP属于间质性肺炎的一种,是一种慢性肺部疾病,肺泡壁均匀增厚、炎症与免疫细胞浸润和胶原纤维沉着是其主要的病理变化,常见症状为咳嗽与呼吸困难[9]。
目前发病机制、诊断依据并不十分清楚,并且治疗方案副作用较多,治疗效果并不理想。生物信息学是多学科交叉融合的一门综合学科,而高通量技术是生物信息学中新一代的测序技术,能以更高通量、更低成本快速完成基因组和转录组的测序[10-11]。因此,使用生物信息学技术对NSIP的关键基因、免疫细胞浸润等情况进行分析,可以对寻找NSIP发病机制起到推动作用。同时基于该技术,为NSIP寻找潜在治疗靶点,并进一步以此预测潜在治疗中药,不仅可以推动传统中药发展达到老药新用的目的,以期对临床治疗提供一定研究基础。
3.1 关键基因与NSIP内在联系
本研究通过对基因芯片GSE110147进行分析,得到273个上调基因和134个下调基因。并且通过PPI网络分析筛选出15个与NSIP发病机制相关的关键基因。分别为下调基因RPS13、SNORD34和上调基因WDR36、ABCE1、SKIV2L2、HSP90AA1、EIF3A、POLR2B、EIF5B、DDX21、GTPBP4、SMC3、ESF1、NCL和EPRS,与基因芯片GSE101286验证结果基本一致(除基因POLR2B、SNORD34和DDX21以外)。
15个关键基因中部分基因已有研究表明与肺部疾病有较大关联:EPRS可以作为抗肺纤维化的治疗靶标,并且通过分泌转化生长因子β1(TGFβ1)/信号转导和转录激活因子(STAT)信号通路调节间充质标志物和细胞外基质蛋白的表达,因此EPRS可作为治疗特发性肺纤维化的潜在靶标[12]。HSP90AA1在肺癌患者中高表达还与较差的生存预后相关,并且可作为辅助诊断指标[13-14]。EIF5B在肺癌中表达较高且预后不良,可以通过激活程序性死亡配体1(PD-L1)而抑制T细胞活性,可作为干预肺癌的靶标[15]。
在非小细胞肺癌患者中GTPBP4的表达水平较高,在敲低GTPBP4的小鼠体内发现癌细胞的增殖和侵袭能力降低[16]。在人的肺腺癌组织中,ABCE1表达水平较高,与临床的分期也有联系,在敲低ABCE1后可以减缓癌细胞的增殖,并且与降低靶向药物的耐药性有关[17-18],而在非小细胞肺癌中,ABCE1可以通过细胞趋化因子7(C-C motif chemokine 7,CCL7)信号通路参与肺癌的进展[19]。SMC3在人肺癌A549细胞中敲低之后会抑制该细胞的增殖和迁移能力[20]。EIF3A通过参与肺泡上皮细胞间质转化作用而影响肺纤维化的进程,通过抑制EIF3A表达可以改善肺纤维化程度,目前已有针对该靶点进行治疗药物的研究[21-23]。
肺纤维化为NSIP重要的病理变化,且预后不理想。如上所述,本研究筛选出的关键基因与肺部纤维化有所关联。因此,在NSIP的进展中,对这些基因的关注可能会给NSIP的防治带来新的研究方向。
3.2 富集结果与NSIP的内在联系
对差异基因进行GO功能富集分析结果显示,NSIP与剪切体、翻译过程高度相关,而KEGG通路富集分析结果显示NSIP与RNA剪接体通路、内质网蛋白质加工通路联系最为密切。其中剪切体出现于2项富集结果中,提示其与NSIP可能存在紧密联系,针对剪切体进行检索后,发现目前研究中,剪切体与肺癌的发病过程有较大关联性[24-25],并且剪切体的相关蛋白130在特发性肺纤维化中的纤维化病灶中高表达,并且与肺部纤维化程度呈正相关,与其发病过程密切相关[26],这提示剪切体可能会在NSIP进展过程中与其纤维化程度有所关联。而内质网应激在间质性肺炎纤维化的过程中也起到一定的作用[27-28],表明这些生物结构过程和通路为NSIP潜在的治疗靶点和研究方向。
结合前文对关键基因的分析,关键基因与富集结果相互印证彼此的可靠性。而目前在NSIP中尚未有对高尔基体、微管蛋白结合、黏着斑激酶信号通路的研究,也许在NSIP的发展过程中有着一定的作用,可为后续的研究提供方向来揭示NSIP尚不明确的发病过程。
3.3 免疫浸润结果分析
对基因芯片进行22种免疫细胞浸润分析显示,NSIP患者组织内静息的CD4+记忆T细胞、活化的CD4+记忆T细胞、嗜酸性粒细胞、幼稚B细胞、单核细胞、肥大细胞等浸润水平较高,但静息的CD4+记忆T细胞浸润水平远远高于活化的CD4+记忆T细胞,而CD8+T细胞、浆细胞、活化NK细胞和M1巨噬细胞浸润水平较低。提示免疫细胞在NSIP的浸润模式有特异性,多种具有免疫应答或促炎功能的细胞浸润水平显著提升,故免疫细胞浸润在NSIP的发展过程中起到重要的作用。
免疫细胞浸润同样是NSIP重要的发病过程,通过文献分析发现免疫细胞浸模式与肺纤维化密切相关。而本研究中所得CD4+ T细胞和CD8+ T细胞在肺纤维化的进程中已被证实存在紧密联系,外周血中的T淋巴细胞可分为CD4+ T细胞和CD8+ T细胞,CD4+ T细胞能够通过释放多种细胞因子,使病原体清除率增加,在抗纤维化的免疫应答中起到关键作用;而CD8+ T细胞则可以识别被感染的细胞,使其凋亡,达到清除病毒的目的同时引起炎症反应,二者相互作用,与其他免疫细胞共同维持着机体免疫系统的正常运行。而CD4+ T细胞与CD8+ T细胞的数量对肺纤维化的发展非常重要,可通过提升二者比值增强体内的免疫功能,降低肺纤维化的发生[29],同时通过抑制程序性死亡因子-1增加CD8+T细胞、效应T细胞的水平来改善肺纤维化水平也被多次证实有效[30-32]。
本研究结果显示NSIP患者体内静息的CD4+记忆T细胞水平增加多于活化的CD4+记忆T细胞,转化为效应T细胞的能力受到影响。而CD8+ T细胞数量则显著减少,反映NSIP患者体内T淋巴细胞数量减少,免疫功能减弱,抗肺纤维化的能力下降,更易发生肺纤维化。而其余临床细胞浸润模式的改变,可能会使得NSIP发病过程中出现有别于其他肺病中肺纤维化的特性。
从关键基因与免疫细胞的相关性分析可知,13个关键基因与最为显著的静息的CD4+记忆T细胞呈现正相关,与CD8+ T细胞呈现负相关。不仅提示了分析结果的可靠性与一致性,还反映出针对关键基因与免疫细胞用药来减轻肺纤维化程度值得深入研究。
目前NSIP诊断仍存在一些问题,难以与其他间质性肺炎区别,而对于免疫浸润模式及其相关基因的深入研究,可以找出NSIP独特的浸润模式,得到新的依据帮助诊断疾病,并针对免疫细胞的差异性和肺纤维化的内在联系制定治疗方案,弥补临床上诊断困难和治疗效果不理想的现状。
3.4 中药预测结果分析
NSIP在中医学中并未有详细准确的介绍,且间质性肺炎在中医理论中也没有统一病名,但有理论认为该病主要累及肺、脾、肾3脏,致3脏皆虚。又根据其症状将其归为肺瘘、肺痹,前者病因归结为先天肾之真阴不足、后天外邪犯肺,后者病因归结为肺气亏虚。
本研究针对关键基因筛选治疗NSIP的潜在中药,得到冬菇、玉米须、向日葵花、松叶、松香、松节油、松花粉、石刁柏、芒果核、落葵、雷公藤、葵花盘、浮小麦、茯神、茯苓、北豆根、板栗和浙贝母共18味中药,主要归为心、肝、脾、肺、肾经,与NSIP中医理论高度符合,其中除与肺、脾、肾经直接关联以外,心经和肝经同样有关,肺气亏虚,金虚木侮,加重病情。气为血之帅,血为气之母,肺气亏虚,宗气不足,则心血运行不畅。故其治疗方案针对不同证候,以清热化痰、活血化瘀、温阳补气和祛瘀解毒为主。18味中药中,浙贝母、北豆根、茯苓、茯神和雷公藤归经功效较为符合。
进一步通过查阅文献,发现雷公藤和茯苓在肺部疾病上已有不少研究,与NSIP更为符合。茯苓对应基因为HSP90AA1和POLR2B,雷公藤对应基因为HSP90AA1和NCL,与内质网蛋白加工通路密切相关。茯苓利水渗湿、健脾宁心,在慢性阻塞性肺疾病[33]、放射性肺损伤[34]等肺部相关疾病中有一定治疗作用,并且可以提升CD4+ T细胞的数量与CD4+T细胞/CD8+T细胞水平[35]。雷公藤清热解毒、祛风通络,已有研究表明雷公藤可以通过多途径影响肺纤维化、哮喘、肺腺癌等肺部相关疾病[36-39],除此之外还有研究表明雷公藤对内质网应激也有影响,与其对应内质网加工通路有较强关联[40],并且还可以调节T淋巴细胞的表达[41-42]。
通过分子对接也初步证明雷公藤与茯苓有效成分与其对应基因转录蛋白自由结合能较低,说明有较大的相互作用可能性,故雷公藤与茯苓对NSIP的潜在治疗价值更具有说服力。
4 结论
综上所述,本研究以探究NSIP的关键基因和免疫浸润模式为主,通过关键基因富集得到NSIP相关的生物学过程和信号通路,完善其发病机制。通过已有研究推测关键基因在NSIP主要病理过程中的作用。分析得到NSIP主要的免疫浸润模式后,找到最为显著的免疫细胞与关键基因做相关性研究,从基因与免疫浸润的角度共同阐述NSIP的主要病理过程。最后通过关键基因分析得到潜在治疗中药,分析其性味归经和功能主治,通过中医理论和已有文献分析其中最有潜在治疗价值的中药。研究结果有助于进一步阐释NSIP的发病机制和发展过程,为NSIP后续实验研究、药物开发和临床应用提供一定的研究基础。但本研究仍然存在不足,NSIP相关基因芯片数量较少,后续研究应关注其发展,及时补充纳入,除此之外本研究还需进一步实验验证关键基因及相关中药的治疗效果。