龙空技术网

“机器学习”提高分析的创新性,2张主图就发1区9分+纯生信?

云生信学生物信息学 426

前言:

现时小伙伴们对“生物信息学进化树分析”可能比较注意,小伙伴们都需要剖析一些“生物信息学进化树分析”的相关知识。那么小编也在网络上收集了一些对于“生物信息学进化树分析””的相关内容,希望同学们能喜欢,小伙伴们快快来学习一下吧!

尔云间 一个专门做科研的团队

欢迎点赞+收藏+关注[给你小心心]

做生信分析不蹭热点怎么创新?

也可以试试从疾病本身出发找创新;

或者从分析思路上找创新~

想要提高生信文章的创新性,有几种方法:

(1) 追热点:双硫死亡等新热点;

(2) 疾病创新:可以选择小众疾病、或者大疾病中的小分支、或者从疾病分组上找创新(耐药vs非耐药,转移vs非转移,某一疾病的不同亚型间比较);

(3) 分析思路创新:双热点、双疾病、二次聚类、机器学习等。

小云之前也已经从上述各个方面都分享过,文章活学活用,提高创新性才能相对减少分析/实验的工作量!

今天小云发现一篇1区9分+TOP期刊的纯生信文章,全文只有2张结果图+1张分析流程图,这工作量简直不敢相信!

先说一下这个杂志,World journal of pediatrics是一本季刊,发表同行评议的关于儿科临床实践和研究的原创论文、评论和特别报告。

非预警期刊:

而且中科院分区是1区,TOP期刊:

自引率也比较低:

说明这本期刊的质量是没有问题的。

那为什么简单的分析内容就可以发呢?

小云分析有两点:

(1) 文章内容和杂志匹配度高:这本杂志就是关注儿科,而作者针对儿童脓毒症进行分析(ps:其实也算是大疾病的分支),投稿到这本杂志自然是非常匹配的~

(2) 分析的创新:采用3种机器学习算法筛选诊断基因,属于分析上的创新,也是很容易弯道超车发高分的!

(如果没有分析思路也可以找小云,超多个性化的分析思路供你选择~)

接下来我们就一起看看文章的内容吧~

文章题目:结合生物信息学和机器学习分析和验证儿童败血症的诊断生物标志物和免疫细胞浸润特征

发表杂志:World journal of pediatrics : WJP

影响因子:9.186

发表时间:2023年4月

数据信息

研究思路

从GEO数据库中获取三个疾病的基因表达数据集。首先利用R程序找到差异表达基因(DEGs),然后进行基因集富集分析。随后,使用加权基因共表达网络将DEGs与选择的主要模块基因结合起来。通过使用三种机器学习算法来识别hub基因:随机森林、支持向量机递归特征消除和LASSO。利用受体工作特征曲线和列线图模型验证了关键基因的鉴别性和有效性。此外,通过CIBERSORT评估儿童脓毒症的炎症和免疫状态。进一步分析了诊断指标与浸润免疫细胞的关系。

图1. 流程图

主要研究结果

1. 机器学习算法筛选基因

分析儿童脓毒症患者和健康对照组的差异表达基因(DEGs),并对DEGs进行GSEA和功能富集分析。使用WGCNA筛选与脓毒症相关的共表达基因模块。利用维恩图比较DEGs和关键模块基因的重叠区域,鉴定出402个重叠的基因(图2a)。

使用了三种机器学习算法来识别特征基因:SVM-RFE(图2b);采用RF结合特征选择来确定错误率、分类树数量与18个基因之间的关系,按相对相关性降序排列(图2c, d);使用LASSO回归分析获得16个预测基因(图2e, f)。

图2使用机器学习算法筛选基因

2. 诊断标记物的筛选和验证

三种算法取交集获得CYSTM1、MMP8和CD177这3个基因为重叠基因(图3a)。使用rms软件包,作者建立了基于标志基因CYSTMI1、MMP8和CD177诊断儿童脓毒症的nomogram模型(图3b)。根据决策曲线分析(DCA)的结果,nomogram模型具有更好的临床效益(图3c)。CYSTM1、MMP8和CD177的AUC分别为0.988、0.973和0.986,ROC曲线显示它们可能是有价值的生物标志物(图3d),表明这些生物标志物具有较高的预测值准确性。

在GSE13904验证集中,儿童脓毒症组CYSTM1、MMP8和CD177的表达明显高于对照组 (图3e)。CYSTM1、MMP8和CD177的AUC分别为0.968、0.964和0.957, 验证集的ROC曲线也表明它们可能是有价值的生物标志物(图3f)。

图3儿童脓毒症诊断标志物

总结

这篇文章主要的结果图就2张,当然,作者还做了功能富集分析、WGCNA、免疫浸润分析等等,其他的结果都放在了补充材料里,但总体的工作量也不是很大。

亮点就是在脓毒症这一大疾病中选择了其中一个分支“儿童脓毒症”进行分析,然后加入机器学习算法的分析思路创新,最重要的是投稿时要选对匹配的杂志!这几点联合起来,就打造了一篇9分+纯生信文章。不得不说机器学习的性价比还是非常高的,你想试试吗?

如果你还苦恼于生信分析没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对机器学习等分析感兴趣的小伙伴快来找小云吧!

非肿瘤纯生信思路

失巢死亡

机器学习

Q1区12分+影像组学

非肿瘤小众疾病

标签: #生物信息学进化树分析