前言:
目前兄弟们对“r语言差异基因分析”都比较关心,小伙伴们都想要知道一些“r语言差异基因分析”的相关资讯。那么小编同时在网络上收集了一些对于“r语言差异基因分析””的相关知识,希望朋友们能喜欢,小伙伴们一起来了解一下吧!知乎上有云:“你多学一样本事,就少说一句求人的话”,这里我们列出了我们R语言与生物信息专题培训班的自测部分,可以测试一下自己对R语言的掌握程度,如果你觉得自己很多问题都还不清楚,欢迎参加来和我们一起学习R语言。
第一部分:R语言基础
什么是R语言,统计软件还是编程语言?
了解R语言的发展历史。
了解R语言在生物信息分析中的应用。
了解R语言的优点。
了解R语言的缺点。
了解学习R语言的方法。
了解数据分析的六个过程。
能够访问R语言的官网。
能够独立安装R语言软件。
了解32位版本与64位版本的区别。
了解Rstudio的作用。
能够独立安装Rstudio。
能够对Rstudio进行设置,包括主题,字体,默认镜像站点等。
熟悉Rstudio的各个窗口的作用。
能够修改默认R语言的编码格式。
能够处理中文乱码的问题。
能够利用Rstudio创建Project。
了解windows目录结构的书写方式。
能够在Rstudio中编辑和运行R脚本。
能够使用ctrl+shift+H修改默认工作目录。
了解R函数的特点及使用方式。
熟悉选项和参数的定义。
熟悉两种R的运行方式。
能够找到R的历史记录。
了解什么是R语言的包。
能够通过R TaskView查找需要的软件包。
能够修改R镜像站点为国内镜像站点。
掌握如何安装R语言的包。
掌握如何加载R语言的包。
能够找到R包的安装目录。
能够查找R中已安装的包。
能够将一台设备的R包迁移到另外一台设备。
能够加载已安装的包。
能够查看R包的帮助文档。
了解什么是vignette形式文档。
能够取消已加载的R包。
能够删除已安装的包。
能够升级低版本的包。
能够查看R包中所有的函数。
了解bioconductor项目。
了解R包与bioconductor包的区别。
了解bioconductor包的分类。
能够修改bioconductor镜像站点为国内站点。
掌握bioconductor包的管理,包括查找,安装,卸载,升级等。
了解bioconductor中workflow的重要作用。
能够修改R语言的默认行为。
修改R语言与bioconductor默认的镜像站点。
设置常用R包为启动后自动加载。
修改默认提示符。
熟悉R语言交互环境。
能够使用tab自动补齐。
会使用ctrl+L清空屏幕。
能够使用esc终止命令。
能够使用alt+-快速生成赋值操作符。
能够使用上下方向键查找历史记录。
了解每一个函数都需要小括号。
熟悉R中对象object的定义。
能够查看当前工作环境中有哪些对象。
能够删除当前环境中的对象。
能够解决“object not found”的错误。
第二部分:文件操作
了解R数据分析中常用的集中数据格式。
能够读写tab分割格式文件。
能够读写csv格式文件。
能够读写excel格式文件。
能够使用head(),tail(),View()函数查看读入内容。
能够读写RDS与Rdata文件。
了解.Rdata文件的作用,并能够找到.Rdata文件。
能够快速调用R内置的数据集。
掌握R语言中不同括号的作用。
第三部分:R语言数据结构
了解R语言中常见的数据类型。
了解R语言中常用的数据结构。
掌握R中向量这种数据结构。
能够通过c()函数创建向量。
能够通过seq()函数生成连续向量。
能够通过rep()函数生成重复向量。
能够通过paste()函数生成组合向量。
能够绘制人染色体长度分布图。
掌握Rcolorbrewer包的用法。
了解向量化操作的概念。
能够进行向量的运算。
能够通过matrix()函数创建矩阵。
能够快速取出矩阵的任意行与列。
掌握热图的绘制方法。
掌握pheatmap包的使用。
掌握不同SV突变类型分布图的绘制。
能够通过data.frame()函数创建数据框。
了解矩阵与数据框之间的差别。
能够取出数据框的任意行与列。
能够通过$符号索引数据。
能够利用R实现Excel vlookup函数的功能。
了解因子的定义,包括levels与labels。
了解因子在数据分析中的重要作用。
能够重新修改因子的水平levels和标签labels。
了解列表这种数据类型。
能够通过list()函数创建列表。
能够索引列表中的各个任意元素。
了解时间序列这种数据类型。
掌握R中缺失数据的表示方式。
了解缺失数据产生的原因。
能够删除数据中的缺失数据。
了解插值法等缺失数据的处理方法。
了解类这种数据类型。
第四部分:数据转换
给定一个数据集,能够判断出其数据类型。
给定一个数据集,能够修改其中任意部分的值。
能够读各种数据之间进行相互转化。
给定数据集,能够进行随机性抽样。
了解有放回抽样与不放回抽样的差别。
了解随机数种子的作用。
给定数据集,能够根据任意列进行排序。
了解sort()函数与order()函数之间的差别。
给定数据集,能够根据两个条件进行排序。
给定数据集,能够将其中满足特定条件的值筛选出来。
给定基因的gff格式文件,能够绘制基因长度分布图。
了解R中apply家族函数的用法。
给定二维数据,能够单独按行或者按列进行计算。
能够分组进行统计。
了解tidyr与dplyr函数的一些用法。
第五部分:统计检验
了解零假设检验的定义。
了解假阳性与假阴性的定义及其计算。
了解p值的定义。
掌握频数的计算方法。
掌握独立性检验的意义。
掌握卡方检验的方法及意义。
掌握fisher精确检验的方法及意义。
掌握t检验的方法及意义。
能够利用apply函数进行批量t检验。
掌握q值的定义及意义。
掌握非参检验方法wilcox检验。
掌握相关性检验的定义及意义。
能够计算相关性系数。
能够进行相关性检验。
第六部分:数据挖掘
了解线性回归的定义。
掌握线性回归中公式的写法。
掌握线性回归结果中各个指标的含义。
了解R方的定义与意义。
能够评估回归模型的好坏。
掌握残差的定义。
能够对基因组大小与基因个数的进行建模。
了解购物篮分析。
掌握利用机器学习预测乳腺癌的案例。
了解建模中的训练集与验证集。
能够将数据集抽样成训练集与验证集。
掌握广义线性回归glm()函数的使用。
能够根据模型对新数据进行预测。
第七部分:R语言与生物信息绘图
了解R语言的四大绘图系统。
了解R语言的绘图设备。
能够将绘制的图形保存到pdf文件中。
能够将绘制的图形保存为png文件。
能够设置图形默认的分辨率。
了解位图与矢量图的定义。
能够关闭绘图设备。
掌握高级绘图与低级绘图的区别。
掌握基本绘图参数。
了解R的一些绘图扩展包。
掌握绘制饼图函数pie()的用法。
掌握绘制箱线图函数box()的用法。
掌握绘制小提琴vioplot)的用法。
了解R中韦恩图的绘制方法。
了解R中曼哈顿图的绘制方法。
掌握R中地图的绘制方法。
掌握ggplot2绘图语法。
理解ggplot2中映射的概念。
能够重复RGraph gallery网站中的案例。
第八部分:R语言分析RNAseq数据
了解转录组和RNAseq的定义。
掌握RNAseq分析的基本流程。
了解RNAseq的定量方法。
掌握RPKM,FPKM,TPM的定义。
重复RNAseq分析的案例。
掌握DESeq2包的使用。
能够评估组间差别与组内差别。
了解FoldChanger的定义及意义。
了解FDR的定义与意义。
能够筛选到差异表达基因。
对差异表达基因进行格式化。
第九部分:基因功能注释以及富集分析
能够正确安装clusterProfiler包。
能够正确安装GO,KEGG,DO等包。
能够找到clusterProfiler的文档。
了解基因功能注释的原理。
了解常见的一些基因ID的表示方法。
给定基因ID,能够转换为另外一种基因ID。
给定基因ID,能够进行GO功能注释与富集。
能够可视化GO功能富集分析的结果。
给定基因ID,能够进行KEGG功能注释与富集。
能够可视化KEGG功能富集分析的结果。
第十部分:WGCNA数据挖掘
了解WGCNA的定义与意义。
了解WGCNA分析对样品数目的要求。
能够安装WGCNA包。
能够准备好输入文件的FPKM表达矩阵。
能够将表达矩阵转换为邻接矩阵。
能够将邻接矩阵转换为拓扑矩阵。
第十一部分:TCGA数据挖掘
了解TCGA项目。
了解TCGA数据的类型以及组织方式。
了解TCGA数据下载的几种方式。
熟悉TCGA官网。
掌握TCGA数据命名的规则。
能够下载样品的mainfest文件。
能够下载样品的元数据metadata。
掌握gdctools工具的使用。
能够安装TCGAbiolinks包。
掌握TCGAbiolinks包的使用。
标签: #r语言差异基因分析