龙空技术网

R语言学习效果自测200题

基因学苑 171

前言:

目前兄弟们对“r语言差异基因分析”都比较关心,小伙伴们都想要知道一些“r语言差异基因分析”的相关资讯。那么小编同时在网络上收集了一些对于“r语言差异基因分析””的相关知识,希望朋友们能喜欢,小伙伴们一起来了解一下吧!

知乎上有云:“你多学一样本事,就少说一句求人的话”,这里我们列出了我们R语言与生物信息专题培训班的自测部分,可以测试一下自己对R语言的掌握程度,如果你觉得自己很多问题都还不清楚,欢迎参加来和我们一起学习R语言。

第一部分:R语言基础

什么是R语言,统计软件还是编程语言?

了解R语言的发展历史。

了解R语言在生物信息分析中的应用。

了解R语言的优点。

了解R语言的缺点。

了解学习R语言的方法。

了解数据分析的六个过程。

能够访问R语言的官网。

能够独立安装R语言软件。

了解32位版本与64位版本的区别。

了解Rstudio的作用。

能够独立安装Rstudio。

能够对Rstudio进行设置,包括主题,字体,默认镜像站点等。

熟悉Rstudio的各个窗口的作用。

能够修改默认R语言的编码格式。

能够处理中文乱码的问题。

能够利用Rstudio创建Project。

了解windows目录结构的书写方式。

能够在Rstudio中编辑和运行R脚本。

能够使用ctrl+shift+H修改默认工作目录。

了解R函数的特点及使用方式。

熟悉选项和参数的定义。

熟悉两种R的运行方式。

能够找到R的历史记录。

了解什么是R语言的包。

能够通过R TaskView查找需要的软件包。

能够修改R镜像站点为国内镜像站点。

掌握如何安装R语言的包。

掌握如何加载R语言的包。

能够找到R包的安装目录。

能够查找R中已安装的包。

能够将一台设备的R包迁移到另外一台设备。

能够加载已安装的包。

能够查看R包的帮助文档。

了解什么是vignette形式文档。

能够取消已加载的R包。

能够删除已安装的包。

能够升级低版本的包。

能够查看R包中所有的函数。

了解bioconductor项目。

了解R包与bioconductor包的区别。

了解bioconductor包的分类。

能够修改bioconductor镜像站点为国内站点。

掌握bioconductor包的管理,包括查找,安装,卸载,升级等。

了解bioconductor中workflow的重要作用。

能够修改R语言的默认行为。

修改R语言与bioconductor默认的镜像站点。

设置常用R包为启动后自动加载。

修改默认提示符。

熟悉R语言交互环境。

能够使用tab自动补齐。

会使用ctrl+L清空屏幕。

能够使用esc终止命令。

能够使用alt+-快速生成赋值操作符。

能够使用上下方向键查找历史记录。

了解每一个函数都需要小括号。

熟悉R中对象object的定义。

能够查看当前工作环境中有哪些对象。

能够删除当前环境中的对象。

能够解决“object not found”的错误。

第二部分:文件操作

了解R数据分析中常用的集中数据格式。

能够读写tab分割格式文件。

能够读写csv格式文件。

能够读写excel格式文件。

能够使用head(),tail(),View()函数查看读入内容。

能够读写RDS与Rdata文件。

了解.Rdata文件的作用,并能够找到.Rdata文件。

能够快速调用R内置的数据集。

掌握R语言中不同括号的作用。

第三部分:R语言数据结构

了解R语言中常见的数据类型。

了解R语言中常用的数据结构。

掌握R中向量这种数据结构。

能够通过c()函数创建向量。

能够通过seq()函数生成连续向量。

能够通过rep()函数生成重复向量。

能够通过paste()函数生成组合向量。

能够绘制人染色体长度分布图。

掌握Rcolorbrewer包的用法。

了解向量化操作的概念。

能够进行向量的运算。

能够通过matrix()函数创建矩阵。

能够快速取出矩阵的任意行与列。

掌握热图的绘制方法。

掌握pheatmap包的使用。

掌握不同SV突变类型分布图的绘制。

能够通过data.frame()函数创建数据框。

了解矩阵与数据框之间的差别。

能够取出数据框的任意行与列。

能够通过$符号索引数据。

能够利用R实现Excel vlookup函数的功能。

了解因子的定义,包括levels与labels。

了解因子在数据分析中的重要作用。

能够重新修改因子的水平levels和标签labels。

了解列表这种数据类型。

能够通过list()函数创建列表。

能够索引列表中的各个任意元素。

了解时间序列这种数据类型。

掌握R中缺失数据的表示方式。

了解缺失数据产生的原因。

能够删除数据中的缺失数据。

了解插值法等缺失数据的处理方法。

了解类这种数据类型。

第四部分:数据转换

给定一个数据集,能够判断出其数据类型。

给定一个数据集,能够修改其中任意部分的值。

能够读各种数据之间进行相互转化。

给定数据集,能够进行随机性抽样。

了解有放回抽样与不放回抽样的差别。

了解随机数种子的作用。

给定数据集,能够根据任意列进行排序。

了解sort()函数与order()函数之间的差别。

给定数据集,能够根据两个条件进行排序。

给定数据集,能够将其中满足特定条件的值筛选出来。

给定基因的gff格式文件,能够绘制基因长度分布图。

了解R中apply家族函数的用法。

给定二维数据,能够单独按行或者按列进行计算。

能够分组进行统计。

了解tidyr与dplyr函数的一些用法。

第五部分:统计检验

了解零假设检验的定义。

了解假阳性与假阴性的定义及其计算。

了解p值的定义。

掌握频数的计算方法。

掌握独立性检验的意义。

掌握卡方检验的方法及意义。

掌握fisher精确检验的方法及意义。

掌握t检验的方法及意义。

能够利用apply函数进行批量t检验。

掌握q值的定义及意义。

掌握非参检验方法wilcox检验。

掌握相关性检验的定义及意义。

能够计算相关性系数。

能够进行相关性检验。

第六部分:数据挖掘

了解线性回归的定义。

掌握线性回归中公式的写法。

掌握线性回归结果中各个指标的含义。

了解R方的定义与意义。

能够评估回归模型的好坏。

掌握残差的定义。

能够对基因组大小与基因个数的进行建模。

了解购物篮分析。

掌握利用机器学习预测乳腺癌的案例。

了解建模中的训练集与验证集。

能够将数据集抽样成训练集与验证集。

掌握广义线性回归glm()函数的使用。

能够根据模型对新数据进行预测。

第七部分:R语言与生物信息绘图

了解R语言的四大绘图系统。

了解R语言的绘图设备。

能够将绘制的图形保存到pdf文件中。

能够将绘制的图形保存为png文件。

能够设置图形默认的分辨率。

了解位图与矢量图的定义。

能够关闭绘图设备。

掌握高级绘图与低级绘图的区别。

掌握基本绘图参数。

了解R的一些绘图扩展包。

掌握绘制饼图函数pie()的用法。

掌握绘制箱线图函数box()的用法。

掌握绘制小提琴vioplot)的用法。

了解R中韦恩图的绘制方法。

了解R中曼哈顿图的绘制方法。

掌握R中地图的绘制方法。

掌握ggplot2绘图语法。

理解ggplot2中映射的概念。

能够重复RGraph gallery网站中的案例。

第八部分:R语言分析RNAseq数据

了解转录组和RNAseq的定义。

掌握RNAseq分析的基本流程。

了解RNAseq的定量方法。

掌握RPKM,FPKM,TPM的定义。

重复RNAseq分析的案例。

掌握DESeq2包的使用。

能够评估组间差别与组内差别。

了解FoldChanger的定义及意义。

了解FDR的定义与意义。

能够筛选到差异表达基因。

对差异表达基因进行格式化。

第九部分:基因功能注释以及富集分析

能够正确安装clusterProfiler包。

能够正确安装GO,KEGG,DO等包。

能够找到clusterProfiler的文档。

了解基因功能注释的原理。

了解常见的一些基因ID的表示方法。

给定基因ID,能够转换为另外一种基因ID。

给定基因ID,能够进行GO功能注释与富集。

能够可视化GO功能富集分析的结果。

给定基因ID,能够进行KEGG功能注释与富集。

能够可视化KEGG功能富集分析的结果。

第十部分:WGCNA数据挖掘

了解WGCNA的定义与意义。

了解WGCNA分析对样品数目的要求。

能够安装WGCNA包。

能够准备好输入文件的FPKM表达矩阵。

能够将表达矩阵转换为邻接矩阵。

能够将邻接矩阵转换为拓扑矩阵。

第十一部分:TCGA数据挖掘

了解TCGA项目。

了解TCGA数据的类型以及组织方式。

了解TCGA数据下载的几种方式。

熟悉TCGA官网。

掌握TCGA数据命名的规则。

能够下载样品的mainfest文件。

能够下载样品的元数据metadata。

掌握gdctools工具的使用。

能够安装TCGAbiolinks包。

掌握TCGAbiolinks包的使用。

标签: #r语言差异基因分析