前言:
现时姐妹们对“logistic回归or值如何计算”可能比较注重,你们都想要剖析一些“logistic回归or值如何计算”的相关知识。那么小编在网摘上网罗了一些关于“logistic回归or值如何计算””的相关知识,希望小伙伴们能喜欢,咱们一起来学习一下吧!医学统计学已经广泛地应用在医学科学研究中。在文献复习与研究设计、实验或观察实施、数据收集与记录、资料整理与分析、结果表达与解释、报告撰写与论文发表等环节无不涉及统计问题。浅浅总结一下医学统计学常用分析方法。
一、差异性研究差异性研究就是分析不同数据资料之间的差异性。简单可以分为研究单样本、两样本、多样本资料之间均数的差异性比较以及定类数据之间差异性比较;分类说明如下:
1、单样本均数比较
单样本均数比较是指研究一组定量数据与一个数字之间的差异性。例如研究36名从事铅作业男性的血红蛋白含量与正常男性血红蛋白均数140g/L的差异。当数据满足正态性时,可以使用单样本t检验方法进行研究;当数据不满足正态性时,可以使用单样本wilcoxon检验进行研究。
2两样本均数比较
两样本均数比较是指研究两组定量数据之间的差异性。
例如研究两类胶囊的降血糖效果是否有差异;而两样本设计又可以分为两独立样本和两配对样本。
两样本相互独立时——当两样本数据都满足正态性和方差齐性,则可以使用独立样本t检验或者方差分析(单因素方差分析)进行研究;当数据呈正态且方差不齐时,可以使用t'检验或者welch方差、Brown-Forsythe方差进行研究;当数据非正态且方差不齐时,则不能使用参数检验,应该使用非参数检验法—wilcoxon秩和检验进行分析。
两样本为配对设计时——当两配对数据的差值满足正态性,使用配对样本t检验进行研究;当差值不满足正态性时,使用配对样本wilcoxon检验进行分析。
3、多样本均数比较
多样本均数比较是指研究多组定量数据之间的差异性。
例如研究某种药物不同剂量下小鼠的存活时间;而多样本设计又可分为完全随机设计、随机区组设计、重复测量设计。
完全随机设计——要将研究对象按照某个处理因素随机分配为多个处理组(也称为处理因素的水平),每组接受一种处理,最后判断多个处理组之间有无差别。当满足正态性和方差齐性时,使用方差分析进行研究;不满足时,可以使用Kruskal-wallisH秩和检验进行分析。
随机区组设计——是配对设计的扩展。具体做法是:先按影响实验结果的非处理因素(如性别、体重、病情、病程等)将实验对象配成区组(block),再分别将各区组内的实验对象随机分配到各处理组或对照组。当满足正态和方差齐时,使用方差分析进行研究;不满足时,可以使用Friedman秩检验进行分析。
重复测量设计——当前后测量设计的重复测量次数m≥3时,称重复测量设计或重复测量数据。重复测量数据进行组内项差异分析时,需要进行球对称假设,当满足时,直接使用重复测量方差分析结果;当不满足时,采用Greenhouse-Geisser校正或者Huynh-Feldt校正结果分析。
4、定类数据比较
定类数据之间的差异性研究主要通过卡方检验进行分析。
例如研究患肺癌与是否吸烟之间的差异性;可以将定类数据资料分为四格表资料、R*C资料、2*2*K资料三类。
四格表资料——只有两行两列。又可以分为配对资料和非配对资料两种。
配对资料例如分别使用抗原检测和核酸检测对同一批样本检验新冠病毒阳性、阴性是否有差异。当为2*2配对设计时,采用McNemar检验;当为n*n配对设计时,采用Bowker检验。非配对资料时,当总样本量n≥40,且期望频率E≥5时,使用Pearson卡方;当n≥40但其中一个格子出现1≤E<5时,使用yates校正卡方;当n<40或者E<1时,使用Fisher卡方进行分析(这一过程SPSSAU将自动选择)。
R*C表资料——当行和列中任意一个大于等于2时,称为R*C表资料。
当E全部>1且 1≤E<5格子的比例小于20%则使用Pearson卡方;否则使用yates校正卡方(SPSSAU将自动选择)。
2*2*K资料——卡方检验研究X和Y的差异,X和Y均是类别数据,当前需要进一步考虑另一个干扰因素分层项时;比如是否吸烟(X)与是否得肺癌(Y)的关系时,将性别纳入考虑范畴此时应该使用分层卡方进行分析。
补充:除此之外,常用的卡方检验还有卡方拟合优度检验,用于分析预期的比例是否与实际的比例有着明显的差异性。
研究数据之间的相关性,主要可以使用Pearson相关系数和Spearman相关系数。
当变量X和Y服从双变量正态分布时,可以使用Pearson相关进行进行相关分析;
Pearson相关系数计算公式如下:
当变量X和Y不服从双变量正态分布时,则使用Spearman相关进行相关分析;
当变量X和Y均为多分类有序资料时,可以用Spearman相关进行相关分析。
Spearman相关系数计算公式如下:
相关系数没有单位,其值为-1≤r≤1。r值为正表示正相关,r值为负表示负相关,r的绝对值等于1为完全相关,r=0为零相关。在生物界由于影响因素众多,因此很少完全相关。Pearson相关或者Spearman相关都要求观察单位之间是独立的。
研究因变量Y的影响因素时,按照因变量Y类型的不同,可以分为以下三类:
因变量Y为定量资料时;当自变量个数为1个时,使用一元线性回归分析进行研究;当自变量的个数为多个时,使用多元线性回归分析进行研究。
因变量Y为定类资料时;当Y为二分类变量,如“是否患病”,此时使用二元logistic回归分析进行研究;与此同时,如果是针对配对资料进行分析的,则应该使用条件logistic回归分析。当Y为多分类变量时,使用多分类logistic回归分析。当Y为有序多分类变量时,如“无效、好转、痊愈”,应该使用有序logistic回归分析。
因变量Y为生存资料时:此时共有两个因变量,Y1表示生存时间,Y2表示生存状态,且0表示生存,1表示死亡,两个因变量缺一不可,此时应该使用cox回归。
以上就是今天的全部内容,主要讲了医学统计学比较常用的差异性研究方法、相关性研究方法以及影响因素研究方法。还想看什么其他内容,请留言告诉我哦~
参考文献:[1]孙振球,徐勇勇.医学统计学.第4版[M].人民卫生出版社,2014
标签: #logistic回归or值如何计算