序
授课教师: 浙江中医药大学-郑卫军
微信公众号: 郑老师统计课程、医学论文与统计分析
统计学基本原理与方法
医学统计学基础
- 统计学: 汇总群体数据,计算并发现其中规律的一门学科,处理数据中的变异性,从变异、看似杂乱的数据中发现必然规律
【从杂乱数据到有序信息、从现象到本质的过程】 - 统计研究是抽样研究,医学研究的数据是抽样数据
1)抽样:从总的研究人群中抽取一部分有代表性的个体的方法
2)总体:总的研究群体,研究者想了解的、根据研究目的确定的、同质观察对象的全体(集合),是观察个体某一特征值的集合
3)样本:研究者能掌握的、从整体中随机抽取的部分个体
【样本含量:样本中所包含的个体数】 - 参数&统计量:
1)参数:根据总体中全部个体值计算出来的描述总体特征的指标,一般用希腊字母表示,如:总体均数μ、总体率π
2)统计量:根据样本中个体值计算出来的描述样本特征的指标,用拉丁字母表示,如:样本均数x拔、样本率p
3)参数一般未知,因为总体不可能全部统计到,但是是存在且固定的;统计量一般可测量,且不同抽样统计量不同
4)统计量一般接近于总体,围绕在总体周围,但和总体不同 - 抽样误差:
表面的统计量与本质的参数存在着误差。样本指标(统计量)与总体指标(参数)之间的差别,由于个体变异、抽样造成的样本统计量与总体参数之间的差别 - 统计研究过程:
从总体随机抽取部分个体得到样本->对样本统计描述,计算统计量->从统计量统计推断总体参数
数据及其类型和分布
- 数据
1)对客观事件进行记录并可鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。
2)它是可识别的、抽象的符号,不仅包含数字,还可以是文字、字母、数字符号的组合、图形、图像、视频、音频等,也是客观事物属性、数量、位置及其相互关系的抽象表示
【例:0、阴、下降、温度、运输状况、档案记录】
3)数据是由多个体的一个或多个变量值组成
①.变量: 由变量名和变量值组成,观察对象的某项特征或指标,如:年龄、性别、身高、体重等
②.变量值: 变量的观察结果或测定值,变量值的集合称为数据或资料 - 数据的类型
包括定量变量数据、定性变量数据、有序变量数据三类
1)定量变量数据(又称:计量资料/数值变量资料):
①.视为测定每个观测单位某项指标的大小而获得的资料
②.定量变量值是量化的,一般有度量单位
③.分为离散型(一定无小数点)和连续性(往往有小数点)
【例:家里有5口人(离散);体重50.5kg(连续)】
2)定性变量数据(又称:计数资料/无序分类变量资料):
①.将观察单位按某种属性或类别分组计数、汇总各组观察单位数后得到的资料
②.变量值为分类,属性值,没有程度上、顺序上的差别(无序)
③.分为二分类和多分类两种
【例:男/女;阳性/阴性;A/B/O型血】
3)有序变量数据:(又称:等级资料/有序分类变量)
①.将观察单位按照某种属性的不同程度分为等级后分组计数,分类汇总各组观察单位数而得到的资料
②.变量具有半定量的性质,有一定的等级
【例:(疗效)无效/好转/显效/治愈;(化验)-/±/+//+】 - 数据的分布
1)定量数据的分布:
①.对称分布(均匀分布、正态分布):
数据以最大值与最小值的中间值为界线,呈左右大致对称分布
【例:血清总胆固醇、身高、体重呈正态分布】
②.不对称分布(偏态分布):
1/. 正偏态:数据主要分布在左侧
2/. 负偏态:数据主要分布在右侧
【例:血铅含量呈正偏态,儿童视力呈负偏态】
数据的统计描述
正式课程
医学研究的常见设计类型
- 实验性研究(干预性研究):
人为施加干预措施,评价干预措施的影响或效果,属于前瞻性研究
1).随机对照研究(RCT研究):
①.随机化:随机分配到干预组和对照组
②.对比干预组与对照组的有效数据差异
③.常采用平行对照(同期对照)
2).非随机对照研究(无对照或历史对照、无随机化) - 观察性研究:
作为旁观者不介入,只调查观察,评价健康相关结局与暴露因素的关系
①.分组不遵循随机化
②.需要设置对照组 - 文献研究:
①.定性——文献综述
②.描述——文献计量分析
③.荟萃分析(Meta分析)
RCT研究
- RCT研究提供最可靠的医学证据:
1). 对照性:具有良好的可比性,即非干预因素均具有相似性
2). 随机性:随机化分组实现均衡可比
3). 重复性:样本量达到一定数量
【注:基于自身前后对照、历史对照的研究结论不可靠】 - RCT研究分类:
1). 完全随机设计研究
2). 配对设计研究:
将受试对象按配对条件(非处理因素)配成对子,再随机将每对拆成干预组和对照组,包括自身配对(前后配对)和异体配对(平行配对),两者都有可比性,但后者能体现配对随机化更可靠
观察性研究
- 暴露因素:
研究对象非干预而本身具有的属性或者具有某种行为或者处于某种环境 - 观察性研究分类:
1). 横断面研究:
①.又称现况调查,获得某地某人群在某一时间点上“果”与“因”的现况信息,探索疾病与暴露因素当下的相关性、分布性,无法分析因果性
2). 病例对照研究:
①.又称回顾性调查,按当下状况分为病例组与对照组,比较病例组暴露因素现状信息与发病前接触暴露因素的过去状况信息,暴露因素的差异性能分析因果关系
3). 队列研究
①.又称前瞻性或随访研究,按暴露因素不同分组,追踪两组疾病发生的未来状况,分析暴露因素与疾病发生的因果性
【注:队列研究相较病例对照研究避免了回忆的偏差,更加可靠】
【注:回顾性队列研究/历史性队列研究也是前瞻性研究】 - 观察性研究不随机化,均衡性差,可靠性略低
医学研究的偏倚
- 误差分为随机误差(测量误差、抽样误差)和系统误差,系统误差又称偏倚
- 偏倚类型:
1). 选择偏倚:
①.常见:就诊机会偏倚、失访偏倚和志愿者偏倚等,他们都不代表总人群
②.降低方法:随机抽样、代表性抽样
2). 信息偏倚:
①.信息收集时来自研究对象/研究者的系统误差
3). 混杂偏倚
①.暴露因素与疾病发生的因果关联受到其他因素的歪曲或干扰,通常由于分组不均衡、对照不可比 - 不同研究类型的偏倚
1). RCT研究受偏倚影响小,其随机化克服了混杂偏倚,盲法克服信息偏倚,仅受选择偏倚影响
2). 观察性研究受偏倚信息大,其病例对照研究受信息偏倚影响,不随机性受混杂偏倚干扰
统计分析策略
- 统计学方法、数据类型、数据分布
1). RCT研究采用简单统计学方法,如:t检验、F检验、卡方检验、秩和检验等
2). 观察性研究采用高级统计学方法,如:线性回归、logistic回归、Cox回归控制偏倚等 - SPSS统计软件
- 阅读结果并正确报告结果
定量数据正态性判定
- 数据分布决定统计方法:
- SPSS正态性判断法
1). 正态性检验:
①. 两层面:单样本、多样本正态性检验。多样本时因子列表勾选分组
②. 两方法:K-S法、S-W法。S-W法常见,常用于2000以下样本量检验(各组样本30-50属于小样本)
③. 显著性(P值):在正态性检验中含义为正态性成立的概率,>0.05正态性符合;<0.05偏态分布;
样本量较大时,P值往往都<0.05,不能反应数据正态性
④. 若样本稍微偏态,正态性检验可能正态性不符合(即P值<0.05),但若理论上该变量总体符合正态分布(即直方图显示近似正态),可等同于正态分布进行统计分析
⑤. 理论上就是偏态分布的数据,或实际数据分布严重的偏态者,需另类对待
⑥. 数据分类:
⑦. 当观察值均为正值时,若标准差>均值,则数据很可能是偏态分布,因为标准差大意味着可能存在极端值
⑧. SPSS软件使用:
【分析 -> 描述统计 -> 探索 -> 因变量列表、因子列表、统计、图】
【因变量列表:选入检验变量或者结局变量(是希望去探讨的目标变量)】
【因子列表:多样本正态性检验时 选入分组变量或者原因变量】
【统计:勾选“百分位数“获得P25, P75等】
【图:勾选“含检验的正态图和茎叶图、直方图”,前者进行正态性检验;后者直观地看出数据的分布形态】
2). 直方图:
①. 与P值结合判定正态性:
3). QQ图
定量数据统计描述
- 正态分布、近似正态分布和偏态分布描述:
- 定量数据统计表格:
0). 一般情况下,一个研究的第一张表格是描述样本的特征以及在病例组和对照组之间的分布差异性
医学研究论文,常见的数据有定量数据和定性数据,定量数据又有正态分布和偏态分布,采用均数和中位数描述;定性数据,一般采用率和构成比描述
1). 表格包括总样本、病例组样本、对照组样本和P值三列,其中总样本列可以省略
2). 偏态分布数据必须用中位数和四分位数间距M(IQR)或中位数(下四分位数P25、上四分位数P75)的形式
3). 表格中的数值一般保留1-2位小数不同,所有的P值应该提供三位小数
4). 所有的变量要注明度量单位(如果有的话)、表格数据的含义
5). 分类数据,一般用n和%共同来描述,列出所有组别的绝对数(具体数目)和相对数(百分比),形成多行多列的格式,一般相对数的小数点不能超过2位
有些分类数据,特别是二分类数据,可以只呈现阳性率的数据,比如患病率
成组两样本t检验
- 问题分析:
研究类型->几个变量->结局变量->分组及组数->结局变量类型->结局变量正态性检验 - 条件:
成组 正态性、方差齐性、独立性的定量变量数据的RCT研究
0). 成组实验:随机对照研究或自然成组(如男生一组,女生一组)
1). 正态性:两组数据均符合正态性或近似正态性
2). 方差齐:两组数据方差相等或近似相等(近似相等指标准差平方相差一倍以内),方差不齐考虑校正t检验(t’检验)
3). 独立性:各组观察值之间互相独立,不相互影响,比如样本A对照和干预后结果没有相关,随机化分组两组数据一般都是独立的(不独立的比如配对设计,如样本A对照时结果高,干预后结果也不会特别低) - 检验过程:
1). 建立两个假设,确定检验水准:
①. 零假设/无差别假设(H0):μ1=μ2,两组的总体均数相同
②. 备择假设/有差别假设(H1):μ1≠μ2,两组的总体均数相同
③. 检验水准(α)=0.05 :小概率事件,大于α被认为有统计学意义
2). 计算检验统计量t值:
3). 确定P值,作出推断结论
①. P值<0.05:P(H0)<0.05,为小概率事件,则接受H1,两组差值有意义
②. P值>0.05:P(H0)>0.05,则接受H0,两组数据无差别 - SPSS软件使用与数据读取:
【分析 -> 比较平均值 -> 独立样本T检验 -> 检验变量、分组变量、定义组 】
【检验变量:即实验中的结局变量】
【分组变量:group(??)】
【定义组:-> 使用指定值:对组1、组2赋值(是分组变量在SPSS数据库的赋值)】
0). 数据读取:
①.组统计 表:读取平均值(= 均数)、标准偏差(= 标准差)
②.独立样本检验->莱文…检验 表:读取显著性(= P值)、t(=t值)
③.独立样本检验->平均…t检验 表:读取Sig.(双尾)(= P值)、差值95%置信区间
1). 莱文方差等同性检验:
①. 显著性(=P值):
P值>0.05则方差齐性,采用t检验,结果读取假定等方差行的t、Sig.和置信区间;
P值<0.05则方差不齐,采用 t’ 检验(校正t检验),结果为假定等方差行的t、Sig.和置信区间
2). 平均值等同t检验:
①. Sig.(=P值):
Sig.<0.05:两组有统计学差异;
Sig.>0.05:两组无统计学差异
在两样本T检验中含义为两组均数相等(H0)的概率,因此P值<0.05则相同(H0)小概率无意义,而差异(H1)有意义,两组不等(与正态性检验中P值区分,正态性检验中P值是正态性成立的概率)
②. 差值95%置信区间:
差值(效应值):相对对照组的均数差值(效应)
95%置信区间(95%CI):总体上两组差值95%可能性所处的位置
1/. 统计学研究本质是通过样本猜总体,但只能猜到总体效应值的一个区间,即置信区间,通俗理解就是干预组相对对照组的效应值95%落在该区间内
2/. 置信区间与P值具有一定关联,若置信区间不包括0,则意味着肯定有效应,P值<0.05,反之同理
3/. 置信区间可判断是否具有临床意义:P值<0.05与临床上是否有效无关,只有置信区间最小值大于3.0才证明有临床意义
4/. 当P值<0.05时,置信区间越窄越可靠,越宽越不可靠
【注:P值粗暴地告诉我们有没有差别,置信区间告诉我们差别有多大】 - 规范结果表达:
1). 规范文字:
1/. 【A】组【结局变量】为(【均数±标准差】)【单位】,【B】组【结局变量】为(【均数±标准差】)【单位】,两组总体【结局变量】总体均数存在/不存在统计差异(t=【t值】 ,P =【P值】 )。
2/. 统计分析结果时可以写”两组均数的差异具有统计学意义/结局变量与干预变量存在统计学关联/干预组结局变量高于对照组“,但不可以下结论”干预组效果高于对照组/组间有显著性差异“
2). 规范表格:
3). 统计分析应提供效应值、检验统计量、P值和置信区间(往往95%置信区间)
①. 效应值:实验组相对对照组的作用大小,即差值,差值类型可以是均差、率差、中位数差、OR、RR或HR。治疗后的观察指标并非效果指标
②. P值:
1/. P值一律大写、斜体,使用不定式表示P值,中文期刊建议保留3位小数
2/. 若P值非常小,不能写为0.000,应写为<0.001;同理若P值非常大,不能写为1.000,应写为>0.999 - 分析习惯:
成组两样本(非参数)秩和检验
- 问题分析:
研究类型->几个变量->结局变量->分组及组数->结局变量类型->结局变量正态性检验 - 条件:
两组 独立的 严重偏态的定量数据的 比较
1). 两组非正态定量数据比较
2). 两组一段或两端存在着不确定数值的数据(如>5)比较
3). 有序分类数据(等级数据)比较 - 参数检验和非参数检验:
1). 参数检验:
以特定的的总体分布(如正态分布)为前提,对其总体参数(如总体均数)作假设检验,如:t检验、z检验、F检验
2). 非参数检验:
对总体分布不作严格假定,又称任意分布检验,直接对总体分布作假设检验,如秩和检验、卡方检验 - Wilcoxon Mann-Whitney秩和检验:
秩和检验为非参数检验方法中的一类,主要以秩次为基础的研究
秩次(rank): 将数值、变量值或等级变量值按一定顺序所排列的序号,即排名
秩和(rank sum,T值): 秩次之和,即排名之和
原理: 若两样本的平均秩次相等或接近,接近 (N+1)/2 ,则无差别假设H0成立,那么两样本无差别;反之有差别 - 检验过程:
1). 建立两个假设,确定检验水准:
H0:两组总体分布相同;
H1:两组总体分布不同
α = 0.05
2). 计算秩和T值和检验统计量Z值:
①.编秩:将两组数据由小到大放在一起编秩,若有相同数据,则该数据取平均秩次,即X .5,下个数据的秩次根据相同数据数目后延
②.求秩和T值:
分别求两组秩和,若两组样本数相等,则任取一组秩和T值;若两组样本数不等,则取样本少的组秩和为T值
③.求Z值(标准正态分布值,检验统计量)
3). 确定P值,作出推断结论:
Z值>1.96,则P(H0)<0.05,H0为小概率,则取H1,说明两组差异有统计学意义 - SPSS软件使用与数据读取:
【分析 -> 非参数检验 -> 旧对话框 -> 2个独立样本 -> 检验变量列表、分组变量、定义组、曼-惠特尼】
【检验变量:选入结局变量】
【分组变量:group(??)】
【定义组:两组的数据库赋值】
【曼-惠特尼:即Mann-Whitney秩和检验,勾选之】
0). 数据读取:
①. 秩 表:读取秩平均数、秩的总和
②. 检验统计表:读取Z(= Z值)、渐近显著性(双尾)(= P值)
【注:渐进显著性若为0.000,则指P值<0.001】
【注:T值、Z值若有负号可忽略】 - 规范结果表达:
1). 规范文字:
【A】组【结局变量】中位数为【中位数】(【P25,P75】)【单位】,【B】组【结局变量】中位数为【中位数】(【P25,P75】)【单位】,两组总体【结局变量】总体分布存在/不存在统计差异(z=【Z值】 ,P =【P值】 )。
2). 规范表格:
①.中位数差值置信区间计算方法:mp.weixin.qq.com/s/uCvIedN2bDSgyjISx0Jacg - t检验与秩和检验总结:
配对样本均数t检验/非独立两样本均数t检验
- 配对设计类型:
1).自身前后配对设计:同意受试对象处理前后的数据
2).平行/异体配对设计:同一受试对象两个部位的数据、同一样品用两种方法(仪器)检验的结果/配对两个受试对象分别接受两种处理后的数据 - 原理:
对于配对样本数据,应该首先计算出各对差值,再求差值的样本均数
若两组无差别或某组处理未生效时,理论上差值的总体均数为0
故可以将配对样本资料的假设检验视为差值样本均数与总体均数为0的比较(即差值的均数是否为0),所用方法即配对t检验 - 条件:
两组数据的差值符合正态性 - 检验过程:
1). 建立检验假设,确定检验水准:
H0:差值样本均数=0,干预后结局变量相同
H1:差值样本均数≠0,干预后结局变量不同
α:0.05
2). 先算差值的样本均值,再计算检验统计量t值
3). 确定P值,作出推断结论 - SPSS软件使用与数据读取
【转换->计算变量->目标变量、数字表达式】
【目标变量:新创建的一个代表差值的变量名】
【数字表达式:如计算两组的差值,即"A组-B组"】
【<-对差值变量进行正态性检验->】
【分析->比较平均值->成对样本T检验->配对变量】
【配对变量:将分组变量全部选入】
0). 数据读取
①.配对样本统计 表:读取平均值(= 均数)、标准偏差(= 标准差)
②.配对样本相关性 表:读取相关性
③.配对样本检验 表:读取平均值(=效应值)、差值95%置信区间、t(=t值)、Sig.(双尾)(=P值)
1). 配对样本相关性
①.相关性:
相关性越接近1,两组相关性越强
2). 配对样本检验 表
①.平均值:
即差值的样本均值,为报告中的效应值
②.Sig.(双尾):
即P值,P值<0.05,H0无意义,接受H1,差异有统计学意义;反之无差异 - 规范结果表达:
1). 规范文字:
【A】组【结局变量】为(【均数±标准差】)【单位】,【B】组【结局变量】为(【均数±标准差】)【单位】,两组总体【结局变量】总体均数存在/不存在统计差异(差值=【效应值】 ,95%CI 【】-【】,P =【P值】 )。
2). 规范表格:
配对秩和检验
- 两组配对资料,如果每对的差值 不符合正态分布,则配对t检验不合适,可采用配对秩和检验
- SPSS软件使用与数据读取:
【分析->非参数检验->旧对话框->2个相关样本->配对变量】
【配对变量:将分组变量全部选入】 - 配对设计注意事项:
1). 不是所有配对设计的研究结论都很可靠:
自身前后自身配对设计配对t检验的结果可以证明两组总体均数存在统计学差异,但不能说明干预因素有效,因为在时间上不可比
只有平行配对设计,尤其是配对随机化设计,产生的证据才具有可靠性
2). 配对随机化设计由于配对个体间差异性小,改善均衡性,提高可比性,甚至较完全随机对照研究具有更高的检验效能,更容易得出有差异的结果
3). 配对设计意味着非独立;成组设计意味着独立,完全随机设计属于成组设计的一种,除此之外还有自然成组
方差分析(F检验/ANOVA)
- 条件:
三个及以上随机分组的正态、方差齐、独立性的定量数据 - 原理:
多组(>2)数据若非要做t检验必须做三个成对的t检验,破坏了整体性,因此一般选择不看均数,看变异程度(方差),即方差分析(F检验),因为方差也是统计量,分析方差得到F检验统计量和P值,进而识别多组是否一致 - 分析步骤:
1). 提出检验假设,确定检验水准:
H0:μ1=μ2=μ3=… ,即每组总体均数都相同
H1:μ1μ2μ3…不全相等,至少存在一对(即两组)的μ不同
α = 0.05
2). 计算检验统计量F值
3). 确定P值,做出推断结论 - SPSS软件使用与数据读取:
【<-对每一组都进行正态性检验,确保符合正态分布->】
【分析->比较平均值->单因素ANQVA检验->因变量列表、因子、选项】
【因变量列表:选入结局变量】
【因子:选入分组变量group】
【选项:勾选方差齐性检验、韦尔奇】
0). 数据读取:
①.方差齐性检验 表:读取显著性(=P值.方差齐性)
②.ANOVA 表:读取 F(=F值)、显著性(=P值.F检验)
③.平均值相等性稳健检验 表:读取显著性(=P值.校正F检验)
1). 方差齐性检验:
①.显著性(=P值.方差齐性):P值<0.05,方差不齐;P值>0.05,方差齐
2). ANOVA:
①.显著性(=P值.F检验):P值<0.05,H0为小概率事件无意义,即差异有统计学意义
3). 平均值相等性稳健检验 表:
①.显著性(=P值.校正F检验):当方差不齐时使用该P值,P值<0.05,H0为小概率事件无意义,即差异有统计学意义 - 规范结果表达:
1). 规范文字:
两组不同【分组变量】下【结局变量】总体均数存在/不存在统计差异(F=【F值】 ,P =【P值.F检验/P值.校正F检验】 )。
2). 规范表格:
- 方差分析要求正态性、方差齐性,近似正态分布也可以用方差分析,方差不齐时用校正方差分析(校正F检验);严重偏态或存在着不确定的数值时可以采用秩和检验
- 多重比较:
若P>0.05,则分析终止;但若P<0.05,接受H1,即表明总体均数不全相等后还要进一步分析——哪两两均数相等?哪两两均数不等?即多重比较
I类错误:对多组的两两比较时用t检验,导致假阳性错误
1). 虽然P(H0)<0.05接受H1,但H0仍是有小概率的,即我们拒绝H0有小概率犯了I类错误,但由于检验水准α(小概率事件阈值)的存在,当犯错率不超过α(0.05)时可以认可H1被接受的结论。
多次两两比较时,由于比较次数变多,I类错误的概率会呈指数上升,使得α最终远高于0.05,这样P值很容易就小于α了,即假阳性
2). 解决措施:
①.方法一:α分割法
对α分割来校正检验水准,即α’=α/比较次数,最终P值<0.05/比较次数才有统计学意义
②.方法二:软件法
使用SPSS专用的方差分析多重比较方法,无须校正α
【…->单因素ANOVA分析->事后比较】
【事后比较:根据具体情况勾选LSD法/S-N-K法(Q检验)/邦弗伦尼/斯达克法/图基法/邓尼特法】
③.方法三:人工法/邓尼特法
多重两两比较会降低单个检验的效能,有时会出现方差分析阳性但多重比较全阴的情况,因此不用全部两两比较,而是挑选若干组进行有目标性的比较,即人工法——以正常对照组为对照,将剩余组分别与对照组用邓尼特法(Dunnet法)比较
要注意的是,正常对照组通常是研究设计时就已经指定的组,而不是数据分析时才指定的
2). 各种多重比较方法详述:
- 注意事项:
1). 实验性研究F检验与观察性研究F检验结论不同:
2). 两样本比较也可以用F检验:
3). F检验“三个性”同t检验,是原则,不是铁标准:
4). 多重比较方法选择:
成组多样本秩和检验(H检验)
- 条件:
多组 独立、严重偏态的 定量数据的比较 - 原理:
如果各组总体分布相同,则各组平均秩次应该相差不大 - 检验步骤:
1)建立假设,确定检验水准:
H0:各组总体分布相同
H1:各组总体分布不全相同
α = 0.05
2)编秩:
多组数据从小到大混合编秩
3)求各组秩和:
将各组秩次相加,即R
4)计算检验统计量H
5)确定P值,得出结论 - SPSS软件使用和数据读取:
【分析->非参数检验->旧对话框->K个独立样本->检验变量列表、分组变量、定义范围、克鲁斯卡尔-沃里斯】
【检验变量列表:选入结局变量】
【分组变量:选入分组变量】
【定义范围:有n组就在最小值和最大值分别填1和n】
【克鲁斯卡尔-沃利斯:勾选该检验类型,H检验】
0)数据读取:
①.秩 表:读取秩平均值
②.检验统计 表:读取克鲁斯卡尔-沃利斯H(K)(=H值)、渐近显著性(=P值)
1)秩 表:
2)检验统计表:
①.P值:<0.05证明各组总体分布不全相同 - 多重比较:
1)方法一:α-分割法
2)方法二:软件法
【分析->非参数检验->独立样本->目标、字段、设置->定制检验->克鲁斯卡尔-沃利斯单因素ANOVA检验、多重比较】
【克鲁斯卡尔-沃利斯单因素ANOVA检验:勾选该检验】
【<-双击运行输出的表格,右下方查看区域选择“成对比较”->】
【注意:读取Adj.Sig(=P值)】 - 规范结果表达:
1) 规范文字:
A组【结局变量】为【中位数】(【P25】,【P75】),B组【结局变量】为【中位数】(【P25】,【P75】),C组【结局变量】为【中位数】(【P25】,【P75】)…所有组总体分布存在/不存在统计差异(H=【H值】 ,P =【P值】 )。
其中,A组与B组存在着统计差异(P值=【P值】),B组与C组不存在着统计差异(P值=【P值】)
2)规范表格:
- 注意事项:
随机对照研究基本分析策略
- RCT研究通常关注几组干预后的结局变量,但干预前结局变量也有作用,其又称基线值,往往是相似的,具有可比性
1)完全随机:基线数据具有很好的可比性;但某些仍有可能分组不均衡,不可比不可靠
2)随意分组:往往不均衡,基线数据不可比
因此基线可以判断分组是否均衡(是否可比);若不均衡,可利用基线值减少不均衡带来的不利影响;同时丰富文章研究素材,深化统计分析的深度和广度 - 干预有效的医学证据:
1)基线最好可比
2)干预后 横向(平行同一时间)各组结局变量有统计学差异
3)试验组与对照组于干预前后(2x2)结局变量有统计学差异
4)试验组与对照组于干预前后(2x2)差值有统计学差异 - RCT研究四步分析法:
1)基线是否可比:最好分组均衡(P>0.05)
2)干预后横向有无差异:应该存在着统计学差异(P≤0.05)
3)两组干预前后有无差异性:对照组不一定有差异(P>0.05)(不必要),但是试验组应存在着统计学差异(P≤0.05)(必要)。
4)差值有无差异:在第二步没有差异的情况下,也许还可以提供对效果有利的信息(P≤0.05) - 检验方式选取:
1)基线上是否可比、干预后结局变量差异性:两样本t检验、两样本秩和检验
2)试验组前后差异性:配对t检验、配对秩和检验
3)差值差异性:两样本t检验、两样本秩和检验 - SPSS软件使用
【<-对每组数据进行正态性检验->】
【<-对基线进行两样本t/秩和检验->】
P值>0.05,说明干预前两组差异无统计学意义,可比
【<-对两组的结局变量进行两样本t/秩和检验->】
->拆分文件
【数据->拆分文件->比较组->分组依据】
【分组依据:选入实验分组[group]】
【<-对各组分别进行干预前后结局变量的配对t/秩和检验->】
->取消拆分文件
【数据->拆分文件->分析所有个案,不创建组】
【<-对两组差值进行正态性检验->】
【<-对两组差值进行两样本t/秩和检验->】
差值有统计学意义也可以一定程度上辅助证明干预后横向差异,体现在干预组较对照组干预幅度较大上 - 规范结果表达:
1)规范文字:
干预前【结局变量】总体均数无统计学差异(t=【T值】,P=【P值】);
干预后【结局变量】总体均数无统计学差异(t=【T值】,P=【P值】);
试验组、对照组干预前后【结局变量】存在着统计学差异(P = 【P值】);
试验组、对照组干预前后差值差异具有统计学意义(差值【差值】,95%CI【 - 】,P=【P值】)
2)规范表格:
- 注意事项:
1)案情分析帮助——PICOS:
2)基线不均衡时,常采用差值作为结局变量
3)可比性:p>0.05,可比
统计学差异:p<0.05,有统计学差异 - 多组时使用方差分析:
用方差分析/秩和检验,再结合多重比较
1)规范表格:
两组率比较的卡方检验(X2检验)
- 分类数据常用的描述方法:率和构成比
医学研究最常见的比较:率的比较
四格表/交叉表/行列表:由对照组、干预组两组各自的有效率和无效率构成 - 条件:
1)单因素的两组
2)数据为二分类的分类变量
3)完全随机设计
4)比较两组的率
5)样本量≥40,理论频数均≥5或至少一个1≤理论频数<5(后者情况用卡方矫正检验)
【注:其他情况用Fisher确切概率法】 - 原理:
卡方检验比较的是两组的分布
比较理论频数和实际频数吻合程度算出统计量P,再根据P决定接受H0还是H1
1)理论频数(T):又称期望频数,是假设H0成立时,各格子发生的假象频数
2)实际频数(A):实际上发生的单元格频数 - 步骤:
1)建立检验假设H0、H1,确定检验水平α
2)求检验统计量卡X2
3)求P值,做统计结论 - Fisher确切概率法/费希尔精确检验:
1)是一种精确检验的方法,应用于小样本研究(样本<40,至少一个T<1),或者当卡方检验P值近似0.05时也借助该法
2)不要觉得Fisher法是补充,相反,无论什么条件都可以用更精确的Fisher法,只不过卡方检验更加简单快捷,满足条件优先卡方检验 - SPSS软件使用与数据读取:
【分析->描述统计->交叉表->行、列、精确、统计、单元格】
【行:选入分组变量】
【列:选入结局变量】
【精确:勾选"精确"】
【统计:勾选“卡方”】
【单元格:勾选”实测“、“行/列”(取决于分组变量在行/列)】
0)数据读取
卡方检验 表:读取有效个案数.值(=样本数)、[表下注释自行解读](=理论频数>5的个数)、皮尔逊卡方.渐近显著性(=P值.卡方检验)、连续性修正b.渐近显著性(=P值.校正卡方检验)、费希尔精确检验.精确显著性(=P值.Fisher确切概率)
【注:三种渐近显著性的选择根据样本数和理论频数>5的个数决定】 - 规范结果表达:
1)规范文字:
【对照】组有效率【对照组有效率】%,【干预】组有效率【干预组有效率】%,两组有效率存在着/不存在统计学差异(差值【两组有效率相减】,差值95%CI 【 - 】,P=【P值】)。
2)规范表格:
多组率或构成比比较的卡方检验
- 类别:
1)多样本的两组率比较:n样本行 x 2列
2)两样本的多组率(构成比)比较:2行 x 多组率列
3)多样本的构成比(构成比)比较:n样本行 x 多组率列 - 步骤:
1)建立检验假设,确定检验水准:
H0:三组总体有效率相同
H1:三组总体有效率不全相同
α = 0.05
2)计算检验统计量
3)确定P值,作出推断结论 - 条件:
1)行列表中每格的T>1
2)1≤T<5的格子数不宜超过格子总数的1/5
若条件不达标则增大样本量、看情况删去T太小的行列或与性质相近的合并,实在不行采用Fisher确切概率法
【注:多行多列的卡方检验没有校正卡方检验】 - SPSS软件使用与数据读取:
【分析->描述统计->交叉表->行、列、精确、统计、单元格】
【行:选入分组变量】
【列:选入结局变量】
【精确:勾选"精确"】
【统计:勾选“卡方”】
【单元格:勾选”实测“、“行/列”(取决于分组变量在行/列)】 - 多重比较:
与方差分析相似,接受H1只能说明不全相同,但具体那两个总体率有差别还需要做多多组率的重比较
1)方法:
①.α分割法:将总表拆成n个2x2行列表分别进行卡方检验,再将α/n得出新的α
如何拆分?
【数据->选择个案->选择】
【选择:勾选“如果条件满足”,./->”如果“】
【如果:输入”group=1 | group=2“】(即比较组1和组2)
②.软件法
【分析->描述统计->交叉表->行、列、精确、统计、单元格】
【行:选入结局变量】
【列:选入分组变量】
【精确:勾选"精确"】
【统计:勾选“卡方”】
【单元格:勾选”实测“、“列”(必须选列)、比较列比例、调整P值】
1/. 读表:
【注:每组计数右下角角标标注一样的字母即无统计学差别,反之则有】 - 规范结果表达:
1)规范文字:
【A组】【结局变量】有效率为【A有效率】%(【A组有效数】/【A组样本数】),【B组】【结局变量】有效率为【B有效率】(【B组有效数】/【B组样本数】),【C组】【结局变量】有效率为【C有效率】%(【C组有效数】/【C组样本数】),三组数据有效率存在着统计差异(X2 =【卡方值】,P=【P值】)。【】组与【】组相比,无统计学差异(P=【P值】),【】组与【】组、与【】组均存在着统计学差异(P=【P值】)
2)规范表格:
等级资料(有序数据)比较的秩和检验
无序分类数据的两样本差异性比较,采用率或构成比的卡方检验;但有序分类数据的两样本比较,有些情况下(比如分析整体效果是否有差异时)卡方检验无法实现目的(但大多数情况下还是用卡方比较构成比分布差异性)
- 条件:
1)根据单因素分成两组或以上
2)有序分类变量数据/等级资料
3)比较不同组别的平均程度分布差异,而不是整体构成比分布有无差异 - 过程:
1)建立假设,确定检验水准:
H0:两组结局变量平均程度相同
H1:两组结局变量平均程度不同
α=0.05
2)混合编秩,计算秩和,求检验统计量z值
3)确定P值,作出推断 - SPSS软件使用与数据读取:
【<-参考两独立样本秩和检验->】 - 等级资料多样本秩和检验:
采用多样本秩和检验(K-W H检验)
https://blog.shakuameji.com/archives/spss#成组多样本秩和检验(H检验) - 注意:
1)对于等级资料,卡方检验与秩和检验有一定的异同。
首先,两者方法都是探讨等级资料分布的差异性。
但是,卡方检验探讨的是构成比分布,准确来说是分布轮廓的差异性;秩和检验探讨的是分布位置差异性,比较的是平均位置的差别。
2)严重不等距等级资料需谨慎开展秩和检验:
在一些场合,等级资料是不等距的,各等级之间的程度递增不一致,比如:死亡、无效、有效之间(疗效递增程度不一致),此时谨慎采用秩和检验分析
3)等级资料/有序数据可能秩和也可以卡方,但是二分类数据只能卡方
数据的转换分析策略
- 很多情况下,可以将定量数据转换成定性数据,有序数据转换为二分类数据
- SPSS软件使用与数据读取:
【转换->重新编码为不同变量->输出变量、标签、变化量、旧值和新值】
【输出变量、标签:输入新变量名、新变量的注释】
【变化量:输入变量、标签点击,点击后左边边框内出现"变量->新变量"的表达式】
【旧值和新值->新值.值、./->旧值.范围】
【新值.值:新变量的等级变量值,如ABCD,1234】
【旧值.范围:根据新变量等级值所对应的旧变量值范围最大/最小填写,注意如果想表示<130,那么从最低到值栏填写129.999】
【<-对定量数据:t检验/秩和检验/方差分析->】
【<-对有序数据:卡方检验/秩和检验->】
【<-对二分类数据:卡方检验->】 - 总结:
1)数据转换可以产生更多信息和统计结果,帮助我们从多角度分析数据
2)但从定量->等级->二分类数据转换过程中会损失信息,一般来说P值往往越来越大
观察性研究(调查研究)
- 不对研究者施加任何干预。通过对研究对象的客观观察和记录,描述观察结果,并分析因素之间的关系
- 主要方法:
1)现况调查(横截面调查)
2)病例对照研究
3)队列研究
现况调查(横截面调查)
- 定义:
用一时性的调查方法,获得某地某人群在某一时点上关于某种疾病及有关影响因素(流行病学称之为暴露因素)自然成组的现况信息,同时探究疾病与暴露因素之间的相关性 - 目的:
1)估计该人群相关健康指标现状和水平
2)探索健康水平与暴露因素之间的关系
- 统计学方法:
1)统计描述(描述现状):
计算样本的均数±标准差、中位数(四分位数间距)、率、构成比、相对比,和RCT研究统计方法使用规则相同
2)总体参数置信区间估计(估计总体的区间):
RCT研究计算差值的置信区间,现况调查计算总体均数、总体率的置信区间
3)差异性分析(人群的“空间、时间、人间”分布与比较):
①.两样本t检验、两样本秩和检验、方差分析、多样本秩和检验、两样本卡方检验、多样本卡方检验
②.由于现况调查中,自然分组导致分组不均衡,观察性研究的分组比较结论不像实验性随机化分组的结论可靠
③.因此若有统计学差异则只能认为两组样本存在差异,但不能认为暴露因素肯定会影响结局变量,也不能说暴露因素是结局变量的决定因素
4)相关与回归法(关联性分析):
①.观察性研究往往采集多个变量
②.变量之间可能存在一定的关系,研究不同变量之间的相关性是医学研究的重要内容
③.相关性研究经常会应用相关分析
④.结局变量可能与具有相关性的多个变量(相关因素)有因果关系
⑤.可以通过构建回归方程来拟合变量之间的因果关系,现况调查常用的回归模型是线性回归和logistic回归
直线相关分析/皮尔逊(Pearson)相关分析
- 事物间关系的表现形式:确定性形式、非确定性(随机)形式
- 相关关系:随机变量间既互相联系,但又不是完全确定的关系
- 相关关系的分类:
1)正相关
2)负相关
3)非线性相关(曲线相关)
4)零相关(无相关) - 直线相关:两个随机变量X、Y之间呈线性趋势的关系,又称简单相关
- 相关:组间有差别,即为有相关
相关系数:对两个随机变量之间线性关系密切程度的数学度量
相关分析:对相关关系的有无和关系大小进行统计分析的方法 - 直线/秩相关分析法:对线性关系的有无及大小进行统计分析的方法
- 条件:
1)研究两个变量的线性关系
2)双变量均为正态或近似正态分布的定量数据
3)常见于现况调查和队列研究 - 步骤:
1)绘制散点图,判断线性趋势
【注:散点图对两个变量之间有无相关关系进行大致描述,但不能准确反映变量之间的关系密切程度】
2)直线相关系数(Pearson相关系数/积差相关系数):
①.总体相关系数ρ:若ρ≠0,称X和Y线性相关;若ρ=0,称X和Y不相关
②.样本相关系数r:往往用来代替总体相关系数。决定相关强度与相关方向
相关强度:取值范围 | r | ≤1,绝对值大小表示两变量之间直线联系的密切程度。(0.7以上强;0.4以下弱)
相关方向:当r为负值时,称为负相关;当r为正值时,称为正相关
3)r的假设检验:
样本相关系数r存在抽样误差,要进行假设检验以判断总体相关系数ρ是否等于0,常用t检验分析ρ和0是否有差异性 - SPSS软件操作与数据读取
【分析->相关->双变量->变量】
【变量:选入判断相关性的两个变量】
0)数据读取
①.Correlations 表:读取Person Correlation(=皮尔逊相关系数)、Sig.(=P值)
1)Correlations 表
①.皮尔逊相关系数:决定相关的强度
②.P值:P<0.05,相关;P>0.05,不相关 - 注意:
1)相关分析前绘制散点图
【图形->旧对话框->散点图/点图】
2)要求线性相关分析的两个变量是服从双变量正态分布或者近似正态的随机变量
3)散点图出现明显脱离分布的异常值时慎用相关
4)相关关系不一定是因果关系
5)注意P值和r值的区别,前者决定是否相关,后者决定相关强度
秩相关分析/斯皮尔曼相关分析
- 可以研究偏态或者等级变量的相关,与秩和检验相似,只是前者研究相关性后者研究差异性。
- 对象:
1)两定量变量至少有一个变量是非正态分布
2)两等级变量
3)一个定量变量+一个等级变量 - SPSS软件操作与数据读取
【分析->相关->双变量->变量、皮尔逊、肯德尔tau-b、斯皮尔曼】
【变量:选入判断相关性的两个变量】
【皮尔逊:取消勾选“皮尔逊”】
【斯皮尔曼:勾选“斯皮尔曼”】
【肯德尔tau-b:仅在比较两个等级变量时勾选】
0)数据读取:
①.Correlations 表:读取 Correlation Coefficient(=斯皮尔曼相关系数)、Sig.(=P值)
1)Correlations 表
①.斯皮尔曼相关系数:决定相关的强度
②.P值:P<0.05,相关;P>0.05,不相关 - 注意:
秩相关分析用于等级或偏态分布变量的分析,若双变量有一个是二分类变量或者无序多分类,选择用卡方检验
简单线性回归分析
- 概念:两变量存在线性关系,可以建立两变量的关系函数,研究因变量对自变量的数量依存关系。构建只有一个自变量的线性回归方程,称之为简单线性回归,又称单因素回归分析
- 条件:
1)回归方程应有实际意义(通常需要有因果关系),仅相关不能进行回归
2)符合四点:线性、独立性、正态性(自变量正态)、方差齐性
3)结局变量为定量变量,自变量为定量变量/二分类变量,研究变量间的线性数量依存关系
4)常见于现况调查和队列研究 - 步骤:
1)求解/构建回归方程的过程称为拟合过程/建模,形成的方程(函数)称为“统计模型”
2)确定其所来自的直线回归关系是否确实存在,即是否总体参数β≠0,
3)采用t检验看是H0(β=0)还是H1(β≠0) - 最小二乘原则:
- SPSS软件操作与数据读取:
【分析->回归->线性->因变量、自变量】
!
0)数据读取:
①.模型摘要b 表:读取:调整后R方(=决定系数)
②.ANOVAa 表:读取:显著性(=P值)
③.系数a 表:读取:(常量).B(=常数项)、胰岛素.B(=回归系数)、胰岛素.显著性(=P值)
1)模型摘要b 表:
①.决定系数:R方越大,建模对真实关系模拟度越高
2)ANOVAa 表:
①.P值:P<0.05,模型有统计学意义
3)系数a 表:
①.P值:P<0.05,自变量对因变量有影响 - 注意:
①.当自变量是定量变量时,回归分析P值与直线相关分析P值相同
②.当自变量时分类变量时,回归分析P值与t检验P值相同(男、女BMI经t检验存在差异性体现BMI与性别的相关性))
多重线性回归(多因素线性回归)
- 条件:
- 步骤:
1)线性关系描述(当自变量时分类变量时无线性要求)
2)用各变量的数据建立线性回归方程
3)对总的方程进行假设检验
4)回归分析应用条件诊断 - SPSS软件操作与数据读取:
【图形->旧对话框->矩阵散点图】
【分析->回归->线性->因变量、自变量、统计量、图】
【统计量:勾选“德宾-沃森”】
【图:Y选入“*ZRESID”,Z选入“*ZPRED”,勾选“直方图”、“正态概率图”】
0)数据读取:
①.模型摘要b 表:读取:调整后R方(=决定系数)、德宾-沃森(=独立性)
②.直方图(确定正态性)、散点图(确定方差齐性)
③.ANOVAa 表:读取:显著性(=P值)
④.系数a 表:读取:(常量).B(=常数项)、变量.B(=偏回归系数)、变量.显著性(=P值)、标准化系数Beta、t(=t值)
1)模型摘要b 表:
①.决定系数:R方越大,建模对真实关系模拟度越高
②.独立性:值在04之间,越靠近2越符合独立性,13之间都可以接受
2)散点图:标准化残差值(Y轴)分布在0值上下,不因预测值(X轴)增大而分布特征发现明显变化,则方差齐性符合
3)ANOVAa 表:
①.P值:P<0.05,模型有统计学意义,至少一个自变量的回归系数不为0
4)系数a 表:
①.P值:P<0.05,自变量对因变量有影响
②.偏回归系数:仅表明该变量的自身影响幅度
如果是分类变量可能有某个类别是危险因素,具体是哪个类别看数据库赋值,SPSS中是赋值较高者比赋值较低者/从赋值低变化到赋值高
③.标准化系数Beta:哪个变量该值大,哪个变量影响越大 - 规范结果表达:
1)规范文字:
纳入【变量1】、【变量2】和【变量3】构建多因素线性回归方程。结果发现,不同【变量1】对【结局变量】的影响有统计学差异(b=【偏回归系数】,t=【t值】,P=【P值】)…
2)规范表格:
- 注意:
- 残差分析:
线性回归分析,光光建模还不够,还得包括模型的总体拟合效果评价,模型条件的诊断。若模型诊断和评价结果不理想,上表的结果可能毫无意义。整个模型的诊断,最重要的工作是残差分析。
现况调查的综合案例分析
- 步骤:
1)统计描述
2)参数置信区间估计
3)关联性分析:
①.差异性分析(t检验/方差检验/卡方检验/秩和检验)、相关分析(直线相关/秩相关)
②.单因素回归分析
③.多因素回归分析和logistic回归 - 例如:
- 注意
1)实验性研究,往往讨论试验组和对照组的结局的差异性,而观察性研究往往探讨的是某一个因素是不是影响因素,自变量与因变量是否相关,两者都从各自角度探讨变量与变量之间的关联性。因此对照组与干预组的差异性等同于结局变量与干预因素的相关性——差异即相关!
2)以估计总体为主要目的的现况调查,必须强调抽样的代表性问题
3)现况调查的因果关联性分析,往往是探索性的研究,结论侧重于相关而不是因果。因为现况调查暴露因素与结局数据是同一个时间点调查获得,其因果关系很难理清。因此,现况调查一般结论侧重于说暴露因素与结局相关性,而不是因果关系。一般流行病学研究认为现况调查可以因果关系提供线索,但无法证明因果。
撰写现况调查论文,在讨论与结论指出“该研究为现况调查,研究因素与结论的关系是探索性的,其因果关系需要进一步通过前瞻性研究予以确认。”