正态分布(normal distribution)是一种最常见、最重要的连续型随机变量分布,许多统计方法如t检验、方差分析等需要样本数据满足正态分布的条件。
在医学研究中,有很多生理、生化指标服从或近似服从正态分布,如红细胞计数和血红蛋白含量等,但并不能保证所有搜集到的样本数据都一定服从正态分布,有的资料可能会出现一定的偏态或者是服从其他分布,这就需要对数据资料进行正态性的检验。
下面,我们一起来学习在spss中用K-S检验对医学数据进行正态分布检验的具体方法。
(1)什么是正态分布?
如果随机变量X的分布服从概率密度函数
,
则称X服从正态分布,记作X~N(μ,
),μ为X的总体均数,
为总体方差。
可以知道,正态分布有两个参数,即位置参数μ和形态参数σ。
若固定形态参数σ,则正态曲线的位置随着μ的改变沿X轴左右移动;若固定位置参数μ,则正态曲线的形状随着σ的改变沿着Y轴变高变低。
(2)什么是K-S检验?
K-S(Kolmogorov-Smirnov)检验,也称D检验,基于累计分布函数,通过对两个分布之间的差异的分析,用以检验样本是否服从某一指定分布的方法。若累计频数分布与指定分布差异很小,则推论该样本服从该指定分布。其基本原理如下:
H0:样本来自的总体分布服从某指定分布。
H1:样本来自的总体分布不服从某指定分布。
检验统计量为:
注:该指定分布可以是连续分布如正态分布、指数分布、均匀分布,也可以是离散分布如泊松分布。
(3)适用条件
K-S检验适合大样本的检验,样本量一般在100以上。
现有一组儿童身高及其身高评分的样本数据,样本量为164。我们采用K-S检验儿童身高和身高评分数据是否符合正态分布。
(1)在SPSS中的具体操作
①依次点击“分析——非参数检验——1个样本”。
②在出现的“单样本K-S检验”窗口中
③将“儿童身高”和“身高评分”变量放入“检验变量列表”;检验分布选择“常规”
④点击“确定”,得到检验结果。
(2)结果解读
由检验结果可知,儿童身高和身高评分的显著性P=0.200>0.05,则接受原假设,认为样本与所指定的分布方法一致,即与正态分布一致,可认为儿童身高和身高评分服从正态分布。
一般来说,医学数据的正态分布检验包括图示法和参数法,本文介绍的K-S检验属于参数法。后续我们将持续更新其他检验正态分布的方法。
SPSS配对样本t检验在SPSS中的操作,输出结果解读及SCI数据分析报告撰写
SPSS数据缺失值处理方法,SPSS操作及结果解读,数据分析报告
初识SPSS数据分析:如何搜集数据?SPSS数据采集要点!
SPSS卡方检验操作视频课程及SPSS软件输出结果解读!
SPSS单样本T检验视频教程(含SPSS数据分析单样本T检验操作及输出结果解读)
SPSS数据变量类型,变量赋值,SPSS数据赋值方法,SPSS软件数据视图和变量视图使用方法
SPSS数据分析教程:SPSS四格表卡方检验案例(含SPSS实操演示及输出结果)
数据缺失值该如何处理?SPSS处理数据缺失值的详细操作步骤