理论解释
关于假设检验的原理,参见如下文章,直接点击蓝色字体即可跳转至相应文章。
案例说明
表1 中记录的是两个公司的部分员工的月收入数据,问:这两个公司的员工月收入是否有显著差异。
公司1 | 3322 | 3456 | 3786 | 3198 | 3789 |
公司2 | 3732 | 3623 | 3548 | 3874 | 4123 |
公司1 | 3042 | 2990 | 3045 | 3016 | 3088 |
公司2 | 3088 | 3042 | 2990 | 3045 | 3016 |
公司1 | 3352 | 3645 | 4329 | 4090 | 4012 |
公司2 | 3198 | 3789 | 3645 | 4329 | 4090 |
公司1 | 3088 | 3888 | 3887 | 3667 | 3564 |
公司2 | 3016 | 4897 | 4678 | 4532 | 4400 |
公司1 | 3645 | 4329 | 4090 | 4012 | 3088 |
公司2 | 4999 | 5089 | 4329 | 4090 | 4012 |
公司1 | 2999 | 3456 | 3789 | 3210 | 3343 |
公司2 | 3088 | 3888 | 3887 | 6019 | 3786 |
公司1 | 3088 | 3042 | 2990 | 3045 | 3016 |
公司2 | 4012 | 3088 | 3042 | 2990 | 3045 |
公司1 | 3721 | 3732 | 3623 | 3548 | 3874 |
公司2 | 3999 | 4487 | 4490 | 5139 | 3667 |
表1 两个公司员工月收入数据
SPSS实现
在SPSS中导入或者录入数据,然后依次点击分析<均值比较<独立样本t检验,如下图所示,将月收入选入“检验变量”,将公司选入“分组变量”,并点击“定义组”按钮,输入两个公司的代号。如果分组变量是连续型变量,比如年龄,可以将40岁作为一个分割点,40岁以下算青年,40岁以上中年(职场上一般只有20到60岁的人)。输入完毕后,点击确定。
得到结果中,同样包含描述性统计量,此处不再解释。直接来看独立样本t检验的结果。如表2所示,置信区间已经截去,只保留了t检验部分。在SPSS中,进行独立样本t检验时,首先会进行方差齐性的检验,如果方差相等采用一种方法计算t统计量,如果方差不相等,则采用另外一种方法计算t统计量。方差齐性检验的原假设与备择假设分别是:
来看表2中的方差齐性检验的sig值,sig=0.004<0.05,因此拒绝原假设,认为方差不齐,选择第二行来查看t检验结果,sig=0.004<0.05,也拒绝了t检验的原假设(两个公司员工月收入相等),所以认为两个公司月收入差异显著。
表2 独立样本t检验结果
R语言实现
下面给出该案例的R语言实现。当使用这段代码时,只需要将数据文件的地址改成自己的数据文件地址,并修改变量名称即可。
t_test03<-read.csv(file="D:/两独立样本t检验salary.csv",
header=TRUE)
t.test(t_test03$公司1月收入,t_test03$公司2月收入,
alternative=c("less"), #将“less”改成“two.side”即可做双侧检验
#可以根据具体的检验结果改这个参数的值
mu=0,paired=FALSE,
var.equal=TRUE,
conf.level=0.95
)
分析结果:
Two Sample t-test
data:t_test03$公司1月收入 and t_test03$公司2月收入
t=-2.9898, df=78, p-value=0.001866
alternative hypothesis:true differenceinmeans is less than 0
95 percent confidence interval:
-Inf-176.2655
sample estimates:
mean of x mean of y
3497.350 3895.025
p-value=0.001866<0.05拒绝原假设,选择备择假设:alternative hypothesis:true differenceinmeans is less than 0。结论是公司1的员工月收入显著低于公司2。
本文暂时没有评论,来添加一个吧(●'◡'●)