之前有同学问到加权的问题,也有同学问到卡方检验数据格式的问题。本文将回答这两个问题,并且还会附带介绍SPSS保存的数据文件可以包含的信息。
一、加权的操作与概念解释
先介绍操作,然后根据操作的结果来介绍加权的概念。
这里会使用SPSS自带一个数据集,如果你还不知道如何找到SPSS内置的数据集,请点击《用好统计软件自带数据集》,关于这些数据的说明,请点击《spss自带数据集说明》。
这里使用accidents.sav这个数据文件,打开后数据格式如下图所示。
如果需要做性别与年龄段的交通事故交叉分析,并且进行性别与年龄段的交通事故卡方检验,那么就需要将交通事故进行加权处理。为了让大家明白加权的作用,将在加权与不加权的情况下分别进行交叉分析。根据结果的不同,你将能够瞬间明白为啥要进行加权处理。
不加权时做的交叉分析表
在不对数据进行加权时,进行交叉分析,交叉分析的操作步骤是分析<描述<交叉表。
你会发现每一个交叉单元格中都是数字1,没有加权时,这些单元格的权重就是1.
进行加权操作
点击数据<加权个案出现如下菜单面板,将事故变量选入“加权个案”选框。点击确定按钮,数据加权完毕。
如果这个数据在每一次打开是都需要加权,那么加权操作完毕后,在数据视图点击保存。
加权后进行交叉分析
加权后再次进行交叉分析,会看到交叉单元格中的数字已经不在是1。是对应加权后的数字。
取消加权
加权数据并且保存数据文件以后,加权这一过程已经保存到数据文件中了,如果在下一次分析中,不需要对这个变量进行加权,那么就需要进行取消加权操作。调出加权操作的菜单。将事故选出加权个案对话框。点击确定。并点击数据视图中的保存,保存数据文件。数据就取消加权了。
2、卡方检验数据的格式
独立性卡方检验数据格式
1第一种—数据进行了汇总处理
将两个分类变量分别各自安排在一列当中,计数单独安排在一个列中。这个数据中,年龄段和性别为两个分类变量,事故属于计数变量。
2第二种—数据没有进行汇总处理
这种数据一般是原始数据进行初步整理后得到,一行表示一个原始记录,在问卷调查中一行对应于一个人。这种数据在进行交叉分析时,无需对变量进行加权操作。这种格式的数据也行进行卡方适合性检验。
适合性卡方检验数据格式
适合性卡方检检验的数据分为两列,一列为分类变量,另外一列为计数(数值)变量。
没有汇总的数据也能够进行适合性卡方检验。
关于卡方检验的操作,原理解释,前面已经发过多篇文章进行介绍。将这些文章汇总到这里,需要的同学可以点击文章标题进行浏览。
卡方检验原理与应用实例
AME统计021|戏说卡方检验(一)
AME统计022|戏说卡方检验(二)
AME统计023|戏说卡方检验(三)
AME统计024|戏说卡方检验(四)
3、SPSS数据文件包含的信息
SPSS数据文件格式为.sav,这种数据文件可以保存数据的标签,值标签,对数据的一些操作痕迹,比如进行加权,进行个案选择等。留意这个特性可以提高数据分析工作的效率。
附本文内容的操作视频