数据加权原理—SPSS中实现

之前有同学问到加权的问题,也有同学问到卡方检验数据格式的问题。本文将回答这两个问题,并且还会附带介绍SPSS保存的数据文件可以包含的信息。

一、加权的操作与概念解释

先介绍操作,然后根据操作的结果来介绍加权的概念。

这里会使用SPSS自带一个数据集,如果你还不知道如何找到SPSS内置的数据集,请点击《用好统计软件自带数据集》,关于这些数据的说明,请点击《spss自带数据集说明》。

这里使用accidents.sav这个数据文件,打开后数据格式如下图所示。

如果需要做性别与年龄段的交通事故交叉分析,并且进行性别与年龄段的交通事故卡方检验,那么就需要将交通事故进行加权处理。为了让大家明白加权的作用,将在加权与不加权的情况下分别进行交叉分析。根据结果的不同,你将能够瞬间明白为啥要进行加权处理。

不加权时做的交叉分析表

在不对数据进行加权时,进行交叉分析,交叉分析的操作步骤是分析<描述<交叉表。

你会发现每一个交叉单元格中都是数字1,没有加权时,这些单元格的权重就是1.

进行加权操作

点击数据<加权个案出现如下菜单面板,将事故变量选入“加权个案”选框。点击确定按钮,数据加权完毕。

如果这个数据在每一次打开是都需要加权,那么加权操作完毕后,在数据视图点击保存。

加权后进行交叉分析

加权后再次进行交叉分析,会看到交叉单元格中的数字已经不在是1。是对应加权后的数字。

取消加权

加权数据并且保存数据文件以后,加权这一过程已经保存到数据文件中了,如果在下一次分析中,不需要对这个变量进行加权,那么就需要进行取消加权操作。调出加权操作的菜单。将事故选出加权个案对话框。点击确定。并点击数据视图中的保存,保存数据文件。数据就取消加权了。

2、卡方检验数据的格式

独立性卡方检验数据格式

1第一种—数据进行了汇总处理

将两个分类变量分别各自安排在一列当中,计数单独安排在一个列中。这个数据中,年龄段和性别为两个分类变量,事故属于计数变量

2第二种—数据没有进行汇总处理

这种数据一般是原始数据进行初步整理后得到,一行表示一个原始记录,在问卷调查中一行对应于一个人。这种数据在进行交叉分析时,无需对变量进行加权操作。这种格式的数据也行进行卡方适合性检验。

适合性卡方检验数据格式

适合性卡方检检验的数据分为两列,一列为分类变量,另外一列为计数(数值)变量。

没有汇总的数据也能够进行适合性卡方检验。

关于卡方检验的操作,原理解释,前面已经发过多篇文章进行介绍。将这些文章汇总到这里,需要的同学可以点击文章标题进行浏览。

卡方检验原理与应用实例

AME统计021|戏说卡方检验(一)

AME统计022|戏说卡方检验(二)

AME统计023|戏说卡方检验(三)

AME统计024|戏说卡方检验(四)

3、SPSS数据文件包含的信息

SPSS数据文件格式为.sav,这种数据文件可以保存数据的标签,值标签,对数据的一些操作痕迹,比如进行加权,进行个案选择等。留意这个特性可以提高数据分析工作的效率。

附本文内容的操作视频

原文链接:,转发请注明来源!