数据加权原理—SPSS中实现-未分类-里克资源网

之前有同学问到加权的问题，也有同学问到卡方检验数据格式的问题。本文将回答这两个问题，并且还会附带介绍SPSS保存的数据文件可以包含的信息。

一、加权的操作与概念解释

先介绍操作，然后根据操作的结果来介绍加权的概念。

这里会使用SPSS自带一个数据集，如果你还不知道如何找到SPSS内置的数据集，请点击《用好统计软件自带数据集》，关于这些数据的说明，请点击《spss自带数据集说明》。

这里使用accidents.sav这个数据文件，打开后数据格式如下图所示。

如果需要做性别与年龄段的交通事故交叉分析，并且进行性别与年龄段的交通事故卡方检验，那么就需要将交通事故进行加权处理。为了让大家明白加权的作用，将在加权与不加权的情况下分别进行交叉分析。根据结果的不同，你将能够瞬间明白为啥要进行加权处理。

不加权时做的交叉分析表

在不对数据进行加权时，进行交叉分析，交叉分析的操作步骤是分析<描述<交叉表。

你会发现每一个交叉单元格中都是数字1，没有加权时，这些单元格的权重就是1.

进行加权操作

点击数据<加权个案出现如下菜单面板，将事故变量选入“加权个案”选框。点击确定按钮，数据加权完毕。

如果这个数据在每一次打开是都需要加权，那么加权操作完毕后，在数据视图点击保存。

加权后进行交叉分析

加权后再次进行交叉分析，会看到交叉单元格中的数字已经不在是1。是对应加权后的数字。

取消加权

加权数据并且保存数据文件以后，加权这一过程已经保存到数据文件中了，如果在下一次分析中，不需要对这个变量进行加权，那么就需要进行取消加权操作。调出加权操作的菜单。将事故选出加权个案对话框。点击确定。并点击数据视图中的保存，保存数据文件。数据就取消加权了。

2、卡方检验数据的格式

独立性卡方检验数据格式

1第一种—数据进行了汇总处理

将两个分类变量分别各自安排在一列当中，计数单独安排在一个列中。这个数据中，年龄段和性别为两个分类变量，事故属于计数变量。

2第二种—数据没有进行汇总处理

这种数据一般是原始数据进行初步整理后得到，一行表示一个原始记录，在问卷调查中一行对应于一个人。这种数据在进行交叉分析时，无需对变量进行加权操作。这种格式的数据也行进行卡方适合性检验。

适合性卡方检验数据格式

适合性卡方检检验的数据分为两列，一列为分类变量，另外一列为计数（数值）变量。

没有汇总的数据也能够进行适合性卡方检验。

关于卡方检验的操作，原理解释，前面已经发过多篇文章进行介绍。将这些文章汇总到这里，需要的同学可以点击文章标题进行浏览。

卡方检验原理与应用实例

AME统计021|戏说卡方检验（一）

AME统计022|戏说卡方检验（二）

AME统计023|戏说卡方检验（三）

AME统计024|戏说卡方检验（四）

3、SPSS数据文件包含的信息

SPSS数据文件格式为.sav，这种数据文件可以保存数据的标签，值标签，对数据的一些操作痕迹，比如进行加权，进行个案选择等。留意这个特性可以提高数据分析工作的效率。

附本文内容的操作视频