使用SPSS进行分箱功能将连续数据离散化的步骤
“分箱法”相信学过统计学的小伙伴们都不会陌生,它的主要作用就在于对噪音数据进行剔除,同时将连续型数据进行离散处理。在模型分析开始前,我们经常需要使用到分箱法来处理和清洗数据。 作为一款功能全面、专业性强的统计分析软件,IBM SPSS Statistic同样具备分箱功能,下面我们一起来通过一篇教程了解一下。 图1是我们准备要分箱的数据,我们将对年龄列进行分箱,按照每10岁为一个标准进行分箱。 图1:要分箱的数据 点击“转换”中的“可视分箱”,进入分箱设置界面。 图2:可视分箱 将“年龄”拉入到“要分箱的变量”中,然后点击“继续”。 图3:拉入要分箱的变量 在图4所示界面,我们可以看到要扫描的个案数共34个,其中最大的变量值为67,最小为22,也就是说要分箱的数据年龄段在22到67岁之间。 我们在“分箱化变量”中,填入“年龄段”,作为一个之后新生成的变量,随后点击“生成分割点”按钮。 图4:分箱化变量 按照我们的分箱目的,我们要每隔10岁分组一次,最小的年龄为22岁,则我们需要在第一个分割点位置填写“20”,然后在宽度填写“10”,此时点击键盘Tap键,S...