马上注册登录,享用更多感控资源,助你轻松入门。
您需要 登录 才可以下载或查看,没有账号?注册
|
×
本帖最后由 疯狂的吗啡 于 2016-11-16 09:20 编辑
在用SPSS做描述性统计分析前,先截两张实证论文中一般做的描述性统计分析表格。进而可以直观看到我们一般做描述性统计分析要交待哪些统计量。
以上两个表格是常见的描述性统计分析表述表格,一般实证论文中,做描述性统计分析要报告以下4个统计量:均值、标准差、最小值和最大值(有的文章限于表格篇幅,只报道均值和标准差)。问题来了,做了描述性统计分析后,结果要怎么看呢?我们要怎么才能确认结果是好或者不好呢(即变量是否符合正态分布呢)? 这个问题一般看均值和标准差。如果标准差>>均值,那表明数据可能存在极端异常值,这时可能要对数据做进一步的处理。如做箱形图看是否存在极端异常值(头上标*的就是)。然而,一般情况下如果均值和标准差相差不大,如上表中“1998—2003年年均调整地块百分比”这类变量,可以就这样,不用做进一步处理。 下面用SPSS截图演示怎么做描述性统计分析吧(案例用的SPSS自带文件accidents.sav)。 软件操作:分析——描述统计——描述
得到如下结果:这时平均值>>标准偏差,说明数据离散程度不高,可以进一步进行后面的建模分析。
为了看看变量的趋势,我们再做一个直方图,附加正态分布曲线看看。 软件操作:图形—图表构建器(弹出对话框,点确认)—选择直方图(直接将下面的图形拖动到图表预览窗口即可),选择“风险人口”变量到X轴,右边勾选“显示正态曲线”。
如果还不放心,做一个箱图看看是否存在极端异常值。 软件操作:图形—图表构建器(弹出对话框,点确认)—选择箱图。这时,“风险人口”这种连续变量放纵坐标,性别等类别变量放横坐标(前提是你想看不同性别风险人口是否存在极端异常值,若只想看变量总体的分布是否存在极端异常值,则只将关心的连续变量拖到纵坐标框即可,横坐标不用管,然后点确定)。我们这里只看总体吧。 看结果,上面没有“*”出现,表明不存在极端异常值。可对数据进一步做建模处理。
分界点:下面我们人为的改变一下原始数据大小,使其出现两个极端异常值(极大值和极小值),看看情况。我们把原始数据人口第一行从198522改为10000,第6行208239改为1000000。然后再重复前面的描述性统计分析过程。
由上表可知,标准偏差>平均值的(但可能是否远远大于不好判断,因为原始数据量就只有6个,比较少)。这时我们持保留态度。看箱图。 软件操作:图形—图表构建器(弹出对话框,点确认)—选择箱图。
|