描述性统计
作者:袁涛 封面:吉江
概念解释
何谓描述性统计,维基百科的定义是:“描述性统计是一种汇总统计,用于定量描述或总结信息集合的特征”。从这个定义,我们不难看出,描述性统计包含两个重要的特征,描述和总结。
通常情况下,我们把描述性统计分为两大类:离散趋势和集中趋势,两种分类常见的统计量如下:
一般情况下,我们首先将收集到的大量数据归纳整理到一张表格,我们把这张表格称之为数据集,数据集一般包含很多类型的数据。通过描述性统计,我们可以根据自己的研究需要,从大量不同类型的数据中,筛选出具有代表性的数据来进行初步的研究分析。
stata软件实操首先,导入数据集auto.dta
通过存储文件打开该数据的stata命令为:use “D:你自己存放auto.dta文件的路径 auto.dta”。
或者打开stata软件自带的数据集。相应的Stata命令为sysuse auto,clear
(注:关注公众号,回复20200622即可获取数据)
出现这样的结果表示数据导入成功。
数据导入成功以后,可先输入stata命令:describe查看数据集的大致信息
结果如下:
从上图我们可以发现,该数据集有74个数据(obs),12个变量(vars)。
接下来,我们根据自己的研究需要,选择具体的变量或者全部的变量进行描述性分析。
Stata的操作演示如下:
第一种方法,输入stata命令: summarize
summarize后可以跟具体变量的名称,如果不跟变量名称,则默认对全部变量进行描述性分析,两种结果如下:
(1)输入命令:summarize,得到全部变量的描述性统计结果。
(2)输入命令:summarize price mpg rep78 headroom,得到部分变量的描述性统计结果。如下图所示。
导出结果到word
提示:如果没有outreg2的命令,需要先安装该命令,相应的安装命令为 ssc install outreg2。
导出描述性统计结果的Stata命令为:outreg2 using 描述性统计结果1.doc, replace sum(log) title(Decriptive statistics),得到下图。
打开描述性统计结果1.doc文件,得到下图。
对其进行整理,使之符合论文的要求以及更美观,得到如下图
第二种方法输入stata命令:tabstat price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign,s(N mean p50 sd min max) f(%12.3f) c(s)
结果如下:
需要注意
s(N mean p50 sd min max)括号里面可以根据自己的需要增加删除相应的统计量,相应统计量的代码如下图所示:
导出描述性统计结果到word提示:如果没有logout的命令,需要先安装该命令,相应的安装命令为 ssc install logout
导入结果的命令如下:
logout,save(描述性统计结果2)word replace:tabstat price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign,s(N mean p50 sd min max range) f(%12.3f) c(s)。结果如下:
打开描述性统计结果2.rtf
对其进行整理,使之符合论文的要求以及更美观,得到如下图:
以上就是如何在stata进行描述性统计分析的实操END