投稿问答最小化  关闭

万维书刊APP下载

运用Stata进行数据分析的常用命令

2023/2/14 14:59:21  阅读:168 发布者:

StataStatacorp1985年开发出来的统计程序,在全球范围内被广泛应用于企业和学术机构中。许多使用者工作在研究领域,特别是在经济学、社会学、政治学及流行病学领域。

Stata的一系列功能包括:

数据管理

统计分析

图表

模拟

自定义编程

写在前面:

Stata对于命令和变量名是区分大小写的,例如sum是概要统计的命令,而SumSUM就不是命令;pricePrice是两个不同的变量。

所有命令中用到的符号都要在英文输入法状态下。

1.概要统计命令:summarize(或简写为sum)

利用这个命令,可以得到观测案例数(Obs)、变量的平均值(Mean)、标准差、最小值和最大值。(在这个例子中,x为自变量,y为因变量)

2.画散点图命令:scatter y x

注意:在Stata的许多命令中,因变量一般都放在自变量前面。

输入命令后,会弹出如上图所示的散点图。

3.画出拟合线命令:twoway (scatter y x)(lfit y x)

注意:这个命令最开始的字母twoway也可以简写为tw

如上图所示。

4.进行最小二乘估计的命令:reg y x

通过这个命令,可以得到估计系数,还可以得到标准误、统计检验要用到的t值等。

5.display命令(该命令也可以简写为dis):作为屏幕显示的统计计算器来用,用来进行一系列计算,进行最基本的加减乘除,也可以进行对数运算。

6.生成新变量的命令:generate(该命令可以简写为gen)

注意:变量名称只能用英文和数字,且若名称中同时有英文和数字,必须以英文开头。

例如,我想生成一个新变量z,它等于x的平方,则输入gen z=x^2。打开数据浏览器,就可以看到数据中多了一列。

7.去除变量的命令:drop

接着第6条,如果我现在想把刚才新生成的变量z给去掉,那么可以输入命令:drop z

这样,z那一栏就不见了。

相对应的一个命令:keep,用来保留变量。

例如命令:keep x  y

也可以达到和上图同样的效果。

8.提取残差的命令:

reg y x

predict e,res      

注意:第二条命令要紧跟在前一条命令之后。

9.list命令:

输入这个命令之后,可以出现类似数据浏览器或者数据编辑器的表格。

10.describe命令(这个命令也可以简写为d):

输入这个命令之后,可以看到对内存中存在的数据的描述,如11个观测案例、3个变量。

来源|知乎(如有侵权,请及时转告。)

作者|彭宏豪

转自:“量化研究方法”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com