运用Stata进行数据分析的常用命令
2023/2/14 14:59:21 阅读:168 发布者:
Stata是Statacorp于1985年开发出来的统计程序,在全球范围内被广泛应用于企业和学术机构中。许多使用者工作在研究领域,特别是在经济学、社会学、政治学及流行病学领域。
Stata的一系列功能包括:
数据管理
统计分析
图表
模拟
自定义编程
写在前面:
Stata对于命令和变量名是区分大小写的,例如sum是概要统计的命令,而Sum和SUM就不是命令;price和Price是两个不同的变量。
所有命令中用到的符号都要在英文输入法状态下。
1.概要统计命令:summarize(或简写为sum)
利用这个命令,可以得到观测案例数(Obs)、变量的平均值(Mean)、标准差、最小值和最大值。(在这个例子中,x为自变量,y为因变量)
2.画散点图命令:scatter y x
注意:在Stata的许多命令中,因变量一般都放在自变量前面。
输入命令后,会弹出如上图所示的散点图。
3.画出拟合线命令:twoway (scatter y x)(lfit y x)
注意:这个命令最开始的字母twoway也可以简写为tw。
如上图所示。
4.进行最小二乘估计的命令:reg y x
通过这个命令,可以得到估计系数,还可以得到标准误、统计检验要用到的t值等。
5.display命令(该命令也可以简写为dis):作为屏幕显示的统计计算器来用,用来进行一系列计算,进行最基本的加减乘除,也可以进行对数运算。
6.生成新变量的命令:generate(该命令可以简写为gen)
注意:变量名称只能用英文和数字,且若名称中同时有英文和数字,必须以英文开头。
例如,我想生成一个新变量z,它等于x的平方,则输入gen z=x^2。打开数据浏览器,就可以看到数据中多了一列。
7.去除变量的命令:drop
接着第6条,如果我现在想把刚才新生成的变量z给去掉,那么可以输入命令:drop z
这样,z那一栏就不见了。
相对应的一个命令:keep,用来保留变量。
例如命令:keep x y
也可以达到和上图同样的效果。
8.提取残差的命令:
reg y x
predict e,res
注意:第二条命令要紧跟在前一条命令之后。
9.list命令:
输入这个命令之后,可以出现类似数据浏览器或者数据编辑器的表格。
10.describe命令(这个命令也可以简写为d):
输入这个命令之后,可以看到对内存中存在的数据的描述,如11个观测案例、3个变量。
来源|知乎(如有侵权,请及时转告。)
作者|彭宏豪
转自:“量化研究方法”微信公众号
如有侵权,请联系本站删除!