运用Stata进行数据分析的常用命令

2023/2/14 14:59:21　阅读：168　发布者：

Stata是Statacorp于1985年开发出来的统计程序，在全球范围内被广泛应用于企业和学术机构中。许多使用者工作在研究领域，特别是在经济学、社会学、政治学及流行病学领域。

Stata的一系列功能包括：

数据管理

统计分析

图表

模拟

自定义编程

写在前面：

Stata对于命令和变量名是区分大小写的，例如sum是概要统计的命令，而Sum和SUM就不是命令；price和Price是两个不同的变量。

所有命令中用到的符号都要在英文输入法状态下。

1.概要统计命令：summarize(或简写为sum)

利用这个命令，可以得到观测案例数(Obs)、变量的平均值(Mean)、标准差、最小值和最大值。（在这个例子中，x为自变量，y为因变量）

2.画散点图命令：scatter y x

注意：在Stata的许多命令中，因变量一般都放在自变量前面。

输入命令后，会弹出如上图所示的散点图。

3.画出拟合线命令：twoway (scatter y x)(lfit y x)

注意：这个命令最开始的字母twoway也可以简写为tw。

如上图所示。

4.进行最小二乘估计的命令：reg y x

通过这个命令，可以得到估计系数，还可以得到标准误、统计检验要用到的t值等。

5.display命令(该命令也可以简写为dis)：作为屏幕显示的统计计算器来用，用来进行一系列计算，进行最基本的加减乘除，也可以进行对数运算。

6.生成新变量的命令：generate(该命令可以简写为gen)

注意：变量名称只能用英文和数字，且若名称中同时有英文和数字，必须以英文开头。

例如，我想生成一个新变量z，它等于x的平方，则输入gen z=x^2。打开数据浏览器，就可以看到数据中多了一列。

7.去除变量的命令：drop

接着第6条，如果我现在想把刚才新生成的变量z给去掉，那么可以输入命令：drop z

这样，z那一栏就不见了。

相对应的一个命令：keep，用来保留变量。

例如命令：keep x y

也可以达到和上图同样的效果。

8.提取残差的命令：

reg y x

predict e,res

注意：第二条命令要紧跟在前一条命令之后。

9.list命令：

输入这个命令之后，可以出现类似数据浏览器或者数据编辑器的表格。

10.describe命令（这个命令也可以简写为d）：

输入这个命令之后，可以看到对内存中存在的数据的描述，如11个观测案例、3个变量。

来源|知乎（如有侵权，请及时转告。）

作者|彭宏豪

转自：“量化研究方法”微信公众号

如有侵权，请联系本站删除！

上一篇： “社会计算与社会科学”主题的专家点评发言观点汇总
下一篇： 如何阅读学术著作？（附：各专业被引用top10学术著作）

投稿问答最小化 关闭

运用Stata进行数据分析的常用命令

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

运用Stata进行数据分析的常用命令

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭