文章目录
一、为什么要学stata
- 对经济统计、计量比较友好,经济学读博必备、必会
- 窗口菜单和代码完成一定的功能,简单
- 上手简单
- 可靠性强-这里指的是权威性
- 模型种类丰富-类似R包、python模块
二、软件基本解释
1.软件界面

- 注意历史窗口,红色表示报错哦
2.导入示例数据



输入summarize price,有时候可简写为sum price

3.认识几个重要的功能符号

- 1.保存日志
- 2.帮助文档
- 3.绘图编辑
- 4.生成do-file文档
- 5.数据编辑
- 6.数据浏览
三、数据的基本观测
describe返回数据的基本情况,如右下角属性窗口
语法:describe [变量],或者不加,注意[]表示可以加可不加
例子:describe, pricecount查看观测变量个数,可以加逻辑判断
语法:count if [变量]>80,或者不加
例子:describe if price>500\describe if missing(rep78)isid类似于索引,独特的区分出每一个观测值
语法:isid 变量
例子:isid price,如果报错,这说明不可以独立区分出每一个观测值,这里说明,每个观测值可能存在重复值unique
语法:unique 变量找唯一
例子:unique mpg weight
四、统计性描述
1.codebook 数据字典使用
可以用于查看数据类型、简单统计量、缺失值、异常值
codebook [] [] [] [,options]
[]:代表不是必须的
varlist:变量名单
if:逻辑判断
in:第几个到第几个观测值
options:跟在逗号后面,一些自定义选项

llast
ffirst
2.summarize



Skewness:偏度
Kurtosis:峰度
五、图像初步探索
1.histogram 直方图
histogram varname[if] [] [] [,[continuous_opts | discrrte_opts]options]
注意这里的varname是个单独变量
语法:
hist varname朴素的图
hist varname, freq bin(5) normal连续的 如果离散的discrete
hist varname, by(varname2) 分组
2.graph box /hbox 箱线图
graph box var

hbox表示横向的直方图
graph box pirce, over(foreign)
分组的直方图
3.vioplot小提琴图
一般情况下,小提琴图比箱线图更好,因为可以看到每一个分位下,数据的观测值数量

语法和图像展示



















