Note: data clear
命用途令 | 缩写 | 用途 |
---|---|---|
generate | gen | 生成新变量 |
egen | egen | 生成新变量(更多函数) |
drop | drop | 删除变量或样本 |
replace | replace | 替换样本值 |
rename | ren | 给变量重命名 |
tabulate | tab | 列出变量下的值/类别 |
summarize | su | 查看变量的描述性统计(均值、最大/小值、方差、样本量) |
encode/decode | encode/decode | 给字符串编码成数值型变量/给数值型变量解码成字符串 |
merge | merge | 匹配数据 |
reshape | reshape | long型面板数据 与 wide型数据互相转换 |
substr | substr | 提取字符中内容 |
bysort | bys | 分组进行操作 |
duplicates drop | duplicates drop | 样本去重 |
Note: bysort & duplicates
1.数据的维度:valueijstvalue_{ijst}valueijst
2.加总到i,j,ti,j,ti,j,t层面
[i,j,s,ti,j,s,ti,j,s,t]→[i,j,ti,j,ti,j,t]
bysort country partner time : egen v = total(value)
bysort实现分组功能,黄色线一组,蓝色线一组。分组后加总,生成最右侧蓝色列
3.删除变量
得到更高层面的变量vijtv_{ijt}vijt后,行业层面变量信息不再重要
keep country partner time v
4.删除重复样本
duplicates drop country partner time,force
// a replaceble method
collapse (sum) v= value ,by(country partner time)
Note: merge
1.merge 1:1
use LEFT.dta
merge 1:1 from to using RIGHT.dta