一、简介
egenmore
是一个用于 Stata 的扩展包,包含了一组扩展的 egen
函数,超出了 Stata 内置的 egen
函数集。这些扩展函数提供了更广泛的操作,包括字符串处理、时间序列分析、数值运算、数据分组和汇总等,进一步增强了 Stata 在数据处理和分析中的功能。
要使用 egenmore
,你需要先通过以下命令在 Stata 中安装这个扩展包:
ssc install egenmore,replace
安装后,你可以像使用内置的 egen
函数一样,使用 egenmore
提供的扩展函数。
二、函数类型
函数根据主题分为以下几类:
- 分组与图形化
- 字符串、数字与转换
- 日期、时间与时间序列
- 汇总与估计
- 第一与最后
- 随机数
- 行操作
三、分组与图形化
- axis(varlist):为图形构建分类轴变量。生成一个变量,值为1, 2, …,代表
varlist
形成的组。支持gap
、label()
、missing
和reverse
选项。适用于分类变量的排序和图表准备。 - clsst(varname):返回最接近指定值的数字。
later
指定在相等时取较晚的值。 - egroup(varlist):
egen
中group()
的扩展,增加了label(lblvarlist)
选项。 - group2(varlist):
egen
中group()
的扩展,增加了按指定egen
调用结果排序的功能。 - mlabvpos(yvar xvar):自动生成标记标签位置的变量,用于散点图中标记标签的钟表位置分布。
四、字符串、数字与转换
- base(varname):将整数变量转换为指定基数(默认2)的字符串表示形式。
- decimal(varlist):将变量列表的值视为指定基数(默认2)的表示,并生成十进制等价值。
- incss(strvarlist):标识字符串列表中是否包含指定子字符串。
- iso3166(varname):将国家名称映射为ISO 3166-1-alpha-2代码,或反之。支持
origin
、language
和verbose
选项。 - msub(strvar):替换字符串变量中的特定子字符串。
- noccur(strvar):计算字符串变量中指定子字符串的出现次数。
- nss(strvar):返回字符串变量中指定子字符串的出现次数。
- ntos(numvar):将数值变量映射为字符串变量。
- nwords(strvar):返回字符串变量中的单词数。
- repeat():按顺序生成重复值列表。
- sieve(strvar):根据指定条件选择字符串中的字符。
- ston(strvar):将字符串变量映射为数值变量。
- truncdig(varname):按指定的十进制位数截断数值变量。
- wordof(strvar):返回字符串变量中的第
#
个单词。
五、日期、时间与时间序列
- bom(m y):生成指定月份和年份的月初日期。
- bomd(datevar):生成包含指定日期的月份的月初日期。
- dayofyear(daily_date_variable):生成指定日期变量的年份中的天数。
- dhms(d h m s):生成包含小时、分钟和秒的日期变量。
- elap(time):生成包含天数、小时、分钟和秒数的字符串变量。
- elap2(time1 time2):生成表示两个时间值之间间隔的字符串变量。
- eom(m y):生成指定月份和年份的月末日期。
- eomd(datevar):生成包含指定日期的月份的月末日期。
- ewma(timeseriesvar):计算指数加权移动平均值。
- filter(timeseriesvar):计算线性滤波器的值。
- f