2023年11月22日-12月4日,JJB竞技宝有幸邀请到著名经济学者、Stata软件专家Christopher F. Baum教授于线上开展Stata Programming短期课程。
Christopher F. Baum教授
本系列课程共有五次课,分为六个部分,分别从不同的角度介绍了Stata软件及其使用方法。
第一部分,Baum教授介绍了Stata编程的基本概念、运行环境和软件界面的各种功能。Stata具有高效率的特点,兼具交互性与可重复性,软件自带搜索功能和用户社区。从宏观环境来看,stata有多种版本,能够适应不同系统的运行环境,满足用户需求。用户可以用state来处理大量的数据和变量。stata拥有自带的数据库,用户可以直接对数据库中的数据进行调用,同时它也可以处理,已经存在的文件和数据。
在第二部分,教授Baum介绍了一些处理数据的实用工具。我们了解了stata如何记录和转换不同类型的数据,处理缺失值,生成新变量与编写新函数。教授着重讲述了宏的概念,“本地宏”与“全局宏”,前缀命令,以及egen、append、merge等实用命令处理矩阵和数据集的具体方法。
在第三部分中,教授讲授了许多在do-file当中可以使用的处理数据的技巧。在使用stata时,要注意一般不遍历数据集合中的全部数据,同时代码应简洁明了,不要出现重复的语句。有些易被忽视的简单命令也有很大的价值。return函数和ereturn函数可以对计算结果重复利用。我们可以利用回归和margins等函数对数据进行预测并计算边际效益,用egen等函数对各组数据的特点进行总结,用foreach等函数处理并行列表,构造新变量处理非平衡面板数据等等。
在第四部分中,教授将OpenOffice,LaTeX和Stata生成的表格进行了对比,并教授我们如何用stata中的table、collect、collect style和estout等命令来生成与美化表格。教授还讲授了我们可以在stata中运用estout、estimate table和etable命令来对已知数据生成预测图表,以及如何运用include命令批量绘制图表。
在第五部分中,教授主要讲了如何用ado-file构建新命令,用临时变量储存中间值并用return函数返回计算后的结果值。Baum教授列举了三个例子帮助大家理解ado-file构建新命令的过程。接着,教授还讲授了处理多变量的通用命令,以及如何用estimates repost命令进行e类预测命令的编写。
在最后一部分,教授Baum用有限的时间为我们介绍了Mata。Mata是一种完整的矩阵编程语言,它可以在Stata当中直接调用。相对于Stata原本的计算过程,Mata有着更快的计算速度和更强的数据处理能力。它能处理行列数更多的矩阵和更大的数据集,同时也可以处理字符串信息。之后,教授为我们讲解了Mata当中的基本运算、元素计算和冒号运算符等计算原则,以及逻辑运算符、循环结构等语法规则。同时,Stata与Mata的本地宏、全局宏和矩阵等数据内容也可以实现互通。然而,切换Mata环境只需要短命令“mata : ”与“mata clear”就可以简单实现。同时,Mata中也有一些自带函数,可以帮我们快速解决实际问题。
本次Stata Programming短期课程于北京时间12月2日晚22点左右正式结束。Christopher F. Baum教授带来的高水平、高质量课程提高了同学们的Stata编程能力,同时也加深了同学们对Stata编程的理解,引导同学们着眼统计数据,解决实际问题。
本次课程受到国合处引智项目“G2022115005L”支持。
撰稿人:秦莺文
审稿人:何召鹏、黄乃静