Homepage

第1点的说明：（考完试再告诉每道题的出题意图）

第2点的说明：我们同学每次做上机练习题最后能交出4种类型的文件，在这里统一规范一下，在下载复现材料时通常提供的是do文件，有时也会附带日志文件，所以最后只需要提交含有代码的do文件便于我能复现你的结果，do文件里有没有运行结果都可以，如果你生成的是log文件把结果复制到do文件里再注释掉运行结果就行。

第3-6点的说明：人大技能大赛要求自己下载外部命令（不能携带U盘等）、不能上网搜索、不能使用AI，我都给放开，只要求独立完成，测试时不要交流讨论，不得使用通讯工具与软件。

总的说明：前面的题有很多基础题（都是课上讲过或我补充的内容），后面的题可能有一定难度，因为同学们这学期刚接触计量和Stata、读的论文也不多，本意不是为了难倒大家，一是检测前期的学习效果，便于我们后期的授课内容安排与节奏进度把握；二是敦促查漏补缺、及时整理与复习，包括但不限于这门课，还有计量1期末考试的准备；三是想带着读一些前沿的文献，提前接触实证研究，为之后做大创、论文等打下基础。

我们这个课的成绩是平时期末六四开，平时成绩还包括出勤、雨课堂答题、课后上机练习等，所以这次测试也不会占比很高，同学们不必有太大压力但也请认真准备！

考虑到大家这学期课程多、难度大，因为做了这次期中测试，所以期末就比较简单（功在平时！）

第一题的说明：我们专业的同学这学期应该在上金融学和公司理财课程，所以这道题以财务报表分析为背景，使用来自国泰安（CSMAR）的数据，最后一道题用的是CNRDS的数据，这些都是一些常用的数据库。技能大赛第一大题考的就是数据清洗，考点就包括drop、winsor2、merge、append

第二题的说明：形式也与技能大赛类似，在一道题的后半段会给出前半段正确结果的新数据，考点包括标准化、分组、Pearson相关系数、输出描述性统计结果到word中。

第三题的说明：这道题改编自第四章多元回归分析估计课件上第三部分遗漏变量偏误，当时说例2有点问题没有讲，我就把它改成了一道题，这道题最精妙的地方就是生成能力时取了educ的对数，大家可以试试不取对数残差和ability的相关性如何？

第四题的说明：因为大家计量1只学了横截面数据，所以不能出时序和面板，这类文章也不太好找，最终找到一篇比较经典的文章，也是希望大家将计量理论所学转化为现实所用；这篇文章属于量化历史（计量经济史）的研究范畴，写作（语言和逻辑）很友好，建议读读英文原文，第四章因果推断中工具变量的使用和第五章机制分析的理论和操作都值得学习，可以之后学到计量2计量3再来做replication。再推荐作者的另外一篇文章，DID有多种变体，Nunn&Qian(2011)用的就是连续型DID。 2024年诺贝尔经济学奖授予Acemoglu、Johnson和Robinson，以表彰他们在关于制度如何形成并影响经济繁荣研究领域的突出贡献。他们在发表于AER上的The Colonial Origins of Comparative Development: An Empirical Investigation一文中探讨了殖民地时期制度差异对后世经济发展的影响，指出制度差异是导致各国人均收入差距的主要原因之一‌。

![	400](https://pics3.baidu.com/feed/0b46f21fbe096b6305d9015e2ea2404aeaf8ac18.jpeg@f_auto?token=33d5de03001f2a2b7658aa6c70eb0f2c)

第五题的说明：其实没有指望大家能做到这，就想把这部分作为补充阅读的材料，同样也是不涉及时序和面板，就选择了一个属于是Stata高级的内容，正则表达式在其他编程语言中也有广泛应用。正则表达式又属于文本分析的基础，我们专业的同学之后可能会看或者写数字化转型方面的论文；本来最后一题出的是关于文本分析的题目，但我感觉和我们这课不太贴和，且文本分析更多还是在用Python做；又换成了社会网络分析，但同样是不太会用Stata做（虽然也能做）；最后定在了岭回归、Lasso回归上，课上在多重共线性那里提到过，我当时也补充了相关原理，于是就考一个Stata实现——随着Stata版本的不断升级，Stata也更多地运用到机器学习当中，个人感觉Stata的代码比Python更简洁（从陈强老师机器学习两本书的厚度来看也是Python实现所需代码比R更多）。

西山yu