Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:董涵敏 (华中科技大学)
邮箱:hanmindong@hust.edu.cn
编者按:本文主要摘译自下文,特此致谢!
Source:Lerner J, Seru A. The use and misuse of patent data: Issues for finance and beyond[J]. The Review of Financial Studies, 2022, 35(6): 2667-2704. -PDF-
目录
创新是企业生存和发展的根本之道。为观察和理解创新,越来越多的金融、会计和其他管理类研究中使用了专利数据。
通过统计引用金融学三大刊 (Journal of Finance,The Journal of Financial Economics 和 The Review of Financial Studies) 且包含 "patent citation[s]" 的论文,作者发现它们的占比从 20 世纪 90 年代的 0.1% 上升到 2010-2019 年的 1.7% 和 2018-2020 年的 2.6%。
然而,专利和引文存在截断 (truncation) 和授权人异质性等问题。如果没有很好地理解专利及其数据的特征,由此得出的推论和解释可能存在系统性偏误。为避免上述问题,本文尝试寻找解决方法,并讨论机器学习解决专利和引文偏误的可行性。
美国专利与商标局 (U.S. Patent and Trademark Office,USPTO):美国第一个最基本的数据库,并且涵盖了 1976 年至今授权的专利,主要存在的问题是申请人没有唯一的标识符,专利授权人的名称频繁更换。
NBER 专利引用数据集:该数据库由 Bronwyn Hall、Adam Jaffe 和 Manuel Trajtenberg (HJT) 创建,并且容易获取 1963 年至 1999 年授予的每项实用新型专利的关键信息。其主要特征如下:
主要贡献——匹配专利授权人:
更新版本——最新版本由 Bronwyn Hall 和 Jim Bessen 在 2006 年带头编制:
自 2006 年完成以来,仍在被持续更新和加强:
文献通常使用申请年份,而非授权年份进行分析,这样做存在两个问题:一是从申请到授权存在时间差异;二是受技术领域和专利局的影响。通过下图可以发现,
针对上述问题,文献中常用的解决方法是加入时间固定效应进行调整和基于时间和技术类别的调整。其中,加入时间固定效应进行调整是根据特定时期内企业专利信息重新计算专利数量。
其中,
基于时间和技术类别的调整:
其中,
该方法的优点是,控制截断问题,调整专利申请政策变化和技术波动带来的变化;缺点是早期高被引专利占比较大,且容易受到某一特定行业重大创新的影响。
过去的几十年来,专利的申请和授权数量激增。根据美国 2006 年的数据统计,1975 年至 2006 年间专利申请数量增加了四倍,授权数量增加了三倍。然而,业内人士认为,专利申请的增加是因为专利权的提高,因此它不能体现创新能力的改变。
同时,这种增加的趋势因技术类别和地区而异,简单的时间或技术调整无法体现这些差异。例如,一些专利会因为其特定的技术地位而被引用,但这不能反映根本的创新。具体来看:
技术类别的差异:下图展示了 HJT 计算机通信和化学分类下的专利数量,可以发现 20 世纪 80 年代至 21 世纪初,计算机通信的专利申请数量大幅上升。从专利引用来看,计算机通信公司的分布是左倾的,引用次数随时间变化逐渐减少。
地区差异:下图展示了特拉华州与加利福尼亚州和马萨诸塞州的专利授权人的变化。可以发现,1990-2000 年间,特拉华州的专利数量只增加了几个百分点,而其他两个州的专利数量增加了 2.5 倍;在加利福尼亚州和马萨诸塞州的专利更有可能被引用。
差异的来源可能是不同州的产业结构和政策存在较大差异,加利福尼亚州和马萨诸塞州可能拥有更多的计算机通信公司。各州的产业结构也会随时间变化,因此考虑企业的创新时也要考虑不同地区的行业和政策差异。
研究数据:
研究设计:
下图展示了随时间变化的专利偏差,可以发现:
下图展示了不同技术类别的专利偏差和引用偏差,可以发现:
下图展示了不同地区的专利偏差和引用偏差,可以发现:
下图展示了使用 OLS 估计的结果,可以发现:公司规模、市场账面价值比率、研发与销售投入、杠杆率、现金率、资产报酬率和买卖价差均与专利和引用偏差正相关。具体而言,
综上所述,公司层面的专利数据因截断问题存在偏差。这些偏差与企业规模、杠杆率、现金资产比率、技术、区域等特征密切相关,文献中常用的方法和固定效应的加入也无法缓解。
我们建议通过一些额外的稳健性检验,来提高专利数据的有效性:
需要注意的是,没有论文是完美的。这些标准有助于帮助研究人员、编辑和审稿人进行判断,不满足所有条件的论文也值得发表,但对于存在严重缺陷的论文应当拒绝。
我们进行两组机器学习预测,相关的资料可以在「附录」和「GitHub」上找到。关于专利偏差,具体设定如下:
关于引用偏差,具体设定如下:
通过 RMSE、
Note:产生如下推文列表的 Stata 命令为:
lianxh 论文复现, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
和songbl
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh