文/李
科学研究的可信度基于新数据的可复制性证据复制的直观概念是重复一项研究的过程,观察之前的发现是否再次出现复制的任何结果都可以被视为关于先前研究主张的诊断证据
复制可以通过使用新的证据来深化理论研究当人们对一个理论的理解最弱的时候,复制的价值最强成功的复制将提供与原始研究不同条件下的普遍证据,不成功的复制也能发现原研究的缺陷
杜克大学的Campbell R. Harvey教授分析了数据和代码共享政策失败的原因以及对其实施的一些看法本文编译自2019年8月发表在《金融评论》上的论文《金融经济学中的复制》
坎贝尔·r·哈维曾于2006年至2012年担任《金融杂志》主编。他与JFE和RFS的主编合作提出了一项政策:
虽然当时该政策失败了,但笔者认为有必要对该政策进行仔细的审视所以在这里和大家分享一下
1.为什么数据和代码共享政策失败了。
2.学科差异
大多数经济学研究使用免费的宏观经济数据,而金融则严重依赖专有数据当实施强有力的数据共享政策时,可能会改变研究方向即使一个有趣但以前高度专有的数据库不适合复制,学者们仍然可以从中学习到一些东西
对于物理和生物科学领域,拒绝提供原始数据和代码可能会导致其论文被撤回大量撤稿属于学术不端,撤稿论文很少被引用
3.吸引优秀论文
2010年,除了《QJE 》,所有顶级经济期刊都有数据和代码共享政策顶级财经期刊的竞争对手不仅是其他顶级财经期刊,还有顶级经济期刊对数据和代码共享的更自由的看法可能会将顶级经济学期刊上的优秀论文转移到顶级金融期刊上所以顶级财经期刊对数据和代码的保守态度也可能是其竞争优势
数据和代码共享的两,三个原因
很多人认为我们的研究是没有问题的,那我们为什么还要对完善的研究进行昂贵而无用的重复研究呢。
首先,支持数据和代码共享会增加学术不端行为的成本发表论文的压力是巨大的,所以期刊更喜欢发表正面成果的论文但有了共享的数据和代码,其他学者可以很容易地检查结果的准确性和稳健性,从而增加了学术不端行为的成本
第二,数据和代码共享可以减少新程序的错误例如,一位学者独立编写了一个计算机程序,在发表的论文中扩展了分析研究人员用发表的论文校准基本情况是非常有用的,会减少新程序出错的几率
第三,机械工作的问题有些机械工作需要大量的时间和精力,但为什么学者们要独立重复同样的过程这是浪费学者的时间和精力,这些时间和精力可以用于更有创新性的项目例如,计算机科学领域正在转向一种更具协作性的模式如果一个学者试图解决计算机科学中的一个问题,他们的第一站是Github,在那里很可能会有人分享解决这个问题或类似问题的代码,这将使研究更加有效
三。摘要
首先,我们明确实施这一政策的成本:
笔者认为,如果数据和代码共享政策能够有效实施,收益可以覆盖甚至超过成本这项政策有许多优点
首先,我们对研究的信任是由强大的复制文化支撑的目前,金融领域的薄弱或不存在的政策与经济学和其他科学领域的大趋势不一致如果金融研究急于制定会影响决策者的想法,如果没有强有力的复制政策,金融研究的结果就很容易被忽视
其次,我们增加了不可观察的软学术不端行为的成本当他们的代码和数据可用时,研究人员会三思而行
最后,研究将变得更加有效研究人员可以很容易地将自己的程序校准到当前发表的工作,不再需要做重复性的工作
。免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。