(原作者:Daniel Cressey)
科学研究工作的一个重要组成部分是将研究成果写成论文发表,以便和同时代以及未来的科学家进行有效的交流。有很多论文一发表就成为大家讨论和引用的热点(X-MOL资讯报导的很多最新研究成果就属于此类),这些论文的引用数在短时间内扶摇直上。但也有很多文章并不被热捧,那么,在如山的文献堆中那么多无人问津的论文就一定没有价值吗?
图片来源:www.nature.com
答案是否定的。历史上也有不少文章,在埋没于厚厚的灰尘中数十年或上百年后,突然重见天日,被科学界追捧并大量引用。这类文章被称为科学文献中的“睡美人”。
睡美人(图片来源:Disney)
美国印第安纳大学伯明顿分校研究复杂网络的研究员Filippo Radicchi及其同事,研究分析了2,200万篇科学论文,希望从中找出这些“睡美人”,并试图发现那些最具传奇色彩的“睡美人”论文。
一般来说,一篇论文的引用率在经过初期一段时间的增长后会下降。之前的研究表明,文章的命运往往是由其在发表后的头五年内的引用率决定。但是,有一些论文会在沉寂多年之后突然被发现非常重要而出现井喷式的引用暴涨。2004年,荷兰莱顿大学的科学和技术研究中心的文献计量学专家Anthony van Raan为其取名为“睡美人现象”。也许最有名的例子就是爱因斯坦、Boris Podolsky和Nathan Rosen在1935年发表的量子力学论文,它在长达数十年的时间里享受着无人问津的寂寞,直至最后被发现。
根据一篇文章获得的引用数量以及发表多久时间后得到这些引用的情况,Radicchi和他的同事们设计出了“睡美人系数”(B)。他们在《PNAS》上发表的论文中描述道,如果一篇论文的引用数随时间线性增长,则其“睡美人系数”为0,而如果一篇文章在沉寂了100年后才突然出名,则其“睡美人系数”的值会在10,000以上。
“睡美人系数”(B value)排名靠前的论文(图片来源:PNAS,2015,DOI: 10.1073/pnas.1424329112)
在这个排名表中,居于首位的是1906年发表的“Concerning adsorption in solutions”,直到2002年才醒来,其B值为11,600。著名的爱因斯坦-Podolsky-Rosen的论文排到第14位,B值为2,258。在排名前15位中沉睡时间最长的是Karl Pearson的统计学文章,题为“On lines and planes of closest fit to systems of points in space”,于1901年发表在《Philosophical Magazine》,醒来时已经是2002年。
Radicchi说,“睡美人现象”出现的原因,在许多情况下是由于在文章本身领域以外出现了新的应用,比如统计方法在生物学中的应用。
Van Raan说,“睡美人系数绝对是一个有创新性的指数”,与他早期的“大睡美人方程”(Grand Sleeping Beauty Equation)相呼应,该方程计算对于给定休眠时间和其它变量的此类论文的数目。
Van Raan现在关注的是一些相关的重要问题,如产生“睡美人现象”的影响因素,以及这样论文是否只是“昙花一现”。如果有些科学家产生出一个以上的“睡美人”,这将表明他们有一个精心策划的研究主题,而不是一个意外的好运。
对Radicchi而言,他正试图找出唤醒“睡美人”的“王子”,即引发引用热潮的重要论文。
宾夕法尼亚州州立大学的信息科学家Dashun Wang说,这篇文章是“科学领域一个非常具有奠基意义的部分”。它最终可能会有助于解释为什么他本人根据早期的引用来预测文章轨迹的模型,对6.5%左右的论文不起作用。Wang说,理解“睡美人现象”将有助于在更广泛的意义上理解引用的动态发展。
“本文的一个重要结论是,虽然睡美人现象发送的比例可能局限在论文总数的6.5%,但它们并不像我们以前认为的那样罕见,”他说。
不过,Radicchi也提醒科学家们不要对自己被冷落的文章抱太大的希望,因为许多论文从未被引用过。“我估计,如果你的论文10年[没有被引用],我猜测它将继续无人理睬,直到永远。”
1. http://www.pnas.org/content/early/2015/05/20/1424329112.abstract
2. http://www.nature.com/news/sleeping-beauty-papers-slumber-for-decades-1.17615
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!