研究者如何第一时间了解生物医学进展?已故植物学家钟扬讲过,最及时、鲜活的信息在研究者的大脑中,然后是面对面交流,其次是学术会议,最末是公开发布的文献。那么预印本文献应该排在什么位置?
相比2003年的SARS疫情时期,本次新冠疫情期间,我们多了一个面向生物医学领域的预印本平台作为学术交流的领地。所以,我们现在可以及时地看到很多关于疫情的流行病学和基础研究论文。据统计[1],在2003年SARS疫情结束时,90%的论文还在审稿当中,没有及时发表。
随着疫情的蔓延,不少科学家加入到新冠病毒的研究当中。第一时间了解全球各地科学家的工作,是科学防疫的基础。临床医生、公卫管理者等防疫人员可以根据科研结论在第一时间作出快速反应。例如病毒的基因组序列、临床特征、治疗效果评价等等,不少进展都是先发表在了bioRxiv或medRxiv这些预印本系统上。
预印本系统的历史
预印本,顾名思义是还未正式发表在学术期刊上的论文,一般未经同行评议(peer review)之类的质量把控。公益性的预印本平台目的在于让学者快速发布论文,因为按照传统的论文审稿流程,一篇论文从投稿到发布需要数周到数年之久。
冷泉港的bioRxiv在2013年推出,medRxiv于2019年问世。另外,不太知名的PeerJ也在2013年面世,中科院的ChinaXiv在2017年7月推出后一直不温不火。
对于物理、数学、社会科学领域的学者来说,预印本系统并不陌生。最早的预印本系统是1991年出现的arXiv,专门收录这几个领域的论文。俄罗斯天才数学家Grigori Perelman证明“庞加莱猜想”的论文就发表在arXiv上。
那么预印本出现之前,科学家想提及时交流成果怎么办?通过信件或电邮——当然,电邮的出现和普及比较晚了。生活在前现代社会的列文虎克(1632年10月24日-1723年8月26日),就是通过给英国皇家学会写信的方式,“佳作”频传,最终被评上皇家学会会士。
越来越多的出版商接受预印本系统的存在。Nature在其“Peer-review policy”中提到,作者发布预印本不影响在Nature系列期刊投稿:“作者可以随时把自己论文发布在个人博客、维基站点或预印本平台上。” 其实早在2005年3月,Nature就曾发表题为Nature respects preprint servers的社论,澄清了Nature接收发布过预印本的稿件的事实。大出版商Elsevier也同意作者先发布预印本乃至学位论文,不会影响正常投稿的接收。
现在生物医学领域的竞争尤其激烈,一些知名科学家在投稿学术期刊之前,也会先放在bioAxiv等平台上宣示优先权,同时看看同行的反馈。另外,预印本系统与科技期刊的开放获取运动同步,大家可以免费看到的最新科学进展越来越多。
生物医学领域预印本系统推出得晚,主要原因不是网络技术或利益纠葛,而是由于生物医学领域自身的特性:获取论文非常简便的情况下,病人会由于缺乏专业分辨能力而误用论文中的“粗糙”结论,从而可能伤害自身健康。和国内常见的情形类似:病人度娘了一些自认无误的医学认识,然后当面质疑医生的诊疗结论。
当然,预印本平台也有接收论文的标准:不能剽窃,不能有冒犯性的内容,不能是非科学或伪科学的内容,不能造成公共安全危害等。但后台不对论文的方法论、结论和质量把关。如果大家了解论文或预印本的生产过程,那么就能够客观看待科学论文中的结论,知道科学进步是一个渐进的过程,科学共同体对一些问题是有共识的。
以科学家对CRISPR(Clustered regularly interspaced short palindromic repeats,原核生物基因组内的一段重复序列)的认识过程为例。目前,CRISPR-Cas9基因编辑技术是非常火的领域,但一开始Fancis Mojica等人在细菌基因组中发现了CRISPR序列后,并不知道它的确切功能。Luciano Marraffini和Erik Sontheimer提出了用CRISPR做基因编辑的设想。Emmanuelle Charpentier和Jörg Vogel等人发现了tracrRNA。等到Jennifer Doudna、张锋等人发明了CRISPR-Cas9系统后,这个科学故事才终于完整。我们现在回过头去看,可以找出一个清晰的科学发现路径,但对于不同年代的科学家来说,他们只是在各自的小领域中孜孜不倦地工作着,无法事先确立一个明确的图景。
解读预印本论文要小心
1998年,英国医生Andrew Wakefield在Lancet(《柳叶刀》)上发表了一篇论文[2],声称麻疹(measle)、风疹(rubella)、流行性腮腺炎(mumps)三联疫苗能够引发自闭症。受此影响,接下来的十多年,英国的部分家长听信这个说法而不再给孩子接种疫苗,使得腮腺炎在英国卷土重来。2004年,媒体记者调查发现,有疫苗官司业务的律师事务所贿赂了Wakefield,让他“做出”疫苗有害的科学证据。
2012年,法国分子生物学家Gilles-Éric Séralini发表了一篇转基因致癌论文[3],其实是用致癌药物让大鼠长出肿瘤,然后移花接木,声称肿瘤是转基因食物引起的。论文一出,媒体对转基因的批判铺天盖地,欧洲的转基因产业深受影响。欧盟不得不浪费1500万欧元(约1.17亿人民币)去证伪这个结果。虽然后来杂志早已撤稿,但巨大的经济社会代价已无法挽回,反转人士依然拿着不靠谱的结论津津乐道。
一些论文的结论往往会唬住外行,那么对于外行来说,看看论文下边的Twitter评论也许更有帮助。预印本论文的读者尤其容易错误理解论文结论,不能正确评价论文的结果,特别是论文本身存在方法缺陷和误导性的时候。
读者要避免把预印本中的一些结果误读成确定的事实。例如,近期一个牛津大学团队发表的流行病模型[4]提出:如果存在大量的轻症和未测试的感染者,群体免疫是否可以实现?这与其说是一个结论,不如说是一个理论上的可能性。除非对人群进行大规模血清学测试,才可以证明群体免疫的进程,但是目前还没有这方面的数据。
“搅拌式新闻”成为时代的信息快餐|Sarah Rieke绘
明智的读者也不要相信那些洗稿或拼凑而成的“搅拌式新闻” (churnalism),这是没有采稿能力的媒体通过东拼西凑而非原始采访而撰写的新闻报导。这些新闻夸大事实,给不出确凿的证据。这里有一个基本原则可以用:无论是科学论文还是新闻,若内容太过惊人,往往是误导性的报道。
关注某个领域一些团队的系列研究,也是个获取真实信息的好办法,有较好发表记录的科研团队往往更可靠。不过,疫情以来,预印本系统中最先涌现的一批论文是中国的科研团队做出的,并且是首次投稿到预印本系统。这时候普通公众若关注某些论文,最好先让领域内的专家先判断下论文的水准。
预印本系统可以让作者快速了解学界对自己工作的反馈。科学共同体也可以通过对论文进行批评、实验验证、继续扩展等方式共同进步。这可以部分起到同行评议的作用:发现错误、评价结果解释是否得当、要求作者补足数据或实验。
创办6年来,bioRxiv平台已收录了8万余篇论文,其中只有不到90篇撤稿。这些撤稿论文大多是作者自己决定撤回的,比如怀疑自己的结果不可靠、作者名单有误等问题。新冠肺炎疫情以来,有两篇论文撤稿。一篇是印度人的工作:通过比对新冠病毒和HIV基因组序列,得出新冠病毒是人造病毒的结论。另外一篇是由于作者获取了更多病人的数据,他们的结论需要修改。