中英五大数据中心签署大英图书馆DataCite服务,领航科研数据共享

五大主要数据中心致力通过大英图书馆(British Library)的DataCite服务使科研人员可以更加轻松地访问和使用研究数据。大英图书馆DataCite服务为全球性的服务项目,其旨在解决查找、访问和再利用科研结果的相关问题。华大基因同四家位于英国的数据中心(即考古学数据库服务、英国国家资料库、英国自然环境研究委员会和科学技术设施委员会)均签署了该项服务,成为首批与大英图书馆就DataCite服务展开合作的机构。据了解,华大基因是参与该项目的首个亚洲数据中心。

 

数据来源于所有参与组织,主要涵盖从冰核到基因序列,从文化遗产到当前人口中提取的信息。这些数据都将采用数字对象标示符(Digital Object Identifiers, DOI)进行标识,从而使其能够检索和引用。目前,DOIs已被广泛使用,其可为学术期刊文章提供永久性链接。数据访问问题已成为当前科研人员所面临的巨大挑战之一。此次合作将为数据的访问问题提供一条实际的解决途径。英国皇家学会于今年七月份曾推出一期特刊《科学是一个开放性的事业》(Science as an open enterprise),主要倡导科研人员应该在其领域甚至更广泛的科研领域内对所拥有的数据进行广泛的交流与共享。这项报告还特别提及了华大基因所发布的首个DOI数据集,即2011年欧洲爆发的导致50人死亡的致死性大肠杆菌基因组序列,将其作为报告的封面图片,并在《明智开放数据的力量》(the power of intelligently open data)一节中作为案例进行了介绍。

 

开放数据使科研人员在以下方面获益:

 

  • 保证数据(或数据相关信息)链接的持久性和唯一性

 

  • 数据引用更加快捷,更易检索及访问,有利于科研人员可以更好地去验证自己的研究或他人的成果

 

  • 可获得大量当前还无法实现的新的研究机会

 

  • 通过共享和被引用数据可获得更高的信誉和认可度

 

“如何保障科研人员能够便捷地引用数据、期刊文章以及其他参考信息,已经成为越来越重要的问题。而DataCite的出现将会给当前科研人员互相交流研究信息的渠道带来变革。”大英图书馆科学、技术及医学部门负责人Lee-Ann Coleman表示,“作为致力于为科研人员提供信息和其他实质性支持的重要机构,我们相信大英图书馆DataCite服务将能够解决数据共享中存在的一些障碍。我们期待这五个机构的参与能够吸引更多的单位参与进来,这将是改变共享资源模式迈出的重要一步。”

 

华大基因执行院长王俊表示:“华大基因是全球最大的基因组学研究机构以及全球最大的生物学数据产出者之一。DataCite的目标为建立认可和奖励数据产生者的学术结构,这点深深吸引着我们。通过DataCite的DOI标识,我们发布了之前一些未公开的数据集,使得这些数据已经能够被《科学》和《自然》等顶级期刊杂志所引用和认可。我们期待能够继续追踪和跟进我们的数据带来的影响。”除了能激励研究者更及时发布他们产生的数据,数据的引用也会提供更好的机制以保证这些数据集和引用数据的出版物之间的链接和关联。华大基因已使用该功能发行了最新的“大数据”期刊杂志——《GigaScience》。

 

据了解,以“数据和文献整合” 为主题的特别会议将于今年12月1日在香港举办的第七届国际基因组学大会暨亚太生物信息学峰会(ICG-7& Bio-IT APAC 2012)上召开。届时,各位与会人员将共同探讨有关数据出版和引用方面的更多新进展。