从德国致病性大肠杆菌到濒临灭绝的北极熊 《GigaScience》将最先为科学界提供可引用数据

    201176日,《GigaScience》杂志执行编辑Scott Edmunds正式对外宣布《GigaScience》杂志已经开始接收数据,并公开了首个可引用的数据库德国大肠杆菌数据库。该期刊由华大基因(BGI)和BioMed Central(简称 BMC ,生物医学中心)共同主办,主要采用全文文献与大型数据库相结合的崭新模式,为广大科学工作者提供前沿、有效的数据以及生物学发现等资源。据悉,该期刊是一个面向所有使用或产出海量数据的生物学研究者的开放阅读期刊,不仅能够促进数据的快速发布,还有助于研究者对数据的轻松访问、重复使用及动态追踪,更重要的是还可以在网上对其进行永久性免费访问。

    目前,由华大基因和其德国的合作伙伴以及万种脊椎动物计划联盟共同创建的数据库包括了最近流行的德国致病性大肠杆菌O104菌株和7种脊椎动物(大熊猫、恒河猴、食蟹猴、北极熊、帝企鹅、阿德利企鹅、家鸽)的基因组序列和组装数据。该数据库已采用数字对象唯一标识符(DOIs)进行标识,使用者可以像使用其他数据库(如NCBI等)一样对其进行访问。

  GigaScience》杂志社通过与DataCite 机构 (http://datacite.org/) 和大英图书馆(the British Library)的合作为数据库提供DOIs。目前论文是数据产生者的研究成果获得认可的唯一有效途径,而传统的论文发表需要较长时间的撰写、修改和编辑,该冗长的过程会限制相关数据的使用性,并将严重阻碍科学发现的进程。因此,创建DOIs的首要目标就是促进数据的快速发布及传播,使得论文发表在相关学术杂志之前就可以获得数据库中的绝大多数信息。

    德国致病性大肠杆菌爆发事件已经明确地证实了数据免费、快速发布的重要性。为了控制疫情的恶化,华大基因和德国汉堡埃普多夫大学医学中心的研究人员以最快的速度完成对致病菌的基因组测序及分析并向全球免费公开所有数据,并声明在公共领域许可证范围内,所公开的数据没有使用限制。该数据库的公开使得整个科学界在第一时间共享了相关数据信息 (http://www.sciencemag.org/content/332/6035/1249.full),省去了从数据产生到文章发表的时间,加速了数据的传播与使用。具有DOI的德国大肠杆菌基因组数据库使得大肠杆菌成为第一个以这种方式公开的物种。此外,研究人员也可以按照同样的方式向数据库中添加已经经过证实的有价值的信息

(http://bacpathgenomics.wordpress.com/2011/06/13/e-coli-data-released-under-creative-commons-0-license/)







关于数据库的其他相关信息,具体见下:

华大基因德国大肠杆菌数据库:http://dx.doi.org/10.5524/100001

德国大肠杆菌数据分析:https://github.com/ehec-outbreak-crowdsourced/BGI-data-analysis/wiki

万种脊椎动物基因组计划:http://climb.genomics.cn/g10k

独立数据库可单独引用的DOIs

10.5524/100001  (大肠杆菌)E. coli
10.5524/100002  (恒河猴)Chinese Rhesus Macaque
10.5524/100003  
(食蟹猴)Crab Eating Macaque
10.5524/100004  
(大熊猫)Giant Panda
10.5524/100005  
(帝企鹅)Emperor penguin
10.5524/100006  
(阿德利企鹅)Adelie penguin
10.5524/100007  
(家鸽)Domestic pigeon
10.5524/100008  
(北极熊)Polar Bear