中国、英国和美国科学家宣布启动国际“千人基因组计划”
    北京时间2008年元月22日21时整,由中国、英国和美国的科学家组成的“国际协作组”在深圳、伦敦和华盛顿同时宣布国际“千人基因组计划”正式启动。 
这一宏伟计划将测定选自全世界各地的至少一千个人类个体的全基因组DNA序列,绘制迄今为止最详尽的、最有医学应用价值的人类基因组遗传多态性图谱。
 
这一国际合作计划的主要发起者和承担者包括英国的Sanger研究所,中国的深圳华大基因研究院(BGI Shenzhen),以及美国的国立卫生研究院(NIH)下属的美国人类基因组研究所(NHGRI)。
 
通过多个学科专家组成的研究团队的共同努力,“千人基因组计划” 将绘制一张与生物医学相关的人类遗传多态性的崭新图谱,其分辨率之高乃现有技术远不能及。与国际“人类基因组计划”和其它重要计划一样,“千人基因组计划”产生的数据和研究成果将迅速通过公共数据库发布,供全球科学家免费共享。
 
该项目的负责人之一,英国Sanger 研究所的Richard Durbin博士说:“‘千人基因组计划’将在前所未有的水平上对人类基因组进行详尽的研究。这一计划即使在两年之前还不敢设想,这应归功于测序技术、生物信息学和群体基因组学的突破。我们现在已技术在手、信心在胸。因此,我们正乘胜追击,从横向和纵深两方面加速发现更多的与人类健康和疾病相关的遗传因素。”
 
任何两个人在基因水平上99%是一样的,只有小部分的基因组序列因人而异。了解这些差异是非常重要的,它能帮助我们了解人与人之间对疾病的易感性、对药物和环境因素的反应性的不同。人类基因组中的相邻变异组成了一个又一个个完整的信息块,称之为单体型,通常是以一段连续的DNA序列遗传。
 
目前的人类遗传变异数据,如人类基因组单体型图(HapMap),已被证实对人类遗传研究很有价值。运用单体型图和相关数据,科学家已经发现了100多个与人类常见疾病相关的基因组区域。这些常见疾病包括糖尿病、冠心病、前列腺及乳腺癌、风湿性关节炎、肠炎,以及与年龄相关的黄斑退变等。
 
然而,由于现有的图谱还不够详细,研究者经常需要通过既昂贵又费时的DNA测序来进一步精确地找到致病基因及其变异。新图谱能让研究者更快地锁定与疾病相关的基因变异点,从而能够使用遗传信息更快地开发常见疾病的诊断、治疗和预防的新策略。
 
“千人基因组计划”的科学目标就是绘制一张几乎覆盖全人类的基因组遗传变异图谱。包括所有在人群中的出现频率不低于1 %的变异,以及那些出现频率还不到0.5 %的位于基因之内的变异都将被识别到。基于这样的目标,初步估计需要测定1,000个以上的个体的全基因组序列。被测序的个体既不公布他们的姓名,也不披露他们的医学信息,因为“千人基因组计划”提供的将是人类遗传变异的基础信息。将来,这一图谱将用于研究人类各种特定的疾病。
 
美国国立人类基因组研究所(NHGRI)所长Francis Collins博士说:“这个新计划将把我们发现疾病相关变异的灵敏度在基因组水平上提高5倍,同时基因区内的灵敏度将提高10倍以上。我们现有的数据库已很不错,涵盖了在人群中出现频率10 % 以上的多态性位点。借助高通量的新测序技术和新开发的计算方法,我们希望为生物医学研究者提供覆盖整个基因组的出现频率为1%的变异。这将彻底改变我们的疾病研究。”
 
用现有的方法,研究者可以研究与疾病相关的两种遗传变异。第一种是非常罕见,但后果严重的变异,如造成囊肿纤维化和亨廷顿(Huntington)舞蹈症的遗传变异。为了找到这些出现频率低于千分之一的变异位点,研究者通常必须花数年时间来研究这些疾病的家系。另外一类,即大多数的常见疾病,如糖尿病和心脏病,是受一些较为常见的变异影响的。大部分常见变异只产生微小的影响,例如使患病风险增加25%或者更少。目前,通过一种新的叫做“全基因组关联研究”的方法,研究者已能够找到这些常见的变异。
 
这一计划,同时也是单体型图计划的另一位负责人,美国波士顿的麻省总医院和哈佛-麻省理工学院的Broad研究所的David Altshuler博士说,“我们对这两种类型的变异,即罕见和常见的变异之间还存在一个巨大的认识上的‘断档’,而“千人基因组计划”正是为了填补这个’断档’而设计的。我们预测这个’断档’中会有很多重要的与人类疾病和健康相关的变异。”
 
这一新图谱的用途之一将是进一步优化“全基因组关联研究”。研究者如果发现某个基因组区域与某种疾病相关联,将参阅新的图谱,就可以在这个基因组区域里找到几乎所有的变异,进行后续的功能研究,来确定这些变异中哪些是直接致病的。“千人基因组计划”是建立在由“国际单体型图计划”绘制的“人类单体型图”的基础上的。新图谱将为单体型图中的变异提供周边的基因组信息,为研究者提供重要线索来确定哪些变异可能是致病的,并搜寻致病因子的更精确的基因组信息。
 
相对于单体型图的一个显著进步是“千人基因组计划”不仅会发现人类基因组中单个碱基的差异(即单核苷酸多态性,SNP),同时还会得到高分辨率的基因组结构变异的图谱。这些基因组结构变异包括染色体重排、缺失和区段重复。在过去的18个月中完成的研究已经清楚地表明,这些基因组结构变异是决定某些疾病(如智力迟钝和自闭症)易感性的主要因子。
 
“千人基因组计划”不仅将加速人们对常见疾病易感性相关的变异的发现,还将加深人们对自身基因组结构变异的认识,同时也开启了医学和生物学中其他新的重大发现的探索之门。
 
“千人基因组计划”的测序工作将由英国的Sanger研究所,中国的深圳华大基因研究院(BGI Shenzhen), 以及包括Broad 研究所、位于圣路易斯的华盛顿大学医学院基因组测序中心和位于休斯敦的贝勒医学院人类基因组测序中心在内的美国人类基因组研究所(NHGRI)的大规模测序平台共同承担。随着计划的进行,也许还将有其它成员加盟。
 
这一计划将采用几种新的高通量测序平台。若使用目前标准的DNA测序技术,同样的工作可能需要花费5亿美元以上。然而,由于该计划的创造性的努力,建立了更高效更低价的新测序技术,“千人基因组计划“的发起者希望这一计划的成本最终将降低至3000万到5000万美元。
 
“千人基因组计划“的第一阶段,将耗时约一年,进行三项先遣实验项目。这些项目的结果将用于决定如何最高效且低成本地绘制这张人类遗传差异图谱。
 
第一项先导实验项目将包括两个核心家庭(双亲与一个成年子女)的全基因组深度测序,每个基因组的平均测序深度为20倍,即反复测定20次。这六个个体所产生的全面详尽的数据集,有助于确定这一计划如何使用新的测序平台识别遗传变异。这一项目建立的方法将作为整个计划中其它项目进行比较的基础。
 
第二项先遣实验项目将对180个个体进行浅度测序,每个基因组的平均深度为两倍。这将用于测试新测序技术的浅度测序数据用于检测和定位序列变异的能力。
 
第三项先遣实验项目将测定1000人的1000个编码区域(也叫外显子)的序列。其目的是探索如何更好地得到约占基因组2%的蛋白质编码基因的更详细的图谱。
 
在为期两年的数据产出阶段,该计划将平均每天测序82亿个碱基,相当于24小时内完成2个人的全基因组序列。如此海量的数据以及对该数据的分析,对生物信息学和统计遗传学领域的领军专家将是极大的挑战。
 
“该计划对人类基因组的研究将达到绝无仅有的精细程度。这一计划将产生6万亿个碱基,它在三年内产生的数据量,将是目前公共数据库中25年内所有数据总和的60倍。”千人基因组计划“数据分析组的首席科学家人之一,牛津大学的Gil McVean博士说:“事实上,当全速运行的时候,该计划在两天内产生的数据量就将相当于当前公共数据库中这么多年来所有数据的总和。”
 
“千人基因组计划”将使用的样品取自自愿捐献者,他们都签署了捐献DNA以供分析和在公共数据库公布的知情同意书。美国人类基因组研究所和合作者将遵循被全面和认真的伦理学程序。同先前的“国际单体型图计划”和国际“人类基因组计划”一样,“千人基因组计划”也将成立专家工作小组,专门监管和该计划相关的伦理、法律和社会问题。
 
“千人基因组计划”采用的首批1000份样品由两部分组成:“国际单体型图计划”使用的相同样品以及采用同样的程序采集的后续样品。自愿捐献者的健康和个人身份信息没有公开,其样品仅仅标记了所属种群的信息。实际采集的样品数要比实际需要的样品多得多,进一步保证了捐献者信息的匿名性。“千人基因组计划”要收集的更多的样品,将采用同样的程序。
 
“千人基因组计划”将测序的人群包括:尼日利亚伊巴丹区域的Yoruba人;居住于东京的日本人;居住于北京的中国人;美国犹他州的北欧和西欧人后裔;肯尼亚Webuye的Luhya人和Kinyawa的Maasai人;意大利的Toscani居民;居住于休斯顿的Gujarati印第安人;居住于丹佛的中国人;居住于洛杉矶的墨西哥人后裔;居住于美国西南部的非洲人后裔。
 
“千人基因组计划”产生的数据,将由欧洲生物信息学中心(EBI),从属于NIH的美国国家生物技术信息中心(NCBI)及深圳华大基因研究院对镜像站点共同管理和发布。除了变异图谱外,数据库还将包含对这些变异的各类遗传学和医学相关信息,以加速识别最为重要的变异位点。
 
“千人基因组计划”,是举世闻名的人类基因组计划的延续和发展,是基因组科学研究向临床医学迈进的重要转折点。人类遗传变异的详细图谱将被众多研究者用于寻找和特定疾病相关的遗传变异的研究。这些研究人员将奠定个体化医学和个体基因组时代的基础。到那时每个人测序自己的基因组将成为常规,以预测患上各种疾病的风险和对药物的反应性以针对性地指导用药,最终到人人拥有自己的基因组图谱已经不再是遥不可及的梦想了。
 
该计划的组织实施是新一代测序技术产业化应用的重大突破,是基因组研究向个体化医疗迈进的重要标志,将为科学界提供最详尽的数字化资源和有力的研究工具,为个体化的预测、预警及诊断和治疗提供必要的基础数据,标志着常见疾病的研究将从局部的模拟信号研究进入到全景式的数字化基因组序列时代,并为解决基因组医学研究相关的伦理、法律和社会问题带来可能。
 
深圳华大基因研究院副院长王俊博士说:“该计划将推动基因组信息用于医学研究的进程,可以让人们更加了解常见疾病。‘千人基因组计划’向全世界研究者提供的重要数据资源将使所有的国家都受益。”
 
华大基因之前还与国家有关机构共同参与了国际“人类基因组计划”和“人类单体型图计划”。在共同发起和参与国际“千人基因组计划”的同时,深圳华大基因研究院还在中国国内启动了“炎黄计划”,在更大的范围研究中国人群的遗传变异,绘制高分辨率的中国人遗传变异图谱。日前已完成并发布了第一个中国人的高质量基因组图谱——“炎黄一号”,近时已经启动了第二阶段的“炎黄99”计划,将对99个中国人个体进行基因组测序及多态性比较。深圳华大基因研究院参与“千人基因组计划”所完成的中国人样品的测序将作为“炎黄计划”的一部分。
 
中国由9年前参与人类基因组计划并承担其中的1%工作,到今天参与发起千人基因组计划并承担其中的黄种人部分,标志着中国基因组科学实现了由参与到引领的跨越发展。深圳华大基因研究院将是这一工作的主承担单位,其合作单位有生物信息系统国家工程研究中心,中国科学院北京基因组研究所。
 
“千人基因组计划”中的黄种人基因组研究,将使我国基因组科学和相关医学研究直接跨入与国际前沿完全接轨的世界先进行列,极大地促进我国药物基因组学研究的发展,对以国际接轨和跨越式发展为目标的国家重大新药创制重大专项具有积极的支撑和推动作用。该计划的研究成果必将对中国的医学科学发展和个体化医学实践产生深远的历史性影响;其先进的技术将迅速转化为中国临床医学实践服务的实用技术;科学和技术的双重突破必然催生新的产业发展。
 
深圳华大基因研究院从2007年10月公布“炎黄一号”完成,到2008年初宣布“全球第一个志愿者基因组测序启动”,发起并参与“国际千人基因组计划”,国内和国际的主要媒体都给与了大量的报道。特别是英国《自然》杂志两篇相关的跟踪专题报道,对深圳和华大、对中国的基因组科学发展给与了高度的正面评价,也引发了国际主要媒体的广泛关注。这在中国生命科学史上还是第一次。深圳市人民政府对这一工作高度重视,全力支持,开创了地方政府主动承担国家重大战略性基础研究的先河,这在中国科技史上也是第一次。
 
深圳参与的这项全球性研究工作,将全面展示中国科学家在基因组科学领域跻身世界前沿的竞争实力和创新精神;也是深圳跻身世界知名城市的闪光标志和象征。其也展现了深圳瞄准世界科技前沿,以国家战略发展为城市发展的创新理念和大胆实践。