国际“千人基因组计划”发布更高精度遗传变异图谱,助力个体化医疗进程

2012111日,由中、美、英等多个国家共同发起的大型国际合作项目千人基因组计划的最新研究成果在《自然》(Nature)上在线发表。该协作组公布了高分辨率的人类基因组遗传变异整合图谱,将为基因组学在人类疾病与健康领域中的应用以及个体化医疗时代的到来奠定了坚实的科学基础。华大基因作为该计划的发起者之一,承担了近四分之一的工作。

 

千人基因组计划2008年初,由中国深圳华大基因研究院、英国桑格研究所以及美国国立人类基因组研究所等多家机构共同启动的一项大规模测序计划。在这一计划中,科学家将对全球各地至少2,500个人类个体的基因组进行测序,绘制最详尽的人类基因多态性图谱,寻找基因与人类疾病之间的关系。结合这些测序信息,将形成一个更加精细的公开的人类基因组变异数据库,从而为人类疾病研究提供科研基础。

 

该国际协作组已于2010年完成了千人基因组计划第一阶段的任务,对于人群携带5%以上的基因变异,绘制出了覆盖度95%的基因多态性图谱。但是对于基因编码区以外富集潜在功能变异的低频突变,则很少进行阐释。因此第一阶段完成后的目标则是集中于对更大规模的人群中低频突变的研究,尤其是低频点突变和结构变异,以便鉴定出更多的功能变异标志。

 

千人基因组计划此次最新的研究报告中,协作组对来自欧洲、东亚、非洲和美洲14个种族的1,092个个体进行了研究,并结合全基因组测序、外显子目标序列捕获和SNP分型等技术构建了变异图谱。通过开发新的方法对多种不同算法和不同来源的数据进行整合,最终协作组成功的绘制出了高分辨率和高精度的单体型图谱,其中包括3,800万个单核苷酸变异位点,140万个插入/缺失位点以及超过1.4万个大片段缺失。这些数据资源涵盖了不同种族人群基因组中携带1%以上的突变,其中覆盖度达98%以上。

 

千人基因组计划第一阶段研究成果公布以来,千人基因组数据库已经广泛应用于各种遗传性疾病和癌症基因组等研究,而这次更加详尽和精确的研究结果,以及在不同种族个体中发现的与功能相关的罕见、低频以及常见变异信息,将会进一步促进该数据库的利用,为其他人类医学疾病研究提供基础。

 

在千人基因组数据库的使用中,其提供的全基因组范围内的变异结合其他大型项目(如ENCODE)中所获得的正常功能信息,可能会促进与疾病相关的非编码变异检测的效力。此外,越来越多的证据表明被全基因组关联分析(GWAS)中所忽视的低频突变对复杂疾病有相当重要的影响,而该数据库中所提供的低频突变信息则为未分类位点的基因型填补提供基础,

 

华大基因在本次研究成果中,主要承担了全部中国人(包括北京汉族人和南方汉族人)的样本收集、8个种族272个个体的全基因组测序、11个种族375个个体的外显子测序以及数据分析中关于插入/缺失和结构变异的检测和分析。此外,华大基因还参与了数据质控和协调等工作。

 

华大基因该项目负责人郭小森表示:这项工作完成了一个更高分辨率的人类基因变异图谱,尤其是其中涵盖了低频突变位点。这将有助于全球科研人员更深入地去探索人类遗传性疾病中表型和基因型之间的联系。因此,这不仅是对整个千人基因组计划,而且对人类遗传疾病的研究,都是一个里程碑式的成果。

 

华大基因执行院长王俊表示:千人基因组计划为从发现基因到解析基因奠定了坚实的基础,是全球科学家在人类健康领域向个体化医疗迈进的重要一步。我们将向全球科学家公开该研究中的全部数据,以充分发挥这些研究结果的价值,从中挖掘更多的信息,更好的探索人类生老病死的奥秘。