华大基因绿色云计算荣获全球生物信息最佳实践奖

2012425日,在第十届全球生物信息会议暨博览会(10th Bio-IT World Conference & Expo)上,华大基因凭借其自主研发的“用于从头组装和重测序分析的弹性绿色云计算设施”,荣获《Bio-IT World》杂志第八届最佳实践奖(Best Practices Award)。华大基因研究院副院长方林、云计算产品部主管何思飞、产品经理徐兴等出席了此次会议,并代表华大基因出席了颁奖典礼。

据介绍,最佳实践奖项设立于2003年,由《Bio-IT World》杂志编辑和众多一流的业界专家共同参与评审。其目的在于重点奖励在技术使用、实践和策略推陈出新等方面具有杰出创新和卓越表现的研究机构,并借此奖项鼓励获奖单位能够继续推动药物研发、生物医学研究和临床试验等领域的发展。

方林表示,“我们很高兴能够获得最佳实践奖,该奖项肯定了我们在‘弹性绿色云计算’方面的研究成果及努力。华大基因将会继续致力于‘灵活、绿色、高效、易用’的云计算应用研究,以更好地应对‘大基因组数据’时代的各项挑战。同时,我们也期待通过云平台及云产品,‘组学’相关的研究能够取得更多的突破,从而推动生命科学的发展,造福人类社会。”

新一代测序技术引发了基因组学研究的巨大变革,而由此产生的海量基因组数据给研究人员带来了巨大的挑战。很多IT企业和大型基因组研究机构已经转变了他们对海量数据的分析处理方法,逐渐开始采用更加高效的绿色云计算设施。云计算虽然是近几年才兴起的一个新生技术,但是它已经成为数据发展的必然趋势。云计算可以规模化降低数据中心成本,增强资源利用率,提高伸缩性、弹性管理应用和数据需求,从而大大降低能耗和使用基础设施的成本。

为了高效分析和妥善存储基因组数据,华大基因在计算机的软件和硬件方面都进行了深入地探索和实践。在软件方面,华大基因的弹性计算开发团队利用Apache™ Hadoop™ MapReduce框架,开发了SOAPhecateSOAPgaea这两款基于分布式集群的新一代测序数据分析软件。这两款软件可以将第二代测序的数据分析任务分布到整个集群上完成,从而提高了集群的利用率和软件的灵活扩展性,因此被命名为弹性计算。SOAPhecate的成功开发使得基因组组装避免了高内存服务器的使用,大幅度降低了基因组组装的成本。在硬件方面,华大基因的高性能计算(HPC)开发团队紧密跟踪图形处理器(GPU)等先进技术,开发完成了SOAPgsnpSOAPgama,提高计算能力的同时降低功耗,力图做到绿色高效能计算,以前需要90个小时完成的数据分析工作现在只需要6个小时就可以完成。如今DNA测序技术成本的下降幅度远远高于测序数据分析成本,云计算已成为基因组学研究领域中的一个日趋重要的工具或服务。基于云计算的软件服务给研究者提供了分析数据的平台,大大提升了运行速度并降低了成本,他们不再需要自己购买计算机集群即可完成海量数据的分析处理。

近日,华大基因推出了首款云计算平台产品EasyGenomics,旨在为组学研究领域的科研人员提供快捷、准确和易于操作的新一代测序分析服务,更好地应对及解决海量基因组数据的存储、处理、分析和挖掘等问题。

面对在基因组学研究中分析处理的数据量的迅猛飙升,华大基因不断地在高性能计算领域内开发可以处理海量生物信息数据的硬件和分析软件。华大基因于2011620日举办的国际超级计算机大会上,荣获由国际数据公司公布的首届高性能计算创新优秀奖HPC Innovation Excellence Award)。目前,华大基因在深圳、香港、北京和武汉等地拥有数个大型生物信息学超级计算中心,已经拥有212 T Flops的峰值计算能力,总内存容量已达到37.2 TB,总存储能力已达到17 PB。为适应更庞大数据存储、处理、分析与应用的要求,华大基因已和国家超算天津中心、深圳超算中心、广州超算中心等机构展开战略性合作,旨在进一步提高基因组学相关技术的研发和应用的效率。