生命科学

当前位置:威尼斯城所有登入网址 > 生命科学 > 海狸的基因组,全世界基因组数据库污染倍受关

海狸的基因组,全世界基因组数据库污染倍受关

来源:http://www.17930ip.com 作者:威尼斯城所有登入网址 时间:2019-08-21 07:32

核心提示:2月16日发表在《公共科学图书馆?综合》期刊上的一份研究报告称康涅狄格大学的遗传学家Mark Longo及同事发现由顶级公共测序机构提供的测序结果构建的基因组数据库中的大约1/5的细菌、植物和非灵长类动物基因组数据受到了人类DNA的污染,样品处理有可能是导致DNA数据库广泛污染的最主要原因。这一研究报告引起了生物研究人员及各大权威媒体的高度关注,《科学家》(The Scientist)杂志以及《自然》杂志均在其官方网络上第一时间对这一事件进行了报道。

在建筑学方面,海狸筑坝的高超能力给了人类不少启示。在生物学方面,人类又能从海狸基因组中获得哪些启示呢?近日,加拿大的团队测序并分析了加拿大海狸的基因组。他们在《G3: Genes, Genomes, Genetics》杂志上报道了这项研究的成果。

生技网资讯: 2月16日发表在《公共科学图书馆?综合》期刊上的一份研究报告称康涅狄格大学的遗传学家Mark Longo及同事发现由顶级公共测序机构提供的测序结果构建的基因组数据库中的大约1/5的细菌、植物和非灵长类动物基因组数据受到了人类DNA的污染,样品处理有可能是导致DNA数据库广泛污染的最主要原因。这一研究报告引起了生物研究人员及各大权威媒体的高度关注,《科学家》(The Scientist)杂志以及《自然》杂志均在其官方网络上第一时间对这一事件进行了报道。

威尼斯城所有登入网址 1

等在报告中呼吁科学家们需更加努力以确保测序获得的基因组不受到污染,并应对来自公共基因组数据库的基因组进行潜在污染检测。

多伦多大学和病童医院的分子遗传学家 Stephen Scherer 是这篇文章的资深作者。他在文中写道:“这项研究为基因组组装带来了新见解,也为海狸及啮齿动物的进化带来了重要的基因组学资源。”

“基因组污染是一个大问题,但却不是一个新问题,”加州大学进化生物学家、美国能源部联合基因组研究所系统发育基因组学计划负责人Jonathan Eisen说:“这篇论文或可帮助提醒人们注意这一问题。”

海狸是北美最大的啮齿动物。一只完全长成的海狸长约 30 英寸,体重达 35-60 磅。北美海狸绝大多数生活在落基山脉和加拿大北部。 它们栖息在林地的各种水域,如池塘、湖泊以及溪流。

威尼斯城所有登入网址,污染有可能在测序的任何一个阶段导入到基因组序列中。有可能是空气中的细菌落到了样品中,或是灭菌后仍残留在试剂中的DNA片段。但最常见的污染原因则可能是科学家自身,譬如在扩增前将自身的一个细胞落入了样品中。

长期以来,海狸一直是重要的生态和经济来源。正如 Scherer 及其同事所解释的,在加拿大,“海狸是一个标志性的国家象征”,其中部分原因是海狸的皮毛及其他产品作为经济动力,推动早年英国和法国的殖民扩张,最终导致加拿大成立。

“研究人员戴手套进行实验操作不仅是对自身的保护,并且也可避免样品受到自身的污染,”论文的作者之一、康涅狄格大学分子遗传学家Rachel O'Neill说道。

在这项研究中,Scherer 及其同事利用 Pacific Biosciences 单分子测序和 de novo 组装,对海狸的肌肉组织和白细胞进行测序,以鉴定其基因组特征。他们的研究对象是一只在魁北克出生、目前住在多伦多动物园的海狸,名叫 Ward。

实验室的一位大学生在对基因组数据库进行保守序列筛查时,兴奋地发现大量物种间均存在一个相同的序列。然而当他尝试在实验室重复这些结果时却失败了。这位学生不禁开始质疑数据库基因组是否存在污染,于是他与实验室的同事合作对四个公共数据库(UCSC Genome Browser数据库,NCBI的GenBank数据库,DOE Joint Genome Institute数据库以及Ensembl)中保存的所有非灵长类基因组进行了人类特异性重复序列Alu元件的筛查。

这个团队利用 PacBio RS II 单分子实时测序技术分析了海狸的基因组 DNA,并从混合样品中提取出线粒体序列,组成了近 17,000 个碱基的线粒体基因组。

在搜索的2057个原始序列基因组中,研究人员发现有454个存在人类Alu元件序列的污染,约占总数的22.39%。“我们发现污染的水平高到足以应引起人们注意的程度,”O'Neill说;“而这还仅只是来自于人类的污染,可以想象会有多少来自实验室常见物种例如大肠杆菌等的污染存在。”

为了完成 27 亿个碱基的 de novo 基因组组装,研究人员还融合了 Illumina 的 HiSeq X 仪器上产生的短片段基因组序列。他们还利用 HiSeq 2500 仪器,对安大略皇家博物馆中收藏的冰冻海狸组织中的肌肉组织进行 RNA 测序,并将基因组与转录组进行比较。

指出:“大量论文曾报道过物种间的水平基因转移,如今不禁让人质疑是否都仅是人类DNA污染数据所致。人类污染的频率将要求科学家们不得不完成一些超过标准的实验以确证他们的实验结果。”

在组装基因组的同时,研究人员开始注释基因组,鉴定可能与人类疾病、啮齿动物的牙列以及其他过程相关的重复序列和蛋白编码区。他们指出,对海狸基因组的进一步研究可能有助于揭开海狸在北美的历史以及它对环境和人群迁移的影响。

“当涉及到人类测序时,高水平的序列污染有可能会引发严重的后果,”O'Neill说:“在一个鱼样本中找到Alu元件非常的简单。但是在一个人类样本中寻找另一个人的样本就非常的困难。根据如此高污染的序列来决定个体化治疗的策略有可能会导致难以想象的悲剧。“

此外,在上周末的动植物基因组大会上,美国俄勒冈州立大学领导的海狸测序计划也展出了一些成果。研究人员指出,他们利用 Illumina 测序技术对海狸基因组进行测序和组装,获得了 17 种不同海狸组织的转录组数据,并对加拿大海狸及 19 个其他物种进行了系统发育分析。

“随着研究的不断推进,科学家们必须投入更多的资金进行质量控制,然而在追求研究数据的压力下质量控制的重要性却被人抛诸在了脑后,”Eisen说:“如果每个人都能意识到数据质量的重要性将会有多好啊,但是目前这似乎很难做到。”

关键字:全球基因组数据库污染

本文由威尼斯城所有登入网址发布于生命科学,转载请注明出处:海狸的基因组,全世界基因组数据库污染倍受关

关键词: 威尼斯城

上一篇:展望文章,将破译所有真核生物基因组

下一篇:没有了