由完成的小鼠基因组组装揭示的谱系特异性生物学。

文章的细节

引用

Church DM, Goodstadt L, Hillier LW, Zody MC, Goldstein S, She X, Bult CJ, Agarwala R, Cherry JL, DiCuccio M, Hlavina W, Kapustin Y, Meric P, Maglott D, Birtle Z, Marques AC, Graves T, Zhou S, Teague B, Potamousis K, Churas C, Place M, Herschleb J, Runnheim R, Forrest D, Amos-Landgraf J, Schwartz DC, Cheng Z, lindblader - toh K, Eichler EE, Ponting CP

由完成的小鼠基因组组装揭示的谱系特异性生物学。

《公共科学图书馆·生物学》,2009年5月5日;7(5):e1000112。doi: 10.1371 / journal.pbio.1000112。Epub 2009 5月26日。

PubMed ID
19468303 (PubMed视图
摘要

小鼠(小家鼠)是了解人类疾病和发育的首要动物模型。在这里,我们表明,全面了解小鼠生物学,只有与完成的,高质量的基因组组装的可用性。本文报道的小鼠菌株C57BL/6J的克隆组装与早期的MGSCv3草图基因组组装相比,减少了超过17.5万个缺口,增加了超过139 Mb的新序列。在对修订后的基因组序列的全面分析中,我们现在能够定义20210个蛋白质编码基因,比人类基因组中预测的19042个基因多出1000多个。此外,我们鉴定了439个长而非蛋白质编码的rna,有证据表明在人类中存在转录的orthors。我们分析了先前发表的组装中丢失或错误组装的267 Mb序列的复杂和重复景观,并对其抗拒全基因组霰弹枪测序和组装的原因提供了见解。在新组装的序列中,重复的区域往往比发表的草稿中的重复区域具有更近的祖先,纠正了我们对小鼠谱系最近进化的最初理解。这些重复序列似乎主要由包含转座元件的序列区域和重复的蛋白质编码基因组成;其中,有些在小鼠种群中可能是固定的,但即使在实验室小鼠品系中,至少有40%的片段重复序列是拷贝数可变的。小鼠谱系特异性区域包含3767个基因,主要来自与生殖功能相关的快速变化的基因家族。 The finished mouse genome assembly, therefore, greatly improves our understanding of rodent-specific biology and allows the delineation of ancestral biological functions that are shared with human from derived functions that are not.

引用本文的药物库数据

多肽
的名字 UniProt ID
细胞色素P450 2B9 P12790 细节
溶质载体家族22成员21 Q9WTN6 细节
溶质载体家族12个成员5 Q91V14 细节
蛋白质unc-13同源物B Q9Z1N9 细节