单细胞藻青菌的基因组序列分析集胞藻属PCC6803 sp.压力。二世。整个基因组的序列测定和分配潜在的蛋白质编码区域。

文章的细节

引用

佐藤Kaneko T, S, Kotani H,田中,Asamizu E,中村Y, Miyajima N, Hirosawa M, Sugiura M, Sasamoto年代,木村T, Hosouchi T, Matsuno, Muraki, Nakazaki N, Naruo K,时候,Shimpo年代,竹内C,和田T,渡边,山田M, Yasuda M, Tabata年代

单细胞藻青菌的基因组序列分析集胞藻属PCC6803 sp.压力。二世。整个基因组的序列测定和分配潜在的蛋白质编码区域。

DNA研究》1996年6月30日;3 (3):109 - 36。

PubMed ID
8905231 (在PubMed
]
文摘

整个基因组的序列测定集胞藻属sp.应变PCC6803完工。基因组最终确定的总长度是3573470个基点,包括1003450个基点的之前报道的序列从64%到92%的基因组地图位置。整个序列组装粘粒的物理图谱重叠群序列的克隆和λ和长PCR克隆产品用于填缝。序列的准确性是保证两股DNA分析整个基因组。装配序列的真实性得到了限制长PCR分析产品,直接放大的使用组装基因组DNA序列数据。预测潜在的蛋白质编码区域,分析开放阅读框(orf),分析由GeneMark程序并进行相似性搜索数据库。必威国际app结果,共有3168个潜在的蛋白基因被分配在基因组中,145(4.6%)相同的报告基因和1257年(39.6%)和340年(10.8%)显示相似报道和假想的基因,分别。剩余的1426(45.0%)没有任何基因数据库有明显的相似性。中潜在的蛋白质基因分配,128人参与光合反应相关基因。蛋白质序列编码的和潜在的基因占87%的基因组长度。 By adding rRNA and tRNA genes, therefore, the genome has a very compact arrangement of protein- and RNA-coding regions. A notable feature on the gene organization of the genome was that 99 ORFs, which showed similarity to transposase genes and could be classified into 6 groups, were found spread all over the genome, and at least 26 of them appeared to remain intact. The result implies that rearrangement of the genome occurred frequently during and after establishment of this species.

DrugBank数据引用了这篇文章

多肽
的名字 UniProt ID
可能半胱氨酸desulfurase Q55793 细节
生物钟蛋白质KaiB P74645 细节
Apocarotenoid-15 15加氧酶 P74334 细节
Ferredoxin-dependent谷氨酸合酶2 P55038 细节
隐花色素破折号 P77967 细节
细胞色素c - 550 Q55013 细节