内在和外在的方法检测细菌基因组的基因。

文章的细节

引用

Borodovsky M,陆客,Koonin EV

内在和外在的方法检测细菌基因组的基因。

核酸研究》1994年11月11日,22 (22):4756 - 67。

PubMed ID
7984428 (在PubMed
]
文摘

未经地区EcoSeq6大肠杆菌基因组DNA序列的数据库,总计1278的基因间序列的长度为359279完全相结合,分析了使用计算机辅助方法,目的是识别假定的未知基因。提出的策略寻找新基因包括两个关键元素:i)的预测表示开放阅读框(orf)使用GeneMark方法基于马尔可夫链模型编码和非编码区域的大肠杆菌DNA,和2)搜索使用程序基于蛋白质序列相似性爆炸主题识别算法和程序。必威国际app共有354名公认的表达并被GeneMark预测。使用BLASTX和TBLASTN程序,结果表明,208个orf位于未经地区的大肠杆菌染色体明显类似于其他蛋白质序列。识别182子可能的基因是由GeneMark和爆炸,包括51.4%的GeneMark爆炸“热门”和87.5%的“热门”。73年的新基因,包括GeneMark预测的20.6%,属于古守恒的蛋白质包括eubacterial和真核的家庭成员。这个值接近总体比例eubacterial之间高度保守的序列的蛋白质,这表明大多数的假定的表示羊痘疮,由GeneMark预测,但没有重大爆炸袭击,不过很可能是真正的基因。大多数的假定的基因被爆炸以来,已描述搜索EcoSeq6数据库的释放,但迄今为止没有检测到大约70个基因。必威国际app在这些新识别基因编码的蛋白质与各种预测功能包括脱氢酶、激酶,其他几种代谢酶、atp酶,核糖体rna甲基转移酶、膜蛋白,不同类型的调控蛋白。

DrugBank数据引用了这篇文章

多肽
的名字 UniProt ID
氨通道 P69681 细节
Alpha-ketoglutarate-dependent牛磺酸加双氧酶 P37610 细节
脂蛋白NlpI P0AFB1 细节
碳链脂肪酸——辅酶a连接酶 P38135 细节