利用逐步MLR、FA-MLR、PLS、GFA、G/PLS和ANN技术对结构多样化化合物的细胞色素3A4抑制活性进行比较化学计量学建模。

文章的细节

引用

罗伊·K,普拉蒂姆·罗伊P

利用逐步MLR、FA-MLR、PLS、GFA、G/PLS和ANN技术对结构多样化化合物的细胞色素3A4抑制活性进行比较化学计量学建模。

中华医学化学杂志2009 7月;44(7):2913-22。doi: 10.1016 / j.ejmech.2008.12.004。Epub 2008 12月16日。

PubMed ID
19128860 (PubMed视图
摘要

28种结构多样的细胞色素3A4 (CYP3A4)抑制剂已经进行了定量构效关系(QSAR)研究。分析采用电子、空间、拓扑和热力学描述符,使用Cerius 2 version 10软件计算。所使用的统计工具为线性[以因子分析为预处理步骤的多元线性回归(FA-MLR),逐步MLR,偏最小二乘(PLS),遗传函数算法(GFA),遗传PLS (G/PLS)]和非线性方法[人工神经网络(ANN)]。所有5种线性建模方法都表明了正辛醇/水分配系数(logP)随拓扑和电子参数的不同而变化的重要性。基于最高外部预测R(2)值和最低RMSEP值的训练集(逐步回归)得到的最佳模型也具有良好的内部预测能力。其他模型如FA-MLR、PLS、GFA和G/PLS也具有统计上显著的内部和外部验证特征。测试集的最佳模型[根据r(m)(2),由P.P. Roy, K. Roy, QSAR Comb定义。Sci. 27(2008) 302-313]对测试集化合物具有较好的r(2)值(观测值与预测值之间的决定系数),优于除逐步回归导出模型外的其他统计模型。然而,基于r(m)(2)值(测试集),当观测值与预测值之间存在较大差异时,会惩罚模型,逐步MLR模型被发现劣于除PLS外的其他方法。考虑到整个集的r(m)(2)值,G/PLS推导模型似乎是该数据集的最佳预测模型。在可比较模型中选择最佳预测模型时,根据训练集的留一预测值和测试集化合物的模型推导预测值计算出的整个集合的r(m)(2)是一个很好的判据。

引用本文的药物库数据

绑定属性
药物 目标 财产 测量 pH值 温度(°C)
溴麦角环肽 细胞色素P450 3A4 IC 50 (nM) 3.00 e + 03 N/A N/A 细节
氯喹 细胞色素P450 3A4 IC 50 (nM) 3.50 e + 05 N/A N/A 细节
西咪替丁 细胞色素P450 3A4 IC 50 (nM) 1.00 e + 06 N/A N/A 细节
克霉唑 细胞色素P450 3A4 IC 50 (nM) 5.00 e + 01 N/A N/A 细节
双氢麦角胺 细胞色素P450 3A4 IC 50 (nM) 3.00 e + 03 N/A N/A 细节
地尔硫卓 细胞色素P450 3A4 IC 50 (nM) 2.17 e + 05 N/A N/A 细节
益康唑 细胞色素P450 3A4 IC 50 (nM) 4.31 e + 02 N/A N/A 细节
氟康唑 细胞色素P450 3A4 IC 50 (nM) 2.50 e + 04 N/A N/A 细节
甲吡酮 细胞色素P450 3A4 IC 50 (nM) 4.93 e + 03 N/A N/A 细节
咪康唑 细胞色素P450 3A4 IC 50 (nM) 8.51 e + 02 N/A N/A 细节
硝苯地平 细胞色素P450 3A4 IC 50 (nM) 4.70 e + 04 N/A N/A 细节
奥美拉唑 细胞色素P450 3A4 IC 50 (nM) 7.80 e + 04 N/A N/A 细节