抽象的

联合 SVM-PLS 方法预测沿海水域有机化合物的雌激素活性

李飞、曹璐璐、吴惠峰、赵建民

使用酵母双杂交试验对 517 种天然、合成和环境化学物质数据集进行了雌激素活性测试(表示为 logREC10),这些化学物质属于多种结构类别。在本研究中,使用偏最小二乘法 (PLS) 和支持向量机 (SVM) 两种方法确定了定量结构-活性关系 (QSAR)。PLS 模型的 Q2 cum 为 0.678,表明具有较高的稳健性和良好的预测能力。观测值和预测值之间的相关系数 (R) 为 0.870,表明最终 QSAR 模型的预测值与相应的实验值高度一致。 PLS 模型包含 8 个 DRAGON 描述符,包括 Mor03p、L3e、R8p、RTv+ 、R8e、R1p+ 、R7p+ 和 HATSv ,这意味着化学物质的雌激素活性与原子性质(原子桑德森电负性、极化率和范德华体积)有关。比较两个模型的结果发现,SVM 方法的总体性能最优,整个模型的 RMS 误差为 0.145 logREC10 单位。此外,根据一些特定家族的化学结构,构建了三个线性 QSAR 模型。这些预测模型应该有助于快速识别潜在的雌激素内分泌干扰化学物质。

免责声明: 此摘要通过人工智能工具翻译,尚未经过审核或验证