计算化学公社

 找回密码 Forget password
 注册 Register

使用MolAICal进行药物的QSAR计算

查看数: 11584 | 评论数: 8 | 收藏 Add to favorites 6
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2020-8-12 20:18

正文摘要:

本帖最后由 MolAICal 于 2020-9-1 01:05 编辑 使用MolAICal进行药物的QSAR计算 更多教程(含英文教程)请见如下:MolAICal官方主页:https://molaical.github.ioMolAICal 文章介绍:https://doi.org/10 ...

回复 Reply

MolAICal 发表于 Post on 2022-1-20 11:25:04
一个用户名 发表于 2022-1-20 00:15
感谢回复!经过测试,我发现是分子活性的列名中有空格,因此在读入数据的时候出现了窜列的问题,将列名中 ...

好的,感谢建议。
一个用户名 发表于 Post on 2022-1-20 00:15:16
MolAICal 发表于 2022-1-6 15:36
您好!您的意思是,用A数据集进行训练,然后在用A数据集通过QSAR的线性模型计算A数据集的活性,然后对不 ...

感谢回复!经过测试,我发现是分子活性的列名中有空格,因此在读入数据的时候出现了窜列的问题,将列名中的空格删除后就一切正常了。不过我觉得,MolAICal将空格也识别为分隔符可能是不太合适的,所以我建议读入时只将制表符视作分隔符,您可以考虑一下。
MolAICal 发表于 Post on 2022-1-6 15:36:47
本帖最后由 MolAICal 于 2022-1-6 15:55 编辑
一个用户名 发表于 2022-1-5 20:07
你好,我在使用MolAICal进行QSAR建模时,发现拟合结果无法重复。如图,MolAICal显示拟合结果良好

然而, ...

您好!您的意思是,用A数据集进行训练,然后在用A数据集通过QSAR的线性模型计算A数据集的活性,然后对不上A数据集原始的活性值吗?

如果是:首先,QSAR模型预测A数据集的值跟真实值有一定的差距,同时,你还要把Q^2这个值训练到 >0.8,甚至 > 0.9,才会预测更好。

其次,QSAR和目前的深度学习,特别依赖数据集,如果你已有非训练集、验证集和测试集的数据,想进行测试,可以少量放入QSAR中进行拟合,然后在进行泛化推广。。不然使用其它数据集,它可能跟你目前想测的数据集性质不同,而导致模型泛化能力很差



一个用户名 发表于 Post on 2022-1-5 20:07:13
你好,我在使用MolAICal进行QSAR建模时,发现拟合结果无法重复。如图,MolAICal显示拟合结果良好

然而,我自行将分子的数据代入线性模型后,发现拟合效果非常不佳

请问这种情况如何解决呢?谢谢!输入文件和模型输出文件如下
descriptors-v1-DRAGON.txt (269.19 KB, 下载次数 Times of downloads: 3) QSAROutFile-1.5.dat (11.82 KB, 下载次数 Times of downloads: 2)
MolAICal 发表于 Post on 2020-9-1 00:22:49
comboy2008 发表于 2020-8-31 10:25
pKd就是要回归的Y值?hyperchem的分子文件格式应该为hin而非bin,软件在参数筛选算法上只有遗传算法吗?能 ...

是,pkd就是要回归的Y值
MolAICal 发表于 Post on 2020-9-1 00:19:33
本帖最后由 MolAICal 于 2020-9-1 00:31 编辑
comboy2008 发表于 2020-8-31 10:25
pKd就是要回归的Y值?hyperchem的分子文件格式应该为hin而非bin,软件在参数筛选算法上只有遗传算法吗?能 ...

谢谢提醒,准备修改,后期会加入各种算法,谢谢建议。目前DRAGON很不错,虽然停止开发了。可用的有 PaDEL-descriptor,shrodinger等,很多性质可以自己算。
comboy2008 发表于 Post on 2020-8-31 10:30:20
另外DRAGON是商业软件,国内购买的人不是多,软件到7.0之后,已经停止开发了。“Dragon has been discontinued. If you currently own a Dragon license and need technical support, please contact us at the chm@kode-solutions.net email address.”,楼主认为哪些开源软件在计算分子描述符方面比较好用?
comboy2008 发表于 Post on 2020-8-31 10:25:40
pKd就是要回归的Y值?hyperchem的分子文件格式应该为hin而非bin,软件在参数筛选算法上只有遗传算法吗?能否考虑加入其它算法,比如深度神经网络,XGboost等等?

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 11:12 , Processed in 0.194978 second(s), 27 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list