一个用户名 发表于 2022-1-20 00:15 好的,感谢建议。 |
MolAICal 发表于 2022-1-6 15:36 感谢回复!经过测试,我发现是分子活性的列名中有空格,因此在读入数据的时候出现了窜列的问题,将列名中的空格删除后就一切正常了。不过我觉得,MolAICal将空格也识别为分隔符可能是不太合适的,所以我建议读入时只将制表符视作分隔符,您可以考虑一下。 |
本帖最后由 MolAICal 于 2022-1-6 15:55 编辑 一个用户名 发表于 2022-1-5 20:07 您好!您的意思是,用A数据集进行训练,然后在用A数据集通过QSAR的线性模型计算A数据集的活性,然后对不上A数据集原始的活性值吗? 如果是:首先,QSAR模型预测A数据集的值跟真实值有一定的差距,同时,你还要把Q^2这个值训练到 >0.8,甚至 > 0.9,才会预测更好。 其次,QSAR和目前的深度学习,特别依赖数据集,如果你已有非训练集、验证集和测试集的数据,想进行测试,可以少量放入QSAR中进行拟合,然后在进行泛化推广。。不然使用其它数据集,它可能跟你目前想测的数据集性质不同,而导致模型泛化能力很差 |
你好,我在使用MolAICal进行QSAR建模时,发现拟合结果无法重复。如图,MolAICal显示拟合结果良好 然而,我自行将分子的数据代入线性模型后,发现拟合效果非常不佳 请问这种情况如何解决呢?谢谢!输入文件和模型输出文件如下 |
comboy2008 发表于 2020-8-31 10:25 是,pkd就是要回归的Y值 |
本帖最后由 MolAICal 于 2020-9-1 00:31 编辑 comboy2008 发表于 2020-8-31 10:25 谢谢提醒,准备修改,后期会加入各种算法,谢谢建议。目前DRAGON很不错,虽然停止开发了。可用的有 PaDEL-descriptor,shrodinger等,很多性质可以自己算。 |
另外DRAGON是商业软件,国内购买的人不是多,软件到7.0之后,已经停止开发了。“Dragon has been discontinued. If you currently own a Dragon license and need technical support, please contact us at the chm@kode-solutions.net email address.”,楼主认为哪些开源软件在计算分子描述符方面比较好用? |
pKd就是要回归的Y值?hyperchem的分子文件格式应该为hin而非bin,软件在参数筛选算法上只有遗传算法吗?能否考虑加入其它算法,比如深度神经网络,XGboost等等? |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2024-11-23 11:12 , Processed in 0.194978 second(s), 27 queries , Gzip On.