计算化学公社

标题: 机器学习中如何将几种度量距离的量进行线性组合 [打印本页]

作者
Author:
哎呀妈呀    时间: 2021-5-27 10:55
标题: 机器学习中如何将几种度量距离的量进行线性组合
在机器学习中如何将度量距离的量D1和D2进行线性组合,得到D=r1*D1+r2*D2,(D1:欧几里得距离,D2=1-T,其中T表示Tanimoto similarity index)

作者
Author:
archer    时间: 2021-5-28 13:16
用kernel ridge regression , 用核函数把descriptor进行线性组合1
作者
Author:
哎呀妈呀    时间: 2021-5-31 11:05
archer 发表于 2021-5-28 13:16
用kernel ridge regression , 用核函数把descriptor进行线性组合1

请问,在使用核岭回归之前,如何进行距离的线性组合呢?在代码中如何进行这种定义?有没有关于线性距离定义相关的帖子或书籍可以推荐啊,万分感谢。
作者
Author:
archer    时间: 2021-5-31 12:34
为啥要进行线性组合,机器学习需要高维的输入,你的维度只有一个,怎么进行学习呢
作者
Author:
哎呀妈呀    时间: 2021-5-31 13:28
archer 发表于 2021-5-31 12:34
为啥要进行线性组合,机器学习需要高维的输入,你的维度只有一个,怎么进行学习呢

因为现在刚开始使用机器学习做预测。想复现别人已发出文章的内容,文章中D是由很多个分子描述符进行定义的,但是我没看明白,距离D是怎么和目标参量之间是如何建立关系的。请问,比如我有100组数据,每组包含8个descriptor(2个分子指纹descriptor,6个物理性质descriptor)和一个target,那么我是否有必要将分子指纹descriptor与6个物理性质descriptor进行距离D的定义,然后建立距离D与target之间的关系。谢谢

作者
Author:
archer    时间: 2021-5-31 16:25
文中是进行线性组合的,系数通过最小化RMSE拟合得到,我觉得多个descriptor组合成一个不是必须的
作者
Author:
哎呀妈呀    时间: 2021-5-31 20:45
archer 发表于 2021-5-31 16:25
文中是进行线性组合的,系数通过最小化RMSE拟合得到,我觉得多个descriptor组合成一个不是必须的

我也认为将多个descriptor组合成一个不是必须的。
对于这种线性组合,请问,我应该如何在python中进行实现呢?
如果将多个descriptor定义为一个D,那么之前多个descriptor对应的target是不是也应该进行距离D的定义?
谢谢




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3