计算化学公社

 找回密码 Forget password
 注册 Register
Views: 4309|回复 Reply: 6
打印 Print 上一主题 Last thread 下一主题 Next thread

[Python] 机器学习中如何将几种度量距离的量进行线性组合

[复制链接 Copy URL]

75

帖子

0

威望

1989

eV
积分
2064

Level 5 (御坂)

跳转到指定楼层 Go to specific reply
楼主
在机器学习中如何将度量距离的量D1和D2进行线性组合,得到D=r1*D1+r2*D2,(D1:欧几里得距离,D2=1-T,其中T表示Tanimoto similarity index)

323

帖子

0

威望

4395

eV
积分
4718

Level 6 (一方通行)

2#
发表于 Post on 2021-5-28 13:16:39 | 只看该作者 Only view this author
用kernel ridge regression , 用核函数把descriptor进行线性组合1

75

帖子

0

威望

1989

eV
积分
2064

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2021-5-31 11:05:09 | 只看该作者 Only view this author
archer 发表于 2021-5-28 13:16
用kernel ridge regression , 用核函数把descriptor进行线性组合1

请问,在使用核岭回归之前,如何进行距离的线性组合呢?在代码中如何进行这种定义?有没有关于线性距离定义相关的帖子或书籍可以推荐啊,万分感谢。

323

帖子

0

威望

4395

eV
积分
4718

Level 6 (一方通行)

4#
发表于 Post on 2021-5-31 12:34:58 | 只看该作者 Only view this author
为啥要进行线性组合,机器学习需要高维的输入,你的维度只有一个,怎么进行学习呢

75

帖子

0

威望

1989

eV
积分
2064

Level 5 (御坂)

5#
 楼主 Author| 发表于 Post on 2021-5-31 13:28:55 | 只看该作者 Only view this author
archer 发表于 2021-5-31 12:34
为啥要进行线性组合,机器学习需要高维的输入,你的维度只有一个,怎么进行学习呢

因为现在刚开始使用机器学习做预测。想复现别人已发出文章的内容,文章中D是由很多个分子描述符进行定义的,但是我没看明白,距离D是怎么和目标参量之间是如何建立关系的。请问,比如我有100组数据,每组包含8个descriptor(2个分子指纹descriptor,6个物理性质descriptor)和一个target,那么我是否有必要将分子指纹descriptor与6个物理性质descriptor进行距离D的定义,然后建立距离D与target之间的关系。谢谢

Effect of increasing the descriptor set on machine learning.pdf

1.16 MB, 下载次数 Times of downloads: 13

323

帖子

0

威望

4395

eV
积分
4718

Level 6 (一方通行)

6#
发表于 Post on 2021-5-31 16:25:30 | 只看该作者 Only view this author
文中是进行线性组合的,系数通过最小化RMSE拟合得到,我觉得多个descriptor组合成一个不是必须的

75

帖子

0

威望

1989

eV
积分
2064

Level 5 (御坂)

7#
 楼主 Author| 发表于 Post on 2021-5-31 20:45:34 | 只看该作者 Only view this author
archer 发表于 2021-5-31 16:25
文中是进行线性组合的,系数通过最小化RMSE拟合得到,我觉得多个descriptor组合成一个不是必须的

我也认为将多个descriptor组合成一个不是必须的。
对于这种线性组合,请问,我应该如何在python中进行实现呢?
如果将多个descriptor定义为一个D,那么之前多个descriptor对应的target是不是也应该进行距离D的定义?
谢谢

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 21:36 , Processed in 0.222305 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list