第11届北京科音分子动力学与GROMACS培训班将于8月13~16日于北京举办,是系统性学习分子动力学与GROMACS使用的最佳机会,请点击此链接查看培训详情,欢迎参加!

计算化学公社

 找回密码 Forget password
 注册 Register
Views: 477|回复 Reply: 2

[Python] Linux下利用SHAP对机器学习模型进行合理解释

[复制链接 Copy URL]

977

帖子

13

威望

5256

eV
积分
6493

Level 6 (一方通行)

计算化学社畜

发表于 Post on 2022-7-4 21:23:50 | 显示全部楼层 Show all |阅读模式 Reading model
本帖最后由 冰释之川 于 2022-7-31 18:18 编辑

前文参见:Linux下Scikit-learn机器学习实例脚本》(http://bbs.keinsci.com/thread-30547-1-1.html

好不容易用Scikit-learn对某个数据集进行机器学习,并且得到了不错的模型,但如果只是看看MSE或者R方等度量指标,抑或是对新样本进行预测,那总感觉缺点啥……
对的,缺的就是对ML模型进行“合理化”分析。

虽然ML在很多人眼里就是个大黑箱,似乎很难对黑箱进行剖析,但是有了SHAP之后,一切都变了,都变了,变了……

本文利用SHAP库编写了一个懒人脚本,对Scikit-learn库中常用ML模型进行了剖析。

不知道SHAP是啥的童鞋,请访问SHAP官网https://shap.readthedocs.io/en/latest/index.html
不知道怎么装SHAP的同学,参见SHAP官网


shap_header.png

以下是基于1502_LYL.csv数据集利用RFR模型预测CUTLOSS(已经“腌制”成CUTLOSS_RFR_best.pkl文件)输出变量的SHAP分析图:
CUTLOSS_RFR_best_importance.png
CUTLOSS_RFR_best_dependence.png
CUTLOSS_RFR_best_force.png
CUTLOSS_RFR_best_waterfall.png
CUTLOSS_RFR_best_summary.png
CUTLOSS_RFR_best_target_interaction.png
CUTLOSS_RFR_best_top_interactions.png

懒人脚本(Model_explanation.py)下载地址
shap.zip (680.94 KB, 下载次数 Times of downloads: 42)

评分 Rate

参与人数
Participants 12
威望 +1 eV +50 收起 理由
Reason
ABB + 3
Chlorine@Chem + 5 赞!
StormSpirts + 5 不明觉厉
muuu2333 + 5 好物!
丁越 + 5 赞!
panernie + 5 好萌好萌好萌!
ggdh + 5 你搞的我完全看不懂啊 慌的一批
hdhxx123 + 5 GJ!
QH1995 + 5 谢谢分享
泡泡媛 + 2 整挺好
sobereva + 1
plus + 5

查看全部评分 View all ratings

Stand on the shoulders of giants

1

帖子

0

威望

9

eV
积分
10

Level 1 能力者

发表于 Post on 3 day ago | 显示全部楼层 Show all
冰冰大佬 为什么我读取模型的时候 报错
AttributeError: 'RandomForestRegressor' object has no attribute '_final_estimator'

977

帖子

13

威望

5256

eV
积分
6493

Level 6 (一方通行)

计算化学社畜

 楼主 Author| 发表于 Post on 3 day ago | 显示全部楼层 Show all
ABB 发表于 2022-8-9 10:15
冰冰大佬 为什么我读取模型的时候 报错
AttributeError: 'RandomForestRegressor' object has no attribut ...

我这边*.pkl保存的是使用pipeline流水线给出最佳模型。
前文参见:《Linux下Scikit-learn机器学习实例脚本》(http://bbs.keinsci.com/thread-30547-1-1.html
Stand on the shoulders of giants

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )

GMT+8, 2022-8-12 02:23 , Processed in 0.683303 second(s), 29 queries .

快速回复 返回顶部 返回列表 Return to list