当前位置:网站首页>ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
2022-07-30 13:11:00 【一个处女座的程序猿】
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
目录
基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性
相关文章
ML:机器学习可解释性之部分依赖图之每个特征如何影响您的预测?
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略实现
基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性
# 1、定义数据集
| Date | Team | Opponent | Goal Scored | Ball Possession % | Attempts | On-Target | Off-Target | Blocked | Corners | Offsides | Free Kicks | Saves | Pass Accuracy % | Passes | Distance Covered (Kms) | Fouls Committed | Yellow Card | Yellow & Red | Red | Man of the Match | 1st Goal | Round | PSO | Goals in PSO | Own goals | Own goal Time |
| 14-06-2018 | Russia | Saudi Arabia | 5 | 40 | 13 | 7 | 3 | 3 | 6 | 3 | 11 | 0 | 78 | 306 | 118 | 22 | 0 | 0 | 0 | Yes | 12 | Group Stage | No | 0 | ||
| 14-06-2018 | Saudi Arabia | Russia | 0 | 60 | 6 | 0 | 3 | 3 | 2 | 1 | 25 | 2 | 86 | 511 | 105 | 10 | 0 | 0 | 0 | No | Group Stage | No | 0 | |||
| 15-06-2018 | Egypt | Uruguay | 0 | 43 | 8 | 3 | 3 | 2 | 0 | 1 | 7 | 3 | 78 | 395 | 112 | 12 | 2 | 0 | 0 | No | Group Stage | No | 0 | |||
| 15-06-2018 | Uruguay | Egypt | 1 | 57 | 14 | 4 | 6 | 4 | 5 | 1 | 13 | 3 | 86 | 589 | 111 | 6 | 0 | 0 | 0 | Yes | 89 | Group Stage | No | 0 | ||
| 15-06-2018 | Morocco | Iran | 0 | 64 | 13 | 3 | 6 | 4 | 5 | 0 | 14 | 2 | 86 | 433 | 101 | 22 | 1 | 0 | 0 | No | Group Stage | No | 0 | 1 | 90 |
# 2、数据预处理
# 2.1、分离特征与标签
df_X Goal Scored Ball Possession % Attempts ... Yellow & Red Red Goals in PSO
0 5 40 13 ... 0 0 0
1 0 60 6 ... 0 0 0
2 0 43 8 ... 0 0 0
3 1 57 14 ... 0 0 0
4 0 64 13 ... 0 0 0
[5 rows x 18 columns]
df_y 0 True
1 False
2 False
3 True
4 False
Name: Man of the Match, dtype: bool
# 3、模型建立和训练
# 3.1、数据集切分
# 3.2、模型训练
# 3.3、树模型可视化并保存图片
# 将dot数据保存为图片

# 3.4、PDP可视化
# (1)、单特征PDP可视化




# (2)、双特征交互PDP可视化


边栏推荐
- Lake storehouse which electricity (2) of the project: project using technology and version and the environment
- 【高等数学】【7】二重积分
- 学习笔记——七周成为数据分析师《第二周:业务》:业务分析指标
- 元宇宙的六大支撑技术
- shell script flow control statement
- Mysql batch insert transaction unique key repeated processing
- 无人艇轨迹跟踪的预设性能抗扰控制研究
- There is no one of the strongest kings in the surveillance world!
- 一本通循环结构的程序设计题解(2)
- 【23考研】408代码题参考模板——链表
猜你喜欢
随机推荐
常见的云计算安全问题以及如何解决
CMake library search function does not search LD_LIBRARY_PATH
Mac Brew 安装PHP
RTSP/Onvif协议视频平台EasyNVR服务一键升级功能的使用教程
curl 执行脚本时传递环境变量与参数
基于柔性人机接口的人机协调运动控制方法
jsArray数组复制方法性能测试2207292307
奇异值分解(SVD)原理与在降维中的应用(附带例题讲解)(纯理论)
qq udp tcp机制
Lake storehouse which electricity (2) of the project: project using technology and version and the environment
自从外包干了四年,基本废了...
no matching host key type found. Their offer: ssh-rsa
Hu-cang integrated e-commerce project (1): project background and structure introduction
一文读懂Elephant Swap,为何为ePLATO带来如此高的溢价?
leetcode207.课程表(判断有向图是否有环)
Mysql batch insert transaction unique key repeated processing
R语言ggplot2可视化:使用ggpubr包的ggmaplot函数可视化MA图(MA-plot)、设置label.select参数自定义在图中显示标签的基因类型(自定义显示的标签列表)
R语言ggpubr包的ggboxplot函数可视化分组箱图、自定义移除可视化图像的特定对象(移除可视化图像轴坐标轴的刻度线标签文本、both x and y axis ticks labels)
双击Idea图标打不开——解决办法
ENVI Image Processing (6): NDVI and Vegetation Index









