当前位置:网站首页>ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
2022-08-02 21:21:00 【一个处女座的程序猿】
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
目录
基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息
相关文章
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例实现
基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
# 1、定义数据集
| PassengerId | Survived | Pclass | Name | Sex | Age | SibSp | Parch | Ticket | Fare | Cabin | Embarked |
| 1 | 0 | 3 | Braund, Mr. Owen Harris | male | 22 | 1 | 0 | A/5 21171 | 7.25 | S | |
| 2 | 1 | 1 | Cumings, Mrs. John Bradley (Florence Briggs Thayer) | female | 38 | 1 | 0 | PC 17599 | 71.2833 | C85 | C |
| 3 | 1 | 3 | Heikkinen, Miss. Laina | female | 26 | 0 | 0 | STON/O2. 3101282 | 7.925 | S | |
| 4 | 1 | 1 | Futrelle, Mrs. Jacques Heath (Lily May Peel) | female | 35 | 1 | 0 | 113803 | 53.1 | C123 | S |
| 5 | 0 | 3 | Allen, Mr. William Henry | male | 35 | 0 | 0 | 373450 | 8.05 | S |
# 2、数据预处理
# 2.1、类别特征编码
# 2.2、特征筛选且空值填充
Pclass Age SibSp Parch Fare Sex_encoding Embarked_encoding \
0 3 22.0 1 0 7.2500 1 0
1 1 38.0 1 0 71.2833 0 1
2 3 26.0 0 0 7.9250 0 0
3 1 35.0 1 0 53.1000 0 0
4 3 35.0 0 0 8.0500 1 0
Survived
0 0
1 1
2 1
3 1
4 0
# 3、模型训练与推理
# 3.1、数据集切分
# 3.2、模型训练
# 4、PDP实现模型可解释性
4.1、Sex_encoding可视化
# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息

# (2)、绘制跨不同特征值(特征网格)的模型预测分布

# (3)、计算并绘制PDP图解释模型预测

4.2、Pclass可视化


边栏推荐
- 用户之声 | GBASE南大通用实训有感
- 解道8-编程技术5
- js how to get the browser zoom ratio
- LeetCode 2360. 图中的最长环 基环树找环+时间戳
- Redis是如何轻松实现系统秒杀的?
- golang刷letcode:公平分发饼干
- golang刷leetcode:到达角落需要移除障碍物的最小数目
- 以赛促练-力扣第304场周赛反思(持续更新中)
- Zabbix 5.0 监控教程(二)
- I interviewed a 985 graduate, and I will never forget the expression when answering the "performance tuning" question
猜你喜欢
随机推荐
golang刷leetcode:按位与结果大于零的最长组合
sre成长之路
ECCV 2022 | ByteTrack: 简单高效的数据关联方法
js: 实现一个cached缓存函数计算结果
@Transactional 事务调用与生效场景总结
C# Monitor class
[C题目]力扣138. 复制带随机指针的链表
golang刷leetcode:最大波动的子字符串
14、学习MySQL 连接的使用
PyRosetta 安装方法之Conda安装
UDP(用户数据报协议)
【STM32学习2】存储器相关概念与操作
Flink优化及相关
微软SQL服务器被黑客入侵以窃取代理服务的带宽
SRv6网络演进面临的挑战
汉源高科千兆4光4电工业级网管型智能环网冗余以太网交换机防浪涌防雷导轨式安装
源码构建LAMP环境-2
行业 SaaS 微服务稳定性保障实战
《分布式微服务电商》专题(一)-项目简介
总结嵌入式C语言难点(2部分)







