当前位置:网站首页>ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
2022-08-02 21:21:00 【一个处女座的程序猿】
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
目录
基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息
相关文章
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例实现
基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
# 1、定义数据集
PassengerId | Survived | Pclass | Name | Sex | Age | SibSp | Parch | Ticket | Fare | Cabin | Embarked |
1 | 0 | 3 | Braund, Mr. Owen Harris | male | 22 | 1 | 0 | A/5 21171 | 7.25 | S | |
2 | 1 | 1 | Cumings, Mrs. John Bradley (Florence Briggs Thayer) | female | 38 | 1 | 0 | PC 17599 | 71.2833 | C85 | C |
3 | 1 | 3 | Heikkinen, Miss. Laina | female | 26 | 0 | 0 | STON/O2. 3101282 | 7.925 | S | |
4 | 1 | 1 | Futrelle, Mrs. Jacques Heath (Lily May Peel) | female | 35 | 1 | 0 | 113803 | 53.1 | C123 | S |
5 | 0 | 3 | Allen, Mr. William Henry | male | 35 | 0 | 0 | 373450 | 8.05 | S |
# 2、数据预处理
# 2.1、类别特征编码
# 2.2、特征筛选且空值填充
Pclass Age SibSp Parch Fare Sex_encoding Embarked_encoding \
0 3 22.0 1 0 7.2500 1 0
1 1 38.0 1 0 71.2833 0 1
2 3 26.0 0 0 7.9250 0 0
3 1 35.0 1 0 53.1000 0 0
4 3 35.0 0 0 8.0500 1 0
Survived
0 0
1 1
2 1
3 1
4 0
# 3、模型训练与推理
# 3.1、数据集切分
# 3.2、模型训练
# 4、PDP实现模型可解释性
4.1、Sex_encoding可视化
# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息
# (2)、绘制跨不同特征值(特征网格)的模型预测分布
# (3)、计算并绘制PDP图解释模型预测
4.2、Pclass可视化
边栏推荐
- JS函数防抖&函数节流及其使用场景
- 人尽皆知的云原生,到底是大势所趋还是过度炒作?
- How the sensor works
- 面试了个985毕业的,回答“性能调优”题时表情令我毕生难忘
- 最近火爆朋友圈的“广告电商”,核心商业模式是什么,广告收入真实靠谱吗?
- 华为设备配置BFD多跳检测
- win10安全中心设置不扫描某个文件夹的方法
- Informatics orsay a tong (1258: 【 9.2 】 digital pyramid)
- PyRosetta 安装方法之Conda安装
- y85.第四章 Prometheus大厂监控体系及实战 -- prometheus告警机制进阶、pushgateway和prometheus存储(十六)
猜你喜欢
源码构建LAMP环境-2
字节内部技术图谱 惊艳级实用
SQL基础练习题(mysql)
JMeter的基本使用
YAML文件格式
【3D视觉】realsense D435三维重建
用户之声 | 大学生的“课外学堂”
Use the TCP protocol, we won't lost package?
汇编语言中b和bl关键字的区别
What is the core business model of the "advertising e-commerce" that has recently become popular in the circle of friends, and is the advertising revenue really reliable?
随机推荐
UDP(用户数据报协议)
工厂模式理解了没有?
golang刷leetcode:统计区间中的整数数目
Finally understand: With threads, why do we need coroutines?
JumpServer open source bastion machine completes Loongson architecture compatibility certification
HCIP--BGP基础实验
Interviewer: can you talk about optimistic locking and pessimistic locks
双轴晶体中的锥形折射
饥荒联机版Mod开发——制作简单的物品(三)
Informatics orsay a tong (1258: 【 9.2 】 digital pyramid)
Flink Yarn Per Job - 启动AM
面试官:可以谈谈乐观锁和悲观锁吗
Add and delete all these years, finally planted in MySQL architecture design!
golang刷leetcode:最大波动的子字符串
如何抓住NFT、元|宇|宙新趋势?
[c] Detailed explanation of operators (1)
Swin Transformer 论文精读,并解析其模型结构
【流媒体】推流与拉流简介
面试官居然问我:删库后,除了跑路还能干什么?
回文自动机+CodeTON Round 2 C,D