当前位置:网站首页>机器学习--人口普查数据分析

机器学习--人口普查数据分析

2022-07-06 09:13:00 萍果馅是年糕

机器学习--人口普查数据分析

在进行人口普查分析的时候需要对数据进行清洗;通过数据清洗的方法对数据进行清洗;

下载数据   从官方网站下载原始数据:UCI Machine Learning Repository

 

 

将下载好的adult.data文件转化成adult.csv文件

 

清洗数据

对数据进行清洗---对照https://archive.ics.uci.edu/ml/datasets/Adult中的数据信息进行清洗。

 替换方法

 

 

 

 

 

 

 

 将所有字符串替换完成后,将<=50K全部替换成0,>50K全部替换成1。

 

 最后将?或者NAN替换成-1。注:一定要注意是否有空格。

清洗数据完成(一定要仔细数据清洗失误会导致决策树分析失败)

 清洗完数据之后到阿里云创建工程,进行配置。

 新建工程

 

编辑工作流 

第一步创建一个COS数据集  输入--数据源--COS数据集

配置COS数据集

 

 第二步创建一个修改列名  算法--机器学习算法--数据预处理--修改列名

 配置修改列名

 第三步进行数据切分  算法--机器学习算法--数据预处理--数据切分

数据切分配置

 

第四步进行决策树分类 算法--机器学习算法--分类--决策树分类

 

再配置决策树分类前面这个

 

 进行连接

最后进行二分类任务评估 输出--模型评估--二分类任务评估

进行运行

 

原网站

版权声明
本文为[萍果馅是年糕]所创,转载请带上原文链接,感谢
https://blog.csdn.net/qq_52159080/article/details/123950993