当前位置:网站首页>机器学习--人口普查数据分析
机器学习--人口普查数据分析
2022-07-06 09:13:00 【萍果馅是年糕】
机器学习--人口普查数据分析
在进行人口普查分析的时候需要对数据进行清洗;通过数据清洗的方法对数据进行清洗;
下载数据 从官方网站下载原始数据:UCI Machine Learning Repository



将下载好的adult.data文件转化成adult.csv文件

清洗数据
对数据进行清洗---对照https://archive.ics.uci.edu/ml/datasets/Adult中的数据信息进行清洗。

替换方法









将所有字符串替换完成后,将<=50K全部替换成0,>50K全部替换成1。


最后将?或者NAN替换成-1。注:一定要注意是否有空格。

清洗数据完成(一定要仔细数据清洗失误会导致决策树分析失败)

清洗完数据之后到阿里云创建工程,进行配置。
新建工程


编辑工作流
第一步创建一个COS数据集 输入--数据源--COS数据集

配置COS数据集
第二步创建一个修改列名 算法--机器学习算法--数据预处理--修改列名

配置修改列名

第三步进行数据切分 算法--机器学习算法--数据预处理--数据切分

数据切分配置

第四步进行决策树分类 算法--机器学习算法--分类--决策树分类

再配置决策树分类前面这个


进行连接

最后进行二分类任务评估 输出--模型评估--二分类任务评估

进行运行

边栏推荐
- Copie maître - esclave MySQL, séparation lecture - écriture
- MySQL24-索引的数据结构
- windows下同时安装mysql5.5和mysql8.0
- 软件测试-面试题分享
- Remember the interview algorithm of a company: find the number of times a number appears in an ordered array
- SSM整合笔记通俗易懂版
- The virtual machine Ping is connected to the host, and the host Ping is not connected to the virtual machine
- Csdn-nlp: difficulty level classification of blog posts based on skill tree and weak supervised learning (I)
- CSDN question and answer module Title Recommendation task (II) -- effect optimization
- Solution: log4j:warn please initialize the log4j system properly
猜你喜欢

CSDN Q & a tag skill tree (V) -- cloud native skill tree

LeetCode #461 汉明距离
![[recommended by bloggers] background management system of SSM framework (with source code)](/img/7f/a6b7a8663a2e410520df75fed368e2.png)
[recommended by bloggers] background management system of SSM framework (with source code)
![[recommended by bloggers] C MVC list realizes the function of adding, deleting, modifying, checking, importing and exporting curves (with source code)](/img/b7/aae35f049ba659326536904ab089cb.png)
[recommended by bloggers] C MVC list realizes the function of adding, deleting, modifying, checking, importing and exporting curves (with source code)

Postman uses scripts to modify the values of environment variables

解决:log4j:WARN Please initialize the log4j system properly.

MySQL22-逻辑架构

【博主推荐】SSM框架的后台管理系统(附源码)

CSDN问答模块标题推荐任务(一) —— 基本框架的搭建

Mysql25 index creation and design principles
随机推荐
解决:log4j:WARN Please initialize the log4j system properly.
Yum prompt another app is currently holding the yum lock; waiting for it to exit...
JDBC原理
JDBC原理
February 13, 2022-2-climbing stairs
虚拟机Ping通主机,主机Ping不通虚拟机
软件测试-面试题分享
【博主推荐】C# Winform定时发送邮箱(附源码)
Generate PDM file from Navicat export table
解决扫描不到xml、yml、properties文件配置
Win10: how to modify the priority of dual network cards?
npm一个错误 npm ERR code ENOENT npm ERR syscall open
导入 SQL 时出现 Invalid default value for ‘create_time‘ 报错解决方法
Ansible实战系列二 _ Playbook入门
1. Mx6u learning notes (VII): bare metal development (4) -- master frequency and clock configuration
[Li Kou 387] the first unique character in the string
CSDN blog summary (I) -- a simple first edition implementation
【博主推荐】asp.net WebService 后台数据API JSON(附源码)
Ubuntu 20.04 安装 MySQL
SSM integrated notes easy to understand version