当前位置:网站首页>【新书推荐】Cleaning Data for Effective Data Science
【新书推荐】Cleaning Data for Effective Data Science
2022-06-30 09:32:00 【图书分享员】
各位好,此账号的目的在于为各位想努力提升自己的程序员分享一些全球最新的技术类图书信息,今天带来的是2021年3月由Packt出版社最新出版的一本关于大数据的书,涉及的语言为Python和R语言。
Cleaning Data for Effective Data Science

作者:David Mertz
出版社:Packt
出版时间:2021-03-31
ISBN:9781801071291
图书简介
在数据科学,数据分析或机器学习中,要实现实际目的所需的大部分工作都在于清理数据,这是不言而喻的。本书以David的标志性友好幽默风格编写,详细讨论了在每个生产数据科学或数据分析管道中执行的基本步骤,并为数据可视化和建模结果做好了准备。
本书深入探讨了数据提取,异常检测,价值估算和功能工程所需的工具和技术的实际应用。在每章的末尾还提供了长篇练习,以练习所获得的技能。
您将首先查看诸如JSON,CSV,SQL RDBMSes,HDF5,NoSQL数据库,图像格式的文件以及二进制序列化数据结构之类的数据格式的数据摄取。此外,这本书提供了许多示例数据集和数据文件,可用于下载和独立探索。
从格式继续,您将估算缺失值,检测不可靠的数据和统计异常,并生成成功进行数据分析和可视化目标所必需的综合功能。
到本书结尾,您将对执行实际数据科学和机器学习任务所需的数据清理过程有深入的了解。
您将学到什么
如何仔细考虑您的数据并提出正确的问题
识别与单个数据点有关的问题数据
以系统的数据“形状”检测问题数据
补救数据完整性和卫生问题
准备用于分析和机器学习任务的数据
将值插值到丢失或不可靠的数据中
生成更适合数据科学,数据分析或可视化目标的综合功能。
这本书是给谁的
本书旨在使对数据分析或科学计算感兴趣的软件开发人员,数据科学家,有抱负的数据科学家和学生受益。
熟悉统计知识,机器学习的一般概念,编程语言(Python或R)的知识以及对数据科学的一些了解会很有帮助。词汇表,参考资料和友好的帮助应该有助于使所有读者快速掌握。
该文本对于希望提高其数据卫生严格性并希望对数据准备问题进行复习的中级和高级数据科学家也将有所帮助。
这就是今天的分享了,不知道对你有没有帮助呢,觉得还不错的话就帮我点个赞吧,如果能关注我就更好了。如果大家想获得这本图书的pdf可以点击书籍的超链接,也欢迎大家在评论区留言和私信,我会持续更新的。祝大家都能够快速成长,早日摆脱996~加油打工人!!
边栏推荐
- Microsoft. Bcl. Async usage summary -- in Net framework 4.5 project Net framework version 4.5 and above can use async/await asynchronous feature in C 5
- 7. know JNI and NDK
- AutoUpdater. Net client custom update file
- [JPEG] how to compile JPEG turbo library files on different platforms
- Deep Learning with Pytorch- A 60 Minute Blitz
- Cftpconnection:: getfile() download FTP server files and related parameter descriptions
- Duplicate entry '2' for key 'primary appears in JPA‘
- Express file download
- 目标检测yolov5开源项目调试
- Invalid update: invalid number of sections. The number of sections contained in the table view after
猜你喜欢

八大排序(二)

Abstract factory pattern

Esp32 (4): overview of the overall code architecture

Set, map and modularity

Talk about the kotlin cooperation process and the difference between job and supervisorjob

Framework program of browser self-service terminal based on IE kernel

ES6 learning path (II) let & const

9.JNI_ Necessary optimization design

asdsadadsad

Solution to pychart's failure in importing torch package
随机推荐
DataTableToModelList实体类
Installation, use and explanation of vulnerability scanning tool OpenVAS
【Ubuntu-redis安装】
List set export excel table
5. Messager framework and imessager interface
JVM family
MySQL-- Entity Framework Code First(EF Code First)
Deep Learning with Pytorch- A 60 Minute Blitz
AutoUpdater. Net client custom update file
Review the old and know the new
2021-10-20
Metasploit practice - SSH brute force cracking process
Why won't gold depreciate???
Enum demo
Splice and slice functions of JS
8.8 heap insertion and deletion
[JPEG] how to compile JPEG turbo library files on different platforms
ReturnJson,让返回数据多一些自定义数据或类名
Talk about how the kotlin process started?
Set, map and modularity