用微信扫描二维码

干净的数据:数据清洗入门与实践

干净的数据:数据清洗入门与实践

作者:[美] 梅甘·斯夸尔

2016.5.1 出版

可语音朗读

开通电子书VIP
30.00得到贝

主编推荐语

掌握高效数据清洗方法,让用户更好地体验大数据价值。

内容简介

理解数据清洗在整个数据科学过程中的作用,掌握数据清洗的基础知识,包括文件清洗、数据类型、字符编码等。 发掘电子表格和文本编辑器中与数据组织和操作相关的重要功能,学会常见数据格式的相互转换,如JSON、CSV和一些特殊用途的格式,采用三种策略来解析和清洗HTML文件中的数据,揭开PDF文档的秘密,提取需要的数据。 借助一系列解决方案来清洗存放在关系型数据库里的坏数据,创建自己的干净数据集,为其打包、添加授权许可并与他人共享,使用书中的工具以及Twitter和Stack Overflow数据,完成两个真实的项目。

出版方

人民邮电出版社·图灵出品