欢迎光临武汉大学出版社!
图书详情首页 > 图书中心
大数据处理:从采集到可视化
作者:余肖生、陈鹏、姜艳静 编著 版次:1-2 开本:16 页数:215 千字数:229 装帧方式:平装
ISBN 978-7-307-21514-6 出版时间:2020-07-03 印刷时间:2023-02-03 定价:¥38元 浏览量: 购买图书
本书共分为9章,第一章数据采集,主要介绍了大数据的概念、类型及其特征,常见的数据采集方法;第2章数据清洗,主要讨论数据质量的维度,数据可能存在的质量问题,常见的数据清洗方法;第3章数据ETL,重点介绍了MGO方法;第4章数据存储,主要介绍了大数据时代的一些主流数据存储平台和相关技术;第5章回归算法,主要介绍了线性回归、决策树回归、随机森林回归等,并介绍了其实现的主要步骤以及相应的Python语言实现代码;第6章分类算法,主要介绍了逻辑回归二分类和多分类、度提升分类树等;第7章聚类算法,主要介绍了分割聚类、层次聚类、基于密度的聚类;第8章推荐算法,主要介绍了基于关联规则的推荐、基于内容过滤的推荐等主流方法;第9章数据可视化的关键技术,主要介绍了数据的降维、可视化隐喻及相关的交互技术。
余肖生,博士,教授,三峡大学计算机学院教授,计算机学系书记,毕业于武汉大学信息管理学院。近年来发表各类学术论文30余篇,其中CSSCI源刊论文10余篇,多篇论文被EI、CPCI收录。