本书介绍了如何使用Spark进行数据处理。主要采用了理论和案例相结合的方式,系统地介绍了Spark方面的知识:从最基本的Spark环境的安装与配置,到Spark RDD算子的基本操作,再到Spark基础实践中典型案例的实例剖析,最后到Spark生态圈,四个子框架的讲解与实践,贯穿整个Spark知识系统。各章知识间,内容由浅到深,循序渐进,从而帮助读者更好的理解和运用Spark的相关知识。本书适用于开设相关课程的高校本科生和研究生,也可以作为感兴趣读者的技术和案例资料。
袁景凌,女,博士,教授/博导,现任武汉理工大学计算机学院教学副院长。主要从事智能方法应用,大数据挖掘,绿色计算等研究。