欢迎来到传智教育旗下图书库

大数据项目实战(第2版)

黑马程序员/编著
定价:暂无

出版社:清华大学出版社

ISBN:暂无

图书种类:高校教材

出版日期:2025-01(预估)

所属学科:大数据

页数:暂无

咨询客服

关注获取新书发布信息

内容简介

本书以某招聘网站中的大数据职位招聘信息为数据源,系统地介绍了如何使用 Hadoop 生态系统进行大数据离线分析的方法和步骤。全书共6章,分别讲解了项目需求、项目架构、项目实现流程、Hadoop集群环境搭建、使用Flume实现数据采集、使用MapReduce实现数据预处理、使用Hive实现数据分析和使用FineBI实现数据可视化。

本书附有配套视频、教学PPT、教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。

适合群体

本书可以作为高等教育本、专科院校数据科学与大数据技术及相关专业的教材,并适合大数据开发初学者、大数据分析与挖掘的从业者阅读。

图书特色

数据的价值不仅与数据的数量有关,更与数据的质量和分析有关。为了从海量的数据中提取有价值的信息,我们需要有效地收集、存储、处理和分析数据,以支持商业决策和社会发展。然而,对于初学者来说,如何将大数据技术应用于实际场景可能是一个挑战。因此,我们编写了这本书,旨在为读者提供一个简洁明了的指南,帮助他们快速掌握和理解使用 Hadoop 生态系统进行大数据离线分析的方法和步骤。本书的特点是简洁明了和实用性。通过系统的章节安排和清晰的语言表达,读者可以逐步了解大数据项目的实现思路。

图书目录
第1章 项目概述
    1.1 项目需求和目标
    1.2 预备知识
    1.3 项目架构
    1.4 开发环境和工具
    1.5 项目开发流程
    1.6 本章小结
第2章 搭建Hadoop集群环境
    2.1 基础环境搭建
		2.1.1 创建虚拟机
		2.1.2 安装Linux操作系统
		2.1.3 克隆虚拟机
		2.1.4 配置虚拟机
		2.1.5 安装JDK
    2.2 部署ZooKeeper集群
    2.3 部署Hadoop集群
    2.4 本章小结
第3章 数据采集	
    3.1 数据采集概述
    3.2 部署Flume
    3.3 采集招聘信息
    3.4 本章小结
第4章 数据预处理
    4.1 数据预处理概述
    4.2 招聘信息分析
    4.3 设计数据预处理方案
    4.4 实现数据预处理
		4.4.1 数据预处理环境准备
        4.4.2 创建工具类
        4.4.3 实现Map过程
        4.4.4 实现驱动类
        4.4.5 运行MapReduce程序
    4.5 本章小结
第5章 数据分析
    5.1 数据分析概述
    5.2 部署Hive
    5.3 数据仓库
        5.3.1 数据仓库简介
        5.3.2 数据仓库设计
		5.3.3 构建数据仓库
    5.4 分析招聘信息
		5.4.1 分析大数据职位的区域分布
        5.4.2 分析大数据职位的薪资区间
        5.4.3 分析大数据职位的学历要求
        5.4.4 分析大数据职位的职位标签
    5.5 本章小结
第6章 数据可视化
    6.1 数据可视化概述
    6.2 数据迁移
		6.2.1 部署Sqoop
		6.2.2 创建表
		6.2.3 实现数据迁移
    6.3 FineBI的安装与配置
    6.4 实现数据可视化
		6.4.1 新建数据集
		6.4.2 实现区域分布的可视化
		6.4.3 实现薪资区间的可视化
		6.4.4 实现学历要求的可视化
		6.4.5 实现职位标签的可视化
    6.5 本章小结
展开全部内容

热销图书推荐

ECharts数据可视化

人民邮电出版社

定价:¥59.80 咨询客服

Python快速编程入门(第3版)

人民邮电出版社

定价:¥59.80 咨询客服

Bootstrap响应式Web开发(第2版)

人民邮电出版社

定价:¥59.80 咨询客服

Spring Cloud微服务架构开发(第2版)

人民邮电出版社

定价:¥59.80 咨询客服