本书选择华为公司贡献的国产开源OpenEuler Linux操作系统来替代常用的CentOS Linux操作系统,OpenEuler与CentOS Linux命令大多数非常兼容,有CentOS Linux经验使用者用起来很快可以适应。本书采用目前官方2022年8月发布的最新版本Hadoop 3.3.4进行安装部署,市面上大多数教材都还是基于Hadoop 2.X的安装部署。 本书共5个项目16个任务,项目由易到难、从单一到综合,各个项目间既有机联系,又相互独立,授课教师可以根据所教学生的学情分析结果选择某一个项目单独教学和进行任务实施。5个项目分别是:安装环境准备、Hadoop集群完全分布式部署、Hadoop生态系统常用组件部署、Hadoop HA集群部署、基于Ambari的HDP生产集群部署。每个项目的任务都包含了任务目标、知识准备、任务实施三部分。本书对于在实际教学过程中发现的学生需要加强学习的知识点和技能点都用较多篇幅进行了讲解,加强对基础知识的了解,知其然且知其所以然,便于学生在任务实施过程中能够得心应手。本书所有项目的任务实施都全部来自实际操作步骤,一步一图,并且对任务实施中执行的每一条命令都进行了详细注释,只要认真仔细阅读后细心操作就能成功。 本书为智慧职教MOOC课程《大数据平台构建》配套教材,学生在智慧职教MOOC学院(网址:https://icve-mooc.icve.com.cn/)搜索并且关注《大数据平台构建》MOOC课程,反复观看MOOC课程里面的教学视频,直至完全掌握。 本书重点侧重于大数据平台构建,即侧重于平台的部署、验证及基本使用,不深入涉及其他大数据分析与应用技术。 本书适合作为各类院校大数据技术课程的教材,也适合作为大数据技术爱好者的参考用书。
项目一安装环境准备
任务1了解大数据的基本概念
任务目标
知识准备
一、大数据的定义
二、全球数字经济的发展现状与趋势
三、我国数字经济的国际地位与优势
四、大数据时代的挑战与机遇
任务实施
任务2下载所需软件安装包
任务目标
知识准备
一、大数据的特征
二、大数据生态系统开源技术和框架
三、Hadoop生态系统
……