本书是大数据技术与应用专业校企合作系列教材之一,采用模块化的编写思路,内容包括Hive概
述、环境准备、Hadoop搭建和配置、安装Hive的基础操作、HiveQL的数据定义、HiveQL语句、Hive综
合应用7个单元和25个教学任务。每个单元通过学习目标引出单元的教学核心内容,明确教学任务。每个任务的编写分为任务目标、知识学习、任务实施、同步训练4个环节。最后通过单元小结回顾每个单元的学习重点。
本书适合作为高职院校软件技术、大数据技术及应用专业,以及计算机类相关专业的教材,也可以作为Hive爱好者的参考用书。
单元1Hive概述
任务1.1Hive的产生背景
1Hive的产生背景
2Hive的发展历史和现状
3Hive与Hadoop
任务1.2Hive的概念
1Hive的系统与部署架构
2Hive与RDBM对比
3数据仓库的理解
4Hive的数据模型
5HiveQL与数据存储
任务1.3Hadoop生态与Hive
1Pig
2HBase
单元小结
单元2环境准备
任务2.1VMware与SecureCRTPortable
1VMware简介
2VMware的虚拟化
任务2.2JDK的配置
1JDK的简介
2JDK的版本
3上传JDK的介质
4tar的解压与压缩
任务2.3免密登录
1免密登录用户
2免密登录的优点
单元小结
单元3Hadoop搭建和配置
任务3.1Hadoop搭建
1上传Hadoop的介质
2解压Hadoop压缩包
3配置Hadoop的环境变量
4配置Hadoop环境变量
5修改Hadoop的配置文件
6启动Hadoop服务
7检查Hadoop的成功
任务3.2Hadoop配置
1Hadoop简介
2MapReduce综述
单元小结
单元4安装Hive的基础操作
任务4.1Hive的模式
1本地模式
2远程模式
3内嵌模式
任务4.2安装Hive实验
1Hive简介
2Hive的定义
3设计特征