一、概述
Apache Hive是一款分布式SQL计算的工具, 其主要功能是:
 将SQL语句翻译成MapReduce程序运行
Hive是单机工具,只需要部署在一台服务器即可。
 Hive虽然是单机的,但是它可以提交分布式运行的MapReduce程序运行。
二、基本逻辑简介
主要由两大模块组成:元数据管理,SQL解析器
 
1、元数据管理

 即:数据位置信息、数据结构信息、对数据进行描述与记录
2、SQL解析器
主要功能:
- SQL分析
- SQL到- MapReduce程序的转换
- 提交MapReduce程序运行并收集执行结果
3、简单流程图

三、基础架构

- 元数据管理,称之为Metastore服务
  
- SQL解析器(- Driver驱动程序),完成- SQL解析、执行优化、代码提交等功能
  
- 用户接口:提供用户和Hive交互的功能
  



















