Hive的工作原理是什么？Hive和Hadoop执行任务的流程

黑马程序员 07-23 418

前言：

眼前同学们对“java运行时工作原理”可能比较注意，各位老铁们都需要学习一些“java运行时工作原理”的相关资讯。那么小编同时在网络上汇集了一些关于“java运行时工作原理””的相关资讯，希望姐妹们能喜欢，各位老铁们一起来学习一下吧！

Hive是基于Hadoop的一个数据仓库工具，主要用来对数据进行抽取、转换、加载操作。HiveQL可以将结构化的数据文件映射为一张数据表，允许熟悉SQL的用户查询数据，也允许熟悉MapReduce的开发者开发自定义的mapper和reducer来处理内建的mapper和 reducer无法完成的复杂的分析工作，相对于Java代码编写的MapReduce来说，Hive的优势更加明显。Hive利用Hadoop的HDFS存储数据，利用Hadoop的MapReduce执行查询。

Hive和Hadoop协作执行任务的工作原理

(1) 用户通过用户接口向Driver提交executeQuery。

(2) Driver向Compiler发送获取计划的请求。

(3) Compiler根据用户提交的executeQuery去MetaStore获取需要的元数据信息。

(4) MetaStore向Compiler发送元数据信息。

(5) Compiler得到元数据信息，并向Driver发送计划。

(6) Driver 向EXECUTION ENGINE提交executePlan。

(7) 用户接口向Driver发起获取结果集(fetchResults)的请求。

(8）Driver向EXECUTION ENGINE发起获取结果集的请求。

(9）EXECUTION ENGINE向Driver发送结果集，Driver获取到结果集后返回用户接口。

本文地址：http://www.longkongtuishu.com/cab17BmsHB1AHDw.html

标签： #java运行时工作原理