Hive基本概念
本文最后更新于 2025-11-29,文章内容可能已经过时。
Hive 官网地址http://hive.apache.org/
文档查看地址https://cwiki.apache.org/confluence/display/Hive/GettingStarted
下 载 地 址 http://archive.apache.org/dist/hive/
github 地 址https://github.com/apache/hive
Hive
Hive 简介
Hive:由Facebook 开源用于解决海量
结构化日志的数据统计工具。Hive 是基于 Hadoop 的一个
数据仓库工具,将结构化的数据文件映射为一张表,并提供类SQL(HQL)查询功能。
Hive 本质:将HQL(hiveSQL)转化成MapReduce 程序

Hive 处理的
数据存储在HDFSHive 分析
数据底层的实现是MapReduce执行程序运行在
Yarn上结构化文件如何映射成一张表的?借助存储在
元数据数据库中的元数据来解析结构化文件
Hive架构原理

Hive架构介绍
Hive的运行机制

hive通过给用户提供的一系列交互接口,接收到的用户的指令(SQl),使用自己的Driver,结合元数据 (MetaStore),将这些指令翻译成MapReduce,提交到Hadoop中执行,最后,将执行返回的结果输出到用户 交互接口中。
Hive和 数据库比较
Hive的优缺点
本文是原创文章,采用 CC BY-NC-ND 4.0 协议,完整转载请注明来自 程序员小航
评论
匿名评论
隐私政策
你无需删除空行,直接评论以获取最佳展示效果