hive中分桶、视图、侧视图的用法

最新推荐文章于 2024-04-25 09:10:17 发布

原创

最新推荐文章于 2024-04-25 09:10:17 发布 · 594 阅读

标签

#hive #大数据

收录于

本文详细介绍了Hive中的分桶、视图和侧视图概念及用法。分桶提高了查询处理效率，通过clustered by进行创建。视图是虚拟表，不存储数据，用于简化查询。侧视图常与表生成函数配合，用于展开array或map类型的字段。

1.分桶

首先明确一点：
分区对应的是文件夹
分桶对应的是文件
分桶对应于HDFS中的文件

更高的查询处理效率
使抽样（sampling）更高效
根据“桶列”的哈希函数将数据进行分桶

1.创建一个分桶表，关键字是clustered

create table if not exists hr_bucket(
name string,
id int,
num string,
time2 string 
)
clustered by (id) into

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Mr.梧桐

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Hive建表（三）侧视图(Lateral View)

zp17834994071的博客

06-12

3173

视图概述 1.通过隐藏子查询、连接和函数来简化查询的逻辑结构 2.产生虚拟表，从真实表中选取数据 3.只保存定义，不存储数据 4.如果删除或更改基础表，则查询视图将失败 5.视图是只读的，不能插入或装载数据应用场景 1.将特定的列提供给用户，保护数据隐私 2.查询语句复杂的场景 侧视图与用户定义的表生成函数（如explode()）关联使用。如表生成函数所述，UDTF为每个输入行生成零个或多个输入行。侧视图首先将UDTF应用于基表的每一行，然后将它们的结果输出行连接到输入行，以形成拥有提供表别名的虚拟表。

参与评论您还未登录，请先登录后发表或查看评论

Hive【二】建表语句分区、分桶及视图

weixin_42487460的博客

06-11

2177

Hive 进阶建表语句分区分桶视图一、建表出错不想drop跑路的万能语句1.修改hive表结构 - alter table常用2.insert overwrite3.`注意`二、Hive建表高阶语句CTAS - as select方式建表CTE(CATS with Common Table Expression )Like创建临时表Hive分区（Partitions）静态分区实例动态分区实例数据分桶视图一、建表出错不想drop跑路的万能语句 1.修改hive表结构 - alter tabl

hive行转列、列传行、侧视图使用案例

weixin_42821133的博客

04-17

530

直接上干货！数据explode_lateral_view.txt： a:shandong,b:beijing,c:hebei|1,2,3,4,5,6,7,8,9|[{“source”:“7fresh”,“monthSales”:4900,“userCount”:1900,“score”:“9.9”},{“source”:“jd”,“monthSales”:2090,“userCount”:789...

【hive】lateral view侧视图

atwdy的博客

04-14

4823

lateral view也叫侧视图，属于hive sql所特有的语法。用来实现类似标准sql中join的操作。join参与运算的往往是两个表，根据指定的关联字段进行横向连接。lateral view参与运算的是一张表，这张表里往往存在某个多值的字段，通过侧视图结合UDTF函数可以将这个多值字段拆分为粒度更小的值，每一个拆分出来的值都会作为新的字段和一条原记录进行拼接。类似于列转行操作，虽然严格意义上不算列转行，因为只是增加了行数，但并未减少列数，只是减少了列中所包含的字段个数。

Hive侧视图 Lateral View（单个、多个、outer）（附案例）

奇迹虎虎的博客

02-17

6200

Hive侧视图 Lateral View（单个、多个、outer）（附案例）

Hive的视图和侧视图

giantleech的博客

03-30

1524

文章目录Hive的视图和侧视图Hive的视图什么是视图视图的优点视图的语法Hive的侧视图总结视图侧视图 Hive的视图和侧视图 Hive的视图什么是视图 1、通过隐藏子查询、连接和函数来简化查询的逻辑结构 2、虚拟表，从真实表中选取数据 3、只保存定义，不存储数据 4、如果删除或更改基础表，则查询视图将失败 5、视图是只读的，不能插入或装载数据视图的优点 1、将特定的列提供给用户，保护数据隐私 2、查询语句复杂的场景视图的语法视图操作命令：CREATE、SHOW、DROP、ALTER CREATE

hive分区、分桶、视图、侧视图

qzc_root的博客

04-28

908

文章目录hive分区创建分区表（静态分区）添加和删除分区动态分区hive分桶抽样视图视图概述应用场景视图的操作侧视图 hive分区在大数据中，最常用的一种思想是分治，分区表实际就是对应hdfs文件系统上的独立的文件夹，该文件夹下是该分区所有数据文件 hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过where子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多。创建分区表（静态分区）通过PARTITIONED BY定义分区 create table d

9、hive的explode、Lateral View侧视图、聚合函数、窗口函数、抽样函数使用详解

热门推荐

alanchanchn的专栏

06-07

8万+

1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解–架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、insert、事务表使用详解及示例 6、hive的select（GROUP BY、ORDER BY、CLUSTER BY、SORT BY、LIMIT、uni

＜Zhuuu_ZZ＞HIVE(四)视图&侧视图

Zhuuu_ZZ的博客

09-17

371

HIVE视图&侧视图一.Hive高阶建表二.Hive视图1. 视图概述2. 应用场景3.Hive视图操作命令4.Hive视图操作实例三.Hive侧视图用侧视图完成wordcount 一.Hive高阶建表如需要hive高阶建表资料的小伙伴们请点击下方链接链接: HIVE高阶. 二.Hive视图 1. 视图概述通过隐藏子查询、连接和函数来简化查询的逻辑结构虚拟表，从真实表中选取数据只保存定义，不存储数据如果删除或更改基础表，则查询视图将失败视图是只读的，不能插入或装载数据 2. 应用场

Hive（四）分桶&&视图

weixin_50034171的博客

12-10

429

Hive目录前言一、分桶1.1、创建分桶的流程二、分桶抽样三、数据块抽样四、视图4.1、创建视图4.2、Hive侧视图概念4.3、操作4.4、案例前言补充：不在一个数据库，想要查询另外一个数据库的表，通常加个数据库名前缀 select * from test.employee; 一、分桶分桶实际上和 MapReduce中的分区是一样的。分桶数和reducer数对应。插入数据时按照分桶列通过hashcode取余，把数据分到相应分桶里生成相应文件跟MR中的HashPartitioner的原理一模

Hive 侧视图创建

DaiSnow的博客

08-11

329

HDFS文件路径: /users/userfriends/user_friends.csv csv文件数据如下：创建外部表（ods）去除首行，字段间按照“，”分割。 create external table if not exists dwd_user_friends ( userid string, friends string ) row format delimited fields terminated by ',' //字段按 ',' 分割 location '/users/userfri

Hive基础(如何建表/分区表/分桶表/视图/侧视图)

Mr_Bright的博客

09-17

1425

Hive基本概念 1.1 Hive简介 1.1.1 什么是Hive Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。 1.1.2 为什么使用Hive 1.）直接使用hadoop所面临的问题人员学习成本太高项目周期要求太短 MapReduce实现复杂查询逻辑开发难度太大 2.）操作接口采用类SQL语法，提供快速开发的能力。避免了去写MapReduce，减少开发人员的学习成本。扩展功能很方便。 1.1.3 Hive的特点 1.）可.

hive-4（分区、分桶、视图）

getBinary的博客

03-30

538

hive-4分区分桶分区和分桶的区别视图侧视图 分区分区的目的：通过表分区能够在特定的区域检索数据，减少扫描成本，在一定程度上提高查询效率单值分区： # 创建分区表 create table tab_name(col type,...) partition (p_col_name type,...); # 添加分区 alter table tab_name add partition (p_col_name type,...); # 查看分区 show partitions tab_name; #

hive之视图

little_sloth的博客

07-19

959

hive之视图一、视图定义：通过隐藏子查询、连接和函数来简化查询的逻辑结构，是虚拟表，从真实表中选取数据；只保存定义，不存储数据，如果删除或更改基础表，则查询视图将失败，而且视图是只读的，不能插入或装载数据应用场景 1）将指定的数据提供给用户，保护数据隐私 2）简化查询语句复杂的场景二、视图表创建视图 CREATE VIEW view_name AS SELECT 。。。。; ps：创建视图支持 CTE, ORDER BY, LIMIT, JOIN 等 – 查找视图 SHO

Hive建表高阶语句、Hive视图

qianchun22的博客

09-17

3798

Hive建表高阶语句 - CTAS and WITH CTAS – as select方式建表 create table ctas_employee as select * from employee; 注：CTAS不能创建partition, external, bucket table CTE (CTAS with Common Table Expression) create table jobs_details as with tmp as (select jobs from emp

Hive学习——分桶抽样、侧视图与炸裂函数搭配、hive实现WordCount

雷神乐乐的博客

02-22

1847

Hive学习——分桶抽样、侧视图与炸裂函数搭配、hive实现WordCount

Hive建表高阶语句和视图

timicai的博客

09-17

1536

Hive建表高阶语句(CTAS and WITH) CTAS – as select方式建表（会复制表结构和表数据） create ctas_employee as select * from employee; 注：CTAS不能创建partition, external, bucket table CTE (CTAS with Common Table Expression) create table jobs_detail as with tmp as (select jobs from em

大数据基础之HIVE(二)——HIVE分区、分桶以及视图等，初学必看

Clozzz的博客

06-10

614

HIVE分区（partitions）分区主要用于提高性能分区列的值将表划分为很多segments（文件夹）查询时使用分区列和常规列类似查询时HIVE自动过滤不用与提高性能的分区分区主要分为静态分区和动态分区 HIVE分区操作静态分区： create table mypart( userid int, username string, gender string, score int ) partitioned by (year int,month int) //如何分割列（字段） r

hive 之 UDTF 之 explode 函数和 lateral view 侧视图（原理）

wowulita123的博客

04-25

1492

hive 之 UDTF 之 explode 函数和 lateral view 侧视图（原理）

Hive基础（数据类型，数据结构，数据库操作，数据表操作，内部表，外部表，临时表，装载数据，分区表，分桶表，视图，侧视图）（二）

May_J_Oldhu的博客

12-14

389

Hive基础（数据类型，数据结构，数据库操作，数据表操作，内部表，外部表，临时表，装载数据，分区表，分桶表，视图，侧视图）八.hive数据类型1.基本数据类型（类似于SQL数据类型）2.集合数据类型九.hive数据结构十.数据库增删改查1.创建数据库2.使用数据库3. 查看数据库信息4.修改数据库信息5.查看当前数据库6. 删除数据库7.删除带表的数据库(强制删除)8.过滤显示查询的数据库9.显示当前数据库十一.数据表（table）1.建表语法(1)字段解释说明（2）Storage SerDe（3）Hive