用Partition函数怎么实现Hive动态分区

这篇文章主要讲解了“用Partition函数怎么实现Hive动态分区”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“用Partition函数怎么实现Hive动态分区”吧!

为修武等地区用户提供了全套网页设计制作服务,及修武网站建设行业解决方案。主营业务为成都网站制作、做网站、修武网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!

一、前段时间因为导表需求(从一张表中查找出数据,按日期分区overwrite 到指定分区表中),在Hive里面研究了一下自动分区。

步骤:

         1、建好所需分区表

         2、设置分区参数

set hive.exec.dynamic.partition=true;(可通过这个语句查看:set hive.exec.dynamic.partition;) 
set hive.exec.dynamic.partition.mode=nonstrict; 
SET hive.exec.max.dynamic.partitions=100000;(如果自动分区数大于这个参数,将会报错)
SET hive.exec.max.dynamic.partitions.pernode=100000;

         3、书写代码(特别注意:日期字段一定要放在末尾),例如:

INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt)
select id        
       ,...
       ,pv
       ,0  uv
       ,cal_dt
from   dw_stage.tiny_info_msg

二、如果要在partition字段用函数处理也可通过通过这种方式实现;例如:

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nostrick;
INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt)
SELECT id    
       ,...
       ,pv
       ,date_sub('2014-03-23',7) cal_dt
FROM   dw_stage.tiny_info_msg07;

感谢各位的阅读,以上就是“用Partition函数怎么实现Hive动态分区”的内容了,经过本文的学习后,相信大家对用Partition函数怎么实现Hive动态分区这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!


文章标题:用Partition函数怎么实现Hive动态分区
文章网址:http://pwwzsj.com/article/jegodg.html