Hive的分区

发布时间 2023-09-16 13:32:24作者: cag2050
  1. 在下面的代码中,我们创建了名为emp的分区表,使用关键字partitioned by:
create table emp(
      name string, 
      age int
) partitioned by (provice string,city string);

在这里,用partitioned by指定创建的分区,多个分区意味着多级目录。在Hive中,可以使用多个列对表进行分区。注意,这里的provice字段和city字段并不在表结构中定义,它们属于表的隐式字段,用来创建对应的物理文件夹。
2. 不能在表中,再插入跟分区字段相同名字的列。

参考:http://xueai8.com/course/182/article