修改Greenplum表存储和分布策略
修改表是DBA最频繁的操作之一。Greenplum利用多种存储机制实现大数据量存储和处理,包括数据分布、分区、堆表、AO表、压缩、外部表等。
本文介绍如何在创建表之后修改表存储和分布策略。修改表命令改变表的定义,使用ALTER TABLE
改变表的属性,如列定义、分布策略,存储模式、分区结构。
如增加列的非空约束。示例:ALTER TABLE sachi ALTER COLUMN name SET NOT NULL;
1. 修改分布策略
ALTER TABLE
提供选项改变表的分布策略。当表分布选项改变时,表数据在磁盘上被重新分布属于资源密集操作。还可以使用现有的分发策略重新分发表数据。
对于分区表,改变分布策略会递归应用到所有子分区,该操作保留所有者和表所有其他属性。举例,下面命令重新分布sales表:
ALTER TABLE sales SET DISTRIBUTED BY (customer_id);
当hash分布表的分布键修改时,表数据会自动重新分布。但修改分布策略为随机分布时不会引起重新分布,举例:
ALTER TABLE sales SET DISTRIBUTED RANDOMLY;
为了重新分布表数据(针对随机分布策略或hash分布策略没有改变)使用REORGANIZE=TRUE
。重新分布数据可解决数据倾斜问题,或有新的段资源加入系统。举例:下面命令重新分布表所有段的数据,使用当前分布策略,包括随机分布。
ALTER TABLE sales SET WITH (REORGANIZE=TRUE);
2. 修改存储策略
表存储、压缩、存储方向(按行、列)仅能在创建时指定。为了改变存储模式,你必须先创建表使用正确的存储选项,然后从原表中加载数据至新表,接着删除原表并修改新表名称为原表名称。当然你必须要有相应权限。举例:
CREATE TABLE sales2 (LIKE sales) WITH (appendonly=true, compresstype=quicklz, compresslevel=5, orientation=column);
INSERT INTO sales2 SELECT * FROM sales;
DROP TABLE sales;
ALTER TABLE sales2 RENAME TO sales;
GRANT ALL PRIVILEGES ON sales TO admin;
GRANT SELECT ON sales TO guest;
ALTER TABLE
命令增加压缩列:
ALTER TABLE test_tab ADD COLUMN new_cmp_fld int DEFAULT 0 ENCODING (COMPRESSTYPE=zlib);
3. 总结
本文介绍了Greenplum如何修改表的存储方式和分布策略,良好的存储和分布策略可以提升系统性能。
本文参考链接:https://blog.csdn.net/neweastsun/article/details/113697808