Skip to main content
 首页 » 数据库

Postgresql修改Greenplum表存储和分布策略

2022年07月19日155xxx_UU

修改Greenplum表存储和分布策略

修改表是DBA最频繁的操作之一。Greenplum利用多种存储机制实现大数据量存储和处理,包括数据分布、分区、堆表、AO表、压缩、外部表等。

本文介绍如何在创建表之后修改表存储和分布策略。修改表命令改变表的定义,使用ALTER TABLE改变表的属性,如列定义、分布策略,存储模式、分区结构。
如增加列的非空约束。示例:ALTER TABLE sachi ALTER COLUMN name SET NOT NULL;

1. 修改分布策略

ALTER TABLE 提供选项改变表的分布策略。当表分布选项改变时,表数据在磁盘上被重新分布属于资源密集操作。还可以使用现有的分发策略重新分发表数据。

对于分区表,改变分布策略会递归应用到所有子分区,该操作保留所有者和表所有其他属性。举例,下面命令重新分布sales表:

ALTER TABLE sales SET DISTRIBUTED BY (customer_id); 

当hash分布表的分布键修改时,表数据会自动重新分布。但修改分布策略为随机分布时不会引起重新分布,举例:

ALTER TABLE sales SET DISTRIBUTED RANDOMLY; 

为了重新分布表数据(针对随机分布策略或hash分布策略没有改变)使用REORGANIZE=TRUE。重新分布数据可解决数据倾斜问题,或有新的段资源加入系统。举例:下面命令重新分布表所有段的数据,使用当前分布策略,包括随机分布。

ALTER TABLE sales SET WITH (REORGANIZE=TRUE); 

2. 修改存储策略

表存储、压缩、存储方向(按行、列)仅能在创建时指定。为了改变存储模式,你必须先创建表使用正确的存储选项,然后从原表中加载数据至新表,接着删除原表并修改新表名称为原表名称。当然你必须要有相应权限。举例:

CREATE TABLE sales2 (LIKE sales) WITH (appendonly=true, compresstype=quicklz, compresslevel=5, orientation=column); 
INSERT INTO sales2 SELECT * FROM sales; 
DROP TABLE sales; 
ALTER TABLE sales2 RENAME TO sales; 
GRANT ALL PRIVILEGES ON sales TO admin; 
GRANT SELECT ON sales TO guest; 

ALTER TABLE 命令增加压缩列:

ALTER TABLE test_tab ADD COLUMN new_cmp_fld int DEFAULT 0 ENCODING (COMPRESSTYPE=zlib); 

3. 总结

本文介绍了Greenplum如何修改表的存储方式和分布策略,良好的存储和分布策略可以提升系统性能。


本文参考链接:https://blog.csdn.net/neweastsun/article/details/113697808
阅读延展