tgoop.com/big_data_systems_analysis/47
Create:
Last Update:
Last Update:
Партиционирование (partitioning) в Greenplum
Партиционирование (или секционирование) помогает повысить производительность запросов за счет разбиения больших таблиц на небольшие части, называемые партициями (partitions). Это позволяет оптимизаторам запросов сканировать ограниченное число строк в таблице (на основе условий) вместо чтения всего содержимого таблицы.
Партицировать маленькие таблицы не имеет смысла!
Партиционирование может быть указано только при создании таблицы, однако удалять/добавлять/изменять партиции в дальнейшем можно. Чтобы сделать добавить партиционирование в таблицу, нужно сделать новую таблицу с партициями и перенести данные из непартиционированной.
Пример создания партиционированной таблицы:
create table [schema_name].<table_name>Важно! Загрузка данных в партиционированные таблицы крайне неэффективна. Поэтому рекомендуется загружать данные в промежуточную (staging) таблицу и затем применять к партиционированной таблице команду EXCHANGE PARTITION.
(<columns_list>)
[with (<storage_options>)]
distributed <distribution_policy>
partition by <partition_spec>;
#greenplum
BY В мире больших данных
Share with your friend now:
tgoop.com/big_data_systems_analysis/47