tgoop.com/big_data_systems_analysis/41
Last Update:
Сжатие данных в Greenplum
Опции хранения данных определяются на этапе создания таблиц.
Уровень сжатия данных:
— на уровне таблицы (table-level) — применяется ко всей таблице. Доступно для AOT-таблиц как со строковой (row-oriented), так и с колоночной (column-oriented) ориентацией данных.
— на уровне столбца (column-level) — применяется к отдельному столбцу. Позволяет использовать различные алгоритмы сжатия для разных столбцов одной таблицы. Этот тип сжатия доступен только для AOT-таблиц с колоночной ориентацией данных.
Независимо от уровня, на котором применяется сжатие данных, для его настройки можно использовать следующие параметры:
— compresstype – тип сжатия данных. Возможные значения: ZLIB, ZSTD и RLE_TYPE. По умолчанию используется значение none, при котором сжатие не применяется.
— compresslevel – уровень сжатия данных. Уровни с наименьшими номерами соответствуют самой быстрой, но при этом наименьшей компрессии данных.
Для наиболее эффективного сжатия данных рекомендуется использовать алгоритм ZSTD, он обеспечивает как скорость, так и хорошую степень сжатия.
Пример создания AOT-таблицы с колоночной ориентацией и zstd-хранением:
create table [schema_name].<table_name>
(<columns_list>)
with (appendoptimized = true,
orientation = column,
compresstype = zstd,
compresslevel = 3
);
#greenplum
BY В мире больших данных
Share with your friend now:
tgoop.com/big_data_systems_analysis/41