tgoop.com/big_data_systems_analysis/38
Create:
Last Update:
Last Update:
Как запросом убрать дублирующиеся данные?
Можно использовать ключевое слово DISTINCT, которое отфильтрует дублирующиеся значения из набора результатов, то есть вернёт только уникальные строки.
Пример выборки только уникальных id из таблицы:
SELECT DISTINCT id
FROM table_name;
Другой вариант — это использование GROUP BY, чтобы сгруппировать дублирующиеся значения.
SELECT id
FROM table_name
GROUP BY id;
Что использовать и есть ли разница?
Если посмотреть план запросов выше, то можно увидеть, что в обоих случаях под капотом происходит группировка данных и скорость выполнения запросов одинаковая. Однако, для лучшей читаемости кода, DISTINCT стоит использовать там, где вы хотите убрать дублирование строк в результатах, а GROUP BY — для группировки в явном виде и дальнейшего использования агрегатных функций.
#sql
BY В мире больших данных
Share with your friend now:
tgoop.com/big_data_systems_analysis/38