В мире больших данных@big_data_systems

В мире больших данных

Как запросом убрать дублирующиеся данные?

Можно использовать ключевое слово DISTINCT, которое отфильтрует дублирующиеся значения из набора результатов, то есть вернёт только уникальные строки.

Пример выборки только уникальных id из таблицы:

SELECT DISTINCT id 
  FROM table_name;

Другой вариант — это использование GROUP BY, чтобы сгруппировать дублирующиеся значения.

SELECT id 
  FROM table_name
 GROUP BY id;

Что использовать и есть ли разница?

Если посмотреть план запросов выше, то можно увидеть, что в обоих случаях под капотом происходит группировка данных и скорость выполнения запросов одинаковая. Однако, для лучшей читаемости кода, DISTINCT стоит использовать там, где вы хотите убрать дублирование строк в результатах, а GROUP BY — для группировки в явном виде и дальнейшего использования агрегатных функций.

#sql

www.tgoop.com/big_data_systems_analysis/38

85 viewsOct 2, 2023 at 14:08

tgoop.com/big_data_systems_analysis/38

Create: 2023-10-02
Last Update: 2025-07-12 22:42:59

SELECT DISTINCT id 
  FROM table_name;

Другой вариант — это использование GROUP BY, чтобы сгруппировать дублирующиеся значения.

SELECT id 
  FROM table_name
 GROUP BY id;

BY В мире больших данных

Share with your friend now:
tgoop.com/big_data_systems_analysis/38

Telegram News

Как запросом убрать дублирующиеся данные?