Please open Telegram to view this post
VIEW IN TELEGRAM
Secret To Optimizing SQL Queries - Understand The SQL Execution Order
https://www.youtube.com/watch?v=BHwzDmr6d7s
https://www.youtube.com/watch?v=BHwzDmr6d7s
YouTube
Secret To Optimizing SQL Queries - Understand The SQL Execution Order
Get a Free System Design PDF with 158 pages by subscribing to our weekly newsletter: https://bytebytego.ck.page/subscribe
Animation tools: Adobe Illustrator and After Effects.
Checkout our bestselling System Design Interview books:
Volume 1: https://amzn.to/3Ou7gkd…
Animation tools: Adobe Illustrator and After Effects.
Checkout our bestselling System Design Interview books:
Volume 1: https://amzn.to/3Ou7gkd…
GitHub - yandex/ch-tools: ClickHouse administration and diagnostics tools
https://github.com/yandex/ch-tools
https://github.com/yandex/ch-tools
GitHub
GitHub - yandex/ch-tools: ClickHouse administration and diagnostics tools
ClickHouse administration and diagnostics tools. Contribute to yandex/ch-tools development by creating an account on GitHub.
Гибкие методологии проектирования Data Vault и Anchor Modeling | Евгений Ермаков
Еще есть вебинарчик на karpov.courses
Смена методологии — это всегда долгий и крайне сложный процесс. Особенно когда речь идёт о чём-то фундаментальном — например, о хранилищах данных. При проектировании детального слоя аналитического DWH [Data Warehouse] сейчас модно применять «гибкие методологии» — Data Vault и Anchor Modeling. Но всегда ли в них есть потребность или это просто мода, которая пройдёт со временем?
https://www.youtube.com/watch?v=fNGIOb8SJvU
Еще есть вебинарчик на karpov.courses
Смена методологии — это всегда долгий и крайне сложный процесс. Особенно когда речь идёт о чём-то фундаментальном — например, о хранилищах данных. При проектировании детального слоя аналитического DWH [Data Warehouse] сейчас модно применять «гибкие методологии» — Data Vault и Anchor Modeling. Но всегда ли в них есть потребность или это просто мода, которая пройдёт со временем?
https://www.youtube.com/watch?v=fNGIOb8SJvU
YouTube
Гибкие методологии проектирования Data Vault и Anchor Modeling | Евгений Ермаков | karpov.courses
Курс «Инженер данных»: https://bit.ly/3yHNs4N
Смена методологии — это всегда долгий и крайне сложный процесс. Особенно когда речь идёт о чём-то фундаментальном — например, о хранилищах данных. При проектировании детального слоя аналитического DWH [Data Warehouse]…
Смена методологии — это всегда долгий и крайне сложный процесс. Особенно когда речь идёт о чём-то фундаментальном — например, о хранилищах данных. При проектировании детального слоя аналитического DWH [Data Warehouse]…
Data Cleaning - DEV Community
Список задач по очистке данных
https://dev.to/nozibul_islam_113b1d5334f/data-cleaning-1c68
Список задач по очистке данных
https://dev.to/nozibul_islam_113b1d5334f/data-cleaning-1c68
DEV Community
Data Cleaning
What is Data Cleaning? Data cleaning is a process where errors, inconsistencies, and...
Введение в dbt: основы моделирования данных
Тайм-коды:
00:00 Начинаем
02:04 Рассказываем об ИнженеркаТех
03:54 В чем практическая ценность dbt?
05:51 Начало Data Lake
08:35 Большие SQL скрипты
10:12 Glue Spark ETL
13:00 Решение через Data Builder
17:40 Как продать команде свое решение?
19:18 Преимущества data build tool
28:33 Анатомия проекта на дбт
30:00 Создаем проект
01:10:15 Моделирование данных с dbt
01:21:41 Проблемы с аналитикой в БД
01:27:50 Оркестрация data build tool
01:30:00 Преимущества на dbt
01:31:10 Подводные камни ди би ти
https://www.youtube.com/watch?v=BSge0lPJeHk
#dbt
Тайм-коды:
00:00 Начинаем
02:04 Рассказываем об ИнженеркаТех
03:54 В чем практическая ценность dbt?
05:51 Начало Data Lake
08:35 Большие SQL скрипты
10:12 Glue Spark ETL
13:00 Решение через Data Builder
17:40 Как продать команде свое решение?
19:18 Преимущества data build tool
28:33 Анатомия проекта на дбт
30:00 Создаем проект
01:10:15 Моделирование данных с dbt
01:21:41 Проблемы с аналитикой в БД
01:27:50 Оркестрация data build tool
01:30:00 Преимущества на dbt
01:31:10 Подводные камни ди би ти
https://www.youtube.com/watch?v=BSge0lPJeHk
#dbt
YouTube
Введение в dbt: основы моделирования данных | INZHENERKA.TECH
#dbt #dataanalytics #dataengineering #dataengineer
🚀 Получить демо-доступ к курсу – https://clck.ru/3Bj87X
тг - канал с новостями от ИнженеркаТех – https://www.tgoop.com/InzhenerkaTech
Тайм-коды:
00:00 Начинаем
02:04 Рассказываем об ИнженеркаТех
03:54 В чем практическая…
🚀 Получить демо-доступ к курсу – https://clck.ru/3Bj87X
тг - канал с новостями от ИнженеркаТех – https://www.tgoop.com/InzhenerkaTech
Тайм-коды:
00:00 Начинаем
02:04 Рассказываем об ИнженеркаТех
03:54 В чем практическая…
DBT Tutorial 12 videos YouTube Playlist
https://youtube.com/playlist?list=PLc2EZr8W2QIBegSYp4dEIMrfLj_cCJgYA&si=RXZY3jcHCOQ9A4Sz
#dbt
https://youtube.com/playlist?list=PLc2EZr8W2QIBegSYp4dEIMrfLj_cCJgYA&si=RXZY3jcHCOQ9A4Sz
#dbt
YouTube
dbt Tutorial (Data Build Tool) Hands-on Course - Beginners and Advanced | in 1 hour
DBT for Beginners: A Complete Guide Dbt tutorial playlist youtube best dbt tutorial Dbt tutorial for beginners Dbt tutorial youtube DBT Fundamentals dbt Cras...
This media is not supported in your browser
VIEW IN TELEGRAM
Apache Kafka
Изначально созданная для обработки логов, Kafka теперь является основой для множества приложений. Её устойчивое хранилище сообщений и гибкий доступ к данным позволяют потребителям извлекать записи в удобное для них время.
Вот несколько популярных сценариев использования Kafka:
▫️Обработка и анализ логов: Эффективно справляется с огромными объёмами данных логов для их анализа и генерации инсайтов.
▫️Стриминг данных для рекомендаций: Обеспечивает потоковую обработку данных в реальном времени для предоставления персонализированных рекомендаций.
▫️Мониторинг и оповещения систем: Ускоряет мониторинг метрик и отправку уведомлений для своевременного реагирования на события в системе.
▫️Change Data Capture (CDC): Фиксирует и обрабатывает изменения в базах данных, чтобы поддерживать синхронизацию данных между системами.
▫️Миграция систем: Поддерживает бесшовную миграцию данных, обеспечивая их консистентность и доступность.
YouTube: Top Kafka use cases you should know
YouTube: Что такое кафка
#kafka
Изначально созданная для обработки логов, Kafka теперь является основой для множества приложений. Её устойчивое хранилище сообщений и гибкий доступ к данным позволяют потребителям извлекать записи в удобное для них время.
Вот несколько популярных сценариев использования Kafka:
▫️Обработка и анализ логов: Эффективно справляется с огромными объёмами данных логов для их анализа и генерации инсайтов.
▫️Стриминг данных для рекомендаций: Обеспечивает потоковую обработку данных в реальном времени для предоставления персонализированных рекомендаций.
▫️Мониторинг и оповещения систем: Ускоряет мониторинг метрик и отправку уведомлений для своевременного реагирования на события в системе.
▫️Change Data Capture (CDC): Фиксирует и обрабатывает изменения в базах данных, чтобы поддерживать синхронизацию данных между системами.
▫️Миграция систем: Поддерживает бесшовную миграцию данных, обеспечивая их консистентность и доступность.
YouTube: Top Kafka use cases you should know
YouTube: Что такое кафка
#kafka
This media is not supported in your browser
VIEW IN TELEGRAM
💡 7 стратегий для масштабирования базы данных
1️⃣ Индексация
Анализируйте запросы вашего приложения и создавайте подходящие индексы для ускорения работы.
2️⃣ Материализованные представления
Предварительно вычисляйте сложные запросы и сохраняйте результаты для быстрого доступа.
3️⃣ Денормализация
Сократите сложные соединения таблиц, чтобы повысить производительность запросов.
4️⃣ Вертикальное масштабирование
Увеличьте мощность сервера базы данных, добавив больше CPU, оперативной памяти или хранилища.
5️⃣ Кэширование
Сохраняйте часто используемые данные в более быстром слое хранения, чтобы снизить нагрузку на базу данных.
6️⃣ Репликация
Создавайте копии основной базы данных на других серверах для распределения нагрузки на чтение.
7️⃣ Шардинг
Разделяйте таблицы на небольшие части и распределяйте их по разным серверам. Это поможет масштабировать как чтение, так и запись.
YouTube: 7 must-know strategies to scale your database
#scaling #масштабирование_базы_данных
1️⃣ Индексация
Анализируйте запросы вашего приложения и создавайте подходящие индексы для ускорения работы.
2️⃣ Материализованные представления
Предварительно вычисляйте сложные запросы и сохраняйте результаты для быстрого доступа.
3️⃣ Денормализация
Сократите сложные соединения таблиц, чтобы повысить производительность запросов.
4️⃣ Вертикальное масштабирование
Увеличьте мощность сервера базы данных, добавив больше CPU, оперативной памяти или хранилища.
5️⃣ Кэширование
Сохраняйте часто используемые данные в более быстром слое хранения, чтобы снизить нагрузку на базу данных.
6️⃣ Репликация
Создавайте копии основной базы данных на других серверах для распределения нагрузки на чтение.
7️⃣ Шардинг
Разделяйте таблицы на небольшие части и распределяйте их по разным серверам. Это поможет масштабировать как чтение, так и запись.
YouTube: 7 must-know strategies to scale your database
#scaling #масштабирование_базы_данных
SQL & Hibernate (лекции JavaRush)
Неплохой набор лекций по работе с базами данных.
Что относится к Java разработке можно пролистать.
https://javarush.com/quests/QUEST_SQL_HIBERNATE_PUBLIC
Неплохой набор лекций по работе с базами данных.
Что относится к Java разработке можно пролистать.
https://javarush.com/quests/QUEST_SQL_HIBERNATE_PUBLIC
JavaRush
SQL & Hibernate
Квест посвящен продвинутому изучению БД в разрезе задач разработчика. Вы узнаете о том, зачем нужны БД и какими они бывают, о проектировании БД, типах данных, ORM Hibernate (архитектура Hibernate, конфигурация, основные аннотации, получение, обновление и…
Data Engineering Zoomcamp 2025 Cohort
_ _ _ Б Е С П Л А Т Н О _ _ _
Start: 13 January 2025
Registration link: https://airtable.com/shr6oVXeQvSI5HuWD
Materials specific to the cohort: cohorts/2025/
https://github.com/DataTalksClub/data-engineering-zoomcamp
_ _ _ Б Е С П Л А Т Н О _ _ _
Start: 13 January 2025
Registration link: https://airtable.com/shr6oVXeQvSI5HuWD
Materials specific to the cohort: cohorts/2025/
https://github.com/DataTalksClub/data-engineering-zoomcamp
GitHub
GitHub - DataTalksClub/data-engineering-zoomcamp: Data Engineering Zoomcamp is a free nine-week course that covers the fundamentals…
Data Engineering Zoomcamp is a free nine-week course that covers the fundamentals of data engineering. - DataTalksClub/data-engineering-zoomcamp
PySpark Playground & Tutorial
https://www.sparkplayground.com/tutorials - здесь можно изучить работу со спарком (на английском)
https://www.sparkplayground.com/playground - здесь можно потренироваться онлайн
#spark #pyspark
https://www.sparkplayground.com/tutorials - здесь можно изучить работу со спарком (на английском)
https://www.sparkplayground.com/playground - здесь можно потренироваться онлайн
#spark #pyspark
Spark Playground
Platform to learn, practice, and solve PySpark interview questions to land your next DE role.
В видео по Spark есть ссылка на роадмап по DE с кучей полезных инструкций по инструментам.
GitHub - halltape/HalltapeRoadmapDE: Roadmap для Data Engineer.
https://github.com/halltape/HalltapeRoadmapDE
GitHub - halltape/HalltapeRoadmapDE: Roadmap для Data Engineer.
https://github.com/halltape/HalltapeRoadmapDE