- Telegram Web

Data Engineering / Инженерия данных / Data Engineer / DWH

Перевод 1 Главы - Введение в хранилища данных

Начало перевода книги "Building a Scalable Data Warehouse with Data Vault 2.0"

https://datatalks.ru/data-vault-2-0-chapter-1-introduction-to-data-warehousing/

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Перевод 1 Главы — Введение в хранилища данных

Перевод 1 Главы - Введение в хранилища данных

1.3K views09:30

Data Engineering / Инженерия данных / Data Engineer / DWH

Перевод 2 Главы - Масштабируемая архитектура хранилища данных

Введение в архитектуру Data Vault 2.0 без детальных подробностей.

https://datatalks.ru/data-vault-2-0-chapter-2-scalable-data-warehouse-architecture/

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Перевод 2 Главы — Масштабируемая архитектура хранилища данных

Перевод 2 Главы - Масштабируемая архитектура хранилища данных Data Vault 2.0

1.3K views06:01

Data Engineering / Инженерия данных / Data Engineer / DWH

Как быстро запустить процесс ведения каталога данных в компании. Пример DataHub - доклад Журавлевой Натальи на SmartData 2024

https://youtu.be/nCt4gYVQdqc?si=YUpGIqHB5SqCddrH

YouTube

Наталья Журавлева — Как быстро запустить процесс ведения каталога данных в компании. Пример DataHub

Подробнее о конференции SmartData: https://jrg.su/aTWU2K
— —
Скачать презентацию с сайта SmartData — https://jrg.su/YPFuf5

Проблема: данных становится слишком много. Вы знаете, что вам нужен каталог данных, но не знаете, с чего начать и как реализовать инструмент…

2.1K views10:01

Data Engineering / Инженерия данных / Data Engineer / DWH

Пример создания DWH по Kimball с применением dbt

Build a Data Warehouse with dbt using Kimball’s dimensional modeling | by Haq Nawaz | Dev Genius
https://blog.devgenius.io/build-a-data-warehouse-with-dbt-using-kimballs-dimensional-modeling-59ea9bfae59f

GitHub: dbt build a datawarehouse using dimensional modeling
https://github.com/hnawaz007/dbt-dw

Medium

Build a Data Warehouse with dbt using Kimball’s dimensional modeling

using dbt, SQL, SQL Server, Postgres

1.4K views06:05

Data Engineering / Инженерия данных / Data Engineer / DWH

SmartData 2024: От хайпа до продакшена: data mesh на Airflow + dbt

https://youtu.be/OT-Sx-bd-6k?si=MG0kbWWjZIXwR2nm

YouTube

Никита Юрасов, Леонид Кожинов — От хайпа до продакшена: data mesh на Airflow + dbt

Подробнее о конференции SmartData: https://jrg.su/aTWU2K
— —
Скачать презентацию с сайта SmartData — https://jrg.su/MnC8LZ

Обещанного три года ждут, а toloka.ai опережает поставленные сроки: год назад спикеры рассказывали про подход к интеграции dbt и Airflow…

1.3K views06:04

Data Engineering / Инженерия данных / Data Engineer / DWH

System Design. База. Разбор книги "Высоконагруженные приложения". Глава 2

▫️Relational vs Document models
▫️One-to-Many, Many-to-One, Many-to-Many
▫️Schema On-Write vs Schema On-Read
▫️Диффузия моделей данных
▫️Imperative vs Declarative models
▫️MapReduce
▫️Graph Model, Свойства, Triple-Store
▫️System Design Interview: Data Models

https://youtu.be/H88-S0bHvJQ?si=5Nycizku0FeSVhxQ

YouTube

System Design. База. Разбор книги "Высоконагруженные приложения". Глава 2

Продолжаем путешествие в мире System Design!
На очереди темы SQL vs NoSQL, Graph Model, MapReduce!

Представляю вашему вниманию серию вебинаров от Михаила Масягина.
Который разбирает главу за главой популярнейшей книги Мартина Клеппмана(Martin Kleppmann "Designing…

1.5K views06:34

Data Engineering / Инженерия данных / Data Engineer / DWH

Перевод 3 Главы - Методология Data Vault 2.0

Подробное описание методологии Data Vault 2.0, больше с точки зрения управления проектами.

https://datatalks.ru/chapter-3-data-vault-2-0-methodology/

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Перевод 3 Главы — Методология Data Vault 2.0

Перевод 3 Главы - Методология Data Vault 2.0

1.4K views06:01

Data Engineering / Инженерия данных / Data Engineer / DWH

Smart Data 2024: Использование вероятностных структур данных для оптимизации ETL-процессов

https://youtu.be/qZ8ud40wDPU?si=RDtVMEc8vq3FGeyT

YouTube

Дмитрий Вертлиб — Использование вероятностных структур данных для оптимизации ETL-процессов

Подробнее о конференции SmartData: https://jrg.su/aTWU2K
— —
Скачать презентацию с сайта SmartData — https://jrg.su/IiiVf8

При обработке больших данных с использованием фреймворка Apache Spark часто возникает большое количество промежуточной информации,…

1.4K views06:03

Data Engineering / Инженерия данных / Data Engineer / DWH

3 и 4 главы книги "Высоконагруженные приложения"

B-tree, OLAP OLTP, Hash Index. Kleppman 3 chapter

JSON, ProtoBuf, Data formats. Kleppman 4 chapter

YouTube

B-tree, OLAP OLTP, Hash Index. Kleppman 3 chapter

Продолжаем путешествие в мире System Design!
На очереди темы B-tree, OLAP vs OLTP, Hash и другие основные понятия из 3 главы!

Представляю вашему вниманию серию вебинаров от Михаила Масягина:
Который разбирает главу за главой популярнейшей книги Мартина …

1.4K views12:02

Data Engineering / Инженерия данных / Data Engineer / DWH

SoftwareMill Kafka Visualization
Визуально можно увидеть, как работает кафка.

https://softwaremill.com/kafka-visualisation/

И дополнительно статья, описывающая инструмент
https://habr.com/ru/articles/865120/

#kafka

Softwaremill

SoftwareMill Kafka Visualization

Using the Kafka Visualization tool you can simulate how data flows through a replicated Kafka topic, to gain a better understanding of the message processing model.

1.6K viewsedited 13:00

Data Engineering / Инженерия данных / Data Engineer / DWH

Обработка событий в Snowplow: от сбора до аналитики

https://youtu.be/539ypLtSIbY?si=acSMEx0uhnCyy8RY

YouTube

Мария Бученкова, Владимир Седельников — Обработка событий в Snowplow: от сбора до аналитики

Подробнее о конференции SmartData: https://jrg.su/aTWU2K
— —
Скачать презентацию с сайта SmartData — https://jrg.su/rI2rVi

Невозможность использовать ставшие привычными сервисы обработки данных, в нашем случае Google Analytics, послужила отправной точкой…

1.2K views06:00

Data Engineering / Инженерия данных / Data Engineer / DWH

Обзор 5 главы "Replication in System Design"

Из книги "Высоконагруженные приложения"

https://youtu.be/KWIUkbcDhHc?si=Bahv3m8zf8z4qLMm

YouTube

Replication in System Design

Replication, Master-Slave, Master-Master, Conflicts.

Linkedin Михаила:
https://kz.linkedin.com/in/masyagin1998

Временные метки:
00:00 - Intro
01:44 - Виды репликации
04:48 - Репликация с одним ведущим узлом
05:41 - Синхронная и асинхронная репликация, Отказы…

1.2K viewsedited 13:28

Data Engineering / Инженерия данных / Data Engineer / DWH

Перевод 4 Главы - Моделирование Data Vault 2.0

В этой главе рассматриваются сущности, используемые в моделировании Data Vault, включая хабы (Hubs), линки/связи (Links) и сателлиты (Satellites). Показано, как идентифицировать бизнес-ключи в исходных данных и связывать их с другими бизнес-ключами в Data Vault с помощью линк-сущностей. Также рассмотрено, как выделять дополнительные атрибуты из исходных данных и моделировать их в виде сателлитных сущностей.

https://datatalks.ru/chapter-4-data-vault-2-0-modeling/

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Перевод 4 Главы — Моделирование Data Vault 2.0 — Что такое Hub / Link / Satellite?

Перевод 4 Главы - Моделирование Data Vault 2.0 - Что такое Hub / Link / Satellite? Data Vault модель данных data warehouse DDS. Примеры. Книга

1.5K views06:00

Data Engineering / Инженерия данных / Data Engineer / DWH

SmartData 2024 "dbt в деле: реальные кейсы и лайфхаки (Антон Александров)"

https://youtu.be/RV5ZSMcwm9w?si=BDSx3q8h0gb_ZQTX

Презентация

YouTube

Антон Александров — dbt в деле: реальные кейсы и лайфхаки

Подробнее о конференции SmartData: https://jrg.su/aTWU2K
— —
Скачать презентацию с сайта SmartData — https://jrg.su/8i0yvb

В 2022 году компания «Детский мир» столкнулась с резким увеличением объема витрин данных, что привело к многочисленным техническим…

1.3K viewsedited 08:01

Data Engineering / Инженерия данных / Data Engineer / DWH

Понравилось)

1.6K views08:53

Data Engineering / Инженерия данных / Data Engineer / DWH

Тренировки по алгоритмам от Яндекса
https://yandex.ru/yaintern/training/algorithm-training

После регистрации приходит письмо с подготовительными лекциями на YT https://youtube.com/playlist?list=PL6Wui14DvQPz_vzmNVOYBRqML6l51lP0G&si=FdTT_WhXPNZnOx46

Тренировки по алгоритмам от Яндекса

Новый сезон — новые задачи и форматы

2.5K views07:23

Data Engineering / Инженерия данных / Data Engineer / DWH

3 ресурса для освоения GIT с интерактивными заданиями

https://learngitbranching.js.org/?locale=ru_RU - Learn Git Branching
Интерактивный тренажер, позволяющий визуализировать и отрабатывать команды Git в режиме реального времени. Подходит как для новичков, так и для опытных пользователей.

https://git-school.github.io/visualizing-git/ - Visualizing Git
Веб-приложение, которое наглядно демонстрирует, как различные команды Git влияют на структуру коммитов, помогая лучше понять внутренние процессы системы контроля версий.

https://ohmygit.org/ - Открытая игра, обучающая Git с помощью визуализации внутренних структур репозиториев в реальном времени. Имеет интерфейс в виде игровых карт для запоминания команд и интегрированный терминал для выполнения произвольных команд Git.

learngitbranching.js.org

Learn Git Branching

An interactive Git visualization tool to educate and challenge!

3.3K viewsedited 12:11

Data Engineering / Инженерия данных / Data Engineer / DWH

SmartData 2024: Инструменты Data Quality (Дмитрий Руднев, Т-Банк)

https://youtu.be/cWHW4RgBibw?si=oUgwRVVuN6J6lOy1

YouTube

Дмитрий Руднев — Инструменты Data Quality: как, зачем, почему. Опыт Т-Банка

Подробнее о конференции SmartData: https://jrg.su/aTWU2K
— —
Скачать презентацию с сайта SmartData — https://jrg.su/BkRmwc

Качество данных — это фундамент успешной работы с данными. Важную роль в этом процессе играют не только люди и процессы, но и инструменты…

1.4K views13:38

Data Engineering / Инженерия данных / Data Engineer / DWH

Введение в Apache Iceberg. Основы, архитектура, как работает?

Накидал базовую статейку по айсбергу. Часть материала - конспект из книги "Apache Iceberg Полное руководство" - всем, кто планирует работать с этой технологией, советую прочитать.

https://ivan-shamaev.ru/apache-iceberg-tutorial-architecture-how-to-work/

#iceberg #trino #parquet #lakehouse

Персональный блог Data Engineer | Ex-TeamLead BI Developer

Введение в Apache Iceberg. Основы, архитектура, как работает?

Введение в Apache Iceberg. Основы. Архитектура. Как работает и внутреннее устройство. Полное руководство, обучение, курс для Data Engineer

1.2K views07:04

Data Engineering / Инженерия данных / Data Engineer / DWH

Smart Data 2024: Максим Гудзикевич, Кирилл Осинцев (Yandex) — "Как навести порядок в двух эксабайтах данных?"

Интро: "В компании с быстрорастущим объемом данных ориентироваться в них становится сложнее с каждым днем. В этой ситуации помогают каталоги данных, однако информация в них, как правило, заполняется пользователями собственноручно или берется из ERM-связей небольших БД. Мы же во внутреннем DataCatalog научились автоматически на основе логов ETL-операций и ad hoc-расчетов собирать Data Lineage системы YTsaurus."

https://youtu.be/dhDU-xA_qVQ?si=3RheeeRL-Xx6Yh4w

YouTube

Максим Гудзикевич, Кирилл Осинцев — Как навести порядок в двух эксабайтах данных?

Подробнее о конференции SmartData: https://jrg.su/aTWU2K
— —
Скачать презентацию с сайта SmartData — https://jrg.su/OMxXcv

В компании с быстрорастущим объемом данных ориентироваться в них становится сложнее с каждым днем. В этой ситуации помогают каталоги…

724 views06:01

2025/06/12 11:57:55
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>