BIG_DATA_SYSTEMS_ANALYSIS Telegram 106
Методология Инмона — классика в области хранилищ данных

Билл Инмон впервые предложил идею корпоративного хранилища в 1990 году. Представьте себе "большой архив", где все данные компании аккуратно упорядочены. Хранилище по Инмону является централизованным репозиторием, объединяющим в себе информацию из разных источников.

Проектирование начинается сверху вниз: сначала анализируется весь бизнес, определяются ключевые бизнес-области, затем сущности. На основе этого строится логическая модель с атрибутами каждого объекта. Затем разрабатывается физическая модель с нормализованной структурой (при этом лог.модель можно не завершать полностью, а начинать построение отдельными сущностями). Однако, из-за множества таблиц и ссылок, такую схему может быть сложно использовать для запросов (да-да, очень много JOIN) 🙃

Основные принципы методологии Инмона
Все данные должны быть согласованы и нормализованы (минимум 3NF), чтобы избежать избыточности и обеспечить высокий уровень целостности. По сути, это ваша "единая версия истины".

Каждая запись обязательно должна быть снабжена временной меткой. Это позволяет анализировать историю изменений данных.

Методология также подчеркивает необходимость поддержки разных уровней детализации данных для различных аналитических задач. По простому — строить различные витрины под разные бизнес-цели на основе централизованных данных.

Кроме того, методология Инмона требует, чтобы система была гибкой к изменениям. Технологии и требования бизнеса могут меняться, и система должна быть способна адаптироваться к этим изменениям без полной перестройки. Представьте, что вы делаете косметический ремонт квартиры — меняя отделку, но не затрагивая несущие стены.

Применение методологии Инмона позволяет получить полное представление о данных бизнеса, что способствует обоснованному принятию решений.

Преимущества и недостатки:
+ Создание единого хранилища для всех корпоративных данных.
+ Логическая модель отражает бизнес-процессы в компании.
+ Построение хранилища не сразу, а по частям.
+ Высокая целостность и надежность данных
+ Неизменность исторических данных.
+ Полное понимание данных для эффективного анализа и принятия решений.

- Высокие затраты на реализацию.
- Сложность внедрения и управления.
- Время на реализацию.
- Большое количество соединений в запросах.

Важно отметить, что методология Инмона особенно подходит для крупных организаций, где требуется строгая целостность данных и сложный анализ. И она же может оказаться не лучшим выбором для стартапов или компаний, ищущих быстрые и гибкие решения из-за высоких затрат и сложности реализации.

Ну а в следующий раз поговорим о главном "противнике" Инмона — Ральфе Кимбалле.

#dwh
Please open Telegram to view this post
VIEW IN TELEGRAM
1



tgoop.com/big_data_systems_analysis/106
Create:
Last Update:

Методология Инмона — классика в области хранилищ данных

Билл Инмон впервые предложил идею корпоративного хранилища в 1990 году. Представьте себе "большой архив", где все данные компании аккуратно упорядочены. Хранилище по Инмону является централизованным репозиторием, объединяющим в себе информацию из разных источников.

Проектирование начинается сверху вниз: сначала анализируется весь бизнес, определяются ключевые бизнес-области, затем сущности. На основе этого строится логическая модель с атрибутами каждого объекта. Затем разрабатывается физическая модель с нормализованной структурой (при этом лог.модель можно не завершать полностью, а начинать построение отдельными сущностями). Однако, из-за множества таблиц и ссылок, такую схему может быть сложно использовать для запросов (да-да, очень много JOIN) 🙃

Основные принципы методологии Инмона
Все данные должны быть согласованы и нормализованы (минимум 3NF), чтобы избежать избыточности и обеспечить высокий уровень целостности. По сути, это ваша "единая версия истины".

Каждая запись обязательно должна быть снабжена временной меткой. Это позволяет анализировать историю изменений данных.

Методология также подчеркивает необходимость поддержки разных уровней детализации данных для различных аналитических задач. По простому — строить различные витрины под разные бизнес-цели на основе централизованных данных.

Кроме того, методология Инмона требует, чтобы система была гибкой к изменениям. Технологии и требования бизнеса могут меняться, и система должна быть способна адаптироваться к этим изменениям без полной перестройки. Представьте, что вы делаете косметический ремонт квартиры — меняя отделку, но не затрагивая несущие стены.

Применение методологии Инмона позволяет получить полное представление о данных бизнеса, что способствует обоснованному принятию решений.

Преимущества и недостатки:
+ Создание единого хранилища для всех корпоративных данных.
+ Логическая модель отражает бизнес-процессы в компании.
+ Построение хранилища не сразу, а по частям.
+ Высокая целостность и надежность данных
+ Неизменность исторических данных.
+ Полное понимание данных для эффективного анализа и принятия решений.

- Высокие затраты на реализацию.
- Сложность внедрения и управления.
- Время на реализацию.
- Большое количество соединений в запросах.

Важно отметить, что методология Инмона особенно подходит для крупных организаций, где требуется строгая целостность данных и сложный анализ. И она же может оказаться не лучшим выбором для стартапов или компаний, ищущих быстрые и гибкие решения из-за высоких затрат и сложности реализации.

Ну а в следующий раз поговорим о главном "противнике" Инмона — Ральфе Кимбалле.

#dwh

BY В мире больших данных


Share with your friend now:
tgoop.com/big_data_systems_analysis/106

View MORE
Open in Telegram


Telegram News

Date: |

With the sharp downturn in the crypto market, yelling has become a coping mechanism for many crypto traders. This screaming therapy became popular after the surge of Goblintown Ethereum NFTs at the end of May or early June. Here, holders made incoherent groaning sounds in late-night Twitter spaces. They also role-played as urine-loving Goblin creatures. Co-founder of NFT renting protocol Rentable World emiliano.eth shared the group Tuesday morning on Twitter, calling out the "degenerate" community, or crypto obsessives that engage in high-risk trading. Over 33,000 people sent out over 1,000 doxxing messages in the group. Although the administrators tried to delete all of the messages, the posting speed was far too much for them to keep up. “Hey degen, are you stressed? Just let it all out,” he wrote, along with a link to join the group. Telegram channels fall into two types:
from us


Telegram В мире больших данных
FROM American