Telegram Web
Обучающие материалы о Grafana от самой Grafana

Узнаете то, о чем раньше не знали. Изучение каждого мини-курса займет 10-20 минут. Все описано в доступной форме в виде пошаговой инструкции.

Среди обучающих курсов:

🚀 Kubernetes Monitoring

🚀 Connect to a Prometheus data source

🚀 Visualize logs

🚀 Create logsalert rule

и многое другое.

@monitorim_it
👍11🔥8
Continuous profiling for native code: Understanding the what, why, and how

Профилирование как метод отладки существует уже давно. В середине 2010-х годов, появился ряд продуктов, которые дали начало использованию этой технологии как четвёртого метода наблюдаемости. Появление eBPF сделали расширило его возможности.

В этой статье рассмотрены преимущества непрерывного профилирования и пример использования для получения наглядной информации о производительности кода.
🔥6👍4
Классический мониторинг уже не справляется с вызовами сложных ИТ-систем: он фиксирует сбои, но не раскрывает их причины.

Observability меняет подход — помогает понять взаимосвязи сервисов, качество работы и опыт пользователей. Подробнее об этом рассказал Антон Новоженин, технический директор GMONIT. В материале:

📌 ограничения традиционного мониторинга;
📌 особенности APM;
📌 ключевые принципы observability;
📌 преимущества сочетания подходов;
📌 тенденции, определяющие развитие систем анализа ИТ-инфраструктуры.

Переходите по ссылке, чтобы прочитать статью! 📖

Реклама. ООО "ХАЙПЕРСОФТЛАБ", ИНН 9705151703, erid 2Vtzqv6m13P
👍8👎32
Your Brain on Incidents

Опыт работы автора этой статьи дежурным начался в середине 2000-х. Было пять вечера пятницы, конец первой недели работы инженером-программистом в финансовой компании в Лондоне. Он как раз закрывал свою IDE на выходные, когда к столу, неловко улыбаясь, подошёл начальник. В руках у него были IBM Thinkpad, Blackberry и, несомненно, грузная ноша человека, которому нужно было сделать одолжение. Веселые истории и поучительный опыт из жизни дежурного.
🔥4👍2👎1
Как продуктовые аналитики в Туту ловят аномалии в метриках

Рано или поздно в любом продукте встает вопрос о том, как успевать отлавливать аномалии в аналитических логах и метриках. В статье продуктовый аналитик из команды Отелей сервиса путешествий Туту расскажет о подходе к алертингу и поделится кодом, с помощью которого продуктовый аналитик может за пару часов самостоятельно настроить базовый алертинг.
👍4🔥4👎1
Configuring PostgreSQL Logs: A Practical Guide

Анализ логов PostgreSQL даёт следующие преимущества:

🚀 Отладка и устранение неполадок: выявление медленных запросов, взаимоблокировок и проблем с подключением.

🚀 Оптимизация производительности: выявление узких мест, конфликтов блокировок и неэффективных шаблонов запросов.

🚀 Аудит и соответствие требованиям: регистрация того, кто, к чему, когда и откуда получил доступ, для обеспечения подотчетности и безопасности.

Проблема в том, что в большинстве боевых сред логирование по-прежнему выполняется неправильно. Некоторые регистрируют всё, генерируя столько данных, что они становятся бесполезными. Другие не регистрируют практически ничего, оставляя критические пробелы при снижении производительности или сбое.

В этой статье основное внимание уделяется поиску правильного баланса: настройке PostgreSQL для регистрации значимых событий, обеспечению компактности и эффективности журналов, а также созданию основы для бесшовной интеграции с современными фреймворками наблюдения, такими как OpenTelemetry.

@monitorim_it
👍5🔥4
Специальное предложение для планирующих миграцию виртуализации

Компания ISPsystem запустила акцию «Мигрируем VMeste» — комплексное решение для перехода с российских платформ виртуализации на VMmanager (Продукт года по версии CNews Awards).

Ключевые преимущества программы:

• Лицензия VMmanager на 12 месяцев по цене технической поддержки
• Годовая лицензия BILLmanager Enterprise в подарок
• Экспертное сопровождение миграции специалистами ISPsystem

Условия участия:
- Приобретение годовой технической поддержки на количество мигрирующих хостов
- Регистрация в акции — до 31 декабря 2025 года
- Завершение всех миграций — до 31 декабря 2026 года

Программа предлагает экономически эффективный подход к переходу на современную российскую платформу виртуализации с профессиональной поддержкой на всех этапах.

Детали акции доступны на официальном сайте ISPsystem.

Реклама. АО «Экзософт»
🔥4👎1
Масштабируемый мониторинг: Настраиваем VictoriaMetrics в HA-конфигурации с VMAgent и Grafana

Когда стек мониторинга перерастает масштаб нескольких серверов, классический Prometheus показывает свои ограничения:

🚀 Проблемы с производительностью при миллионах метрик

🚀 Вертикальное масштабирование

🚀 Сложности с долгосрочным хранением

🚀 Ограниченные возможности репликации

Очередная статья про настройку VM

@monitorim_it
🔥6👍4👎4
Aliaksandr Valialkin - Cost-Effective Monitoring in Kubernetes

В этой записи доклада с Kubernetes Community Days Warsaw 2025 Александр Валялкин, соучредитель и технический директор VictoriaMetrics, объясняет, как создать экономичную, быструю и масштабируемую систему мониторинга.

Александр делится практическими советами о том, как современные системы мониторинга могут оставаться простыми, не жертвуя глубиной хранения. Также рассказывает про распространённые ошибки, связанные со сложными системами мониторинга, и показывает, как инструменты с открытым исходным кодом на основе Go могут обеспечить производительность и прозрачность при масштабировании.
🔥122👍1
Свой мини-«мониторинг как сервис»: Python-демон + Next.js-дашборд

В какой-то момент автор этой статьи поймал себя на том, что в третий раз пишет похожий набор проверок (API, страницы, базы, очереди, TLS, Docker…) и снова открывает это все в голых логах или простых HTML-страничках. В итоге он сел и сделал отдельный проект — мониторинг-демон на Python + Next.js-дашборд. Подробности в статье.

Репыч на Гитхабе

@monitorim_it
👍7🔥2👎1
RUM на Prometheus: пишем за вечер свой простой и надёжный фронтенд-мониторинг

В разработке давно привыкли смотреть на потребление процессора и памяти, на ошибки и бизнес-метрики, но метрики скорости фронтенда почему-то до сих пор игнорируют даже в крупных компаниях. В этой статье автор рассказывает, как решить эту задачу, сделав свой RUM поверх Prometheus. Читать дальше на Хабре.

@monitorim_it
🔥13👍31
Observability все дороже и дороже

В очередной раз натолкнулся на статью с предложением снизить расходы на Observability-платформу. На этот раз статья от ClickHouse (ClickStack).

Представим, что мы средняя компания с несколькими сотнями сервисов, контейнеров и виртуалок. Мы хотим мониторить всё: метрики, логи, трейсы, пользовательские события. Давайте-ка теперь прикинем в формате пол-палец-потолок какие у нас будут расходы на хранение, например, логов.

Предположим, что у нас 200 нод/контейнеров/host-объектов, которые генерят
ingest ~ по 2 TB сырых логов, метрик и трейсов в месяц. Хранить для простоты мы будем эти данные 30 дней.

А теперь при помощи опыта, чатгпт и простого поиска в интернете разложим как эти данные ложатся в архитектуры Elasticsearch, LGTM, Victoria (Metrics/Logs/Traces), Thanos, Prometheus.

🚀 ElasticSearch

Логи: расжатие 1.2×–1.6×, ~1,5× в среднем (~3 Тб). Рост дают инвертированные индексы.
Метрики: ~0.9 Б/сэмпл (при хранении в формате TSDS) ~115 ГБ
Трейсы: расжатие 1.5×–2,5×, ~2× в среднем (~4 Тб).

🚀 Clickhouse

Логи: сжатие 10×-30×, ~20× в среднем (~100 Гб)
Метрики: 0.5–1.6 Б/сэмпл ~100 ГБ
Трейсы: сжатие 7×-18×, ~10× в среднем (~200 Гб)

🚀 Victoria

(Logs) Логи: сжатие 10×-20×, ~15× в среднем (~133 Гб)
(Metrics) Метрики: ≈1 Б/сэмпл ~125 ГБ
(Traces) Трейсы: сжатие 8×-15×, ~11,5× в среднем (~170 Гб)

🚀 Grafana

(Loki) Логи: сжатие 3×-10×, ~5× в среднем (~400 Гб)
(Mimir) Метрики: ~1.3 Б/сэмпл~160 ГБ
(Tempo) Трейсы: расжатие 0,8×-1,5×, ~1× в среднем (~2000 Гб)

🚀 Thanos

Метрики: ~1-2 Б/сэмпл + 20% оверхед на метаданные и индексы ~225 ГБ

🚀 Prometheus

Метрики: ~1-2 Б/сэмпл (среднее 1,5 Б/сэмпл) ~190 ГБ

По итогу логи/метрики/трейсы займут места в:

ElasticSearch ~7115 Гб
ClickHouse ~400 Гб
Victoria ~428 Гб
LGTM ~2560 Гб

Путем математических вычислений теперь можно посчитать сколько вам нужно заплатить или за хранение в облаке этих данных или за хранение во внутреннем контуре. Также очевидно, что чем больше данных вы храните тем большая инфраструктура это все должна обслуживать (кластера, ноды и т.д.). А ещё ведь резервные копии нужны. Уф.

В общем, правильный выбор стека сэкономит вам практически всё: деньги, человекочасы и нервы.

🚀 Напишите в комментариях какой стек используете в своих observability-системах и чем довольны/не довольны. Обменяемся опытом.

@monitorim_it
🔥14👍62
Приглашаем на ЮMoneyDay — бесплатную онлайн-конференцию про финтех и IT 🔥

На протяжении двух дней будем общаться с разработчиками, инженерами, тестировщиками, продактами, дизайнерами и другими специалистами из ЮMoney. Они расскажут про свой опыт работы в большом финансовом продукте, поделятся лайфхаками и секретами.

Будут доклады по 16 направлениям:

🟣 Будущее финтеха
🟣 Бэкенд
🟣 Фронтенд
🟣 Тестирование
🟣 Python
🟣 Менеджмент проектов
🟣 Менеджмент продуктов
🟣 Системный анализ
🟣 SQL
🟣 UX
🟣 ИИ
🟣 Архитектура IT-решений
🟣 Внутренние системы
🟣 Мобильная разработка
🟣 Инфраструктура
🟣 О компании

Встречаемся онлайн 5 и 6 декабря в 11:00 мск. Чтобы участвовать, зарегистрируйтесь на сайте конференции
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍3
Deprecating Zipkin Exporter

Проанализировав особенности использования в различных языковых экосистемах, мы отметили, что сообщество всё больше склоняется к OTLP, при этом экспортёры Zipkin получили ограниченное распространение — на некоторых языках, даже меньшее, чем уже устаревший экспортёр Jaeger. Учитывая минимальное участие пользователей в решении связанных вопросов и наличие альтернатив, мы считаем, что сейчас самое время прекратить поддержку экспортёров Zipkin в SDK OTel.


Больше подробностей в блоге OTEL.

@monitorim_it
👍5🔥5
Zabbix Meetup уже завтра!

Уже завтра состоится наш совместный с Zabbix митап, где я также буду выступать. Приходите, чтобы узнать много интересного и просто поддержать🙏

🔥 На вебинаре выступит Алексей Владышев — СЕО Zabbix и расскажет о планируемых нововведениях в Zabbix 8.0.

Зарегистрируйтесь, чтобы не пропустить
🔥93👍2
Я сделал Log Bull — простую open source альтернативу ELK, Loki и Graylog для сбора логов из кода (Python, Go, JS и т.д.)

За последние ~5 лет я много раз сталкивался с задачей собирать логи: обычно из маленьких или средних по размеру кодовой базы проектов. Отправлять логи из кода не проблема, у Java и Go для этого есть библиотеки практически из коробки. А вот разворачивать что-то для их сбора — головняк. Понятно, что решаемый (ещё до ChatGPT, а сейчас так тем более), но всё же.

Запуск ELK для меня каждый раз испытание: куча настроек, нетривиальный деплой, а при заходе в UI разбегаются глаза от вкладок. С Loki и Graylog — немного проще, но всё равно функций сильно больше, чем мне нужно. При этом разделять логи между проектами, добавлять других пользователей в систему так, чтобы они не видели лишнего — тоже не самый очевидный процесс.

Поэтому примерно год назад я решил, что сделаю свою систему для сбора логов для себя: максимально простую в использовании и запуске. Чтобы разворачивалась на сервере одной командой, вообще без настроек и без лишних вкладок в интерфейсе. Собственно, так появился и теперь вышел в open source Log Bull: система для сбора логов для разработчиков с проектами middle-sized размера.


Читать статью на Хабре

Вопрос к читателям канала! Есть ли смысл в 2к25 пилить свою собственную систему логирования или все же есть уже готовые достойные варианты?

@monitorim_it
🔥11👎9👍7🤔1
10 лучших open source инструментов Observability 2025

В этом году инструменты observability с открытым исходным кодом вышли за рамки простого мониторинга. Теперь они конкурируют, а зачастую и превосходят коммерческие SaaS‑платформы по масштабируемости, гибкости и совместимости. Команды из разных отраслей внедряют стеки решений наблюдения с открытым исходным кодом, чтобы избежать привязки к одному поставщику, обеспечения сквозной прозрачности (логи, метрики, трассировки), экономии на лицензиях и много другого.

В этой статье мы рассмотрим 10 лучших инструментов наблюдения с открытым исходным кодом 2025 года, изучив их сильные стороны, недостатки и наилучшие варианты использования для современных DevOps‑ и SRE‑команд.


Читать статью на Хабре

@monitorim_it
👎10🔥6👍3
How to pair Grafana Drilldown with Loki for faster logging insights

Никто не хочет тратить время на просмотр бесконечных строк логов, поэтому мы продолжаем развивать Grafana Logs Drilldown как инструмент, который поможет вам быстрее находить нужную информацию. С Logs Drilldown вы можете легко фильтровать логи, анализировать данные глубже, используя шаблоны, получать автоматические визуализации и находить связанные логи — и всё это без необходимости писать запросы.


В блоге Grafana рассказывают про подход Grafana Logs Drilldown. Вы узнаете как эффективно искать по логам, если используете Loki.

@monitorim_it
🔥6👍3
Мониторинг SSSD через D-Bus: создаем собственный Ansible-модуль вместо sssctl

Сегодня хочу поделиться опытом того, как я отказался от стандартного пакета sssd-tools для мониторинга службы SSSD в пользу прямого общения с демоном через D-Bus и создал свой первый Ansible-модуль.


D-Bus (сокращенно от «Desktop Bus») — это система межпроцессного взаимодействия (IPC), которая позволяет приложениям на одном компьютере общаться друг с другом, обмениваясь сообщениями. Она действует как «шина сообщений», через которую один процесс может отправлять запросы, сигналы и данные другим процессам.


Подробности в статье на Хабре →

@monitorim_it
🔥7👍1
Мониторим ESB и анализируем нагрузку через Nginx в Zabbix, когда «из коробки» не работает

Рассказываю, как наша команда реализовала мониторинг состояния шины и аналитику запросов к ней через обратный прокси. Пришлось повозиться, ведь Zabbix из коробки не очень успешно с этим взаимодействует.

В сложных интеграционных системах мониторинг является неотъемлемым инструментом как для инженера, так и для бизнеса. Zabbix показал себя надёжной и гибкой системой, которая позволяет строить понятные дашборды. Но я, как тимлид команды поддержки, столкнулся с тем, что шину Red Hat JBoss Fuse так просто к Zabbix не подключить. Шина работает на JVM, а значит, нужен мониторинг по JMX.


Подробности в статье на Хабре →
🔥5👍4
2025/12/07 12:52:34
Back to Top
HTML Embed Code: