tgoop.com/HighLoadChannel/4147
Last Update:
Часто о надежности начинают задумываться, когда система уже написана, запущена в боевую эксплуатацию и «вдруг» случился серьезный инцидент. Как идентифицировать важные риски еще на этапе проектирования системы и заложить защитные меры в дизайн системы? А только ли в архитектуре дело? Что насчет процедур и инженерной культуры?
Разберёмся с этими вопросами на докладах:
1) Надежность на масштабе в 45 млн клиентов — инструменты и практики цифрового банка. Алексей Мерсон (Т-Банк)
В любой сложной системе есть механизмы поддержки, их много, и часто они разрозненны. Дежурные команды, оповещения, «железные женщины» и т.д. В докладе Алексея вы узнаете, как связать их в цельную стройную систему, чтобы надёжными были не только инфраструктура и приложения, но также услуги и клиентский опыт.
2) Что продуктовой команде нужно сделать ДО полного блэкаута системы. Наталья Макарова (CDEK)
Наталья покажет блекаут, про который мы все слышали, глазами техлида одной из команд CDEK, поделится своим прошлым опытом по восстановлению работоспособности систем и новыми инсайтами, как подниматься с нуля. С самого нуля. А ещё какие скрипты приготовить, где все будут толкаться при запуске и пр.
3) Как мы в Авито анализируем 5 миллионов трейсов и проводим архитектурный надзор. Иван Нещадин (Авито)
Вы узнаете как осуществлять архитектурный надзор post-factum анализируя трейсы, какие классы проблем можно идентифицировать таким образом и как организовать хранилище подобных данных.
🖐️ Присоединяйтесь к нам 2 и 3 декабря в Москве на крупнейшую профессиональную конференцию для разработчиков высоконагруженных систем HighLoad++ 2024.