П
Притчи СТО
@pritchin_cto408 подп.
555просмотров
18 июня 2025 г.
📷 ФотоScore: 611
Пара моих личных осознаний по постмортемам за последний год Заглянул в постмортемы, решил поделиться парой инсайдов по этой системе, которые ко мне пришли за последний год. 1.Постмортемы лучше вести в таск трекинге. Мы сначала долго вели в гитхабе в маркдауне, потом вели в ноушене(в системе документации), но после съезда с ноушена перевели в наш таск трекинг(кайтен). И стало сильно лучше. Ведение статусов улучшилось, меньше зависших, лучше подвязываются задачи. 2.Буквально пара важных обязательных полей дает кучу аналитики. Для меня важные поля - время даунтайма в минутах, потери в деньгах от сбоя, критичность(тут 4 степени), сервис. Эти поля дают всю нужную аналитику. Можно посчитать аптайм, взяв сумму времени даунтайма в критичных сбоях, тем самым отсечь некритичные. Или можно задетектить проблемность определенного сервиса через количество сбоев по нему. Вести пяток полей вполне реально. 3.Метрики от процесса постмортема обязательно выносим в крупные ОКРы. Уже много лет одна из постоянных годовых целей айти - это попасть в прогноз по потерям на падениях. Эта сумма как раз считается по постмортемам, трекать такое просто поквартально. Ну и общая крупная цель поднимает важность ведения обязательных полей из предыдущего пункта. 4.Уровни критичности сбоев очень нужны. Раньше я жил в парадигме, что “нет неважных сбоев, надо чинить все”. Увы, это оказалось нереальным. Это хорошо работало, когда все было очень нестабильно и надо было резко поднять уровень качества. Но в режиме поддержки или небольшого улучшения работает плохо. Еще при росте масштабов разработки тоже стало сложно ко всем подходить одинаково. Не все сбои одинаковые, некоторые требуют моего личного участия, а какие-то достаточно провести командой или инжиниринг менеджером юнита. Когда ввели систему уровней критичности, появился каркас, на который легко все ложится. Саппорту стало понятно, при каких сбоях какой уровень коммуникации вести. Появился единый язык и общий контекст важности. Есть ли у вас какие-то новые понимания по постморетмам за последнее время? Добавляйте, обсудим
555
просмотров
2079
символов
Нет
эмодзи
Да
медиа

Другие посты @pritchin_cto

Все посты канала →
Пара моих личных осознаний по постмортемам за последний год — @pritchin_cto | PostSniper