Нет лучшего способа попробовать обнаружение инцидентов с инцидентами с рынком Tagged с DevOps, Kubernetes, SRE, MachineLearning.
Метка: incident
Ретроспективы инцидентов (или посмерти, после инциденты отчеты, RCAS и т. Д.)-наиболее важные PA … Tagged с SRE, DevOps.
Первоначально опубликовано по неудаче, неизбежно. Время простоя стоит больше, чем доллары. Это также стоит usto … Tagged с DevOps, SRE.
Какой из следующих трех сценариев вы испытываете больше всего, когда происходит новый инцидент? • Surp … Tagged с SRE, DevOps.
Если вы читаете это, вы, вероятно, очень заботитесь о среде, чтобы обнаружить (Mttd) и среднее время для … Tagged с DevOps, SRE.
С тех пор, как я опубликовал свою серию блогов в отношении оперативного совершенства, я получил относительно большой Amou … Tagged with AWS, DevOps, SRE, учебник.
Устойчивость — это не то, что происходит; Это результат самоотверженности и тяжелой работы. Связаться с Вами… Tagged с SRE, DevOps.
Увеличить инцидент
Я хотел дать вам обновление моего последнего блога на MTTR, показав вам нашу интеграцию Pagerduty в AC … Tagged с DevOps, SRE.
Команда Shift Shift Forward взяла интервью у SRES и нашего менеджера в Glitch, а также многих других людей — и задавала кучу отличных вопросов. Tagged с DevOps, SRE, подкаст.
Вы приземлились здесь, ища, чтобы уменьшить MTTR в качестве DevOps/SRE или инженера по надежности? Если да, … с меткой инцидента, DevOps, Reducemttr, Oncall.