Рубрики
Uncategorized

Вы инженер Одинокого DEVOPS делают 24/7 по вызову? Измени это!

Вы единственный в вашей команде, который берет на себя ответственность за продуктивную систему … Теги с DevOps, OnCall, Sre.

Вы единственный в вашей команде, который берет на себя ответственность за продуктивную систему? Вы несете свой ноутбук с вами даже в свободное время, чтобы иметь возможность исправить проблемы в производстве? Вы неофициально на звонок 24/7?

Я был в той же ситуации. Будучи одиноким инженером DEVOPS — даже если вы являетесь частью большей команды — может быть бременем.

Но как сделать перемен от шоу одного человека на вызову команды на вызове, например, из картинной книги? Вот несколько идей о том, как изменить вашу ситуацию.

Пара программирования и защищенная пара отладки

Команда с одним членом команды, когда Программирование или Отладка Отказ

  1. Поделитесь своим экраном и объясните, что вы делаете с вашим коллегой. Спросите своего коллега, чтобы помочь избежать ошибок и найти лучшие решения.
  2. Направьте своего коллега путем внесения изменений в инфраструктуру с его/ее машины. Не забудьте обсудить «почему».
  3. Следите за своим коллегой и позвольте ей/ему объяснить, что она/Он делает с тобой. Дайте ценную обратную связь, но только время от времени.

Повторите процесс со всей вашей командой.

Безопасная обучающая среда

Обучение того, как управлять сложной облачной инфраструктурой страшной для остальной вашей команды. Ориентичен, чтобы забрать своих коллег боиться о нарушении производства. Обязательно предоставить целую команду доступ к безопасной учебной среде. Например, учетная запись AWS, которая используется только для того, чтобы попробовать себя. Еще лучше, предоставьте отдельный учетную запись AWS всем коллегам.

Инфраструктура и операционная документация

Инвестируйте в создание и обновление документации вашей облачной инфраструктуры и операций. Это не может быть вашей любимой работой, но это необходимо. Соблюдайте вопросы от своих коллег и соответствующим образом улучшите документацию.

  • Иллюстрируйте архитектуру высокого уровня с диаграммой. Lucidchart и Cloudcraft Являются ли мои любимые инструменты для создания архитектурных диаграмм.
  • Иллюстрируйте топологию сети с фигурой.
  • Опишите разные части вашей архитектуры.
  • Опишите свою стратегию резервного копирования и восстановления.
  • Объясните, где найти метрики мониторинга, аварийных сигналов и журналов.

Показать и рассказать

Вы планируете значительные изменения в производстве? Вы улучшили мониторинг или регистрацию? Распространите знания и организуйте шоу и расскажите встречу. Тридцать минут должны быть отличными. Не забудьте зарезервировать 10 минут на вопросы от ваших коллег.

Runbook

Находясь на звонок для производственной системы оставляет вашу команду с точнее чувством. Требуется некоторое время, чтобы построить уверенность в том, чтобы быть в состоянии исправить любую проблему. Поддержите своих коллег, предоставляя Runbooks, направляющих их через локализацию и исправить общие вопросы.

Руковезон должен ответить на следующие вопросы:

  • Как классифицировать серьезность инцидента? Например, указывая на соответствующие метрики или журналы.
  • Как локализовать корневую причину неудачи?
  • Как исправить корневую причину инцидента?

Проверьте наш безонбор «Альба нездоровыйhostcount» Runbook Например.

Безумертные постммермы

При передаче ответственности за производство в вашей команде, инциденты, вызванные провалом человека, увеличится. Установите хороший пример. Не обвиняйте в человеческой неудаче. Вместо того, чтобы организовать неприятные постмеремы. Помогите вашей команде учиться от неудачи. Не забудьте также чувствовать ваше управление.

Похвальная похвалы

Цените коллеги, которые занимаются называть и берут на себя ответственность за производство.

  • Хвалите коллегу, который завершил ее/его первые выходные или ночью на звонках.
  • Хвалите коллегу, который захватывает лишний поворот от больного коллеги.
  • Награда «инженер-звонок месяца» на основе количества фиксированных инцидентов.
  • Предоставьте выходной для коллег, которые преуспели во время сдвигов на звонок.

Или думать о другой гейфике, которая соответствует вашему команде духу. Обязательно получить поддержку от руководства для оценки коллег, занимающихся называть сдвиги.

Резюме

Вы инженер Одинокого DEVOPS делают 24/7 по вызову? Измени это! Там нет одного размера вписывается во все решения. Но никто кроме того, вы не будете проводить изменения.

Вы одинокий инженер DEVOPS? Я хочу подключиться. Пожалуйста, свяжитесь со мной!

Оригинал: «https://dev.to/andreaswittig/are-you-the-lonely-devops-engineer-doing-24-7-on-call-change-it-p1i»