Первоначально опубликовано на Ошибка неизбежна Отказ
Нет, невозможно продолжить действующий бизнес-как обычно. Для непредвиденного будущего команды по всему миру будут иметь дело с сокращениями, нестабильностью инфраструктуры и многое другое. Но, с лучшими практиками, ваша команда может принять устойчивость и адаптировать.
Один из способов подумать об этих сложных обстоятельствах, — представить их как инцидент. Инциденты являются формами незапланированной работы, а кризисы попадают в эту категорию. Чтобы справиться с инцидентами, вы, скорее всего, ссылаетесь на Runbooks, когда вы находитесь под давлением. Эти ключевые компоненты к ответу на инциденту также применимы при работе с неопределенными обстоятельствами.
Вам все равно нужны точные организационные графики, чтобы узнать, кто работает в каком отделе, как их связаться, и как при необходимости противоречить проблемы. Вам все еще нужны PlayBooks, чтобы выполнить повседневные проблемы. Но вам нужно настроить их, чтобы лучше отразить текущую реальность.
Ваши новые рутины должны будут вращаться вокруг работы из дома. Основная информация будет включать в себя протоколы заседаний, согласованные на часы или результаты, необходимые в день или неделю, и как общаться с вашей командой. Это потребует гибкости. Некоторые люди предпочитают стандартную электронную почту, другие захотят сообщения с помощью провисания. Вам также необходимо определить, какие обсуждения заслуживают звонки, и которые должны быть уведомлены в мероприятии Emproomtu Meetings.
Помимо создания новых Runbooks, вам также нужно будет просмотреть, как вы справляетесь с болезнью и чрезвычайными ситуациями на семью. Емкость потребуется увеличить (для серверов, хранения и т. Д.), Но и для численности персонала. Будет важно планировать, как ваша команда будет функционировать, когда члены заболевают или должны заботиться о семье и друзьям.
По-вызыве понадобится изменения. С увеличенным напряжением на вашей инфраструктуре инциденты могут шипаться. Если некоторые инженеры находятся на звонок на время с наибольшим использованием, они могут быть теми, которые отвечают на основной удар вопросов. Этот умственный штамм может привести к выгоранию, а ослабленные иммунные системы из-за стресса . Вместо того, чтобы отслеживать время, когда человек тратит на звонок, начните качественный анализ. Если кто-то проводит день по вызову и выступает только один раз, может показаться, что они могут помочь загрузить баланс против кого-то, кто был на звонке на целые выходные и был в курсе три раза. Но, если три отсека длились только один час кусок, а одно отключение длилось 16 часов, человек № 1 понадобится больше отдыха.
Планирование во времена неопределенности и гибкость может улучшить непрерывность вашего бизнеса. Если вам нужна небольшая помощь, у HUBSPOT имеет Шаблон непрерывности бизнеса Отказ
Отключения в течение этого времени беспрецедентны, поскольку компании борются на повышенном спросе. С коммутатором на WFH даже Microsoft Teams было отключение длится два часа. Компьютерные игры, торговые площадки, а также корпоративные VPN имеют существенную проблему с притоком ежедневных пользователей. Инциденты обрезают на тревожном уровне.
Фактически, все услуги (от интернет-провайдеров в продуктовые магазины и медицинские учреждения) растянуты к емкости и не могут позволить себе продолжать делать те же ошибки. С увеличенным объемом инцидентов было бы легко пропустить ретроспективу. Но это один из самых худших ловушек пожарных. Пропустив ретроспектива, вы теряете возможность учиться у инцидентов и предотвратить их снова. Кризисы не имеют установленного окончания. Если вы не начните работать по вопросам того же класса, в конце концов, вы будете перегружены.
Начиная о ретроспективах и пройти свой путь через анализ root причина, вы сможете определить два способа ускорить ваши процессы:
Определить узкие места. Существует ли повторная остановка для улучшенных услуг, или инциденты решаются быстро? Узкие места могут быть людьми или процессами, и важно знать, с кем вы имеете дело. Например, в Gene Kim’s «Phoix Project» Brent был огромным узким местом. В качестве одаренного инженера, который воспользовался всеми аспектами сервиса, Брент был постоянным идет к любой проблеме. Это означало, что он провел большую часть своего времени на незапланированную работу и без документов. Это перегружено ему и замедлило системные улучшения. В таких ситуациях, как это, важно убедиться, что инженеры чувствуют себя уполномоченным сказать нет, сосредоточиться на работе проекта и получить некоторое качество головы.
Если узкое место является процессом, вам нужно будет просмотреть ваши рабочие процессы для этого конкретного процесса. Хотя такая работа менее заметна, важно эффективность и инновации. Без узких мест вы сможете улучшить свой сервис и быстрее разрешить инциденты. Стоит позвонить на встречу, чтобы проработать. И вам понадобится ретроспективы, чтобы сделать эти обоснованные решения.
Автоматизировать труд. Письменные ретроспективы также могут помочь вам понять, где вы теряете время, чтобы трудиться. Например, в течение 15-минутного отключения, если 5 минут потрачены на получение участников, заполненных по этому вопросу, 33% вашего MTTR является труд. Вы можете автоматизировать процесс разрешения инцидента для создания концентратора связи для вашего инцидента, чтобы заполнить другие на деталях. Кроме того, сколько времени вы проводите написание постметем? Вы проводите часы поиском различия информации, чтобы включить в вашу графику? Это тоже трудно. Используя инструмент для совокупных ключевых данных для вас, вы и ваши товарищи по команде свободны сделать важную роль: обучение.
Обнимая устойчивость также требует гибкости мышления и обучения. Если вы допустите ключевые возможности для прохождения, вы упустите возможность изучить гибкость. Эта адаптация имеет решающее значение во время кризиса и неопределенности. Бизнес не может продолжаться, как раньше. Нам нужно итерацию на нашему процессу, поведению и Mindsets, чтобы процветать.
Первый шаг в гибкости — это изменение мышления. Вам нужно научиться быть терпеливым с другими. Многие из ваших коллег сейчас работают из дома. Это означает, что есть домашние животные, партнеры и дети для решения. Это не идеальная рабочая ситуация для большинства. Это высокий стресс и отвлекает. Участник вашего команды, который отвечал на ваши слабые сообщения через две минуты, теперь может потребоваться 15-20. И это нормально. Встречи могут быть немного более жесткими с занятыми домохозяйствами, и все в порядке. Производительность может окунуться, в то время как люди учатся работать в этом новом норме, и это нормально. Мы должны быть терпеливы друг с другом и сами, пока мы адаптируемся.
Вам также потребуется рассмотреть, как быть гибким в создании новой динамики команды. В офисе вы знаете, как ваши товарищи по команде занимают свой кофе и что они сделали в прошлые выходные, потому что у вас есть разрыв, которая позволяет для этого уровня подключения. Без этого, как вы будете держать свою команду разговаривать? Веселые слабые группы, командные водяные кулеры через зум, а ночь виртуальной игры все так важна здесь. Не только потому, что они держат вас в том, чтобы вы чувствовали себя частью одной и той же команды, но потому что Camaraderie так важен, пока социальный дистанцирующий. Человеческая связь держит нас мотивированным. Зная, что кто-то еще рассчитывает на нас, может держать нас работать, даже когда мы перегружены.
Наконец, вам также нужно быть гибким в ваших учебных ресурсах. Отмененные конференции, отсутствие внутреннего непрерывного образования, а классы либо отложены, либо перемещены в онлайн означает, что вы можете страдать от засухи знаний. Важно больше, чем когда-либо находить безопасные, здоровые способы изучения и взаимодействия с сообществом. Это может быть присутствовать на виртуальных конференциях, весом на живых панелях или чтения отраслевых новостей. Некоторые из наших любимых ресурсов:
- Sre Weekly
- Уроки, извлеченные из устойчивости и устойчивости сообщества
- Дежопт
- Устойчивость окружающей среды
Оригинал: «https://dev.to/blameless/sre-for-business-continuity-in-the-face-of-uncertainty-31e1»