Рубрики
Uncategorized

Инцидент ответ во время удаленной работы

Неожиданный и внезапный сдвиг на удаленную работу вводит новый набор проблем в Inciden … Tagged с Sre, DevOps, RemoteWork, IncidentResponse.

Неожиданный и внезапный сдвиг к удаленной работе представляет новый набор проблем в пространстве реагирования на инциденту. И хотя у каждой организации необходимо учитывать свои собственные уникальные обстоятельства, этот пост описывает лучшие практики и шаги, которые могут быть приняты в правильном направлении в соблюдении операций как продуктивных, так и проактивных.

В свете недавних событий происходит по всему миру, с растущими случаями COVID-19, многие страны общедоступны публично объявлены блокировки. Это было довольно легко управлять для некоторых компаний, но многие пытаются определить соответствующую работу из домой (WFH) политики.

Это ударила операционные компании больше, чем большинство. Операции включают в себя огромное количество координации, связи и реагирования; Все это сложно достичь, когда у вас вдруг придется иметь дело с вашей командой удаленно.

Как это влияет на ответ на инцидент и команды на звонках?

Один прозрачный результат в карантинском и поддержании социальных динамиков — насколько чрезвычайно зависят от того, что мы стали на цифровом мире. Таким образом, операционные команды и на вызове люди находятся под добавлением давления, чтобы сохранить ИТ-инфраструктуру и приложения в верхней форме. В результате становится действительно важно, чтобы мы остаемся связаны с несколькими модами связи. В конце концов, ответ инцидента — все о том, чтобы добраться до правильный человек в нужное время и эффективно общение не только в командной команде, но и для внешних заинтересованных сторон.

Инцидентные оповещения и инструменты управления доступны людям независимо от того, откуда они работают. Но это полезно только в том случае, если ваша практика управления инцидентами звучит и дополняет инструмент.

Обработка по вызову в обычный день на работе может быть стрессовым, но если вы работаете удаленно, это становится все более важным для обеспечения хорошего протокола связи. Никогда не поздно настроить ваши процессы реагирования на инциденту, чтобы облегчить команды управления инцидентами на одной странице и убедиться, что ваши системы и услуги всегда надежны. Вот некоторые способы вы можете настроить себя на успех.

Подготовка к дистанционному управлению инцидентом

Как компания, которая сосредоточена на лучших практиках, которые помогают упростить ответ на инциденты, мы следуем за несколько практик, чтобы всегда быть готовыми.

  • Связанное сообщение
  • Краеугольный камень любого хорошего процесса реагирования на инциденту является связь.

    Документ больше : Одно следует иметь в виду, чтобы уменьшить риск дезинформации или коммуникационного пробела, состоит в том, чтобы написать больше и писать лучше. Всегда лучше иметь запись информации и связанной с ними активность, чтобы вернуться к, при необходимости. Когда сомневаетесь, брось еще несколько подробностей.

    Используйте центральный слабый канал : Для тех из вас, которые любят чаты или зависят от Провисание для управления инцидентами Используйте выделенный канал для привлечения всех ваших инцидентов. Возможно, вам придется создавать отдельные каналы для общения в отношении конкретных вопросов и отключений. Но центральный канал может выступать в качестве индекса, и предотвращает поиск конкретного инцидента и его статуса.

    Виртуальная военная комната : Не говорит о том, что сотрудничество является ключом к уменьшение вашего МТТР Отказ Вы можете имитировать традиционную вайную комнату War Chuddle, используя инструмент для видеоконференций или платформы чата с командой ответного ответа инцидент. С Squadcast вы можете использовать наши Виртуальная военная комната Там, где вы можете пообщаться, привлечь других членов из вашей команды, МСП, заинтересованных сторон и команд с бизнесом, чтобы убедиться, что все ваши цели выровнены.

    Опубликовать ссылку на совещание : Вы можете создать виртуальный конференц-зал для простого боевого боя и держать это открытыми на протяжении всего вращения на вызове. Вы можете добавить идентификатор встречи вместе с подробностями инцидента или выкрепите детали в расслоенном канале или любую другую связь, который вы используете.

    Обычно мы используем зум, чтобы сохранить открытый конференц-зал, который может присоединиться к идентификатору собрания. Вы также должны иметь возможность сделать это с другими инструментами.

    Говорит быстрее, чем печатать, так что может быть заманчиво просто призвать со всеми сомнениями; Тем не менее, используйте его только в том случае, если ситуация призывает к нему. Никто не любит постоянно прерываться.

    Быть прозрачным : Связь может принять большой удар с работой из домашних команд. Это происходит просто потому, что вы можете подумать, что вы сообщаете всю доступную информацию, которую вы знаете, но можете пропустить некоторые предпосылки, необходимые для лучшего понимания информации.

    Чтобы избежать этого, приятно просто добавить во всех соответствующих командах при работе с инцидентом. Также не забудьте обновить свой Состояние страницы С любой новой необходимой информацией немедленно опустите разрешение инцидента.

    Это открывает их до всей деятельности, существующую серьезность вопроса и выступает в качестве единой платформы для обсуждения и доли. Со всеми всегда сообщили, вам не нужно бороться с переключением контекста, чтобы просто разработать правильное сообщение для отправки внешних команд или клиентов.

  • Инцидентный ответ
  • Как только вы получите правильные процессы связи, ответ на инциденты проще. Вы можете сосредоточиться на пожарных без необходимости беспокоиться о чем-либо еще.

    Назначьте роли : Вы самые быстрые, когда вы знаете, что вам нужно сделать. Такая ясность может быть достигнута просто Назначение ролей к вашей команде ответной ответственности . Это также помогает распределить работу, которые в противном случае упадут только на один человек, выясший из фиксации.

    Для команд всего 1 или 2, просто контрольный список предметов, чтобы сделать, когда падающие хиты могут пройти долгий путь. Это очищает разум каких-либо сомнений в ожидании работы.

    Сроки инцидентной деятельности : Обычно ожидается, что писание будет поддерживать запись всех видов деятельности взимания. Это всегда хорошая идея, чтобы не доверять вашей памяти в ситуации с высокой стрессовой стресс. Это позволяет вам иметь всю информацию, необходимую для лучшего анализа, пишите лучшие постмены и создаем эффективную плейутюбюр в качестве упреждающей меры. С каскадацией мы используем наши Автоматические сроки Чтобы понять мероприятия по разрешению во время проведения постммертов.

    Настройка автоматизированного Вращение на звонок : Если вы еще этого не установили, вы можете ожидать диаграмма мотивации по скорости для всех инженеров, которые делают это сегодня. Вполне вероятно, что когда у вас нет настроек вращения, стресс инцидентов падает всего на 1 или немногие.

    Это нагрузка с ума, если вы просто знали заранее, когда вам придется пойти на звонок. Вращения также помогут вам назначить соответствующую нагрузку для всех в команде.

    Помните, что находясь на звонок, это все ответственность.

  • Разрешение инцидента
  • Всегда создавайте Runbooks (с параметрами Foxback) : Полезно создать базу знаний всех информационной информации о взаимозаполнении, которую можно ссылаться, когда аналогичные инциденты попали в ваш сервис. Таким образом, вам не нужно тратить время, выяснение инцидента снова.

    Руководительные книги особенно полезны для людей, которые являются новыми на звонок или новее в вашей организации. Всегда хорошо иметь больше информации, когда вы новые.

    Безопасные постмертемы : Еще один великий источник информации — постмертем и публикует отзывы инцидента. Не очень много организаций не выполняются, чтобы закончить постмертем просто потому, что это длинный, утомительный и иногда стрессовый процесс. Но лучший способ обеспечить, чтобы инцидент снова не возникал, состоит в том, чтобы проанализировать, почему это произошло в первую очередь, а затем сделать эту информацию доступной для всей команды. В SQUADCACT вы можете создать постмертем инцидентов из приложения и можно посмотреть кому-либо в вашей команде.

    Неожиданный и внезапный сдвиг на удаленную работу вводит новые риски. И хотя каждая организация должна учитывать свои собственные уникальные обстоятельства, вышеупомянутые практики предложили шаг в правильном направлении в обеспечении операций как продуктивных, так и упрежденных.

Высказывание Является ли инструмент для управления инцидентами, который предназначен для Sre. Создайте безупречную культуру, уменьшая потребность в физических военных комнатах, унифицировать внутреннюю и внешнюю SLIS, автоматизировать разрешение инцидента и создать базу знаний, чтобы эффективно обрабатывать инциденты.

Оригинал: «https://dev.to/squadcast/incident-response-in-the-time-of-remote-work-kog»