Клиенты StaturanPage зарегистрированы более 194 года коллективных инцидентов в 2018 году. Это колоссальное увеличение на 87% от 104 года вошли в систему 2017 И мы даже не до декабря еще.
Открытое взаимодействие на инциденте становится все более и важнее для компаний и их клиентов. Это подчеркивается большими именами, которые создали общедоступное состояние в этом году, как Github , LinkedIn и ЙЛП . С более акцентом на падающем коммуникации находятся больше внимания на управлении инцидентом в целом. Компании тратят больше времени и ресурсов подготовки к простоянию, поскольку мы узнали от нескольких клиентов, которые мы профилировали Как они готовятся к успехам .
Мы выкопали глубже в наших данных 2018 года, чтобы получить лучшее представление о том, когда и как наши клиенты общались вокруг простоя в этом году. Данные представляют все зарегистрированные инциденты — от небольших кругов в обслуживании в масштабных отключениях — плюс любые запланированные простоя, зарегистрированные за счет запланированного обслуживания.
Что значит цифры
Конечно, резкое увеличение часов инцидентов, зарегистрированных с 2017 года по 2018 год, может быть частично отнесено к увеличению общего количества клиентов состояния, но мы также считаем, что это отражает все более облачный менталитет компании, опираясь на продукты SaaS. Компании выбирают общение вокруг этих инцидентов, и клиенты пришли ожидать такого типа прозрачности.
В дополнение к прыжке в количестве инцидентов зарегистрирован в этом году, Мы также увидели среднее количество обновлений за инцидент почти вдвое. В этом году в среднем 4,4 обновления на инцидент в этом году мы считаем, что компании приоритет от приоритеты частого, прозрачного общения со своими клиентами.
Мы также были удивлены, увидев, что почти половина наших клиентов (45% точнее) выбрали некоторую форму автоматизации страниц, интегрируясь с инструментом оповещения или мониторинга. Пока мы выступаем за всегда Сохранение человеческого элемента в вашем процессе инцидента Comms Настройка некоторого уровня автоматизации может определенно сэкономить время, когда он имеет значение больше всего. Многие клиенты принимают этот гибридный ручной/автоматический подход, чтобы сэкономить время, не рискуя плохим опытом клиентов.
В то время как инциденты, зарегистрированные и обновления, которые размещены, растут, все еще очень мало постмектограмм, написанных — только 3% инцидентов, зарегистрированных в строке состояния, более 2018 года, имел прикрепленную постмерту. Это не слишком удивительно, так как не каждый инцидент требует, чтобы постМорктом (и некоторые компании пишут постмертем на блоге компании), но мы представляем, что этот процент, поднимающийся в 2019 году, когда клиенты ожидают, что этот тип наблюдения.
Выделяющиеся инциденты
Есть несколько дней, когда время простоя, скорее всего, для определенных компаний или отраслей. Кибер понедельник является одним из примеров — в день, когда компании электронной коммерции видят экспоненциальное увеличение трафика на свои сайты или приложения. Для Amazon , Prime Day (их самая большая продажа года) в тот день — соперничество даже в безумной черной пятницу и кибер-понедельник. Хотя розничный гигант до сих пор добился рекордно в продажах, покупателей были проблемы с подключением к Amazon.com уже более часа, заставляя много разочарования клиентов и оценку до 100 миллионов долларов в потере доходов Отказ Серебряная подкладка была наводнением милых собачьих картин на Twitter, Постановка мощности большой ошибки страницы :
Для Epic Games Их «главные» дни дорожного движения пришли, когда игроки стекаются, чтобы играть в свою очень популярную видеоигру, Фортет. Они испытали периоды, где более 3 миллионов геймеров играли одновременно, что привело к некоторым крупным прерываниям услуг. Во время инцидента в июне игроки со всего мира вошли в эпические игры Состояние страницы чтобы увидеть, что происходит, в результате чего пик около 15 000 запросов в секунду. (Наш самый высокодемышленнический инцидент на сегодняшний день.) Основные слава в эпические игры для написания очень тщательные постмектограммы закрыть петлю на больших инцидентах.
Некоторая форма простоя неизбежна — особенно с чрезвычайной нагрузкой, такими как один опыт Fortnite. Epic Games показывает нам, что это то, что вы справляетесь с этим время простоя и общаетесь со своими клиентами, которые действительно имеют значение.
И мы не можем забыть IRS , у которого был необычно стрессовый налоговый день 2018 года, когда их сайт разбился 17 апреля, крайний срок подачи налогов. Это было очень проблематично, как Приблизительно 10 миллионов американцев ждут, чтобы представить свои налоги в последний день . Они оказались расширением срока на 18 апреля, но общение в то же время не было точно идеальным. Исходное сообщение об ошибке IRS сообщило о запланированном мероприятии простоя от 17 апреля 2018 года по 31 декабря 9999 — Yikes.
Простои времени происходит с лучшими из нас, но точные и частые обновления проходят долгий путь. Мы написали открытое письмо для IRS Предлагая некоторыми советами и бесплатным состоянием — предложение действует до налогового дня 2019 года. Мы все еще ждем их, чтобы заставить нас на это.
#Hugops на 2019 год
В то время как в этом году могло быть больше часов простоя в этом году, было также намного больше любви и признательности (#hugops) Показано компаниям, которые были открыты о плохих временах — более 7000 твитов и ретвиетов, упомянув на самом деле. Мы начали отправлять фактические плакаты HugOps людям, которые ретвидят наших цифровых плакатов HugOps и отправили более 70 в этом году. Это означает, что 1% всех Tweeters Hurewops теперь с гордостью отображают строение состояния HugOps Poster в своем кабинете, как тот, который ниже — HOORAY!
Последнее в Атлассианском для управления инцидентами
В то время как связь в падаке является большой частью управления инцидентами, это только один кусок большей головоломки. У Атлассина мы удвоили на наших инвестиций в инструменты управления инцидентами и практики Отказ Ознакомьтесь с тем, что мы были до:
* PostMortems для * * Jira Ops: * Одной из наиболее важных частей процесса управления инцидентами является постмертем. Именно здесь команды реагирования на инциденты могут учиться, улучшить и собирать все возвраты на время и инвестиции, которые пытаются решить инцидент. К сожалению, постмертемный процесс часто пренебрегают тем, что слишком много времени и трудно управлять. Ключевой временной заставкой с Postmortems JiraOps — это временная экономика, которая собирает все ключевые события от инцидента в хронологическом порядке. Команды могут проанализировать, что произошло, определить корневые причины и создавать проблемы с программным обеспечением JIRA непосредственно от постмертем, чтобы обеспечить принятие действий для улучшения от каждого инцидента. Узнать больше Отказ
* Автоматизация Действия для * * Opsgenie: * Инцидентные респонденты часто принимают предсказуемые, повторяющиеся действия в ответ на предупреждение. Эти действия могут включать в себя собрание больше информации о конкретной системе, работающей с сетевой диагностики, увеличения облачных ресурсов или перезапуска службы. Действия Automation позволяют запустить автоматические сценарии и игровые книги через 3-й партийные платформы. Opsgenie теперь предлагает поддержку двух методов интеграции автоматизации: AWS Systems Manager и общий конечный точку отдыха. Команды могут интегрировать с этими платформами, чтобы вызвать автоматические задачи прямо из консоли Opsgenie или мобильного приложения. Это экономит время респондентов, уменьшает количество приложений, которые необходимо использовать во время ответа на инциденту, и может положительно влиять на МТТР. Узнать больше.
Tweet Этот отчет, получите плакат
Любой, кто твитет, получит бесплатные HUDOPS PASTER для отображения в качестве напоминания о том, что ваша команда поддерживается при забастовках простоя в 2019 году …
Эта статья появилась первой на Атласский блог Отказ
Оригинал: «https://dev.to/atlassian/194-years-of-downtime-looking-back-on-incident-data-from-2018-3j85»