Рубрики
Uncategorized

Как SLO помогают вашей команде с владением обслуживанием

Первоначально опубликовано по неудаче, неизбежно. Соблюдение услуг становится лучшей практикой для чая … Tagged с DevOps, SRE.

Первоначально опубликовано на Неудача неизбежна Анкет

Владение услугами становится лучшей практикой для команд, стремящихся к инновациям, сохраняя при этом уровень надежности, который ожидают клиенты. Соблюдение услуг означает просмотр сервиса на протяжении всего жизненного цикла. Короче говоря, это означает, что вы строите его, вы запускаете его. Вы будете нести ответственность за безопасность, надежность, производительность и качество Сервиса.

Это не означает, что у вас не будет помощи от SRES для оптимизации или автоматизации труда. Это означает, что, как разработчик, вам нужно создавать с учетом качества, поскольку вы будете на вызове, если ваш код сломается.

Соблюдение услуг приходит со многими преимуществами как команде, так и для организации. Владение услугами имеет решающее значение, потому что, как Вице -президент Instacart инфраструктуры Дастин Пирс отмечает: «Развязка людей, которые создают, и людей, которые владеют проблемами, создают проблемы, как в программном обеспечении, так и в процессе. Качество падает «.

Но может быть трудно понять, с чего начать, где Цели уровня обслуживания (SLOS) может иметь большое значение. SLO могут помочь командам по:

  • Абстрагируя сложность и создание общего языка вокруг показателей обслуживания (как в этом тематическом исследовании из Twitter )
  • Помощь командам определять приоритеты ключевых путешествий пользователей
  • Объединяющие стимулы по заинтересованным сторонам (продукт, инженерия, OPS)
  • Предоставление данных, чтобы оправдать, где сосредоточиться на инженерных усилиях

Команды, которые являются новичками в владении обслуживанием, могут чувствовать себя пугающими, поскольку это происходит со значительными обязанностями. Бремя вызовов может стать кошмаром, если команды постоянно получают страхование на оповещениях с низким сигналом или ложными срабатываниями. Таким образом, первый шаг — определить, что делает для здоровой системы. Это помогает гарантировать, что команда ориентирована на значения сигналов. Поскольку инженеры не в прямом контакте с клиентами, может быть трудно измерить их опыт. SLOS может обеспечить важный контекст для этого.

Как сказал Дастин, «поиск этих показателей надежности или уровня обслуживания, и определение некоторых целей в отношении того, как вы измеряете надежность, доступность или правильность, давно существует вокруг. Не то чтобы мы изобрели сигналы здесь. Ключ в том, как мы можем собрать эти сигналы вместе в сплоченном виде ».

Другими словами, SLO — это проверка температуры для счастья ваших клиентов, чтобы предотвратить резкие последствия нарушения вашей SLA. Итак, вы должны убедиться, что метрики, которые вы измеряете, имеют значение для своих пользователей.

Потратьте время, чтобы пройти через путешествие пользователя и определить Slis ваши клиенты заботятся о Анкет Затем оптимизируйте для этих болевых точек. Загрузка страницы заказа загружается слишком медленно? Сервис недоступен в часы пик спроса? Сосредоточьтесь на этих показателях для ваших SLOS и установите оповещения, чтобы убедиться, что потенциальные нарушения бюджета ошибки рано увеличиваются.

Еще одним преимуществом владения услугами является получение всех заинтересованных сторон на одной странице. Чтобы это произошло, каждый должен быть на борту, от разработчиков до уровня C. Все стороны должны будут договориться о SLO, политике эскалации и предлагаемом воздействии на клиента, что, опять же, очень сложно, но пожинает огромные выгоды, если все сделано правильно. Настоящее соглашение станет вашей политикой бюджета ошибок: процесс, который кодифицирует то, что происходит при нарушении SLO.

Это не может быть мандатом от руководителей, который должен подчиняться инженерии. В то время как успешная реализация SLO требует культурной трансформации и сверху вниз, создание SLO должно быть связано с низовыми усилиями с лидерством, позволяя инженерам управлять усыновлением. В статье о Поездка на надежность Твиттера , Sres Brian, Zac и JP указывают на поддержку лидерства как важную для обеспечения надежности первоклассным приоритетом, который помог катализировать инициативы и наем для поддержки надежности.

Чтобы получить выравнивание, сначала проведите собрания команды, чтобы определить, что наиболее важно для клиента и установить SLO. Затем поговорите с руководством. Поделитесь, как SLO могут помочь сэкономить время и избежать инцидентов. Далее, возьмите его в исполнительный уровень И объясните, что SLO -SLOS позитивного влияния на бизнес.

Как только все будут на одной странице на целевых показателях, команды будут чувствовать себя более уверенно в отношении владения услугами.

SLOS также помогает командам указывать на данные, чтобы сделать сложные, но важные компромиссы между инновациями и надежностью. В современном быстро меняющемся мире SaaS этот баланс имеет решающее значение. Как сказал Дастин: «Ты должен двигаться. Вы должны инновации. Вы должны быстро захватить рост маркетинга, потому что, если вы этого не сделаете, кто -то собирается взорвать вас. Это так. Машины и возможность создать компанию и далеко пойти с тремя людьми, а ноутбук абсурдно ».

Если вам не удастся вводить новшества достаточно быстро, ваш клиент перейдет на более блестящие продукты. Но если вы бежите слишком быстро и накапливаете технический долг, вы можете столкнуться с заморозом кода, предоставив конкурентам возможность превзойти вас. На сегодняшний день принятие решений о том, куда инвестировать было в значительной степени политическим или просто догадки. Этот баланс становится легче ударить с помощью SLO.

SLO и их соответствующие бюджеты ошибок дают руководящие принципы команды, когда отправить. Если в вашем бюджете ошибок есть много места для маневра в конце окна, отправьте! Если вы слишком часто нарушаете SLO, пришло время замедлить и укрепить надежность. В конце концов, наиболее важной особенностью является знание: «Это просто работает». Это помогает держать дорожную карту продукта, сосредоточенную на потребностях клиента.

Хотя владение услугами может быть сложной задачей, SLO — хорошее место для начала.

У Дастина были некоторые вдохновляющие советы, чтобы поддерживать команды владения обслуживанием впереди игры: «Идея о том, что вы энергично приоритет и всегда бросаете вызов своим предположениям и никогда не сидите на лаврах, важна. Большинство лидерских групп согласны с тем, что это то, что нас соединяет ».

С помощью SLO вы сможете быстро работать, не жертвуя качеством, и гарантировать, что показатели, с которыми вы контролируете, отражают потребности клиентов при улучшении сигнала: шум для вашей команды по вызову. Все эти вещи являются отличительными знаками исключительного владения услугами.

Если вам понравилась эта статья, проверьте их:

Оригинал: «https://dev.to/blameless/how-slos-help-your-team-with-service-ownership-3hn6»