Рубрики
Uncategorized

Насколько древнесляют и стр.

У меня было удовольствие разговаривать со многими организациями о своих операциях практики и как они … помечены DevOps, Sre.

У меня было удовольствие разговаривать со многими организациями по поводу своих операций по эксплуатации и о том, как они думают о проблемах, которые они сталкиваются с поддержанием производственной среды, которая адекватно служит их бизнесу. Я еще не встречал организацию, которая не пришлось сбалансировать часто противоречивые потребности вокруг функции скорости и эксплуатационной стабильности. Проще говоря, это классические «Devs Gotta» (клиенты хотят функции и функциональности), а OPS должен держать вещи работать (системы, которые не могут служить клиентам) «дихотомию, с которыми все борется.

Два «движения» (из-за отсутствия лучшего слова) возникли в прямом ответе на эту проблему: DEVOPS и инженерии надежности на сайте (SRE). Первый лучше известен, потому что он вырос в более публичной сфере. Во-вторых, до сравненно недавно недавно было подкреплено в более крупных организациях как часть их усилий по масштабированию операций за пределы чего-либо планеты ранее. В результате публичное понимание и усыновление девопам значительно далее опережают СРР. Этот пост является попыткой обеспечить очень короткое введение в SRE и надеяться, что он может относиться к вашей существующей практике DevOps.

Также как ни одно каноническое определение для DEVOPS, я не буду притворяться, что смогу дать вам последнее слово на SRE. Вы услышите диапазон ответов, начиная с «SRE, — это то, что происходит, когда вы просим программный инженер для разработки операционной команды» на «Инженер по надежности на сайте (SRE) — это применение сценариев и автоматизации к нему операционным задачам, таких как обслуживание и поддержка «

Когда я говорю о SRE, я обычно описываю его как инженерная дисциплина, посвященная помощи организации, достичь соответствующего уровня надежности в своих системах, услугах и продуктах. Для этого определения есть две важные части: во-первых, SRE специально ориентирован на надежность в качестве фундаментальной собственности (возможно, фундаментальная собственность). Обоснование за этим довольно простым. Вы можете расходовать огромное количество усилий и ресурсов, добавляющих функции и функциональности на ваш сервис или продукт. Kerjillions of Dollars и бесчисленные часы можно утратить, чтобы создать что-то невероятно функциональность и функциональность богатых. Но если он не работает, если он не доступен, когда ваши клиенты пытаются использовать его, это не делает их или вашим бизнесом облизывание добра (или вашей прибыли).

Вторая, немного более тонкая часть моего определения висит на слово «уместно», когда говорится о уровне надежности. Важным наблюдением, сделанным миром SRE рано, заключалась в том, что на самом деле очень мало системных и услуг, которые должны быть на 100% надежны. На самом деле, существует очень мало ситуаций, когда даже желательно, потому что почти всегда стоимость достижения большей надежности от точки зрения затрат и усилий, повышается на очень крутой ставке. А как друзья в Google любит указывать, иногда даже не удается поражать определенные уровни надежности. Sre стремится не только признать этот разрыв между совершенной надежностью и желательной надежностью, но во многих случаях эксплуатируйте его для большего добра инженерных приоритетов организации.

Многие (большинство?) Из тех же проблем, которые были созданы для решения, были также та же мотивация для формирования дежобов. Я думаю о SRE и DEVOPS, так как параллельные треки оба пытаются решить те же проблемы. В результате не случайно, что некоторые из той же лучших практик являются требованиями для обоих наборов практики. Например, оба SRE и DEVOPS требуют, чтобы вы принесли автоматизацию, чтобы нести как способ устранения масштабирования (и других) проблем. Звуковые релиз инженерные процессы (включая CI/CD) необходимы для создания управляемой производственной среды. И любимые любые предметы: мониторинг и наблюдаемость — это ядро для практики SRE и DEVOPS.

Ну, не так много. В то время как в практике есть перекрытие, в философии, отношение и подходу нет эквивалеции в философии, отношения и подхода к двум практикам. Акцент в двух практиках часто может быть разным. Кроме того, для того, чтобы SRE добиться успеха EN MASSE, важные части организации должны быть готовы принять некоторые ценности и приоритеты, которые позволяют правильно действовать. По крайней мере, в нужных местах должен быть входящие в нужные места вокруг ценности надежности в бизнес, как обсуждалось ранее.

Очень важно различать преданные роли SRE (люди, которые называют себя инженерами надежности на сайт) и практики SRE. Во многих организациях, поскольку они растут, приходит точка перегиба, где становится целесообразным нанимать людей (а затем формировать их команды), чья опыт и основное внимание уделяются надежности. Важно отметить, что когда у вас есть такие люди на заработной плате, это не так, что они являются единственными людьми в организации, ответственную за уплату внимания на надежность (все отвечают за построение надежного программного обеспечения и инфраструктуры). Срес — это люди, у которых есть специализация, которую можно привлечь к этим проблемам. В связи с этим существует прямая аналогия для безопасности. В определенный момент это имеет смысл для бизнеса нанимать людей, которые сосредотачиваются в основном на безопасность. Они не единственные люди в организации, обращающей внимание на безопасность (они лучше не являются — безопасность — это ответственность всех), но они служат решающей ролью в отношении этой области.

Это роли, но как насчет практики SRE? До того, как упомянутое до упомянутой до точки перегиба, прежде чем вы наняли преданные СРЭС, это имеет смысл ввести некоторые более конгруэнтные практики SRE и инструменты SRE в вашей организации.

Часто развлеченные организации являются идеальным местом для посадки этих семян, потому что у них уже есть культура, которая ценит современные операционные практики (как упомянуто в развлечении выше). Легкий пример — один из близких и дорогих людям, которые управляют этим блогом: ответный ответ и последующий инцидент (безупречные постмортизации от этих инцидентов). Другой может быть вокруг создания целей уровня обслуживания (подробнее на этом в более позднем куске). По мере того, как эти практики становятся популярными, поскольку культура меняется в результате, и, поскольку некоторые люди начинают тяготеть к точке зрения, ориентированной на достоверность, становится естественным, чтобы рассмотреть вопрос о том, чтобы ввести в качестве постоянной роли для этих людей.

SRE предлагает набор принципов, практик/и особый фокус. Если у вас уже есть развлеченные культуры и практики в вашей организации, нет никаких веских причин прогуляться по залам, разрывающимся народным визитным карточкам и раздавлю новые титулы … На самом деле, не делайте этого (это тема для будущего поста в блоге).

Но если вы посмотрите на SRE и найдите его способность к локальному обращению о скорости функции против оперативной устойчивости. Эксперимент с некоторыми практиками и инструментами, которые облегчают усыновление. Посмотрите, может ли он предложить вам те же преимущества, пользующиеся многими организациями, которые уже провалили этот путь. И обязательно позвольте мне знать, как это идет для вас.

Если вы хотите увидеть, как платформа может помочь вам принять лучшие практики SRE (и DEVOPS) через Tools, безупречная команда может показать вам, как. Подпишитесь на пробную версию на www.blameless.com Отказ

Написано Дэвидом Blank-Edelman Первоначально опубликовано на Бесплатный блог Отказ

Оригинал: «https://dev.to/blameless/devops-and-sre-defined-20ek»