Общим SLA может быть время отклика.
Допустим, ваш SLA заключается в том, что каждый запрос будет разрешен в течение 300 мс, тогда вы можете установить SLO 200 мс.
Важно заметить, что вы обнаружите, что вы нарушаете свой SLO, прежде чем преодолеть соглашение клиентов и уровень обслуживания.
Возвращение к концепции надежности считается функцией — если у вас есть четкий SLO на время отклика, а затем вы начинаете ломать ее, то это, по сути, показатель того, что скорость функции должна замедлить, а инвестиции в надежность/производительность должны быть приоритетными. Ура!
Теперь эта часть я люблю! Ключевым понятием вокруг элемента, который вы собираетесь измерить, является Индикатор уровня обслуживания (SLI)
Так, например, измерение времени отклика будет сделано путем проверки задержки. Так что задержка — это ваш SLI.
SLI, как правило, выражаются как доля событий, которые были хорошими. НАПРИМЕР. Сколько запросов было в пределах отметки 200 мс против того, сколько запросов в общей сложности.
Вау, даже я теперь ненавижу аббревиатуры, но давайте продолжим.
Таким образом, мы измеряем время отклика, и мы знаем, сколько запросов было отмечено как хорошее (200 мс или меньше) из всех наших запросов.
Но какая цель SLO мы можем поставить?
У них есть несколько ключевых функций.
- Обычно в процентном уровне стоимость
- Используйте SLI
- Сроки (например, Последние 4 недели)
Например:
99% запросов упадут в течение 200 мс за последние 4 недели.
Оригинал: «https://dev.to/eggsy84/gcp-devops-certification-day-five-5ck6»