Рубрики
Uncategorized

3 Фундаментальные методы мониторинга, необходимые для каждого инженера DevOps 🚀💥

Метод использования | Красный метод | Четыре золотых сигнала, использующие приложения в масштабе, … Tagged с DevOps, Docker, Monitoring, SRE.

Метод использования | Красный метод | Четыре золотых сигнала

Запуск приложений в масштабе не является средней задачей. Приложения сейчас более глобальны, чем когда -либо. А с этой шкалой возникает сложность управления многочисленными системами, услугами и сторонними интеграциями.

Современные распределенные системы чреваты проблемами и ловушками на каждом этапе их жизненного цикла: разработка, тестирование, развертывание и работа в производстве.

Наиболее важным этапом является то, что ваше приложение находится в руках его пользователей. Как ваши инфраструктуры, так и прикладные услуги должны постоянно контролироваться по вопросам, которые могут повлиять на опыт конечного пользователя.

Но современные системы могут излучать тысячи или миллионы метрик, и современные инструменты мониторинга могут собрать все это. Но это никогда не бывает эффективно.

В этой статье я хочу поговорить о некоторых методологиях, используемых для мониторинга приложений. Эти методологии могут направлять ваши стратегии мониторинга и служить превосходными отправными точками, чтобы получить большую видимость в ваших развернутых приложениях.

Эти методы дают вам прочную отправную точку, чтобы определить, что вы должны контролировать. 🔍

Signoz — Инструмент с открытым исходным кодом и инструмент наблюдения. Альтернатива Datadog.

Проверьте наш GitHub Repo👇

Signoz/Signoz

Signoz помогает разработчикам отслеживать свои приложения и проблемы с устранением неполадок, альтернативу DataDog, Newrelic и т. Д. 🖥 🖥 🖥. 👉 Мониторинг производительности приложения с открытым исходным кодом (APM) и инструмент наблюдения

Следите за своими приложениями и устранением проблем в развернутых приложениях, альтернативу открытым исходным кодам Datadog, новой реликвии и т. Д.

Документация • Readme на китайском языке • Slack Community • Twitter

Signoz помогает разработчикам отслеживать приложения и устранения проблем в их развернутых приложениях. Signoz использует распределенную трассировку, чтобы получить видимость в вашем программном стеке.

👉 Вы можете увидеть такие показатели, как задержка P99, частота ошибок для ваших услуг, внешние вызовы API и отдельные конечные точки.

👉 Вы можете найти основную причину проблемы, перейдя на точные следы, которые вызывают проблему, и просмотреть подробные пламенные графики отдельных следов запроса.

Присоединяйтесь к нашему сообществу Slack

Приходите, скачите нам привет Слаб 👋

Функции:

  • Метрики обзора приложений, такие как RPS, 50 -й/90 -й/99 -й процентиль задержек и частота ошибок
  • Самые медленные конечные точки в вашем приложении
  • См. Точный след запроса, чтобы выяснить проблемы в сфере услуг, замедленных запросов DB, позвоните в сторонние услуги, такие как оплата …

Метод использования

Использование является аббревиатурой для использования, насыщения и ошибок. Он был разработан Бренденом Греггом, который достаточно известен своей работой по анализу производительности систем. Этот метод может быть использован для быстрого решения общих проблем производительности, не пропуская важные области.

«Как аварийный контрольный список в руководстве по полету, он предназначен для того, чтобы быть простым, простым, полным и быстрым». -Brenden Грегг

Метод использования может быть обобщен как: для каждого ресурса проверьте использование, насыщение и ошибки.

Метрики обычно выражаются в следующих терминах:

  • Использование: среднее время, когда ресурс был занят обслуживанием.
  • Насыщение: степень, в которой ресурс имеет дополнительную работу, которую он не может обслуживать, часто в очереди.
  • Ошибки: количество событий ошибок.

Пример метрического списка на основе использования для операционных систем Linux👇

Метрический список на основе использования для операционных систем Linux (Источник)

Красный метод

Красный обозначает три метрики, которые вы должны измерить для каждого микросервиса в вашей архитектуре. Метрики:

  • Ставки на запросы — количество запросов в секунду обслуживает ваши услуги.
  • Ошибки — количество неудачных запросов в секунду.
  • Продолжительность — Распределение количества времени, которое требуется каждый запрос.

Красные метрики сосредоточены на измерении вещей, о которых заботятся конечные пользователи при использовании ваших услуг.

Красные метрики можно легко отслеживать с помощью инструментов APM и наблюдения, таких как Подписание .

Красные метрики, как показано в инструменте APM,
(Signoz)
.

Ставки запроса Дайте вам представление о пропускной способности используемой услуги. Это может помочь вам избежать сбоя путем мониторинга пикового трафика.

Ошибки оказывать прямое влияние на опыт конечного пользователя, и, следовательно, необходимым показатели ошибок. Неправильные, неполные или неожиданные запросы пользователей могут быть определены как ошибки. Определение точной причины ошибок может быть реальной болезнью для технических команд, часто требуя глубокого ухода в код приложения. Именно здесь могут помочь приложения мониторинга производительности, такие как Signoz.

Продолжительность В контексте микросервисов обычно обнаруживается с использованием метода, называемого распределенным трассировкой. Короче говоря, распределенная трассировка — это метод, с помощью которого пользовательский запрос отслеживается в разных службах, измеряя время, проведенное событиями через каждый микросервис.

Использование Flamegraphs на
(Signoz)
Панель инструментов, вы можете свернуть в события, занимая больше времени.

Четыре золотых сигнала Google

Четыре золотых сигнала Google тесно связаны с красными метриками. На самом деле, красные метрики-это непредвзятость золотых сигналов.

Инженеры по надежности сайта Google определили четыре золотых сигнала мониторинга как задержку, трафик, ошибки и насыщение.

Задержка

Медленный это новый вниз , они говорят. Задержка определяется как время, необходимое для обслуживания запроса. Google также предостерегает различие между задержкой успешных запросов и задержкой неудачных запросов. Неудачные запросы могут быть быстрыми, но если они включены в расчеты задержки, они могут вводить в заблуждение.

Движение

Трафик является мерой объема активности в вашем приложении. Это может быть измерено в любой высокоуровневой системной метрике. Например, в веб -приложениях трафик обычно измеряется HTTP -запросами в секунду.

Ошибки

Ошибки, как обсуждалось ранее, являются скоростью запросов, которые не сняты. Это могут быть экземпляры явных ошибок, таких как HTTP 500S или неявные, такие как HTTP 200 с неправильным поставленным контентом.

Насыщенность

Как следует из названия, насыщение — это «полная» ваша система. Насыщение системы может быть сложной задачей измерять время от времени. Он напрямую связан с показателями использования системы. Иногда сбои могут происходить, даже когда система не используется на 100%. Следовательно, выбор цели использования важен.

Измерение насыщения также является специфичным для системы. Например, для систем с ограниченными памятью используется использование памяти. Для баз данных и потоковых приложений могут использоваться скорости ввода -вывода диска.

С помощью этих методов вы можете создать методы мониторинга в вашей организации. Выбор правильного инструмента для мониторинга вашего приложения имеет решающее значение в этом отношении.

Если вам интересно, проверьте Signoz -Полный источник с открытым исходным кодом и инструмент наблюдения. Вы можете самостоятельно самостоятельно, чтобы начать с мониторинга ваших красных метрик. Signoz использует Opentelemetry для инструментов, которая поддерживает все популярные языки, такие как Java, Python, Golang, Nodejs и т. Д.

Проверьте наш GitHub Repo 👇

Signoz/Signoz

Signoz помогает разработчикам отслеживать свои приложения и проблемы с устранением неполадок, альтернативу DataDog, Newrelic и т. Д. 🖥 🖥 🖥. 👉 Мониторинг производительности приложения с открытым исходным кодом (APM) и инструмент наблюдения

Следите за своими приложениями и устранением проблем в развернутых приложениях, альтернативу открытым исходным кодам Datadog, новой реликвии и т. Д.

Документация • Readme на китайском языке • Slack Community • Twitter

Signoz помогает разработчикам отслеживать приложения и устранения проблем в их развернутых приложениях. Signoz использует распределенную трассировку, чтобы получить видимость в вашем программном стеке.

👉 Вы можете увидеть такие показатели, как задержка P99, частота ошибок для ваших услуг, внешние вызовы API и отдельные конечные точки.

👉 Вы можете найти основную причину проблемы, перейдя на точные следы, которые вызывают проблему, и просмотреть подробные пламенные графики отдельных следов запроса.

Присоединяйтесь к нашему сообществу Slack

Приходите, скачите нам привет Слаб 👋

Функции:

  • Метрики обзора приложений, такие как RPS, 50 -й/90 -й/99 -й процентиль задержек и частота ошибок
  • Самые медленные конечные точки в вашем приложении
  • См. Точный след запроса, чтобы выяснить проблемы в сфере услуг, замедленных запросов DB, позвоните в сторонние услуги, такие как оплата …

Оригинал: «https://dev.to/ankit01oss/3-fundamental-monitoring-methods-essential-for-every-devops-engineer-4a5i»