В наши дни есть много болтовни о наблюдении, событиях, метриках, мониторинге и т. П., В том числе отличный пост Синди Шридхаран по мониторингу и наблюдению.
Она занимается целым рядом исторических и различий между ними, включая более формальные определения, но я хотел бы взглянуть на нее по -другому, отчасти с точки зрения контролируемой системы.
В направлении мышления мониторинг — это пассивная коллекция метрик, журналов и т. Д. О системе, в то время как наблюдение — это активное распространение информации из системы. Глядя на это по -другому, с точки зрения внешнего «супервизора», я контролирую вас, но вы делаете себя заметным.
Для мониторинга не имеет значения, если метрики тянутся или продвигаются, так как это стратегия связи, но они почти полностью составлены свойствами или условиями о системе, ее ресурсах, состоянии, производительности, ошибках, задержке и т. Д. Любимые и склонны командами OPS и самыми современными разработчиками. Все основные сигналы SRE/использования вписываются в эту категорию.
Для наблюдения, система, код, разработчики и т. Д. Предпринимают шаг, чтобы сделать вещи доступными, чтобы сделать систему более заметной. Это часто начинается со все более богатых и структурированных журналов, плюс события или маркеры, точки данных JMX и испускаемые метрики в стиле Etsy. Любимый и склонность к разработчикам и самым современным операциям.
Мониторинг чаще всего используется для оповещения, устранения неполадок, планирования пропускной способности и других традиционных функций ИТ, обычно не слишком глубоко. Элементы наблюдения, с другой стороны, часто много детализируются, более разнообразны и используются больше для отладки, сложных устранения неполадок, анализа производительности и, как правило, «глубже».
Возможно, намерение также имеет значение, поскольку наблюдение системы может означать повышенный мониторинг поведения (часто через метрики), например, Как он ведет себя в соответствии с этим или иным условием, с этими входами, или если я потерпел эти ручки? Может быть, это третья категория вещей.
Теперь, конечно, все на самом деле не так просто, так как есть совпадение, особенно когда все становится выше в стеке. Использование ресурсов процессора довольно прочно в лагере мониторинга, но как насчет производительности приложений, если мы даже знаем, что это такое?
Или вы издаете достаточно информации, возможно, через контролируемые метрики, поэтому у разработчиков или OPS достаточно информации, чтобы знать, что не так, может быть, даже как это исправить. Границы немного неуловимы, там вдоль континуума.
Пост Синди рассказывает о контексте, который также становится все более важным. Мониторинг и наблюдение нуждаются в том, чтобы и взаимно его улучшают, в том числе предоставление гораздо более богатого набора контекстных наблюдений до и во время отключений, замедления и случайных задач дня.
Вывод
По мере того, как все становится более сложным, с более движущимися частями, и особенно более распределенными, нам нужно больше наблюдения. Нам также нужен больше и лучшего мониторинга, на более высоких уровнях стека и более глубоких уровнях системы, после чего это может быть очень похоже на наблюдаемость.
В конце концов, нам нужны все, и то, что это называется, не имеет большого значения. Различные команды могут использовать и сосредоточиться на разных терминах, направлениях и намерениях, но все это во имя того, чтобы сделать наши системы быстрее, более надежными и легче строить, управлять и устранение неполадок.
Оригинал: «https://dev.to/stevemushero/observability-vs-monitoring-is-it-about-active-vs-passive-or-dev-vs-ops-«