Умная блогосфера

//

23 февраля 2021, 11:13

Автор: Павел

Обзор компании Datadog

В этом обзоре рассмотрим компанию Datadog. Компания является лидером в области решений для мониторинга облачных приложений. Скорость разработки их продуктов является впечатляющей, за последний год количество платных решений увеличилось вдвое. Рассмотрим перспективу дополнительных возможностей на смежных рынках, также рассмотрим результаты отчета за 4 квартал 2020 года. С начала 2020 года акции росли быстрее индексов вместе с другими компаниями Saas. После выхода отчета котировки слегка скорректировались. Попробуем разобраться, что не понравилось инвесторам.

Сфера услуг мониторинга

Термины «наблюдаемость и мониторинг», приобрели в последнее время большую популярность, впервые они были введены около 7 лет назад. Одно из первых упоминаний об этом сделал Twitter в своем блоге в 2013 году. По мере того, как Twitter быстро рос и сталкивался со сбоями в работе, они перенесли свою внутреннюю архитектуру с одного приложения на набор распределенных облачных сервисов. Когда возникала проблема, влияющая на сайт, инженерам Twitter нужно было быстро устранить неполадки, чтобы определить основную причину. Это привело к созданию специальной группы по наблюдению, в обязанности которой входило: 1) создание центральной системы для сбора, хранения, запроса и визуализации данных о производительности всех разрозненных сервисов и 2) быстрого анализа всех этих данных при возникновении проблем, чтобы определить причину. Комбинация этих двух функций позволила команде по «наблюдаемости» быстро диагностировать и исправить проблемы сайта.

В процессе мониторинга собираются соответствующие данные о производительности систем и служб, отражающие их текущее состояние работы. Данные о производительности могут охватывать широкий диапазон показателей, от уровней ЦП до времени ответа на запросы. Он также может включать в себя базовые проверки доступности услуг.

Другой сегмент мониторинга - это анализ журнала. Каждая программная служба создает журнал активности. Сюда могут входить системные журналы, журналы безопасности или журналы приложений.

Третий аспект мониторинга - это трассировки (процесс пошагового выполнения программы). Трассировки дают представление о том, как запрос проходит через код приложения. Трассировка показывает каждый шаг процесса и сколько времени он занимает. Это позволяет оператору системы быстро увидеть, где может существовать узкое место.

Инструменты для этих типов мониторинга были доступны в течение долгого времени. Проекты с открытым исходным кодом сначала помогали системным операторам выполнять мониторинг, а затем появились коммерческие организации, чтобы сделать это проще.

Сначала каждый инструмент мониторинга был адаптирован к конкретному варианту использования, например, New Relic для трассировки приложений, Splunk для анализа журналов и т.д. Если возникнет проблема, влияющая на пользователя, например, отказ веб-сайта, системным операторам придется отчаянно переключаться между каждым из этих инструментов мониторинга, чтобы найти основную причину.

Полная наблюдаемость систем стала необходимостью в последние пять лет, из-за нескольких факторов:

Количество приложений. Компании создают множество новых автономных приложений для клиентов. Эти приложения часто создаются на заказ собственными разработчиками. Как только эти приложения будут приняты клиентами, время их безотказной работы станет критически важным для бизнеса.

Облачный хостинг. Миграция программных рабочих нагрузок в облако означает, что приложения размещаются на временных серверах и в новых контейнерах хостинга. Понятие сервера больше не привязано к одному физическому устройству в центре обработки данных компании, которое перезагружается один раз в год. В облаке экземпляры серверов постоянно меняются местами, часто при каждом выпуске или посредством автоматического масштабирования. Кроме того, больше не соблюдается однозначное соотношение между сервером и машиной.

DevOps. Сфера мониторинга услуг и решения проблем больше не является изолированной в рамках группы эксплуатации системы. Разработчики все чаще берут на себя операционную ответственность за производительность своих приложений. Это резко увеличивает ожидания в отношении инструментов и требований к контексту, поскольку разработчики не знакомы со всеми параметрами производительности на нижних уровнях серверного стека.

Уважаемый пользователь! Вы видите лишь 10% статьи, для прочтения оставшейся части, зарегистрируйтесь. Это займет не больше минуты



Теги: $DDOD, #Datadog