Пользователи облачной инфраструктуры VMware Cloud в части гибридных облаков (то есть комбинации онпремизных ресурсов и инфраструктуры публичного облака) имеют в своем распоряжении такой инструмент, как CloudHealth. С помощью него можно получить информацию о доступности и состоянии всех облачных ресурсов различных вендоров в единой консоли администратора.
Сегодня мы рассмотрим пример поиска причины проблем (Root Cause Analysis), которые возникают в виртуальной инфраструктуре. Метод RCA основан на обнаружении и исследовании аномалий, которые администратор может изучить путем анализа основных показателей виртуальной облачной среды.
CloudHealth позволяет не только обнаружить саму аномалию, но и посмотреть дополнительную информацию о ней, например, вот что мы можем увидеть в аналитике инстанса Amazon EC2:
Как мы видим, в какой-то момент произошло увеличение затрат на содержание инфраструктуры. Далее мы можем "провалиться" в детальный RCA-анализ аномалии, нажав на кнопку View Root Cause в правом верхнем углу:
На картинке выше мы видим, что в какой-то момент существенно увеличился объем передаваемых данных. Чтобы увидеть, когда именно больше всего выросли затраты, можно отсортировать колонку Unblended Cost по убыванию - это даст нам возможность понять, что произошло:
Теперь рассмотрим пример для службы AmazonS3 Service. Также перейдем к конкретному ресурсу, который вызвал данную аномалию:
Здесь мы видим, что 14 апреля произошел всплеск запросов Tier-2, что и привело к увеличению затрат на сервис (то есть проблема не заключается, например, в изменении стоимости услуг со стороны Amazon/VMware).