Как многие помнят, в VMware Virtual Infrastructure 3.5 была такая возможность как Virtual Machine Failure Monitoring, о которой мы писали. В VMware vSphere эта возможность доступна из графического интерфейса, называется VM Monitoring и является одной из частей кластера высокой доступности VMware HA.
Напомним приведенные на картинке параметры:
Failure interval – Виртуальная машина объявляется зависшей и перезагружается, если в течение 30 секунд не получено хартбитов от VMware Tools.
Minimum Uptime - Это время дается на загрузку виртуальной машины и инициализацию VMware Tools для начала обмена хартбитами.
Maximum per-VM resets - Максимальное число автоматических перезагрузок из-за неполучения хартбитов, допустимое за время, указанное в параметре ниже (within 1 hours). Если данное количество перезагрузок (3) произошло в течение 1 часа механизм VMware VM Monitoring отключается, но через этот час включится снова. Если установлено значение «No window», то Maximum per-VM resets означает абсолютное число отказов или зависаний ОС, после которого автоматические перезагрузки виртуальной машины прекращаются и отключается VM Monitoring для виртуальной машины. Когда VMware VM Monitoring отключен - HA продолжает мониторить зависания виртуальных машин, а vCenter выводить алармы.
Как показано на рисунке, можно также перекрыть настройки отдельной виртуальной машины, выбрав для нее соответствующий уровень чувствительности VMware VM Monitoring. Можно также выставить чувствительность для всех машин кластера VMware HA в целом.
Для успешной диагностики проблемы перезагрузки виртуальной машины, механизм VM Monitoring делает скриншот ее консоли и кладет его в папку с vmx файлом. В этой папке может храниться до 10 скриншотов, сделанных VMware VM Monitoring.