Некоторые из вас знают, что в VMware vSphere есть механизм удаленного сбора дампов с серверов VMware ESXi, которые иногда выпадают в "розовый экран смерти" с диагностической информацией в случае критической ошибки.
Для сбора диагностической информации используется специальная служба ESXi dump collector service, которая принимает дамп хост-сервера по сети. Но сначала эту службу надо включить на сервере VMware vCenter (в частности, на vCenter Server Appliance). Для этого надо в vSphere Web Client пойти сюда:
Home > Administration > System Configuration > Services > VMware vSphere ESXi Dump Collector > Start
Кроме этого, нужно задать порт для приема дампов, а также надо сконфигурировать максимальный размер репозитория в гигабайтах, задав параметр Repository max size.
Теперь надо сконфигурировать параметры отправки кордампов через сеть на хостах ESXi. Сначала выполним следующую команду для проверки текущего статуса:
esxcli system coredump network get
Зададим сетевые параметры отправки дампов :
esxcli system coredump network set -- interface -name vmk0 -- server -ipv4 172.20.10.94 --server -port 6500
И включим службу сбора дампов:
esxcli system coredump network set --enable true
Проверим параметры отправки:
Теперь можно выполнить следующую команду для проверки параметров:
esxcli system coredump network check
Теперь, чтобы проверить, что vCenter Server Appliance принимает дампы, надо открыть следующий файл:
/var/log/vmware/netdumper/netdumper.log
Мы увидим там примерно следующую картину:
Теперь принудительно отправим ESXi в розовый экран командой CrashMe и заглянем в этот же файл еще раз:
Мы видим, что теперь появилась запись о дампе var/core/netdumps/ffff/172/20/10/52/zdump_ffff.172.20.10.52-2017-01-05-09_53-0. Откроем этот файл и увидим содержание дампа, появляющегося при крэше ESXi: