Современная инфраструктура не прощает простоев. Любая потеря доступности данных — это не только бизнес-риск, но и вопрос репутации. VMware vSAN, будучи ядром гиперконвергентной архитектуры VMware Cloud Foundation, всегда стремился обеспечивать высокую доступность и устойчивость хранения. Но с появлением Express Storage Architecture (ESA) подход к отказоустойчивости изменился фундаментально.
Документ vSAN Availability Technologies (часть VCF 9.0) описывает, как именно реализована устойчивость на уровне данных, сетей и устройств. Разберём, какие технологии стоят за доступностью vSAN, и почему переход к ESA меняет правила игры.
Архитектура отказоустойчивости: OSA против ESA
OSA — классика, но с ограничениями
Original Storage Architecture (OSA) — традиционный вариант vSAN, основанный на концепции дисковых групп (disk groups):
Одно кэш-устройство (SSD)
Несколько накопителей ёмкости (HDD/SSD)
Проблема в том, что выход из строя кеш-диска делает всю группу недоступной. Кроме того, классическая зеркальная защита (RAID-1) неэффективна по ёмкости: чтобы выдержать один отказ, приходится хранить копию 1:1.
ESA — новое поколение хранения
Express Storage Architecture (ESA) ломает эту модель:
Нет больше disk groups — каждый накопитель независим.
Встроен мониторинг NVMe-износа, зеркалирование метаданных и прогноз отказов устройств.
В результате ESA уменьшает "зону взрыва" при сбое и повышает эффективность хранения до 30–50 %, особенно при политике FTT=2.
Как vSAN обеспечивает доступность данных
Всё в vSAN строится вокруг объектов (диски ВМ, swap, конфигурации). Каждый объект состоит из компонентов, которые распределяются по узлам.
Доступность объекта определяется параметром FTT (Failures To Tolerate) — числом отказов, которые система выдержит без потери данных.
Например:
FTT=1 (RAID-1) — один отказ хоста или диска.
FTT=2 (RAID-6) — два отказа одновременно.
RAID-5/6 обеспечивает ту же устойчивость, но с меньшими затратами ёмкости.
Механизм кворума
Каждый компонент имеет "голос". Объект считается доступным, если более 50 % голосов доступны. Это предотвращает split-brain-ситуации, когда две части кластера считают себя активными.
В сценариях 2-Node или stretched-cluster добавляется witness-компонент — виртуальный "свидетель", решающий, какая часть кластера останется активной.
Домены отказов и географическая устойчивость
vSAN позволяет группировать узлы в домены отказов — например, по стойкам, стойкам или площадкам. Данные и компоненты одной ВМ никогда не размещаются в пределах одного домена, что исключает потерю данных при отказе стойки или сайта.
В растянутом кластере (stretched cluster) домены соответствуют сайтам, а witness appliance располагается в третьей зоне для арбитража.
Рекомендация: проектируйте кластер не по минимуму (3–4 узла), а с запасом. Например, для FTT=2 нужно минимум 6 узлов, но VMware рекомендует 7, чтобы система могла восстановить избыточность без потери устойчивости.
Поведение при сбоях: состояния компонентов
vSAN отслеживает каждое состояние компонентов:
Состояние
Описание
Active
Компонент доступен и синхронизирован
Absent
Недоступен (например, временный сбой сети)
Degraded
Компонент повреждён, требуется восстановление
Active-Stale
Компонент доступен, но содержит устаревшие данные
Reconfiguring
Идёт перестройка или изменение политики
Компоненты в состоянии Absent ждут по умолчанию 60 минут перед восстановлением — чтобы избежать лишнего трафика из-за кратковременных сбоев.
Если восстановление невозможно, создаётся новая копия на другом узле.
Сеть как основа устойчивости
vSAN — это распределённое хранилище, и его надёжность напрямую зависит от сети.
Транспорт — TCP/unicast с внутренним протоколом Reliable Datagram Transport (RDT).
Поддерживается RDMA (RoCE v2) для минимизации задержек.
Рекомендуется:
2 NIC на каждый хост;
Подключение к разным коммутаторам;
Active/Standby teaming для vSAN-трафика (предсказуемые пути).
Если часть сети теряет связность, vSAN формирует partition groups и использует кворум, чтобы определить, какая группа "основная". vSAN тесно интегрирован с vSphere HA, что обеспечивает синхронное понимание состояния сети и автоматический рестарт ВМ при отказах.
Ресинхронизация и обслуживание
Resync (восстановление)
Когда хост возвращается в строй или изменяется политика, vSAN ресинхронизирует данные для восстановления FTT-уровня. В ESA ресинхронизация стала интеллектуальной и возобновляемой (resumable) — меньше нагрузка на сеть и диски.
Maintenance Mode
При вводе хоста в обслуживание доступны три режима:
Full Data Migration — полная миграция данных (долго, безопасно).
Ensure Accessibility — минимальный перенос для сохранения доступности (дефолт).
No Data Migration — без переноса (быстро, рискованно).
ESA использует durability components, чтобы временно сохранить данные и ускорить возврат в строй.
Предиктивное обслуживание и мониторинг
VMware внедрила целый ряд механизмов прогнозирования и диагностики:
Degraded Device Handling (DDH) — анализ деградации накопителей по задержкам и ошибкам до фактического отказа.
NVMe Endurance Tracking — контроль износа NVMe с предупреждениями в vCenter.
Low-Level Metadata Resilience — зеркалирование метаданных для защиты от URE-ошибок.
Proactive Hardware Management — интеграция с OEM-телеметрией и предупреждения через Skyline Health.
Эти механизмы в ESA работают точнее и с меньшими ложными срабатываниями по сравнению с OSA.
Disaster Recovery — восстановление после катастрофы (вторая площадка, репликация, резервное копирование).
vSAN отвечает за первое. Для второго используются VMware SRM, vSphere Replication и внешние DR-решения. Однако комбинация vSAN ESA + stretched cluster уже позволяет реализовать site-level resilience без отдельного DR-инструмента.
Практические рекомендации
Используйте ESA при проектировании новых кластеров.
Современные NVMe-узлы и сети 25 GbE позволяют реализовать отказоустойчивость без потери производительности.
Проектируйте с запасом по хостам.
Один дополнительный узел обеспечит восстановление без снижения FTT-уровня.
Настройте отказоустойчивую сеть.
Два интерфейса, разные коммутаторы, Route Based on Port ID — минимальные требования для надёжного vSAN-трафика.
Следите за здоровьем устройств.
Активируйте DDH и NVMe Endurance Monitoring, используйте Skyline Health для предиктивного анализа.
Планируйте обслуживание грамотно.
Режим Ensure Accessibility — оптимальный баланс между безопасностью и скоростью.
Заключение
VMware vSAN уже давно стал стандартом для гиперконвергентных систем, но именно с Express Storage Architecture он сделал шаг от "устойчивости" к "самоисцеляемости". ESA сочетает erasure coding, предиктивную аналитику и глубокую интеграцию с платформой vSphere, обеспечивая устойчивость, производительность и эффективность хранения. Для архитекторов и инженеров это значит одно: устойчивость теперь проектируется не как надстройка, а как неотъемлемая часть самой архитектуры хранения.
Таги: VMware, vSAN, Availability, HA, DR, Storage, Whitepaper
Недавно компания VMware обновила решение Cloud Director Availability 4.7, которое предназначено для создания резервной инфраструктуры в одном из публичных облаков на основе VMware Cloud Director (так называемая услуга Disaster-Recovery-as-a-Service, DRaaS). Напомним, что о прошлой версии этого продукта мы писали вот тут.
Новый механизм репликации
До настоящего момента VMware Cloud Director Availability использовал независимые (independent) диски при репликации рабочих нагрузок в облака Cloud Director. Однако это не является их изначальным назначением, что может оказать отрицательное влияние на механику репликации в определенных случаях.
Для уменьшения действия этого фактора и дальнейшего улучшения стабильности и оперативности, а также для обеспечения возможности будущих улучшений, введена система отслеживания репликации Replication Tracking VM (RT VM). Она позволяет использовать новый способ репликации виртуальных машин, совместимый с продуктом Cloud Director Availability 4.7, который зарегистрирован в Cloud Director 10.5+.
Запущенные репликации не будут затронуты этим изменением после обновления VMware Cloud Director Availability. Существует опция для их миграции с независимых дисков на RT VM через пользовательский интерфейс VMware Cloud Director Availability.
Все новые репликации будут использовать этот новый механизм размещения.
Выбор политики хранения
VMware Cloud Director Availability 4.7 получил две новые функции, связанные с выбором политики хранения:
Выбор политики хранения для каждого диска
Переназначение политики хранения во время восстановления рабочей нагрузки
Выбор политики для каждого диска
В предыдущих версиях VMware Cloud Director Availability при выборе политики для репликации применялись одни и те же настройки для всех ее дисков. В версии 4.7 вы теперь можете указать политику для каждого диска, сохраняя при этом остальные функции, такие как исключение диска или использование Seed VM.
Эта функция доступна как для облаков Cloud Director, так и для vSphere с одним отличием - для облаков vSphere вы можете выбрать политику хранения и хранилище размещения для каждого диска.
При использовании seed VM репликация будет использовать ее настройки хранилища, и вы не сможете их указать.
Переназначение политики во время восстановления рабочей нагрузки
С учетом оптимизации затрат часто принято использовать медленное, но более дешевое хранилище для данных. Это актуально и для репликаций, где с течением времени может накапливаться большой объем данных.
Однако скорость хранилища может негативно сказаться на производительности рабочей нагрузки при ее переключении в случае сбоя. Чтобы сэкономить клиентам сложный выбор того, где именно пойти на уступки, VMware Cloud Director Availability 4.7 позволяет использовать конкретные настройки хранилища при начальной настройке репликации, а затем выбрать другие настройки при восстановлении реплик.
Эта новая функция доступна как для облаков vSphere, так и для облаков Cloud Director.
Предварительная проверка выполнения планов восстановления
При использовании планов восстановления довольно неприятно достичь определенного этапа их выполнения и обнаружить, что некоторые настройки репликации не настроены, что приводит к неудачному завершению плана. Предварительная проверка выполнения планов восстановления убирает это неудобство и уменьшает время, затрачиваемое на проверку обязательных конфигураций, необходимых Cloud Director Availability для завершения репликации или набора репликаций.
Эти проверки учитывают значительные изменения в инфраструктуре облака, проверяют настройки размещения и наличие недостающих настроек восстановления, а также доступность исходного сайта для случаев миграции.
Эта информация доступна в новой вкладке "Health", которая присутствует в каждом плане восстановления при его выборе. Там вы можете увидеть, когда была проведена последняя проверка, а также доступные действия для устранения обнаруженной проблемы.
Механизм vSphere DR и поддержка миграций Seed VM
В рамках улучшений по обеспечению равенства функций для точек назначения vSphere и Cloud Director, теперь можно выбрать начальную виртуальную машину (Seed VM) при репликации рабочих нагрузок в облака vSphere.
Улучшения для облаков VMware Cloud Director
Появилось несколько новых функций, которые решают проблемы для поставщиков облачных услуг и их клиентов, которые реплицируют рабочие нагрузки в облака назначения Cloud Director:
Передача меток безопасности NSX, связанных с реплицированной виртуальной машиной при инициировании миграции/восстановления между двумя облаками, работающими на VMware Cloud Director 10.3+.
Автовыбор политики сайзинга при cloud-to-cloud - если виртуальной машине назначена политика сайзинга на исходном сайте, и на назначенном сайте существует политика с таким же именем, она будет автоматически выбрана при настройке репликации.
Управление видимостью удаленных облачных сайтов - поставщики облачных услуг могут контролировать, какие партнерские сайты будут видны для каких организаций. Если сайт, на котором активны репликации, скрыт, они будут продолжать отображаться в пользовательском интерфейсе, но невозможно будет создавать новые репликации в/из скрытого сайта.
Управление политиками для направлений репликации - доступные средства управления расширяются еще одной новой опцией для поддержания возможного направления операций репликации для клиента облака. С ее помощью поставщики облачных услуг могут ограничить клиентов в защите рабочих нагрузок, работающих в облаке, только в направлении их собственного датацентра.
Более подробную информацию о VMware Cloud Director Availability 4.7 можно получить по этой ссылке.
Таги: VMware, vSphere, Cloud, Availability, Director, Update, DR
На днях компания VMware объявила о выпуске пакета управления vRealize Operations Management Pack for Cloud Director Availability версии 1.2. Напомним, что он предназначен для сбора информации о задачах репликации в инстансах VMware Cloud Director Availability и предоставления относящихся к репликации свойств и метрик в решение vRealize Operations (оно теперь называется Aria Operations). Это позволяет ИТ-специалистам сервис-провайдеров получать информацию о состоянии задач репликации и потреблении ими системных ресурсов.
VMware vRealize Operations Management Pack for Cloud Director Availability 1.2 поддерживает следующие версии продуктов облачной инфраструктуры:
VMware Cloud Director Availability 4.4.x или более поздние (версии 4.2 и 4.3 НЕ поддерживаются)
VMware Cloud Director 10.1.4 – 10.4.x
VMware vRealize Operations TenantApp – 8.6.x или более поздние
VMware vRealize Operations Management Pack for VMware Cloud Director 8.6.x или более поздние
VMware vRealize Operations 8.6.x или более поздние
Теперь давайте посмотрим на новые возможности пакета:
1. Новые метрики
Теперь в VMware vRealize Operations Management Pack for Cloud Director Availability 1.2 появились метрики касательно нарушения политики RPO, а также миграций шаблонов объектов виртуальных приложений vApp.
Кроме того, на базе запросов от облачных провайдеров, теперь появился ресурс Site, для которого собираются метрики состояния системы - свободное дисковое пространство, доступность сервиса, статус соединений между компонентами, проблемы с лицензиями и сертификатами и многое другое.
Эти метрики доступы в инстансе Cloud Director Availability в разделе Provider Incoming Replications:
На базе метрик репликации и состояния системы пакет Operations Management Pack for Cloud Director Availability 1.2 предоставляет набор из 13 встроенных алертов с их определениями симптомов, размещенных на дэшборде состояния системы. Алерты покрывают большинство проблемных ситуаций, которые могут произойти со службой VMware Cloud Director Availability Cloud, а также нарушениями политик RPO и репликации в целом.
Ввиду того, что конфигурации инфраструктур облачных провайдеров очень разные, алерты не включаются автоматически в политику и находятся в деактивированном состоянии. Их нужно вручную добавлять в политику и активировать после установки Management Pack.
Дэшборд VCDA Sites Health можно найти в разделе дэшбордов All > Cloud Director Availability. Там будет показана информация о метриках статуса сайта для экземпляра VMware Cloud Director Availability. Также пользователям доступна визуализация связей между компонентами для всех репликаций, а также все алерты объектов, чтобы иметь возможность получить к ним доступ напрямую.
Не все метрики включены в дэшборд по умолчанию, но вы можете добавлять и исключать их в любой момент.
Загрузить vRealize Operations Management Pack for Cloud Director Availability 1.2 можно по этой ссылке, Release Notes доступны тут.
Совсем недавно компания VMware выпустила обновленную версию своего решения для обеспечения высокой доступности датацентров на базе VMware Cloud Director - Cloud Director Availability 4.4. По-сути, Cloud Director Availability предназначен для создания резервной инфраструктуры в одном из публичных облаков сервис-провайдеров на основе VMware vCloud Director (так называемая услуга Disaster-Recovery-as-a-Service, DRaaS). Сегодня мы посмотрим на новые возможности этого продукта...
Недавно компания Veeam Software, производитель лучших решений для обеспечения доступности виртуального датацентра, выпустила обновление платформы Veeam Cloud Data Management Platform, в состав которой входит самое известное решение для защиты виртуальных сред - Veeam Backup and Replication v11. Мы уже писали об RTM-релизе этого продукта, где вкратце рассказывали его новых возможностях, а сегодня разберем их подробнее.
Итак, собственно основные новые возможности Veeam Backup and Replication v11 (наш топ-15):
1. CDP : Continuous Data Protection
Эта технология позволяет настроить непрерывную защиту виртуальных машин средствами репликации таким образом, чтобы соблюдать заданные политики RPO (Recovery Point Objectives). Достигается это за счет использования технологии VMware VAIO (vSphere API for I/O filtering).
Для этого на хосты ESXi ставится специальный VIB-пакет (фильтр VAIO), который в режиме драйвера привязывается к нужным ВМ.
При создании CDP-политики вы задаете время в секундах, за которое вы можете себе позволить потерять данные в случае сбоя (RPO):
Short-term реплики будут crash-консистентными, а long-term можно уже настроить как Application-aware, чтобы быть уверенным в работоспособности приложений виртуальной машины в конкретной точке в прошлом.
2. Функции асинхронного процессинга
В Veeam v11 при чтении данных с репозиториев происходит их асинхронный процессинг. Это ускоряет процесс для Enterprise-оборудования, но может быть неудобно для недорогих систем хранения, поэтому эту опцию можно отключить в реестре.
3. Возможность Backup Copy Retention
Политика хранения задач Backup copy job теперь имеет такую же логику, как и primary backup job - то есть GFS (Grandfather-Father-Son).
4. Улучшенная работа с тэгами vSphere
Теперь вы можете использовать оператор AND для добавления условия по комбинациям тегов при поиске и создании задач.
5. Представления избранных фильтров
Теперь представление с избранными фильтрами есть в управляющем дереве наравне с самими фильтрами.
6. Защищенный Linux-репозиторий
Возможность создания на Linux-репозиториях бэкапов, которые нельзя удалить (immutability), в целях защиты от вредоносных действий, который может предпринять злоумышленник, заметая следы (также это очень полезно в борьбе с Ransomware, когда может возникнуть ситуация, что вас нет рабочих систем, а бэкапы удалены). Кроме того, это может защитить от намеренной порчи данных изнутри организации.
Очень подробно об этой возможности на русском языке рассказано тут. Эта технология, по аналогии с Instant VM Recovery, позволяет быстро восстановить поврежденную или удаленную базу данных MS SQL из резервной копии. Для этого надо зайти в Restoring Application Items -> Microsoft SQL Server. Далее в Veeam Explorer для нужной базы нужно выбрать опцию Instant Recovery.
Работает сама технология по такой схеме:
8. Возможность восстановления файлов Linux без необходимости развертывания виртуального модуля Helper Appliance
Теперь вам не нужно развертывать эти виртуальные модули, чтобы иметь возможность быстро восстанавливать файлы на Linux. Бэкап можно примонтировать к любой Linux-машине напрямую. Теперь восстановление будет работать быстрее, так как не нужно тратить время на развертывание helper appliance.
Отдельные файлы можно восстанавливать также и в системах IBM AIX, MAC и Oracle Solaris.
9. Улучшенные режимы Linux Backup Proxy
Теперь можно использовать не только методику hot-add, как было в 10-й версии, но и другие режимы (Network Mode, Direct SAN с NFS, iSCSI и FC, а также бэкап из снапшотов хранилищ).
10. Улучшения по программе Veeam Cloud Service Provider
Технология CDP Low second RPO replication, которая позволяет улучшить показатели репликации за счет использования интерфейса vSphere APIs for IO (VAIO).
VCD to VCD Replication – функция для провайдеров VCSP, которая позволяет реплицировать данные между организациями VMware Cloud Director для одного или разных инстансов VCD.
VCD Native HTML5 Plugin - vCloud Director Self Service Portal интегрирован напрямую в VCD.
Улучшенная поддержка объектных хранилищ, в частности появилась поддержка Google Storage.
11. Улучшения Veeam Service Provider Console v5
Новая версия консоли Veeam Service Provider Console v5 даст сервис-провайдерам следующие возможности:
Готовая к производственной эксплуатации третья версия API
Новые возможности контроля над агентами для Windows, Linux и Mac
Возможность управлять бэкапами на AWS и Azure через обновленные нативные плагины
Улучшенные функции безопасности и новые интеграции
12. Модуль PowerShell для Veeam Backup and Replication
Теперь есть интегрированный модуль PowerShell 6.0, который устанавливается по умолчанию. Он позволяет управлять инфраструктурой резервного копирования на базе решений Veeam с помощью сценариев. Также в одиннадцатой версии Veeam B&R появилось 184 новых командлета.
13. Новый Rest API для Veeam Backup and Replication
Теперь Rest API есть не только в Veeam Backup Enterprise Manager, но и непосредственно на бэкап-серверах, что существенно увеличивает гибкость выполнения задач и построения новых интеграций через API.
14. Поддержка Amazon S3 Glacier и Microsoft Azure Archive Storage
Теперь администраторы могут использовать сервисы хранилища Amazon S3 Glacier (включая Glacier Deep Archive) и Microsoft Azure Archive Storage для обеспечения полного цикла облачного хранения резервных копий.
15. Расширение поддержки объектных хранилищ
Теперь можно использовать Google Cloud Storage (GCS) как объектное хранилище за счет нативной интеграции GCS через собственный API Veeam.
Backup & Replication v11 содержит новые версии Veeam ONE v11 (11.0.0.1379), а также апдейт Agent for Windows (5.0.0.4300) и Linux (5.0.0.4318), плюс совершенно новые Mac Agent (1.0.0.713) и Veeam Service Provider Console (5.0.0.6726). Про агенты можно подробно прочитать на русском языке вот тут.
Полный список новых возможностей приведен в документе Veeam v11 What's New (всего их более 200), в котором они занимают аж 21 страницу. Скачать новую версию этого продукта можно по этой ссылке.
Свершилось. Компания Veeam Software, лидер в сфере средств для обеспечения доступности виртуальных датацентров, объявила о выпуске и доступности для загрузки новой версии пакета
Veeam Availability Suite v10, в состав которого входит решение для резервного копирования и репликации виртуальных машин Veeam Backup and Replication v10.
Таги: Veeam, Backup, Update, Replication, Availability Suire, DR
Продолжаем рассказывать о новых продуктах и технологиях, анонсированных VMware на конференции VMworld Europe 2019. Сегодня мы поговорим о продукте VMware vCloud Availability 3.5, предназначенном для создания резервной инфраструктуры в одном из публичных облаков сервис-провайдеров на основе VMware vCloud Director (так называемая услуга Disaster-Recovery-as-a-Service, DRaaS).
В марте этого года VMware выпускала vCloud Availability версии 3.0, а вот уже и подоспела версия 3.5. Давайте посмотрим, что там появилось нового:
Функции унифицированного решения по защите данных
В этом релизе были введены возможности для упрощения защиты данных в гибридных окружениях, а также средства для того, чтобы убедиться в целостности имеющихся точек восстановления инфраструктуры. Также vCloud Availability 3.5 дает возможности контроля гибридной среды, состоящей из нескольких облаков.
1. Упрощение средств защиты данных.
Теперь сервис-провайдеры имеют функции поддержки региональных датацентров с возможностью корректной маршрутизации трафика. Также можно проводить миграцию сервисов vApp с возможностью репликации настроек этих сервисов и оптимизаций гостевых систем. Кроме того, можно приоритизировать загрузку критичных виртуальных машин после начала процесса восстановления.
2. Консистентность точек восстановления.
vCloud Availability 3.5 дает возможности группировки и создания ярусов защиты виртуальных машин, что позволяет соблюсти требования к контрольной точке восстановления (RPO) в случае сбоя в рамках каждой группы машин. Например, в одну группу можно включить разные сервисы одного приложения - веб-сервер, сервер БД и сервер приложения. Эта группа будет восстанавливаться как единый объект.
3. Лучшая видимость на сетевом уровне.
vCloud Availability 3.5 может мониторить и анализировать трафик на уровне виртуальной машины в реальном времени из нативно интегрированного интерфейса для того, чтобы убедиться в эффективности организации сетевого взаимодействия и нужной производительности (например, при миграции сервисов). Сервис-провайдеры также смогут создавать исторические отчеты с информацией о потребленной пропускной способности канала.
4. Функции использования ресурсов и отчетности.
VMware Usage Meter (UM) 3.6.1 теперь поддерживает vCloud Availability 3.x для автоматического измерения потребления ресурсов и создания отчетов на помесячной основе. Теперь не нужно получать доступ к каждому экземпляру vCA для ручного создания отчетов. Usage Meter сделает это автоматически в рамках подготовки месячного отчета.
Более подробно о продукте вы можете узнать на странице vCloud Availability. Хороший технический обзор новых возможностей доступен тут.
Таги: VMware, vCloud, Cloud, Availability, HA, DR, IaaS
Еще весной прошлого года мы писали про продукт Veeam Availability Orchestrator, который предназначен для восстановления виртуальной инфраструктуры из реплик Veeam Backup & Replication после аварии или катастрофы на основной площадке предприятия.
По сути, это качественная замена неказистого продукта VMware Site Recovery Manager. Инженеры Veeam хорошо поработали и сделали один из самых интересных и нужных продуктов компании - теперь стратегии Data Protection и Disaster Recovery можно сделать на базе продуктов одного вендора. На днях Veeam Availability Orchestrator стал доступен для загрузки.
Давайте посмотрим на самые интересные возможности этого решения:
Эта функция позволяет создать необходимый набор документации, в которой отражены основные процедуры и схемы восстановления инфраструктуры после крупного сбоя или аварии средствами Veeam. Тут важны вот какие моменты:
Решение содержит 4 полностью кастомизируемых шаблона отчетности для катастрофоустойчивой инфраструктуры в удобном для пользователя формате.
Возможность соответствия требованиям законодательства и комплаенсу в сфере disaster recovery. Также эти отчеты на регулярной основе не стыдно предоставлять директорам C-level (CEO, CIO и т.п.).
Автоматическое обновление документации при внесении изменений в виртуальную инфраструктуру - то есть поддержание актуальности данных в отчетах.
2. Тестирование плана восстановления после сбоев.
Для того, чтобы организация была уверена в том, что в случае форс-мажора можно будет восстановить функционирование ИТ-инфраструктуры, нужно регулярно проводить тестирование восстановления виртуальной инфраструктуры. Здесь важны следующие моменты:
Возможность исполнения ручного и запланированного тестирования с верификацией восстановления работы ИТ-сервисов.
Доступ в реальном времени к отчетам и дэшбордам, предоставляющим информацию о плановой готовности сервисов, исполнении плана тестирования и восстановления.
Регулярное исполнение тестов без влияния на производственную среду, производительность сервисов и пользователей.
3. Исполнение плана аварийного восстановления в случае аварии.
Это, понятное дело, самая важная фича продукта. Она подразумевает как восстановление работоспособности сервисов основного сайта на резервной площадке (failover), так и обратное восстановление виртуальной инфраструктуры на основную площадку (failback).
Здесь есть вот какие особенности:
Верификация восстановления на уровне виртуальных машин, приложений и сервисов - например, для Microsoft Exchange, SQL Server и IIS — при фейловере с заранее определенным порядком запуска сервисов.
Через открытый API процесс восстановления можно интегрировать с другими средствами обеспечения доступности ИТ-инфраструктуры.
Доступ к средствам планирования и исполнения disaster recovery можно регулировать с помощью ролевой модели доступа (role-based access control, RBAC).
Более подробно о функциях Veeam Availability Orchestrator можно прочитать вот тут. Скачать продукт можно по этой ссылке.
Как мы уже писали, на прошедшей недавно в Новом Орлеане конференции VeeamON 2017, была анонсирована следующая версия пакета для обеспечения доступности виртуального датацентра - Veeam Availability Suite v10 (напомним, что она выйдет к концу года).
CDP традиционно расшифровывается как continuous data protection, то есть непрерывная защита данных. Ранее Veeam Backup and Replication, являющийся частью пакета Veeam Availability Suite наряду с Veeam ONE, делал обычную программную репликацию за счет технологии снапшотов (называлось это near-CDP data protection).
Теперь же с помощью Veeam CDP будет возможно оперировать понятием RPO (Recovery Point Objective), то есть максимальным временем изменения данных, которые можно потерять в случае сбоя хранилища или повреждения данных. Удивительно, но без технологии снапшотов, а только за счет интерфейса VAIO (vSphere APIs for IO Filters) от VMware можно достичь RPO в размере 15 секунд и менее (в зависимости от используемого оборудования на хосте и его загрузки).
Это дефолтное значение фигурирует в демо-скринах Veeam:
Обратите внимание, что задача репликации выглядит как обычно, за исключением того, что появилась вкладка Schedule, на которой можно настроить RPO, если ваш хост ESXi поддерживает VAIO (а это было добавлено еще в ESXi 6.0 Update 1). Кроме того, появились две опции: первая - это Short-tetm retention - время, за которое будут храниться копии машины в краткосрочном периоде - например, 4 часа. Во время этих 4 часов вы сможете откатиться на любую точку в соответствии с параметром RPO.
Это очень важно, когда вы не сразу можете обнаружить повреждение данных, и поврежденные данные (например, каталога Active Directory) с какого-то момента начинают реплицироваться. Если вы опомнитесь в течение 4 часов, то сможете откатить реплику назад на любое время в рамках заданного интервала RPO, не потеряв более 15 секунд с того момента. Понятное дело, что если здесь вы поставите большие значения ретеншена, то потребуется огромное место для хранения дельта-состояний на каждые 15 секунд. Поэтому 4 часа здесь наиболее оптимальное значение.
Вторая настройка, Long-term retention, позволяет откидывать точки восстановления с определенной периодичностью и хранить их заданное время в соответствии с политикой предприятия.
Veeam Backup and Replication 10 будет использовать специальный драйвер VAIO (CDP filter driver), который будет устанавливаться на хосте VMware ESXi как пакет VIB и не потребует установки никакого специального ПО в гостевые ОС виртуальных машин. Работает он на уровне VMDK-диска отдельной ВМ, привязывается к ее VMX-процессу и позволяет получать данные из потока ввода-вывода напрямую, что существенно ускорит работу механизма репликации и не потребует создания снапшотов ВМ.
При восстановлении ВМ из реплики мы увидим вот такую картинку (кликабельно):
Зеленым цветом обозначаются доступный для восстановления интервал - вы можете вернуться в любую его точку. Темно зеленым обозначается Application-consistent реплика (то есть сделанная с помощью поддержки VSS на уровне приложения), а обычным зеленым - Crash-consistent реплика, то есть та, из которой гарантированно запускается операционная система (на самом деле и приложения в 95% случаев тоже).
У Veeam CDP будет несколько моментов в эксплуатации:
Можно будет использовать традиционный механизм репликации вместо CDP.
Реплицировать шаблоны и выключенные ВМ через CDP не получится (потому что нет потока ввода-вывода и процесса VMX).
CDP не нужно включать для всех виртуальных машин. Ей нужно защищать только самые бизнес-критичные приложения, так как это требует много места и создает дополнительную нагрузку на ресурсы.
Если вам реально не нужна 15-секундная защита, то интервал лучше увеличить. Если вы, например, поставите 60 секунд, то Veeam будет иметь больше времени на организацию процесса репликации и начнет дедуплицировать пространство хранения реплик, а также проводить другие оптимизации. Для маленьких же интервалов во главу угла будет поставлено, прежде всего, обеспечение политики RPO.
Технология потребует тестирования, чтобы определить физические возможности обеспечения заданных политик.
Использовать Veeam CDP и VMware Essentials/Essentials Plus не получится, так как VAIO не включена в эти издания (понадобится издание vSphere Standard или выше).
Что касается архитектуры CDP-решения, то можно использовать машину CDP Proxy, которая снимает данные с виртуальных машин хоста, как в виде ВМ на этом же хосте (для небольших и дешевых окружений), так и в виде отдельной от хоста ESXi машины, подключенной отдельным сетевым адаптером в выделенной сети к хосту ESXi, с которого будут уходить данные CDP по высокоскоростному каналу.
Ну а за новостями технологии Veeam CDP и всего пакета Veeam Availability Suite v10 в целом можно следить на этой странице.
В этом году компания Veeam Software, мои большие и давние друзья (без малого почти 12 лет!), дали мне награду Veeam Vanguard за вклад в популяризацию продуктов и решений компании, а также в развитие индустрии виртуализации в целом.
Награду я эту получаю в третий раз, в первый раз я ездил в Лас-Вегас в 2015 году (репортажи здесь), второй - в Лондон (репортаж тут), а в этом году поеду в Новый Орлеан на конференцию VeeamON 2017, откуда также буду писать о новостях Veeam в области новых технологий и продуктов.
Те, кто знаком с подходом Veeam, знают, что компания традиционно является технологическим лидером отрасли, всегда первой анонсирует новые фичи, которые все потом воруют/копируют, а что самое главное - делает продукты простыми в эксплуатации, элегантными на вид и мощными внутри.
И еще одно - Veeam умеет здорово развлекать своих гостей на конференциях. На картинке клуб Omnia одного из главных казино Вгеаса - Caesars Palace (кстати, на зеленых трусах девушки - логотип Veeam):
Приезжайте на конференцию, пишите мне или подходите прямо там, встретимся, и я вам расскажу, как начиналась виртуализация в России))
И немного более официального текста о VeeamON 2017:
Конференция VeeamON 2017 является главным событием года в области обеспечения доступности ИТ-инфраструктуры. Компания Veeam Software приглашает администраторов, маркетологов, разработчиков и других ИТ-специалистов принять участие в одном из наиболее открытых и интересных мероприятий по теме виртуализации, защиты данных и обеспечения непрерывной работы сред виртуализации на всех уровнях.
В 2017 году Veeam планирует принять в 2 раза больше участников (около 3,500 человек) в Новом Орлеане, США. В первый день будут выступать такие видные докладчики, как Марк Руссинович (CTO, Microsoft Azure) и Sanjay Poonen (Customer Operations, VMware). Всего в течение трех дней конференции будет больше 85 сессий на технические и бизнес темы.
Также во время конференции Veeam традиционно отдаст чек на $10,000 USD человеку, который покажет лучшее знание продуктов Veeam.
Вкратце, тут появились следующие нововведения и улучшения:
Увеличение скорости резервного копирования - удвоенная производительность I/O-операций, пятикратное сокращение окна резервного копирования, а также снижение нагрузки на основную и резервную СХД и серверы vCenter.
Увеличение скорости восстановления ВМ - значительное увеличение скорости восстановления ВМ благодаря оптимизации логики работы с дисковыми массивами, дедуплицирующими СХД и ленточными устройствами.
Улучшения в механизме обработки данных - улучшенный интерфейс пользователя, снижение размера конфигурационной базы данных и правила выбора прокси-серверов для работы с репозиториями помогают поддерживать самые крупные среды и эффективно обрабатывать тысячи ВМ и миллионы файлов в рамках одного задания.
2. Интеграция с файловой системой ReFS.
Как многие из вас знают, в операционной системе Windows Server 2016 появилась файловая система ReFS, которая является развитием технологии NTFS и предоставляет различные средства для обеспечения надежности, доступности и безопасности.
Вот какие улучшения нас ожидают в плане интеграции с ReFS:
Технология Fast cloning позволяет создавать и преобразовывать файлы синтетических бэкапов до 10 раз быстрее, чем раньше. При этом не происходит физического перемещения данных между файлами, что существенно снижает нагрузку на хранилища.
Технология полного бэкапа с шарингом блоков. Теперь полные бэкапы нескольких машин на хранилище ReFS можно хранить таким образом, что одинаковые блоки будут доступны нескольким файлам, то есть фактически это встроенный механизм дедупликации.
Поддержка технологии data integrity streams обеспечивает сканирование и проактивное исправление ошибок сканером ReFS, что позволяет защитить резервные копии от "тихого" повреждения вследствие ошибок оборудования и т.п.
3. Появился Veeam ONE 9.5 Chargeback.
Наконец-то Veeam позволит вести финансовый учет и планирование всех потребленных ресурсов виртуального датацентра. Можно будет задавать и подсчитывать стоимость всех типов ресурсов на различных уровнях (датацентр, подразделения, клиенты публичного облака и т.п.).
Обратите внимание, что Chargeback будет доступен как для VMware vSphere, так и для Microsoft Hyper-V.
4. Полная поддержка Windows Server 2016 и Hyper-V в новой версии Veeam Backup and Replication 9.5.
Поддержка Windows Server 2016 как для защиты виртуальных машин средствами резервного копирования, так и в качестве ОС для установки консоли продукта.
Поддержка Microsoft System Center Virtual Machine Manager 2016 (SCVMM).
Возможность Hyper-V Resilient Change Tracking (RCT). Также для этой технологии доступна и поддержка хранилищ SMB v3.
Поддержка Microsoft Hyper-V на платформе Nano Server и технологии Storage Spaces Direct.
5. Полная поддержка vCloud Director и самостоятельного восстановления.
Единая аутентификация vCloud Director и Veeam Enterprise Manager
Самостоятельное создание резервных копий пользователями
Самостоятельное восстановление пользователями
6. Интеграция с аппаратными хранилищами Nimble Storage
Backup from Storage Snapshots. Это возможность создавать резервные копии виртуальных машин путем снятия аппаратных снапшотов хранилища (средствами технологии native snapshot scheduling engine), а также оркестрация операций репликации ВМ на резервном хранилище.
Veeam Explorer for Storage Snapshots- восстановление виртуальных машин из снапшотов хранилищ или реплицированных копий, а также восстановление отдельных объектов (файлов, объектов приложений, таких как письма Exchange).
On-Demand Sandbox for Storage Snapshots- возможность использовать аппаратную интеграцию для создания изолированных окружений, например, для целей тестирования восстановления резервных копий.
7. Функция Direct Restoreto Microsoft Azure.
Возможность Direct Restoreto Microsoft Azure позволяет восстановить резервную копию, созданную в любом из продуктов Veeam (включая бесплатную версию) напрямую в облако Microsoft Azure. Средствами этой технологии пользователи смогут:
Быстро, в параллельном режиме обработки виртуальных дисков, восстанавливать виртуальные машины Windows и Linux (бэка которых создан через Veeam Agent for Linux) в облачную инфраструктуру прямо из консоли Veeam Backup без необходимости иметь вспомогательный виртуальный модуль (как было в бета-версии).
Проводить плановые миграции рабочих нагрузок в облако, чтобы компенсировать всплески нагрузки.
Создавать виртуальное окружение в облаке Azure для целей разработки и тестирования.
8. Мгновенное восстановление из любой резервной копии.
Теперь Veeam Backup and Replication умеет делать мгновенное восстановление и для бэкапов физических компьютеров в виде виртуальной машины Hyper-V. Если ранее можно было восстанавливать с помощью Instant Recovery только виртуальные машины, которые были забэкаплены Veeam, то теперь на любом сервере с ролью Hyper-V можно восстановить физический компьютер в виде ВМ. И эта функциональность доступна даже в бесплатном издании Veeam Backup!
Компания Veeam Software, известная своим лидирующим в отрасли продуктом для обеспечения доступности виртуального датацентра и бэкапа виртуальных машин Veeam Availability Suite, вчера сделала главный анонс в своей истории: теперь интегрированная линейка решений компании позволит делать вам бэкап любой машины в датацентре (физической или виртуальной), а также бэкапить и реплицировать их в любое облако.
Давайте рассмотрим ключевые компоненты, представленные на схеме:
Veeam Availability Suite - это знакомый нам пакет решений, состоящий из Veeam Backup and Replication, предназначенного для резервного копирования и репликации виртуальных машин, а также продукт Veeam ONE - для комплексного мониторинга виртуальных сред.
Veeam Agent for Microsoft Windows - это новое решение Veeam, основанное на существующем бесплатном продукте Veeam Endpoint Backup FREE, которое сейчас позволяет делать бэкап данных Windows-серверов. Теперь это будет полноценное Enterprise-решение для бэкапа физических Windows-систем.
Veeam Agent for Linux - аналогично агенту для Windows, агент для Linux будет позволяет производить резервное копирование любого Linux-сервера. Напомним, что мы писали о бэкапе Veeam для Linux вот тут.
Veeam Availabilty Console - это новый продукт, который основан на технологиях существующего Veeam Managed Backup Portal. Это интегрированные средства для сервис провайдеров и больших компаний, которые позволят организовать инфраструктуру BaaS (Backup-as-a-Service) для гибридной среды предприятия (внутренние инфраструктуры + облачные). Он включает в себя фреймворк для управления всеми компонентами Veeam Availability Platform.
Veeam Cloud Connect - это решение для резервного копирования бэкапов в облака различных типов - как собственные онпремизные облака предприятия на базе платформ VMware vSphere или Microsoft Hyper-V, так и публичные облака - либо сервис-провайдеров, либо публичные облака VMware vCloud Air или Microsoft Azure.
Veeam Availability Orchestrator - это средство для обеспечения комплексной катастрофоустойчивости на базе резервного копирования и репликации. По-сути, Veeam сделала аналог VMware Site Recovery Manager для асинхронной репликации, но, как и всегда, сделает это лучше, чем сама VMware.
Управление процессами резервного копирования и репликацией в рамках создаваемого плана восстановления после сбоев (Disaster Recovery Plan).
Автоматизированное тестирование DR-плана, на затрагивающее производственную среду предприятия и не влияющее не ее производительность.
Встроенные средства документирования по DR-планам, включающие в себя различные виды отчетности, в том чиле средства отслеживания изменений и соответствия корпоративным политикам.
Бета-версия Veeam Availability Orchestrator будет доступна уже в сентябре этого года, а релизную версию можно ждать в первом квартале 2017 года.
Veeam Cloud Connect вы уже знаете - это средства резервного копирования и репликации виртуальных машин в одно из публичных или частных облаков:
Подробнее о Veeam Cloud Connect можно почитать вот тут.
Предоставляет крупным предприятиям средства для организации защиты как виртуальных машин основного датацентра, так и облачных ресурсов, а также удаленных офисов и мобильных пользователей.
Позволяет сервис-провайдерам предоставлять услуги по резервному копированию и репликации виртуальных машин для своих пользователей средствами единой консоли с возможностью разделения управления по клиентам.
Дает возможность партнерам и реселлерам запустить собственный бизнес для своих клиентов по организации хранения их резервных копий на своих площадках, что увеличит возможности для зарабатывания денег.
Veeam Availability Console также ожидается в первом квартале 2017 года.
Они позволят делать резервные копии данных любых физических серверов или рабочих станций на уровне образов томов или отдельных файлов на диски, сетевые папки или репозитории Veeam.
Хорошая новость - Veeam Agent for Microsoft Windows мы сможем увидеть уже в декабре этого года, а релиз Veeam Agent for Linux состоится уже в этом ноябре! Напомним, что сейчас идет открытое бета-тестирование Veeam Agent for Linux.
Агенты будут лицензироваться вот таким образом (обратите внимание, что бесплатное издание останется):
Также был анонсирован Veeam Backup for Microsoft Office 365, который делает резервные копии и восстанавливает их на уровне приложения. Это важный и отдельный компонент линейки решений Veeam, так как он касается критической точки инфраструктуры - корпоративной почты.
Ну и главная новость состоявшегося анонса:
В мае 2017 года на конференции VeeamON будет анонсирован Veeam Availability Suite v10, где будет масса новых возможностей. Для затравки - аппаратная интеграция с массивами IBM:
Ну а готовящийся к выпуску Veeam Availability Suite 9.5 будет доступен уже в октябре 2016 года (напомним, что мы писали о его фичах вот тут). В следующей статье мы подробнее расскажем о его новых возможностях, тем более, что его несколько фич были объявлены в рамках прошедшего большого анонса. Следите за нашими новостями!
Как вы знаете, в VMware vSphere 6.0 функции кластеров непрерывной доступности Fault Tolerance были существенно улучшены. Например, в издании Standard/Enterprise стало возможным использовать виртуальные машины с двумя виртуальными процессорами (2 vCPU), а для издания Enterprise Plus можно сделать FT-машину с четырьмя vCPU (но не более 8 vCPU на один хост).
Между тем, Fault Tolerance предъявляет довольно существенные требования к серверам, сетям и хранилищам для функционирования такого кластера. Они изложены в документе vSphere Availability Guide в секции "Fault Tolerance Requirements, Limits, and Licensing".
Немногие знают, что на сайте VMware есть удобная утилита-плагин к VMware vSphere C# Client под названием SiteSurvey, которая позволяет проверить хосты VMware ESXi на возможность создания на них FT-кластеров из виртуальных машин. Вот результат ее работы:
Как мы видим, галочками и крестиками отмечаются категории, в которых хост ESXi проходит или не проходит тест на совместимость с кластером Fault Tolerance. К сожалению, пока утилита доступна только для "толстого" клиента vSphere Client, но для следующего релиза vSphere, скорее всего, ее доработают и как плагин для Web Client.
Скачать SiteSurvey для Windows можно по этой ссылке. Помимо этого, вам будет полезно ознакомиться с KB 1013428 на тему основных вопросов по Fault Tolerance.
Мы уже немало писали о новых фичах, которые появятся в новой версии решения Veeam Availability Suite 9.5, главным компонентом которого является средство резервного копирования и репликации виртуальных машин Veeam Backup and Replication.
Напомним наши статьи о новых возможностях Veeam 9.5:
Ну а на днях Veeam в своем блоге рассказала о еще одной важной группе нововведений - полной поддержке Windows Server 2016 и Hyper-V, которая появится одновременно с релизом этих платформ.
Если посмотреть историю продуктов Veeam, то вы увидите, что компания всегда первой или одной из первых поддерживает новые версии платформ Microsoft. Например, решение Veeam Endpoint Backup было первым продуктом для резервного копирования, который поддерживал Windows 10.
Давайте посмотрим, что теперь будет сделано к выходу Windows Server 2016 со стороны Veeam в Availability Suite 9.5:
Поддержка Windows Server 2016 как для защиты виртуальных машин средствами резервного копирования, так и в качестве ОС для установки консоли продукта.
Поддержка новых функций Windows Server, таких как, например, PowerShell Direct, позволяющей прямое соединение с хоста Hyper-V к гостевым виртуальным машинам. Это сделает доступными такие функции, как application-aware processing и guest file system indexing, для хостов Hyper-V без сетевого соединения со своми виртуальными машинами. Это упрощает автоматизацию операций, проводимых со стороны хоста.
Полная поддержка Microsoft Hyper-V 2016, включая обновленное аппаратное обеспечение VM hardware version 7.1 (или более позднее, если оно выйдет).
Возможность Hyper-V Resilient Change Tracking (RCT). У VMware давно есть технология Changed Block Tracking (CBT), упрощающая производителям средств резервного копирования процедуру снятия инкрементальных бэкапов за счет отслеживания изменившихся блоков самим движком гипервизора. Ранее Veeam также использовал эту технологию для Hyper-V средствами собственного драйвера, но теперь можно будет нативно и быстро делать инкрементальные бэкапы, опираясь на технологию Microsoft, в которую она, бесспорно, будет постоянно инвестировать. Также для этой технологии будет доступна и поддержка хранилищ SMB v3.
Поддержка Microsoft Hyper-V на платформе Nano Server и технологии Storage Spaces Direct. Veeam будет, конечно же, поддерживать архитектуру Nano Server с ролью Hyper-V, а также эффективную технологию организации хранилищ от Microsoft.
В версии 2016 Microsoft внесет множество изменений в корпоративные продукты Microsoft Active Directory, Exchange, SharePoint и SQL Server, но пользователи Veeam могут не волноваться - все они будут поддерживаться для движка application-aware processing. Это позволит создавать application-consistent бэкапы, а также проводить быстрое восстановление отдельных объектов приложений.
Более подробно о новых функциях Veeam Availability Suite 9.5 можно оперативно узнавать на этой странице или в блоге Veeam.
В среду и четверг этой недели я принял участие в двух интереснейших событиях компании Veeam - Veeam Vanguard Symposium и VeeamOn Forum London 2016 (они оба прошли в Лондоне). Первое - это небольшое, но очень продуктивное мероприятие для ИТ-профессионалов, получивших премию Veeam Vanguard 2016 (о прошлом мероприятии в Лас-Вегасе читайте здесь), которые собираются и обсуждают продукты и технологии компании Veeam, а многие отчаянно вмешиваются в дискуссию и дают довольно-таки полезные советы, как в технической сфере, так и в области маркетинга.
К сожалению, большинство рассказанной нам информации находится под эмбарго, то есть соглашением о неразглашении (NDA):
Но, я думаю, можно рассказать в самых общих чертах, не затрагивая подробности. Большая часть доносимых нам новостей была, конечно же, о новой версии Veeam Backup and Replication 9.5 - ведущем на сегодняшний день на рынке решении для резервного копирования и репликации виртуальных машин, которое от версии к версии становится все лучше.
Вот что нас ждет в ближайшем будущем (новая версия будет в этом году):
Увеличение производительности подсистемы работы с хранилищами за счет снятия ограничений, которые сейчас существуют в программной реализации механизма VMware для работы с системами хранения данных. Был человек, который сейчас тестирует новую версию, и он сообщил, что производительность действительно возросла в некоторых случаях до 2-3 раз.
В ближайшее время будет сделано еще больше улучшений в механизмах работы с хранилищами NFS.
Будет существенно улучшено взаимодействие с СУБД SQL Server за счет оптимизации запросов и изменения их структуры.
Появится специализированный сервис для обработки задач резервного копирования от прокси-серверов - также в целях повышения производительности.
Появится возможность балансировать нагрузку прокси-серверов резервного копирования между хост-серверами.
Приятная новость для сервис-провайдеров: будет удобная интеграция с решением VMware vCloud Director.
Появятся новые эксплореры для восстановления объектов приложений.
Очень много будет сделано для поддержки новой функциональности Windows Server 2016. Конечно же, и как всегда, Veeam будет поддерживать новый функционал платформы виртуализации Hyper-V в Windows Server 2016 практически одновременно с релизом самой платформы.
Как вы знаете, Veeam B&R помогает организовывать предприятиям решения для обеспечения катастрофоустойчивости (disaster recovery). В этой сфере тоже будет небольшая революция.
В общем, следите за нашими новостями - мы первыми расскажем о новых возможностях продукта Veeam Backup and Replication 9.5 (а мы уже начали это делать).
Всем раздавали приятные мелочи:
На самом деле, приятных мелочей было очень много:
Итогом Veeam Vanguard Symposium стали душевные посиделки под London Bridge и London Lager:
На следующий день стартовал VeeamOn Forum London 2016:
Многие из вас знают, что конференции серии VeeamOn Forum прошли во многих городах России, в том числе в Москве и Санкт-Петербурге.
Но в Лондоне масштаб был побольше:
Самое интересное, что Veeam активно привлекает своих клиентов к докладам на конференциях. Они рассказывают иногда очень интересные детали о своем бизнесе.
Большая часть разговоров была о доступности сервисов в виртуальных датацентрах. Ценность ИТ растет год от года. Ввиду все большей информатизации предприятий стоимость минуты простоя возрастает в разы.
Вот почему ключевой мессадж Veeam - это Availability, на нем компания не только зарабатывает все больше и больше, но и инвестирует туда больше всех. Поэтому инновации Veeam в этой сфере - самые значимые.
Также очень интересная часть любого мероприятия Veeam - это поддержка компанией обычных инженеров, которые, по мнению Veeam, являются основным драйвером в развитии решений компании. Для них было очень много всего, например, те же Lab Warz, где можно было вживую выполнять практические задания в консолях продуктов, а также тренинги Veeam Certified Engineer (VMCE), которые прошли перед VeeamOn Forum.
В целом, оба мероприятия прошли просто на ура, все вангарды - интересные личности (особенно ребята из Италии), а сотрудники Veeam сделали все возможное, чтобы сделать наше пребывание в Лондоне максимально комфортным.
От всей души благодарю Диму Князева, Дашу Крючкову, Кирстен Стоунер, Рика Вановера (ака Рикатрон), Майка Реселера, Лею и Люку. А у Даши еще и День рожденья был в четверг, с чем я ее искренне поздравляю и желаю большого профессионального роста!
В самом конце этого поста хочу в очередной раз сказать, что Veeam - это единственная на сегодняшний день компания в индустрии виртуализации, которая думает о построении экосистемы вокруг своих решений. Ведь именно администраторы являются пользователями продуктов, а значит нужно уделять им большое внимание, а не только постоянно поить ИТ-директоров. И только Veeam это понимает.
Компания VMware в своем блоге, посвященном продуктам линейки VMware vSphere, представила интереснейшее доказательство, что кластер VMware Virtual SAN дает надежность "шесть девяток", то есть доступность данных 99,9999% времени в году. А это меньше, чем 32 секунды простоя в год.
Бесспорно, приведенное ниже "доказательство" основано на множестве допущений, поэтому заявление о шести девятках является несколько популистским. С моей точки зрения, гораздо более вероятно, что админ с бодуна не туда нажмет, или, например, в команде vmkfstools укажет не тот LUN и снесет все виртуальные машины на томе VMFS (привет, Антон!), чем откажет оборудование с дублированием компонентов. Но все же, рассмотрим это доказательство ниже.
Прежде всего, введем 2 понятия:
AFR – Annualized Failure Rate, то есть вероятность отказа в год (носителя данных или другого компонента), выраженная в процентах.
MTBF – Mean Time Between Failures (среднее время между отказами). Это время в часах.
Эти 2 величины взаимосвязаны и выражаются одна через другую в соответствии с формулой:
AFR = 1/(MTBF/8760) * 100%
Обычно, как HDD, так и SSD накопители, имеют AFR от 0.87% до 0.44%, что дает от 1 000 000 до 2 000 000 часов MTBF. Далее для примера берут диск 10K HDD от Seagate (популярная модель ST1200MM0088), для которой AFR равен 0.44% (см. вторую страницу даташита) или 2 миллиона часов в понятии MTBF. Ну и взяли популярный SSD Intel 3710 для целей кэширования, который также имеет MTBF на 2 миллиона часов.
Для того, чтобы вычислить время доступности данных на таких накопителях, нужно понимать время, которое необходимо для восстановления бэкапа на новый накопитель в случае сбоя. По консервативным оценкам - это 24 часа. Таким образом, доступность данных будет равна:
2 000 000/ (2 000 000 + 24) = 0,99998
То есть, 4 девятки. Но диск - это еще не весь сервис. Есть еще надежность дискового контроллера, самого хост-сервера и стойки в целом (по питанию). VMware запросила данные у производителей и получила следующие параметры доступности:
Вот, доступность уже 3 девятки, что эквивалентно 8,76 часов простоя в год. Не так плохо, но это слишком оптимистичные значения - на деле есть прочие факторы, влияющие на доступность, поэтому уберем последнюю цифру из долей для доступности каждого из компонентов:
Получается 2 девятки, а это 3,65 дня простоя в год, что уже довольно критично для многих бизнесов.
Ну а теперь применим технологию VMware Virtual SAN, которая дублирует данные на уровне виртуальных машин и отдельных виртуальных дисков. Если мы используем параметр FTT (Numbers of failures to tolerate) равный 1, что подразумевает хранение одной реплики данных, то вероятность недоступности хранилища Virtual SAN данных будет равна вероятности отказа 2-х хранилищ одновременно, то есть:
(1-0.997)^2 = 0.00000528
Ну а доступность в данном случае равна:
1-0.00000528 = 0.999994
То есть, уже 5 девяток. Но это доступность для одного объекта VSAN, а отдельная виртуальная машина обычно имеет несколько объектов, допустим, 10. Тогда ее доступность будет равна:
0.999994^10 = 0.99994
В итоге, 4 девятки. Это 52,56 минуты простоя в год. В зависимости от того, сколько объектов у вас будет на одну ВМ, вы будете иметь доступность от 4 до 5 девяток.
А теперь возьмем FTT=2, то есть конфигурацию, когда имеется 2 дополнительных копии данных для каждого объекта в кластере Virtual SAN. В этом случае вероятность полного отказа всех трех копий данных:
(1-0.997)^3 = 0.00000001214
А доступность для ВМ с десятью объектами:
0.999999988^10 = 0.999999879
То есть, те самые 6 девяток, о которых говорится на слайде. Конечно, все это допущения, фантазии и игра с вероятностями, но читать это все равно интересно. Еще более интересно то, что оригинал этой статьи написала женщина)
Таги: VMware, Virtual SAN, HA, VSAN, Enterprise, Blog, Availability, Storage