Российское ПО

VMware

Veeam

StarWind

vStack

Microsoft

Citrix

Symantec

Все самое нужное о виртуализации и облаках

Более 6530 заметок о VMware, AWS, Azure, Veeam, Kubernetes и других

VM Guru / Articles / Новые возможности AI-инфраструктуры в VMware Cloud Foundation 9.1

Новые возможности AI-инфраструктуры в VMware Cloud Foundation 9.1

Новые возможности AI-инфраструктуры в VMware Cloud Foundation 9.1

Автор: Александр Самойленко
Дата: 29/06/2026

Поддержите VM Guru!

USDT / TRC20, адрес: TCDP7d9hBM4dhU2mBt5oX2x5REPtq9QdU1

Статья:

Компания Broadcom не так давно объявила о выпуске VMware Cloud Foundation (VCF) 9.1 — очередном этапе развития самой широко применяемой в отрасли платформы частного облака. Этот релиз имеет ясную и сфокусированную цель: стать наиболее экономичным и защищённым фундаментом для продуктивного искусственного интеллекта, современных приложений и традиционных нагрузок, управляемых из единой плоскости управления, на инфраструктуре, которой предприятие владеет и которую само контролирует.

Релиз появился в момент, когда требования к корпоративной инфраструктуре практически никогда не были столь высокими и одновременно столь противоречивыми. Чтобы понять, почему VCF 9.1 устроена именно так, стоит коротко взглянуть на силы, формирующие любую ИТ-стратегию в 2026 году, и на архитектурные решения, которые эти силы теперь диктуют.

Три силы, переопределяющие корпоративное ИТ в 2026 году

Первая сила — зашкаливающий спрос на AI. Искусственный интеллект всё глубже встраивается в повседневные приложения и операции. По прогнозу IDC, мировые расходы на AI будут расти со среднегодовым темпом 31,9% вплоть до 2029 года и достигнут 1,3 трлн долларов, превысив 26% совокупных мировых расходов на ИТ. Это структурное перераспределение корпоративного технологического бюджета в пользу приложений с поддержкой AI и платформ, на которых они работают. Согласно барометру PwC 2025 Global AI Jobs Barometer, основанному на анализе почти миллиарда вакансий на шести континентах, рост производительности в отраслях, наиболее затронутых AI, почти учетверился с 2022 года.

Вторая сила — геополитическая гравитация, которая усугубляет проблемы безопасности AI. Регулирование суверенитета данных, экспортные ограничения на ускорители и фрагментированные региональные режимы соответствия превратили вопрос о месте размещения нагрузки в задачу уровня совета директоров. Опора по умолчанию исключительно на публичное облако в 2026 году выглядит спорным выбором.

Третья сила — сжатие бюджетов. Лидеры в области AI добиваются ощутимого снижения затрат именно потому, что относятся к эффективности инфраструктуры как к первоклассной дисциплине. От остальной части рынка при этом ожидают финансирования AI-амбиций из неизменных или сокращающихся операционных бюджетов.

Предварительная версия отчёта Broadcom Private Cloud Outlook 2026 показывает, что частное облако остаётся предпочтительной платформой для продуктивного AI. Более половины опрошенных организаций (56%) уже запускают или планируют запускать продуктивный инференс в частном облаке. Что важнее, использование публичного облака для продуктивного инференса составило 41% - это на 15% меньше год к году. Кроме того, 62% ИТ-руководителей заявили, что очень или крайне обеспокоены затратами на инфраструктуру генеративного AI, а 36% сообщили, что AI формирует новые требования к защите данных, конфиденциальности, средствам контроля безопасности и управлению рисками.

VCF 9.1 в общих чертах

VMware Cloud Foundation 9.1 представляет собой нативную для AI и Kubernetes платформу частного облака со встроенной безопасностью и поддержкой смешанной вычислительной инфраструктуры на процессорах и ускорителях AMD, Intel и NVIDIA. Это позволяет предприятиям развёртывать приложения инференса и агентского AI при существенно более низких затратах, с повышенной безопасностью и со свободой выбора лучшего в своём классе оборудования — как GPU, так и CPU. Платформа спроектирована так, чтобы запускать продуктивный AI при наименьшей стоимости в расчёте на нагрузку, под суверенным контролем предприятия и без компромиссов по безопасности или скорости доставки.

Ключевые экономические показатели релиза VCF 9.1 заявлены следующим образом:

До 40% снижения затрат на серверы за счёт интеллектуального многоуровневого распределения памяти для кластеров со смешанными AI- и не-AI-нагрузками.
До 39% снижения совокупной стоимости владения системой хранения благодаря улучшенным сжатию и дедупликации для конвейеров данных AI.
До 46% снижения операционных затрат на Kubernetes при работе AI-нагрузок в масштабе.
В 4 раза более быстрое обновление кластеров и удвоение ёмкости управляемого парка для стремительного масштабирования ИИ-инфраструктуры.

Эффективная инфраструктура для AI-нагрузок в масштабе

Заказчики запускают всё более плотные и требовательные нагрузки — инференс AI, конвейеры на GPU, крупные базы данных в оперативной памяти, — и при этом от них требуют делать больше в рамках прежнего бюджета на инфраструктуру. VCF 9.1 отвечает на это по двум направлениям: снижает стоимость в расчёте на нагрузку и делает эксплуатацию в масштабе менее болезненной. За счёт интеллектуального управления ресурсами и автоматизации операций предприятия могут разместить больше продуктивных нагрузок на текущих серверах, эффективно масштабироваться в распределённых средах и избежать дорогостоящего расширения парка в период дефицита оборудования и роста цен.

Интеллектуальная оптимизация ресурсов максимизирует утилизацию инфраструктуры за счёт усовершенствованного многоуровневого распределения памяти и сжатия хранилища нового поколения для конвейеров данных AI, обеспечивая более высокую плотность AI-нагрузок без снижения производительности и без дорогостоящего обновления оборудования. Расширенные дедупликация и сжатие vSAN снижают стоимость в расчёте на полезный терабайт, планирование с учётом топологии (Topology Aware Scheduling) размещает нагрузки с учётом локальности NUMA и ускорителей, а корпоративная поддержка операционной системы Ubuntu расширяет экосистему рабочих нагрузок без дополнительных накладных расходов.

Автоматизированная эксплуатация парка обеспечивает удвоенную ёмкость управления (до 5000 хостов) и в 4 раза более быстрое обновление кластеров в распределённых и изолированных (air-gapped) средах. Это устраняет ручные накладные расходы на установку исправлений и поддерживает быстрое расширение AI-инфраструктуры. Технология vSphere Elastic Provisioning обеспечивает расширение парка без вмешательства оператора, а наблюдаемость в реальном времени превращает телеметрию в конкретные действия.

Multitenant-инфраструктура для изоляции AI позволяет предприятиям и поставщикам услуг запускать несколько AI-проектов и обслуживать несколько заказчиков на общей инфраструктуре со строгими границами безопасности. Это максимизирует утилизацию дорогих ресурсов GPU и CPU и одновременно поддерживает суверенитет данных для чувствительных моделей. Итоговый результат - больше нагрузок на стойку, меньше операторов на тысячу нагрузок и измеримое снижение стоимости обслуживания.

Глубокое погружение: расширенное многоуровневое распределение памяти

Любой, кто в последнее время участвовал в обсуждении закупки серверов, знает суть проблемы: цены на память резко выросли. С 2023 года стоимость корпоративных модулей DDR5 RDIMM взлетела, во многом из-за того, что производители переориентировали производственные мощности на память с высокой пропускной способностью (HBM) для GPU под AI (хотя есть и слухи о ценовом сговоре). Высокоплотный узел виртуализации более чем удвоился в цене, причём только память может доходить до 95% от всей спецификации компонентов. Именно поэтому многоуровневое распределение памяти имеет столь большое значение, а улучшения, вошедшие в VCF 9.1, настолько важны.

Memory Tiering позволяет хостам ESX использовать устройства NVMe как вторичный уровень памяти наряду с традиционной DRAM. Виртуальные машины потребляют так называемую «логическую память» — единый пул, охватывающий оба уровня (DRAM и NVMe). Гипервизор интеллектуально классифицирует страницы памяти как «горячие» или «холодные»: горячие остаются в быстрой DRAM, холодные перемещаются на NVMe. Весь процесс прозрачен для приложений.

Результат: до 4 раз больше доступной памяти на хост, в 2 раза лучшая консолидация виртуальных машин, на 20–30% более высокая эффективность CPU (поскольку процессоры больше не простаивают из-за нехватки памяти) и до 40% более низкая совокупная стоимость владения. Это не маркетинговые лозунги, а показатели, которые заказчики наблюдают в эксплуатации в производственной среде.

Пять ключевых улучшений в VCF 9.1

VCF 9.1 приносит пять значимых улучшений механизма многоуровневой памяти, и каждое из них отвечает на реальные отзывы, поступавшие со времён выпуска 9.0.

Прирост производительности. По сравнению с многоуровневой памятью в VCF 9.0 наблюдается прирост производительности до 16% в нагрузках баз данных, измеренных в HammerDB, наряду со снижением загрузки CPU на 12% в тестах VMmark. Эти результаты не теоретические — они получены за счёт оптимизаций в том, как гипервизор управляет классификацией страниц и их перемещением между уровнями. Если ранее предприятие откладывало включение многоуровневой памяти из-за опасений за производительность, теперь есть веский повод вернуться к этому вопросу.

Программное зеркалирование NVMe. В VCF 9.0 единственным способом обеспечить избыточность уровня NVMe был аппаратный RAID. Варианты сводились к контроллеру Tri-Mode или к технологии Intel VROC. Это означало дополнительные расходы на контроллеры, операционные накладные расходы на управление прошивками и драйверами, а также потенциальные проблемы совместимости с vSAN при совместном использовании контроллеров.

VCF 9.1 вводит программное зеркалирование NVMe, встроенное непосредственно в vSphere. Контроллер RAID не требуется. Нет дополнительных закупок, а значит - ниже стоимость. Не нужны операционные усилия на конфигурацию, установку, прошивки и драйверы. Гипервизор обрабатывает зеркалирование нативно, получая полный контроль над распределением страниц памяти между устройствами. Именно такой простоты пользователи и просили.

Упрощённая настройка. Настройка многоуровневой памяти в версии 9.0 включала отдельные шаги для создания раздела NVMe и для включения самой функции. В версии 9.1 это меняется: весь процесс сведён в единую панель конфигурации с использованием профилей конфигурации vSphere (vSphere Configuration Profiles). Разделы дисков NVMe теперь создаются автоматически - больше не нужны ручные команды ESXCLI или сценарии PowerShell, хотя при желании их по-прежнему можно использовать. Самое важное: настройка больше не требует перезагрузки хоста, достаточно режима обслуживания. Итоговый результат - сокращение времени конфигурации более чем на 50%.

Расширенная наблюдаемость и анализ «что если». Нельзя оптимизировать то, чего не видишь, и VCF 9.1 обеспечивает существенно лучшую видимость среды многоуровневой памяти. В vCenter новые сводные карточки на уровне хоста и кластера показывают состояние конфигурации, разбивку по уровням, потреблённую память на каждом уровне и сравнение потреблённого и активного объёмов. Доступен также полный перечень устройств многоуровневого хранения с детальным статусом их работоспособности.

После развёртывания можно отслеживать пропускную способность и задержки для обоих уровней памяти и даже детализировать использование пропускной способности уровней до отдельной виртуальной машины. На стороне VCF Operations предусмотрена отдельная панель мониторинга многоуровневой памяти и инструмент анализа «что если» (What-If). Он позволяет смоделировать, что произойдёт при включении многоуровневой памяти в конкретной среде и какой будет экономия. Это превосходный способ обосновать бизнес-кейс ещё до того, как будет начат реальный процесс масштабирования или оптимизации среды.

Поддержка профилей виртуальных машин. В VCF 9.0 некоторые профили виртуальных машин не могли включиться при активной многоуровневой памяти на хосте. В версии 9.1 это ограничение полностью снято: машины безопасности, машины с низкой задержкой, отказоустойчивые виртуальные машины и другие теперь могут запускаться. Хотя часть таких профилей по-прежнему не участвует в многоуровневом распределении напрямую, больше не нужно держать отдельные хосты ради их размещения. Кроме того, теперь полностью поддерживается вложенная виртуализация: вложенные (nested) виртуальные машины в лабораторной среде участвуют в распределении наравне с любыми другими нагрузками.

Итог по экономике: многоуровневое распределение памяти в VCF 9.1 обеспечивает до 40% снижения совокупной стоимости владения за счёт лучших коэффициентов консолидации и более полного использования ресурсов. Новый инструмент анализа «что если» в VCF Operations упрощает оценку среды и количественную оценку экономии до принятия обязательств. Функция готова к продуктивному применению, поставляется уже сейчас и принципиально меняет экономику памяти в виртуализированных средах.

Высокоскоростная доставка приложений для AI, контейнеров и ВМ

Современная платформа в эпоху AI обязана с равной свободой поставлять виртуальные машины, контейнеры, AI-сервисы и сервисы данных. VCF 9.1 закрывает этот разрыв, предоставляя единый уровень инфраструктуры для рабочих нагрузок инференса, агентских приложений, контейнеризованных сервисов и традиционных ВМ. Это устраняет операционную фрагментацию и затраты на сопровождение отдельных стеков, обеспечивая при этом скорость разработки и управляемость платформы, которые требуются продуктивному AI.

Масштаб и производительность Kubernetes. Сервис VMware vSphere Kubernetes Service (VKS) обеспечивает увеличение масштаба кластеров в 2,6 раза, на 70% более быстрые развёртывания и на 75% более короткие окна обновления по сравнению с предварительными версиями, а также бесшовное масштабирование с нулевым простоем для продуктивных AI-сервисов. Технологии VKS и VM Fast-Deploy существенно сокращают время до запуска как для Kubernetes-, так и для ВМ-нагрузок, а упрощённая модель «контейнеры как услуга» превращает VKS в полноценный слой самообслуживания для прикладных команд.

Управление смешанными вычислениями эффективно обслуживает как ресурсоёмкие по CPU агентские AI-процессы, так и ускоренный на GPU инференс на единой платформе. Это отвечает реальности, в которой агентские нагрузки требуют значительно больше ресурсов CPU, чем GPU, для исполнения рабочих процессов и оркестрации принятия решений. Возможность запускать оба типа нагрузок на одной платформе устраняет необходимость в раздельных инфраструктурных стеках.

Наблюдаемость и управление AI предоставляют детальные метрики времени до первого токена (time to first token), пропускной способности по токенам и утилизации GPU для нескольких типов ускорителей. Это позволяет предприятиям максимизировать отдачу от инфраструктуры за счёт точного мониторинга использования оборудования. Специальная функция Private AI Model and GPU Metrics раскрывает телеметрию, необходимую командам платформы и MLOps: утилизацию, давление на память и видимость на уровне модели — в той же консоли, что и остальная часть парка. Централизованное внедрение политик и средства контроля суверенитета данных обеспечивают соблюдение требований к AI и защищённый доступ к моделям.

Живые шаблоны прикладных стеков (Live Application Stack Blueprints) фиксируют многомашинные приложения как переиспользуемые шаблоны для быстрого развёртывания сред. Это устраняет ошибки ручной настройки и предотвращает дрейф конфигурации между средами разработки, тестирования и продуктивной эксплуатации, одновременно ускоряя доставку инфраструктуры. В числе сопутствующих возможностей — нативное объектное хранилище с совместимостью с S3 (в режиме технического превью в ветке 9.1.x), интеграция с Tanzu Marketplace для доступа к сертифицированному связующему ПО и сервисам данных, а также SQL Server в модели «база данных как услуга».

Высокоскоростные сети и открытая экосистема

Интеграция экосистемы в VCF 9.1 является сквозным принципом проектирования. Ни одно предприятие значимого масштаба не работает на инфраструктуре единственного поставщика, поэтому VCF 9.1 спроектирована так, чтобы существующий у заказчика выбор оборудования, сетевой фабрики и программных каркасов взаимодействовал в рамках единой операционной модели.

Высокоскоростные сети для AI-нагрузок. Поддержка сетевых адаптеров NVIDIA ConnectX-7 и устройств NVIDIA BlueField-3 совместно с технологией Enhanced DirectPath I/O обеспечивает высокоскоростную многохостовую передачу данных и обучение моделей AI, что критично для требовательных нагрузок генеративного AI. Усовершенствованная технология DirectPath I/O распространяет производительность ускорителей, близкую к «голому железу», и на новейшее поколение кремния AMD.

Открытая сетевая фабрика и выбор оборудования. Унифицированная поддержка EVPN с фабриками Arista, Cisco и SONiC обеспечивает единообразную оверлейную сеть поверх трёх доминирующих стеков сетевого оборудования ЦОД, включая вариант с открытым исходным кодом, который гиперскейлеры узаконили для корпоративного применения. Сетевые команды получают единую операционную модель независимо от того, коммутатор какого поставщика стоит в той или иной стойке, что существенно сокращает время на подключение новых площадок или поглощение приобретённых активов. Стандартная совместимость EVPN и VXLAN с Arista Universal Cloud Network через прямое подключение ESX к фабрике позволяет строить масштабируемые сетевые архитектуры для AI-инфраструктуры, снижая как капитальные, так и операционные затраты.

Открытая экосистема обеспечивает выбор ускорителей GPU между AMD и NVIDIA, поддержку ведущих платформ CPU от AMD и Intel, а также новые эталонные архитектуры VKS с участием облачно-нативных независимых поставщиков ПО, дающие командам платформы проверенную отправную точку. Виртуализированные балансировка нагрузки и безопасность на базе VMware Avi Load Balancer и VMware vDefend устраняют потребность в аппаратных устройствах для конечных точек инференса AI и агентских приложений, снижая капитальные затраты и обеспечивая корпоративную отказоустойчивость с автоматизированным управлением жизненным циклом.

Архитектура нулевого доверия для суверенитета и защиты данных AI

VCF 9.1 интегрирует безопасность на уровне инфраструктуры, чтобы защитить AI-нагрузки, проприетарные модели и обучающие данные — от гипервизора до приложения. Обеспечивая сегментацию по принципу нулевого доверия, суверенное восстановление и непрерывную установку исправлений без сторонних надстроек, VCF укрепляет уровень безопасности, необходимый для продуктивных развёртываний AI, который среды публичного облака не способны обеспечить.

Локальное восстановление после программ-вымогателей предоставляет изолированные среды восстановления и встроенные инструменты валидации, включая новую поддержку CrowdStrike Falcon Endpoint Security. Это защищает модели и обучающие данные (то есть ценную интеллектуальную собственность) от трансграничного перемещения и одновременно избавляет от огромных платежей за полосу пропускания при восстановлении в кризисной ситуации. Функции vSAN for Recovery и On-prem Ransomware Recovery дают суверенный, встроенный в платформу путь к восстановлению после разрушительных атак без внешних зависимостей.

Непрерывное обеспечение соответствия поддерживает соблюдение нормативных требований за счёт централизованного мониторинга и автоматизированного приведения к желаемому состоянию для рабочих нагрузок и компонентов стека VCF. Это позволяет предприятиям демонстрировать готовность к аудиту продуктивных AI-развёртываний без ручных усилий и отдельных инструментов соответствия. Соблюдение требований превращается из ежеквартального аудиторского мероприятия в гарантию времени выполнения.

Установка исправлений без простоя. Живая установка исправлений с нулевым простоем покрывает до 80% сценариев без эвакуации хоста и без окон обслуживания, устраняя перебои в работе продуктивных сервисов инференса AI и агентских приложений, которым требуется непрерывная доступность для соблюдения соглашений об уровне сервиса. Отдельно функция живой установки исправлений для хостов с поддержкой TPM устраняет один из крупнейших источников незапланированного простоя в больших парках. Технология Encrypted vMotion с Intel QAT переносит криптографические операции на выделенный кремний, снимая историческую плату за производительность при сквозном шифровании данных в движении.

Латеральная безопасность нулевого доверия впервые распространяет распределённую защиту IDS/IPS на AI-нагрузки Kubernetes, обеспечивая производительность инспекции угроз 9 Тбит/с для распределённого инференса и пятикратное увеличение числа идентифицируемых приложений для частного облака и интернет-приложений. Самообслуживаемая безопасность с автоматизацией предоставляет централизованную маркировку, предопределённые профили безопасности, делегированную настройку межсетевых экранов и защиту веб-приложений на входе, позволяя предприятиям и поставщикам услуг защищать AI-развёртывания без операционной сложности и без фрагментированных наборов инструментов безопасности. Итог: восстановление, установка исправлений и соответствие требованиям перестают быть периодическими событиями в календаре операций и становятся непрерывными свойствами платформы.

Заключение

VMware Cloud Foundation 9.1 — это сфокусированный релиз, который позиционирует частное облако как естественный дом для корпоративного ИИ. Платформа объединяет три опоры: эффективную инфраструктуру и операции в масштабе, высокоскоростную доставку приложений и киберустойчивость с защитой данных. В совокупности эти возможности отвечают на ключевые вызовы продуктивного ИИ — приватность данных и интеллектуальной собственности, растущие затраты на инфраструктуру и готовность к агентскому ИИ.

Технологический фундамент релиза составляют расширенное многоуровневое распределение памяти с программным зеркалированием NVMe, высокоскоростные сети на базе ConnectX-7 и BlueField-3, открытая экосистема ускорителей AMD, Intel и NVIDIA, а также архитектура нулевого доверия, впервые распространившая распределённую защиту IDS/IPS на ИИ-нагрузки Kubernetes. Эти технологии позволяют запускать инференс и агентские приложения при наименьшей стоимости в расчёте на нагрузку и под полным контролем предприятия.

Заказчики на VCF 9.0 могут перейти на 9.1 по поддерживаемому пути обновления на месте; рекомендуемой отправной точкой служат руководство по обновлению VCF 9.1 и матрица совместимости на портале поддержки Broadcom. Тем, кто находится в начале пути, следует начать с библиотеки эталонных архитектур VCF 9.1, содержащей проверенные проекты для ИИ-, контейнерных и традиционных нагрузок.