Grok Imagine получил обновление: улучшенная синхронизация губ и реалистичный звук

|
Grok Imagine получил обновление: улучшенная синхронизация губ и реалистичный звук

Grok Imagine

Об этом сообщает KURAZH

Платформа Grok Imagine, которая принадлежит экосистеме xAI Илона Маска, получила масштабное обновление, которое существенно расширяет её возможности в сфере генерации видеоконтента. Теперь этот инструмент способен создавать видеоролики с высоким уровнем реалистичности, где персонажи говорят с идеально синхронизированными губами и естественным звуком.

Революция в генерации видео: мимика и звук

Большинство современных генеративных видеомоделей страдают от эффекта «зловещей долины», когда внешний вид персонажей кажется почти человеческим, но движения губ не совпадают с речью, что создает ощущение искусственности. Однако команда xAI усовершенствовала Grok Imagine, и теперь алгоритмы точно воспроизводят мимику в соответствии с озвучкой, а также автоматически генерируют реалистичный аудиосопровождение для видео.

«Grok Imagine теперь имеет значительно улучшенную синхронизацию губ и более четкое качество звука на всех генерациях из изображения в видео. Диалоги совпадают с движением рта. Звук соответствует сцене. Ваши видео выглядят и звучат так, как вы их представляли».

Илон Маск подчеркивает, что в демонстрационном ролике, представленном в соцсети X, все визуальные и аудиоэлементы созданы искусственным интеллектом, без участия реальных людей или записей. Это открывает новый уровень в вопросе достоверности цифрового контента и актуализирует необходимость верификации видео в сети.

Быстрое развитие и новые функции Grok Imagine

Темпы развития нейросети впечатляют: всего за последний месяц Grok Imagine получил ряд важных нововведений. Среди них:

  • Анимация и монтаж: пользователи могут анимировать статические изображения и объединять их в целостные видеосцены.
  • Умное продолжение: система способна автоматически дополнять видеоряд, сохраняя стиль и логическую последовательность кадров.
  • Кинематографичность: Grok Imagine создает видео по коротким текстовым запросам, достигая эффекта профессиональной съемки.

Технологическая гонка и новые продукты xAI

Пока Grok Imagine удивляет публику реалистичными видео, xAI активно продвигает другие практические решения. В частности, недавно представленная версия Grok 4.3 ориентируется на прикладные задачи для бизнеса, а новый API Grok Speech to Text (STT) стал доступным разработчикам по всему миру. Это позволяет интегрировать передовые технологии распознавания речи в различные цифровые продукты.

Скорость развития xAI свидетельствует о стремлении компании сократить отставание от таких гигантов, как OpenAI и Google. Если раньше Grok Imagine считался ироничным чат-ботом для узкой аудитории, то сейчас он превращается в мощный мультимедийный инструмент для создания контента, который трудно отличить от реального.

Пока команда Маска усовершенствует системы генерации речи, компания Anthropic провела эксперимент с Project Deal, где искусственный интеллект самостоятельно заключал сделки на маркетплейсе, что свидетельствует о общем тренде развития автономных агентов на рынке технологий.