Nvidia представила платформу Vera Rubin з Groq 3 LPU за $20 млрд: технічні подробиці

|
Nvidia представила платформу Vera Rubin з Groq 3 LPU за $20 млрд: технічні подробиці

Архітектура платформи Vera Rubin. Фото: Nvidia

Про це розповідає KURAZH

Nvidia оголосила про створення нової штучного інтелекту платформи Vera Rubin, інвестувавши у партнерство з Groq, Intel та іншими гравцями ринку $20 млрд (близько 860 млрд грн). Завдяки цій масштабній угоді компанія не лише отримала необхідні ліцензії, а й залучила ключових фахівців, включаючи засновника Groq.

Інноваційна архітектура: Groq 3 LPU та швидкість SRAM

Серцем платформи став процесор Groq 3 LPU (Language Processing Unit), який спеціалізується на надшвидкому виконанні виводу для великих мовних моделей. Незважаючи на те, що в Groq 3 LPU лише 500 МБ пам’яті SRAM, у пристрої розміщено 98 млрд транзисторів. Головна перевага — надвисока пропускна здатність пам’яті, що становить 150 ТБ/с. Для порівняння, сучасна HBM4-пам’ять у графічних процесорах Rubin забезпечує лише 22 ТБ/с при обсязі 288 ГБ. Це критично важливо для швидкої обробки даних у мовних моделях, де кожна затримка впливає на ефективність роботи системи.

«Нова платформа Vera Rubin тепер не просто черговий прискорювач обчислень, а справжній гібрид високих технологій, де під одним капотом зійшлися напрацювання Nvidia, Intel та Groq. Останній союз обійшовся „зеленим“ у солідні 20$ млрд (860$ млрд грн), що дозволило отримати не лише ліцензії, а й ключових фахівців разом із засновником Groq».

Масштабування та продуктивність для сучасних AI-завдань

Платформа Vera Rubin підтримує масштабування на рівні шаф: стійка Groq 3 LPX поєднує 256 LPU-процесорів, що разом мають 128 ГБ SRAM і пропускну здатність уражаючі 40 ПБ/с. Таке рішення дозволяє використовувати Groq 3 LPX як потужний сопроцесор для графічних процесорів Rubin, що суттєво прискорює декодування на різних рівнях моделі штучного інтелекту.

Крім того, до платформи входять 88-ядерний серверний процесор Vera та GPU-система Rubin NVL72. Якщо Rubin традиційно використовується для навчання моделей, то поєднання з Groq LPX підвищило загальну потужність виводу ШІ до 315 PFLOPS. Це дозволяє обробляти запити у реальному часі з недосяжною раніше швидкістю навіть для потужних кластерів минулих поколінь.

Таким чином, Nvidia суттєво посилила свої позиції у сфері спеціалізованих мовних процесорів, поглинувши найбільш перспективні розробки Groq. Окрім корпоративного сектору, нові можливості платформи можуть найближчим часом стати доступними і для користувачів домашніх ПК, про що свідчать анонси під час конференції Nvidia GTC 2026.

Презентація стійки Groq 3 LPX на GTC 2026. Фото: Nvidia