Вычислительные мощности: ключ к успеху ИИ от MIT

Учёные из Массачусетского технологического института (MIT) представили новое исследование, которое кардинально меняет представление о успехе больших языковых моделей и систем искусственного интеллекта. Они пришли к выводу, что прогресс в этой сфере в значительной степени зависит не от уникальных архитектур или сложных алгоритмов, а прежде всего от объёмов вычислительных ресурсов и количества доступного оборудования.

Об этом сообщает KURAZH

Роль вычислений в развитии искусственного интеллекта

Исследователи MIT проанализировали 809 языковых моделей, созданных в период с октября 2022 по март 2025 года. Выяснилось, что примерно 80–90% достижений в сфере искусственного интеллекта обеспечиваются именно масштабом вычислительных мощностей. Для повышения интеллектуальных возможностей моделей разработчикам в большинстве случаев необходимо увеличивать количество видеокарт NVIDIA и создавать большие дата-центры.

В течение последних трёх лет потребление вычислительных ресурсов для обучения ведущих моделей возросло в 5000 раз. Такой стремительный рост объясняет, почему выход на передовые позиции в сфере ИИ становится всё более дорогим и сложным для стартапов, не имеющих значительных инвестиций. Специалисты MIT FutureTech определили четыре основных фактора, влияющих на развитие индустрии: вычислительные ресурсы, общие алгоритмические достижения, фирменный инжиниринг и особенности архитектуры моделей.

Иллюстрация вычислений о успехе языковых моделей

Вычисления против интеллекта: что на самом деле определяет успех больших языковых моделей. Иллюстрация: AI

Фирменные решения и эффективность

Доля уникальных инженерных решений, которые внедряют отдельные компании, составляет всего 14–18% от общего прогресса. Это свидетельствует о том, что даже самые талантливые программисты не способны компенсировать нехватку современной вычислительной инфраструктуры. В то же время общие алгоритмические усовершенствования, доступные всем участникам рынка, помогли повысить эффективность обучения моделей в 7,5 раза. Особенно это заметно в отношении небольших моделей, которые становятся всё более мощными без необходимости тратить огромные бюджеты.

«Около 80–90% прогресса, который мы наблюдаем на переднем крае искусственного интеллекта, обеспечивается исключительно масштабом вычислений. Проще говоря, если вы хотите более умный ИИ, вам просто нужно больше видеокарт NVIDIA и огромные дата-центры».

Интересно, что разница в эффективности между отдельными командами разработчиков является существенной: некоторые способны достигать аналогичных результатов, используя в 61 раз меньше ресурсов, чем конкуренты. Это свидетельствует о важности оптимизации, но в то же время подчеркивает: на сегодняшний день именно доступ к современным дата-центрам определяет успех в соревновании за лидерство в сфере искусственного интеллекта.

Пока крупнейшие компании вкладывают значительные средства в масштабирование вычислений, отдельные разработчики ищут альтернативные подходы и локальные решения. В частности, примеры OpenClaw и китайских разработок демонстрируют возможность создания эффективных моделей без опоры на глобальные инфраструктуры.