Учёные из Массачусетского технологического института (MIT) представили новое исследование, которое кардинально меняет представление о успехе больших языковых моделей и систем искусственного интеллекта. Они пришли к выводу, что прогресс в этой сфере в значительной степени зависит не от уникальных архитектур или сложных алгоритмов, а прежде всего от объёмов вычислительных ресурсов и количества доступного оборудования.
Об этом сообщает KURAZH
Роль вычислений в развитии искусственного интеллекта
Исследователи MIT проанализировали 809 языковых моделей, созданных в период с октября 2022 по март 2025 года. Выяснилось, что примерно 80–90% достижений в сфере искусственного интеллекта обеспечиваются именно масштабом вычислительных мощностей. Для повышения интеллектуальных возможностей моделей разработчикам в большинстве случаев необходимо увеличивать количество видеокарт NVIDIA и создавать большие дата-центры.
В течение последних трёх лет потребление вычислительных ресурсов для обучения ведущих моделей возросло в 5000 раз. Такой стремительный рост объясняет, почему выход на передовые позиции в сфере ИИ становится всё более дорогим и сложным для стартапов, не имеющих значительных инвестиций. Специалисты MIT FutureTech определили четыре основных фактора, влияющих на развитие индустрии: вычислительные ресурсы, общие алгоритмические достижения, фирменный инжиниринг и особенности архитектуры моделей.
Вычисления против интеллекта: что на самом деле определяет успех больших языковых моделей. Иллюстрация: AI
Фирменные решения и эффективность
Доля уникальных инженерных решений, которые внедряют отдельные компании, составляет всего 14–18% от общего прогресса. Это свидетельствует о том, что даже самые талантливые программисты не способны компенсировать нехватку современной вычислительной инфраструктуры. В то же время общие алгоритмические усовершенствования, доступные всем участникам рынка, помогли повысить эффективность обучения моделей в 7,5 раза. Особенно это заметно в отношении небольших моделей, которые становятся всё более мощными без необходимости тратить огромные бюджеты.
«Около 80–90% прогресса, который мы наблюдаем на переднем крае искусственного интеллекта, обеспечивается исключительно масштабом вычислений. Проще говоря, если вы хотите более умный ИИ, вам просто нужно больше видеокарт NVIDIA и огромные дата-центры».
Интересно, что разница в эффективности между отдельными командами разработчиков является существенной: некоторые способны достигать аналогичных результатов, используя в 61 раз меньше ресурсов, чем конкуренты. Это свидетельствует о важности оптимизации, но в то же время подчеркивает: на сегодняшний день именно доступ к современным дата-центрам определяет успех в соревновании за лидерство в сфере искусственного интеллекта.
Пока крупнейшие компании вкладывают значительные средства в масштабирование вычислений, отдельные разработчики ищут альтернативные подходы и локальные решения. В частности, примеры OpenClaw и китайских разработок демонстрируют возможность создания эффективных моделей без опоры на глобальные инфраструктуры.