Qwen3-Coder: мощный кодогенератор с поддержкой 1M токенов

Qwen3-Coder

Об этом сообщает KURAZH

Команда Qwen представила свою новую разработку — Qwen3-Coder, который в настоящее время является самым мощным кодогенератором с агентным подходом в линейке компании. Флагманской моделью стала Qwen3-Coder-480B-A35B-Instruct — гибридная архитектура Mixture-of-Experts с 480 миллиардами параметров, из которых 35 миллиардов активны одновременно. Модель может обрабатывать до 256 000 токенов в режиме нативной работы и до 1 миллиона токенов с использованием экстраполяции. В тестах Qwen3-Coder демонстрирует рекордные результаты среди открытых моделей в задачах Agentic Coding, Agentic Browser-Use и Agentic Tool-Use, достигая уровня таких закрытых систем, как Claude Sonnet 4.

Агентный подход в кодировании

Qwen3-Coder создан не только для генерации кода, но и для выполнения роли агента, который способен планировать действия, применять различные инструменты, получать обратную связь и принимать решения. В практических задачах, таких как SWE-Bench, эта модель взаимодействует с окружением в несколько стадий, используя сложное обучение с длинным горизонтом (Long-Horizon RL). Для достижения высокой эффективности команда Qwen развернула масштабируемую систему из 20 000 параллельных окружений на основе Alibaba Cloud.

Ключевые возможности и интеграции Qwen3-Coder

Модель обучена на объеме 7,5 триллионов токенов, из которых 70% — это код.
Поддержка большого контекста до 1 миллиона токенов (с использованием YaRN).
Использование reinforcement learning (Code RL) на реальных задачах для повышения эффективности выполнения кода.
Возможность интеграции с инструментами для разработчиков — Qwen Code (CLI), Claude Code, а также OpenAI SDK.
Поддержка работы через API или в локальном окружении.

Вместе с моделью разработчики получают доступ к CLI-инструменту Qwen Code, который основан на Gemini Code. Это позволяет интегрировать Qwen3-Coder в собственные проекты с поддержкой кастомных промптов и функций. Также предусмотрена работа через Claude Code и прямой API-доступ через Alibaba Cloud Model Studio.

«Qwen3-Coder позиционируется как универсальный агент для кодирования — от генерации вебсайтов до сложных многошаговых задач в разработке. Команда Qwen планирует выпустить больше размеров моделей, чтобы снизить затраты на развертывание, и исследует возможности для «самоусовершенствования» агентов».

Qwen — это серия больших языковых моделей и агентных решений от команды Alibaba, созданных для работы с текстом, кодом, анализом данных и многошаговыми сценариями с использованием различных инструментов. Последняя модель Qwen3-Coder поддерживает интеграцию с OpenAI SDK, CLI-инструментами (Qwen Code, Claude Code), API Alibaba Cloud, а также экосистемами GitHub и Hugging Face. Она использует reinforcement learning на реальных кодовых задачах для повышения точности и производительности, демонстрируя результаты, сопоставимые с ведущими закрытыми моделями.