
Про це розповідає KURAZH
Команда Qwen презентувала свою нову розробку — Qwen3-Coder, який наразі є найпотужнішим кодогенератором з агентним підходом у лінійці компанії. Флагманською моделлю стала Qwen3-Coder-480B-A35B-Instruct — гібридна архітектура Mixture-of-Experts із 480 мільярдами параметрів, з яких 35 мільярдів активні одночасно. Модель може обробляти до 256 000 токенів у режимі нативної роботи та до 1 мільйона токенів із використанням екстраполяції. В тестах Qwen3-Coder демонструє рекордні результати серед відкритих моделей у завданнях Agentic Coding, Agentic Browser-Use та Agentic Tool-Use, досягаючи рівня таких закритих систем, як Claude Sonnet 4.
Агентний підхід у кодуванні
Qwen3-Coder створено не лише для генерації коду, а й для виконання ролі агента, який здатен планувати дії, застосовувати різні інструменти, отримувати фідбек та приймати рішення. У практичних задачах, таких як SWE-Bench, ця модель взаємодіє з середовищем у декілька стадій, використовуючи складне навчання з довгим горизонтом (Long-Horizon RL). Для досягнення високої ефективності команда Qwen розгорнула масштабовану систему із 20 000 паралельних середовищ на основі Alibaba Cloud.
Ключові можливості та інтеграції Qwen3-Coder
- Модель навчена на обсязі 7,5 трильйонів токенів, з яких 70% — це код.
- Підтримка великого контексту до 1 мільйона токенів (з використанням YaRN).
- Використання reinforcement learning (Code RL) на реальних завданнях для підвищення ефективності виконання коду.
- Можливість інтеграції з інструментами для розробників — Qwen Code (CLI), Claude Code, а також OpenAI SDK.
- Підтримка роботи через API або у локальному середовищі.
Разом із моделлю розробники отримують доступ до CLI-інструменту Qwen Code, який базується на Gemini Code. Це дозволяє інтегрувати Qwen3-Coder у власні проєкти з підтримкою кастомних промптів і функцій. Також передбачена робота через Claude Code та прямий API-доступ через Alibaba Cloud Model Studio.
“Qwen3-Coder позиціонується як універсальний агент для кодування — від генерації вебсайтів до складних багатокрокових завдань у розробці. Команда Qwen планує випустити більше розмірів моделей, щоб знизити витрати на розгортання, та досліджує можливості для «самоудосконалення» агентів”.
Qwen — це серія великих мовних моделей і агентних рішень від команди Alibaba, створених для роботи з текстом, кодом, аналізом даних і багатокроковими сценаріями із використанням різних інструментів. Остання модель Qwen3-Coder підтримує інтеграцію з OpenAI SDK, CLI-інструментами (Qwen Code, Claude Code), API Alibaba Cloud, а також екосистемами GitHub і Hugging Face. Вона використовує reinforcement learning на реальних кодових задачах для підвищення точності та продуктивності, демонструючи результати, зіставні із провідними закритими моделями.