
Про це розповідає KURAZH
Китайський стартап DeepSeek, який останнім часом привертає особливу увагу технологічної спільноти, готує масштабний крок у розвитку штучного інтелекту. В умовах посилення санкційного тиску з боку США щодо постачання передових чипів NVIDIA, компанія вирішила перейти на власну апаратну платформу, використовуючи виключно китайські розробки.
DeepSeek робить ставку на екосистему Huawei
За інформацією інсайдерів, DeepSeek V4 стане першим поколінням мовної моделі компанії, яке повністю працюватиме на чипах Ascend 950PR від Huawei. Йдеться про масштабне впровадження сотень тисяч цих процесорів у навчальні кластери, що є відповіддю на обмеження США щодо експорту високотехнологічного обладнання до Китаю. Раніше такі гіганти, як Alibaba Group, ByteDance та Tencent, також активно впроваджували рішення Huawei, формуючи внутрішній ринок незалежних від імпорту технологій.
Попри наявний досвід використання обладнання Huawei, для DeepSeek організація повного циклу навчання моделі такого масштабу на не-NVIDIA архітектурі стала справжнім випробуванням. Інженерам довелось не лише змінювати програмний код, а й адаптувати алгоритми до особливостей нової платформи, залучаючи до співпраці ще одну велику компанію — Cambricon.
Майже трильйон параметрів і новий рівень конкуренції
DeepSeek V4 вирізняється вражаючими технічними характеристиками: її архітектура налічує майже трильйон параметрів. Щоб забезпечити ефективну роботу такої моделі на чипах Huawei, розробники провели масштабну переписку основних модулів коду та організували тривале тестування.
Нова модель позиціонується як прямий конкурент ChatGPT і спеціалізується на автоматизації написання коду, виконанні складних математичних розрахунків і розв’язанні логічних задач. Експерти відзначають, що попередні версії DeepSeek демонстрували високу ефективність при помірних витратах на навчання, що дає підстави очікувати від V4 справжнього прориву на ринку штучного інтелекту.
«Офіційний реліз DeepSeek V4 очікується вже найближчими тижнями. Ба більше, стартап не планує зупинятися і вже працює над ще двома оновленнями, які мають з’явитися до кінця 2026 року. Для індустрії це важливий сигнал: якщо DeepSeek вдасться показати результати рівня GPT-4 або Claude 3.5 на чисто китайському залізі, міф про незамінність NVIDIA для навчання великих мовних моделей буде остаточно зруйновано».
Наразі компанії DeepSeek та Huawei утримуються від офіційних коментарів, однак галузь вже розглядає їхню співпрацю як доконаний факт. Йдеться не лише про імпортозаміщення, а про створення повністю автономної технологічної екосистеми, незалежної від зовнішньополітичних впливів.
Поки китайські компанії демонструють здатність створювати автономні рішення у сфері ШІ, західні технологічні гіганти, зокрема Microsoft, продовжують пошук балансу між професійними можливостями та інтеграцією штучного інтелекту в повсякденне життя користувачів.