

В продължение на години разказът около китайската AI индустрия беше очертан като надпревара за намаляване на пропастта със Запада – по-бързи чипове, по-големи модели, повече данни. Но настъпи тиха промяна. Съдейки по числата, излизащи от OpenRouter и инженерните решения зад DeepSeek V4, това рамкиране вече е остаряло.
Екосистемата на ИИ в Китай не просто е наваксала. В ключови измерения той е напреднал – и е изграден върху основа, която е архитектурно различна от всичко, създадено от Силиконовата долина.
Консумацията на токени разказва историята
Най-ясният сигнал за зрелостта на ИИ в Китай са данните за употребата. Според непрекъснатото проследяване от OpenRouter през март и април 2026 г., големите китайски модели постоянно се класират на първо място в световен мащаб по седмично потребление на токени за няколко последователни седмици.
През седмицата на 9 март китайските компании за модели претендираха за първите две места в месечните статистики на платформата за първи път. До началото на април и шестте най-високо класирани световни модели бяха китайски.
За да поставим това в контекст: ежедневното потребление на токени в Китай е скочило от приблизително 100 милиарда на 140 трилиона. Това не е видът растеж, който виждате от изследователите, провеждащи експерименти. Ето как изглежда AI, превръщайки се в инфраструктура – същата категория като електричеството или широколентовия достъп, а не демонстрационен проект.
Значението на този мащаб надхвърля самохвалството. Потреблението на токени е заместител на икономическата интеграция. Всеки корпоративен работен процес е автоматизиран, всеки инструмент за разработчици е захранван, всеки потребителски продукт е подобрен – всеки генерира използване, което се връща обратно към подобряването на модела и дълбочината на екосистемата. Със 140 трилиона токена на ден, китайските AI компании натрупват сигнали за обучение и внедряване в реалния свят с темпове, които е много трудно да се възпроизведат отзад.
Докато голяма част от западната технологична индустрия все още обсъжда кога AI приложенията ще станат реални, в Китай отговорът вече е вграден в ежедневните числа за употреба.
DeepSeek V4 променя разговора на чипа
Пускането на DeepSeek V4 беше технически крайъгълен камък, но може би не поради причината, която повечето хора предполагат. Да, възможностите на модела са впечатляващи. Но по-важната история е това, което се случи на ниво инфраструктура.
Когато Huawei обяви пълна поддръжка за DeepSeek V4 в същия момент, в който моделът стартира, това разби дългогодишното предположение в индустрията: че китайските чипове постоянно изостават с половин крачка, изисквайки работа по адаптиране след факта. Моделът „пускане след стартиране“ обърна това предположение с главата надолу.
Това не беше процес на трансплантация и адаптиране. DeepSeek V4 и продуктът Atlas SuperPoD бяха съвместно проектирани — фината архитектура Expert Parallel (EP) на модела беше изградена с мисъл за хардуера от самото начало. Както се посочва в техническия доклад на DeepSeek в Раздел 3.1: „Ние проверихме тази фина експертна паралелна схема както на NVIDIA GPU, така и на Huawei Ascend NPU платформите.“ Схемата разделя експертите на MoE на вълни и непрекъснато припокрива изчисленията, изпращането и изпращането на резултати – осигурявайки подобрение на производителността от 1,5x до 1,73x на продукта Atlas SuperPoD, като печалбите достигат до 1,96x при чувствителни към забавяне RL внедрявания. Това не е „използваемо“. Това е предимство в производителността.
За да разберете защо това има значение, помислете как NVIDIA изгради своето господство. Това не бяха само чипове – това бяха две десетилетия модели, рамки и библиотеки, всички оптимизирани за хардуер на NVIDIA, създавайки самоподсилваща се верига, където най-добрите модели работят най-добре на NVIDIA. Съвместният дизайн на DeepSeek V4 с продукта Atlas SuperPoD е първото убедително доказателство, че Китай изгражда своя собствена версия на този цикъл – и че вече дава резултати.
За глобалната AI индустрия, която е свикнала с NVIDIA като единствената сериозна опция, това представлява истинска алтернатива – такава, която вече не е теоретична.
Промяната на системата: от подреждане на чипове към SuperPod
Разбирането защо това има значение изисква да се отдръпнем от спецификациите на отделните чипове и да разгледаме как всъщност работят широкомащабното обучение и изводи за AI.
Тясното място в модерните изчисления с ИИ вече не е производителността на един чип. Това е ефективност на клъстера. Когато работите с групи от хиляди — или десетки хиляди — ускорители, доминират два проблема:
Комуникационни разходи. Синхронизирането на данни между чипове въвежда латентност, която изяжда суровата изчислителна мощност. Колкото по-голям е клъстерът, толкова по-лошо се влошава коефициентът на линейно ускоряване.
Ограничения на паметта. Големите модели на MoE имат брой параметри, които нито един чип не може да побере. Това изисква унифицирано адресиране между възли и ефективен достъп до паметта на системно ниво.
Без значение колко бързо работи един чип на пик, тясното място на клъстера намалява ефективната производителност до най-слабото звено. Ето защо конкурентният фокус на индустрията се измести от „пиков FLOPS на чип“ към „ефективна производителност на клъстер“. Простото закупуване и подреждане на повече чипове – подходът, който работеше в по-ранните поколения на ИИ – спира мащабирането ефективно след определена точка.
Отговорът на Huawei е иновативна архитектура „клъстер + SuperPoD“ и най-новият продукт SuperPoD — преосмисляне на системно ниво, а не постепенно надграждане на хардуера.
В основата на това са Atlas 950 SuperPoD (изчисления с изкуствен интелект) и TaiShan 950 SuperPoD (общи изчисления). Atlas 950 SuperPoD поддържа до 8192 карти, свързани помежду си чрез връзката UnifiedBus на Huawei, осигурявайки ултрависока честотна лента, ултра ниска латентност и унифицирано адресиране на паметта в целия клъстер. Тази последна характеристика има най-голямо значение: унифицираното адресиране на паметта означава, че софтуерът не трябва изрично да управлява картографиране на адреси за предаване на данни между възли – от гледна точка на модела, клъстерът се държи като единична система с голяма памет, което е точно това, което архитектурите на MoE трябва да работят ефективно в мащаб. В момента това е единственият AI SuperPod в Китай, който е постигнал широкомащабно търговско внедряване.
TaiShan 950 SuperPoD разширява тази архитектурна логика до изчисления с общо предназначение – и отива по-далеч. Той въвежда междусистемна честотна лента на ниво TB, латентност на ниво сто ns и обединяване на паметта, което позволява прехвърляне на данни между възли чрез семантика на паметта, като основно се справя с дългогодишните предизвикателства на висока латентност, преместване на данни и неефективност на координацията при общи изчислителни натоварвания. Това също го прави основополагаща архитектура за ИТ инфраструктура в ерата на Agentic AI.
Въпросът за екосистемата: Играта с отворен код на CANN
Хардуерът е само половината от историята. Другата половина – и исторически по-трудната половина за китайските технологии – е софтуерната екосистема.
Разработчиците не приемат нов хардуер, защото спецификациите изглеждат добре. Те го приемат, когато разходите за миграция са ниски и инструментите са зрели. Това е точно мястото, където съперниците на NVIDIA постоянно се спъват: ROCm екосистемата на AMD, например, предлага конкурентен хардуер, но се бори да привлече базата от разработчици, необходима за съвпадение на дълбочината на инструменти и документация на CUDA.
Стратегията на Huawei за отворен код за CANN (Компютърна архитектура за невронни мрежи) е предназначена да отговори точно на това безпокойство – като се среща с разработчиците там, където вече са, вместо да ги моли да започнат отначало.
CANN поддържа Ascend C и PyPTO и е съвместим с основните програмни рамки, включително Triton и TileLang. Повече от 70 масови модела — китайски и международни — работят веднага. Библиотеката включва 1500+ основни оператора и 100+ оператора за синтез. Системата е интегрирана с повече от 90 общности с отворен код.
CANN премина към напълно отворен код през 2025 г. През петте месеца оттогава 65 проекта с отворен код стартираха в общността — приблизително един нов проект на всеки три дни. Месечните активни разработчици в общността вече надхвърлят 3000.
Този темп на растеж на екосистемата е значим. Известно е, че екосистемите на разработчиците се изграждат бавно и изоставят бързо. Моделът с отворен код разпределя разходите за разработка в общността, като същевременно създава истинска собственост – същата книга, която направи PyTorch и Linux това, което са. Цифрите показват, че този набира истинска скорост.
Какво означава това за глобалната AI индустрия
Картината, която излиза от всичко това, не е просто „Китай вече има добри AI чипове“. Това е нещо по-структурно.
Китайският AI стек — от Atlas 950 SuperPoD и TaiShan 950 SuperPoD на инфраструктурния слой, през рамката с отворен код на CANN до модели като DeepSeek V4 на приложния слой — сега представлява цялостна, местно иновативна екосистема. Затвореният цикъл от чип до модел, който индустрията някога е предполагала, че само NVIDIA и нейните партньори могат да осигурят, вече не е изключителен.
За глобални клиенти и разработчици това променя изчислението по смислен начин. Вече има нова опция за ерата на Agentic AI: такава с конкурентни показатели за ефективност, нарастваща екосистема с отворен код и изчислителен стек, специално създаден за изискванията на постоянни, многоетапни работни натоварвания на AI, които определят накъде се движи индустрията.
Дали тази опция ще бъде възприета широко ще зависи от фактори извън технологията: доверието, инертността на предприятието и познаването на разработчиците играят роля. Но техническата основа е реална и вече не се изгражда – тя е построена.
По-интересният въпрос сега е колко бързо останалият свят забелязва.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта