Подкрепяната от Джак Ма компания Ant Group Co. е използвала произведени в Китай процесори, за да разработи техники за обучение на модели на изкуствен интелект, които биха намалили разходите с 20%, твърдят запознати.
Ant е използвала местни чипове, в това число от свързаните с Alibaba Group Holding Ltd. и Huawei Technologies Co., за да обучава модели чрез т.нар. метод за машинно обучение Mixture of Experts (MoE), твърдят те. Получени са резултати, подобни на тези при чиповете H800 на Nvidia Corp, заявяват те, като пожелават да останат анонимни, тъй като информацията не е публична.
Базираната в Ханджоу компания Ant продължава да използва Nvidia за разработването на изкуствен интелект, но понастоящем разчита предимно на алтернативи, включително от Advanced Micro Devices Inc. и китайски чипове за най-новите си модели, отбелязва един от хората.
Моделите бележат навлизането на Ant в надпреварата между китайските и американските компании, която се ускори, след като DeepSeek показа колко ефективни модели могат да бъдат обучени за далеч по-малко средства от милиардите, инвестирани от OpenAI и Google. Това подчертава как китайските компании се опитват да използват местни алтернативи на най-модерните процесори на Nvidia. Макар и да не е най-усъвършенстваният, H800 е сравнително мощен процесор и в момента е забранен от САЩ за внос в Китай.
Този месец компанията публикува научно изследване, в което се твърди, че моделите ѝ понякога надминават Meta Platforms Inc. в някои показатели, което Bloomberg News не е проверила независимо. Ако обаче работят както е обявено, платформите на Ant биха могли да отбележат още една крачка напред в развитието на изкуствения интелект в Китай, като намалят разходите за създаване или поддръжка на AI услуги.
Тъй като компаниите инвестират значителни средства в изкуствения интелект, моделите, базирани на MoE, са популярна опция, спечелила признание с употребата си от Google и DeepSeek. Тази техника разделя задачите на по-малки набори от данни, много подобно на наличието на екип от специалисти, всеки от които се фокусира върху сегмент от дадена работа, което прави процеса по-ефективен. Ant е отказала коментар в изпратено по имейл становище.
Въпреки това обучението на моделите на MoE обикновено разчита на мощни чипове като графичните процесори, които продава Nvidia. Цената им досега е била непосилна за много от малките фирми и е ограничила по-широкото им внедряване. Ant работи по начини за по-ефективно обучение на големи езикови модели и премахване на това ограничение. Заглавието на документа ясно показва това, тъй като компанията си поставя за цел да скалира модел „без първокласни графични процесори“.
Това е в разрез със схващанията на Nvidia. Главният изпълнителен директор Дженсън Хуан твърди, че търсенето на изчислителна мощ ще расте дори с появата на по-ефективни модели като R1 на DeepSeek, като изтъква, че компаниите ще се нуждаят от по-добри чипове, за да генерират повече приходи, а не от по-евтини, за да намалят разходите си. Той се придържа към стратегията за създаване на големи графични процесори с повече процесорни ядра, транзистори и увеличен капацитет на паметта.
Какво казват от Bloomberg Intelligence:
Документът на Ant Group акцентира върху растежа на иновациите и ускоряването на технологичния напредък в областта на изкуствения интелект в Китай. Ако твърденията на фирмата се потвърдят, те показват, че Китай е на път да стане самодостатъчен в областта на изкуствения интелект, тъй като страната се насочва към по-евтини и ефективни в изчислително отношение модели, за да заобиколи контрола върху износа на чиповете на Nvidia.
- Робърт Лиа, старши анализатор на BI
Ant посочва, че обучението на 1 трлн. токена струва около 6,35 млн. юана (880 хил. долара), ако се използва високопроизводителен хардуер, но оптимизираният ѝ подход ще намали тази сума до 5,1 млн. юана (700 хил. долара), ако се използва хардуер с по-ниска производителност. Токените са информационни единици, които моделът приема, за да опознае света и да предостави полезни отговори на потребителските заявки.
Тази година Ant е закупила китайската онлайн платформа Haodf.com, за да разшири услугите си с изкуствен интелект в областта на здравеопазването. Ant създава AI Doctor Assistant, за да подпомогне 290 000 лекари на Haodf при изпълнението на задачи като управление на медицински досиета, съобщава компанията в отделно изявление в понеделник.
Компанията има и приложение за „асистент за живота“ с изкуствен интелект, наречено Zhixiaobao, и услуга за финансови консултации с изкуствен интелект Maxiaocai.По отношение на разбирането на английски език Ant посочва в своя документ, че моделът Ling-Lite се е справил по-добре в ключов сравнителен тест в сравнение с един от моделите Llama на Meta. И двата модела Ling-Lite и Ling-Plus са се представили по-добре от еквивалентите на DeepSeek в сравнителните тестове за разбиране на китайски език.
„Ако намерите дори една точка за атака, с която да победите най-добрия майстор на кунг-фу в света, все пак можете да кажете, че сте го победили, затова е важно приложението в реалния свят“, казва Робин Ю, главен технологичен директор на базирания в Пекин доставчик на решения за изкуствен интелект Shengshang Tech Co.
Ant е направила моделите на Ling с отворен код. Ling-Lite съдържа 16,8 млрд. параметри, които представляват регулируеми настройки, които работят като копчета и циферблати, за да насочват работата на модела. Ling-Plus има 290 млрд. параметъра, което се счита за сравнително голям обем в сферата на езиковите модели. За сравнение, според MIT Technology Review експертите смятат, че GPT-4.5 на ChatGPT има 1,8 трлн. параметри. DeepSeek-R1 има 671 милиарда параметри.
Компанията се сблъска с предизвикателства в някои области на обучението, включително стабилността. Дори малки промени в хардуера или структурата на модела водят до проблеми, включително скок в процента на грешките на моделите, се посочва в документа.
В понеделник Ant съобщи, че е изградила големи машини с модели, насочени към здравеопазването, които се използват от седем болници и доставчици на здравни услуги в градове като Пекин и Шанхай. Големият модел използва DeepSeek R1, Qwen на Alibaba и собствения голям езиков модел на Ant и може да извършва медицински консултации, се казва в съобщението.
Компанията също така заяви, че е пуснала два медицински агента с изкуствен интелект - Angel, който обслужва над 1000 медицински заведения, и Yibaoer, който поддържа медицински застрахователни услуги. През септември миналата година компанията стартира услугата AI Healthcare Manager в рамките на своето приложение за разплащания Alipay.