Отвореният AI модел на DeepSeek би трябвало да ужасява Сам Алтман

Може би бъдещето принадлежи не на тези, които могат да похарчат най-много, а на тези, които се осмеляват да споделят работата си със света

19:00 | 30 януари 2025

Автор: Парми Олсън

Снимка: Bloomberg LP

Откакто стартира ChatGPT преди две години, главният изпълнителен директор на OpenAI Сам Олтман твърди, че бизнесът му се захранва от няколко основни съставки: чипове, данни и пари. Колкото повече от тези три елемента вкарате в неговата фирма, както въглища в пещта на парен влак, толкова по-мощен изкуствен интелект ще произведе тя. В тази формула обаче се появява малка компания от Китай, наречена DeepSeek, която пробива дупка с модел на изкуствен интелект, който е също толкова мощен и е създаден на малка част от цената. Но в тази история за Давид и Голиат има нещо повече от една компания - или дори от Китай.

В целия свят се създават подобни модели с отворен код, които са готови да отнемат пазарния дял на Алтман със системи, които са значително по-евтини или дори безплатни за използване. Това е обезпокоителна перспектива за предприятия като OpenAI и Anthropic, чийто основен път към рентабилността е продажбата на достъп до модела на основата на по-висока цена. (Google на Alphabet Inc. и Microsoft Corp. поне разполагат с облачни и софтуерни бизнеси, на които да се опрат.) Публично достъпните модели като DeepSeek може и да не се възцарят в крайна сметка, но биха могли да спечелят неудобно голям дял от пая и да изпълнят обещанията, които Алтман пренебрегна по отношение на отвореността и сътрудничеството.

„ Докладът на DeepSeek за [нейния нов модел на изкуствен интелект, известен като] R1, беше по-прозрачен от всичко, което съм виждал от OpenAI след GPT-3“, казва Гари Маркъс, почетен професор в Нюйоркския университет, който отдавна се оплаква от непрозрачността на OpenAI и предупреждава за срив на пазара на изкуствен интелект.

Тази откритост е част от промяната, която се случва в Китай. DeepSeek е основана от предприемач от хедж фонд на име Лян Уенфън, който събира бившите си служители и десетки докторанти от китайски университети, за да се опита да създаде изкуствен интелект на човешко ниво. След това той използва 10 000 чипа, придобити от Nvidia Corp. през 2021 г. (преди репресиите на САЩ върху износа на чипове), като според съобщенията използва 1/50 от изчислителната мощ, с която разполагат технологични гиганти като Google, Microsoft и OpenAI.

През тази седмица на отчетите, докато тези компании се опитват да обяснят на инвеститорите своите главозамайващо високи капиталови разходи за изкуствен интелект, те ще направят всичко възможно да дадат някаква надежда. След като се притесняваха от намаляващата възвръщаемост на т.нар. закони за мащабиране, които са в основата на формулата на Алтман „повече е по-добре“, благодарение на DeepSeek те вече разполагат с проекти за заобикаляне на тези изисквания.

Китайската компания е публикувала повечето от подробностите за R1 в интернет - нещо, което OpenAI и Google не биха направили днес. Нейният пробив по същество е нов подход към т.нар. моделиране на възнагражденията, според едно обобщение на резултатите. Инженерите на Meta Platforms Inc. вече се занимават с тези подробности и през следващите седмици и месеци може да видим как Марк Зукърбърг и неговите колеги от големите технологични компании пускат нови модели на изкуствен интелект, които са много по-ефективни.

Това няма да е лесно, тъй като DeepSeek технически не е „с отворен код“, според Инициативата за отворен код (OSI), глобален орган, който сертифицира софтуерни лицензи. „Те не предоставят изходния код за обработка, филтриране и обучение на данните, нито информация за данните за обучение“, казва ми говорител на OSI. „Другите ще трябва да изградят това от нулата само въз основа на публикувания от тях документ“.

Но като т.нар. система с отворено тегло DeepSeek все пак може да предостави решаващите параметри на модела, които други могат да копират и подобрят, за разлика от OpenAI, която държи моделите си заключени в черна кутия.

Самият DeepSeek е изграден върху работата на други хора. Компанията твърди, че нейният изкуствен интелект е изграден върху отворения модел Llama на Meta. Microsoft също така проучва дали DeepSeek не е изградила своя ИИ с помощта на технологията на OpenAI, макар и без съответното разрешение, което вероятно предизвиква недоумение в Сан Франциско. (Можете да оплаквате OpenAI с най-малката цигулка в света, защото това е компания, иззела защитените с авторски права произведения на хиляди художници и писатели с цел собствена търговска изгода).

Безплатните, високоспособни системи за изкуствен интелект не се изчерпват само с DeepSeek. От Китай идват още продукти с отворен код за ИИ, като например YuE, който генерира пълни поп песни с изсвирени текстове, и Qwen на Alibaba Group Holding Ltd., който създава интелигентни помощници.

Преминаването на Китай към създаване на модели с отворен код стана през последните няколко години, благодарение на контрола върху износа от страна на САЩ, правителствената подкрепа и въздействието на собствения модел с отворени баланси Llama на Meta, който няколко китайски технологични фирми ентусиазирано доработват за собствените си приложения, според Computer Weekly.

За утвърдените гиганти от Силициевата долина истинската заплаха не е само Китай, а начинът, по който китайските технологични фирми биха могли да подхранят още по-силен импулс за движението за отворен код в други части на света - като Франция, където се намират обещаващите фирми за ИИ с отворен код Mistral AI и Hugging Face Inc., и САЩ, където изследователският колектив EleutherAI е оказал влияние върху създаването на модели като GPT-J и GPT-NeoX.

Разбира се, изкуственият интелект с отворен код има и недостатъци, като очевидният от тях е злоупотребата с него от страна на лоши играчи. И макар че новият модел на DeepSeek е решил проблема с разходите, той не е решил проблема с халюцинациите. В социалните медии съществуват множество примери за потребители, които разбиват джейлбрейк на R1, за да заобиколят неговите филтри, благоприятни за Китайската комунистическа партия. И макар че създаването на модела е било евтино, управлението му все още е относително скъпо, посочва Маркъс.

Въпреки това DeepSeek все още дава на изкуствения интелект с отворен код новопридобито доверие сред създателите на софтуер. Разработчиците във форуми като X показват всички приложения, които създават на безплатната платформа на DeepSeek. Един от тях казва, че я е използвал, за да клонира машината за отговори с изкуствен интелект Perplexity, без да пише никакъв код. Друг разработчик заяви, че е използвал R1, за да създаде приложение, което ви позволява да задавате въпроси за всеки PDF файл.

Дейността на OpenAI по изграждане на модели на основата на софтуер се е превърнала в стока. Истинският икономически потенциал е за тези, които изграждат продукти върху цялата тази инфраструктура или върху платформи като тази на DeepSeek, които са безплатни за използване.

Иронията е богата. Когато OpenAI стартира през 2015 г., тя обещаваше да си сътрудничи „свободно“ и да споделя своите патенти със света. Вместо това, в галактически амбициозния си стремеж към изкуствен интелект на човешко ниво, тя започна да се превръща точно в това, което искаше да разруши: непрозрачен, жаден за пари технологичен гигант, който сега е предизвикан от истински отворен изкуствен интелект.

Алтман убеди света, че изграждането на мощен ИИ изисква огромни ресурси, но сега научава, че ровът му все пак не е толкова дълбок. Може би бъдещето принадлежи не на тези, които могат да похарчат най-много, а на тези, които се осмеляват да споделят работата си със света.