Не можем да отделим ситуацията около DeepSeek от геополитиката. Какви са тревогите ви за реакцията на Вашингтон или други правителства? Дали ще ограничат някак използването на отворения код, за да изолират Китай от технологията?
Има много начини да се говори за ситуацията между САЩ и Китай. Но като цяло тук става дума за ефекта на отворения код. Можеше да се появи практически във всяка друга страна. Бих очаквал от Китай да продължат да идват модели с отворен код. Но имаме и европейски компании като Mistral, които стартират такъв модел. Много скоро и други.
Надявам се скоро да излезем от геополитическото тълкуване на темата към обсъждане на отворения код спрямо затворения. Ние в Hugging Face смятаме, че отвореният е пътя, който води към пробив в развитието на технологията, развитие на общността и много повече прилагане в бизнеса.
Вие самият сте програмист. Сигурно се възхищавате на това, което направиха DeepSeek. Явно с много по-малки разходи от конкурентите им тук в САЩ. Сигурно обаче имате и въпроси. Какво бихте скали да знаете повече за начина им на работа и как са успели.
Интересното е, че вече започнахме да мислим как бихме могли да възпроизведем модела. Да го направим отново и пак да е с отворен код. Вчера аз самият се опитах с DeepSeek.
Те предлагат стандарт. Това е много мощен модел. Но бихме искали да знаем дали можем да го обучим, дали можем да приложим същото към други модели.
Затова започнахме проекта R1, който е отворено възпроизвеждане на модела на DeepSeek. Слава Богу, те споделиха много подробности как са обучили модела. Много повече, отколкото напоследък сме виждали. Затова съм силно уверен, че в близките месеци ще можем да разберем как е направен.