Миналата година по това време Артър Менш бе на 30 години, работейки все още в подразделението на Google, а изкуственият интелект тъкмо бе започнал да навлиза в общественото съзнание като нещо повече от научна фантастика.
Оттогава насам така нареченият генеративен изкуствен интелект, който може да разговаря - и вероятно да разсъждава като хората - се превръща в най-обсъждания технологичен пробив от десетилетия насам. А стартъпът, заради който Менш напусна Google, за да стартира, е вече на девет месеца и се оценява на малко над 2 млрд. долара, пише WSJ.
Бързината на промените отразява лудостта и страха, която обгражда усилията за изграждане и комерсиализиране на усъвършенствани системи за изкуствен интелект.
Стартъпът на Менш, наречен Mistral AI, оспорва общоприетата мъдрост, че победителите в надпреварата за изкуствен интелект ще се появят сред гигантите на технологичната индустрия в САЩ. Менш, който е основал компанията заедно с двама приятели от инженерни училища, не смята, че огромният мащаб е от съществено значение - или че САЩ непременно ще доминират.
„Винаги съм съжалявал, че в Европа няма големи технологии“, казва 31-годишният Менш в парижкия офис на Mistral AI. „Мисля, че това е нашият шанс да се превърнем в такъв.“
Компанията на Менш, която е набрала малко над 500 млн. долара от инвеститори, сред които Andreessen Horowitz, остава малка в сравнение с голиатите в индустрията. Подкрепяната от Microsoft OpenAI и Alphabet на Google влагат милиарди долари в обучението на най-новите системи за изкуствен интелект, използвайки достъпа си до специализираните компютърни чипове, необходими за изграждането на такива системи, и дебелите баланси, необходими за заплащане на електроенергията, която тези чипове консумират.
Mistral е създадена отчасти въз основа на идеята, че много от тези пари се пилеят напразно.
Менш, който е започнал работа в академичните среди, е прекарал голяма част от живота си в търсене на начини за повишаване на ефективността на системите за изкуствен интелект и машинно обучение. В началото на миналата година той обединява усилията си със съоснователите Тимоте Лакроа, на 32 г., и Гийом Лампл, на 33 г., които тогава са били в лабораторията за изкуствен интелект на Meta Platforms в Париж.
Артър Менш. Снимка: Нейтън Лейн/Bloomberg
Заедно те залагат на това, че малкият им екип може да изпревари титаните от Силициевата долина, като намери по-ефективни начини за изграждане и внедряване на системи за изкуствен интелект. И искат да го направят отчасти като предоставят много от своите системи за изкуствен интелект като софтуер с отворен код.
„Искаме да бъдем най-капиталово ефективната компания в света на изкуствения интелект“, заяви Менш. „Това е причината да съществуваме.“
В понеделник Mistral планира да обяви нов модел на AI, наречен Mistral Large, който според Менш може да изпълнява някои задачи за разсъждение, сравними с GPT-4, най-усъвършенствания езиков модел на OpenAI до момента, и Gemini Ultra, новия модел на Google.
Менш заяви, че обучението на новия модел е струвало по-малко от 20 милиона евро, което се равнява на около 22 милиона долара. За разлика от него главният изпълнителен директор на OpenAI Сам Алтман заяви миналата година след пускането на GPT-4, че обучението на най-големите модели на компанията му е струвало „много повече от 50-100 млн. долара“.
Индустрията се съобразява с това. Mistral привлича интереса на корпоративни клиенти и инвеститори, включително Microsoft, която в понеделник планира да обяви, че добавя новия модел на Mistral като опция за разработчиците в своята облачна услуга Azure. Като част от сделката Microsoft ще придобие малък дял в компанията.
Mistral също така си партнира и продава малки дялове на други компании, включително на компанията за корпоративен софтуер Salesforce и на Nvidia, производител на най-мощните графични процесори, използвани за изграждане на системи за изкуствен интелект като тези на Mistral.
Brave Software използва безплатен модел с отворен код от Mistral по подразбиране за захранване на своя чатбот за уеб браузъри, посочи Брайън Бонди, съосновател и главен технологичен директор на Brave. Той добави, че компанията намира качеството за сравнимо с това на патентованите модели, а подходът на Mistral с отворен код позволява на Brave да контролира модела на местно ниво.
Ерик Бойд, корпоративен вицепрезидент на платформата за изкуствен интелект на Microsoft, заяви, че Mistral представлява интригуващ тест за това докъде може да стигне интелигентното инженерство в системите за изкуствен интелект. „И докъде още може да се стигне?. Това предстои да видим.“
Висок, с гъста тъмна коса, Менш не изглежда и не се държи като главен изпълнителен директор на забележителен технологичен стартъп. Приятелите и колегите му казват, че се шегува на по бира. Също така е спортист, завършил е маратона в Париж за по-малко от 3 часа и половина месеци преди да завърши докторската си дисертация през 2018 г.
Менш отдавна е разкъсван между академичните занимания и предприемаческите такива. Той израства в предградията западно от Париж, син на майка учителка по физика и баща с малък технологичен бизнес.
Бъдещият главен изпълнителен директор е посещавал някои от най-добрите френски училища по математика и машинно обучение. Съветниците му описват ученик, който се впускал с желание в проектите и ги овладявал, дори и да имал слаба подготовка.
„Обичам новите преживявания. Много бързо се отегчавам“, споделя Менш.
В рамките на докторската си степен Менш работи по начини за увеличаване на софтуера за анализ на триизмерни мозъчни изображения от функционална система за магнитно-резонансно изобразяване, така че да може да поглъща милиони изображения - да картографира мрежи на мозъка, отговорни за неща като математика и лица.
Менш се присъединява към звеното за изкуствен интелект на Google, наречено тогава DeepMind, в края на 2020 г., където работи в екипа, създаващ т.нар. големи езикови модели - типът система за изкуствен интелект, която по-късно ще захранва ChatGPT. До 2022 г. той е един от водещите автори на статия за нов модел на изкуствения интелект, наречен Chinchilla, която променя разбирането на областта за връзката между размера на модела на AI, количеството данни, използвани за изграждането му, и това колко добре се представя, известна като закони за мащабиране на AI.
„Кой друг би могъл да оспори световното разбиране за законите за мащабиране, ако не един от хората, които са помогнали за дефинирането им“, коментира Сара Гуо, ранен инвеститор в Mistral чрез своята компания за рисков капитал Conviction.
С разгарянето на надпреварата в областта на изкуствения интелект през 2022 г. Менш заяви, че е разочарован, че големите частни лаборатории за изкуствен интелект са започнали да публикуват по-малко статии за големи езикови модели, споделяйки по-малко с по-широката изследователска общност. След като ChatGPT стартира, в рамките на Google започна надпревара да се изравни с него. Менш казва, че от екип от 10 души е преминал към 30, а след това към 70.
„Мисля, че напуснах точно преди да стане твърде бюрократично за мен“, смята Менш. „Не исках да изграждам непрозрачна технология в рамките на големите технологии.“
Миналата пролет в първоначалния документ на Mistral, представен на инвеститорите, се посочва, че се оформя „олигопол”, ръководен от американски компании, които продават патентовани модели.
Още в началото Менш взе участие в лобирането на френските политици, включително на френския президент Еманюел Макрон, срещу някои елементи от новия Закон за изкуствения интелект на Европейския съюз, за който Менш предупреди, че може да забави компаниите и според него няма да допринесе за повишаване на безопасността на изкуствения интелект. След промените в текста в Брюксел, той ще бъде управляема тежест за Mistral, казва Менш, макар да смята, че законът е трябвало да остане фокусиран върху това как се използва изкуствения интелект, а не да регулира и основната технология.
За Менш и неговите съоснователи пускането на първоначалните им системи за изкуствен интелект като системи с отворен код, които всеки може да използва или адаптира безплатно, е важен принцип. Това беше и начин да бъдат забелязани от разработчиците и потенциалните клиенти, желаещи по-голям контрол върху използвания от тях изкуствен интелект. Най-усъвършенстваните модели на Mistral, включително обявеният в понеделник, не са достъпни с отворен код.
„Очевидно това е тънък баланс между изграждането на бизнес модел и придържането към нашите ценности на отворения код“, каза Менш. „Искаме да изобретяваме нови неща, нови архитектури, и все пак искаме да имаме нещо, което да продаваме допълнително на нашите клиенти.“