OpenAI пуска по-бърза и по-евтина версия на модела за изкуствен интелект, който е в основата на нейния чатбот ChatGPT, тъй като стартъпът се опитва да задържи водещата си позиция на все по-пренаселения пазар.
По време на събитие, предавано на живо в понеделник, OpenAI дебютира с GPT-4o. Това е актуализирана версия на модела GPT-4, който е на повече от година. Новият голям езиков модел, обучен на базата на огромни количества данни от интернет, ще може да обработва по-добре текст, аудио и изображения в реално време. Актуализациите ще бъдат налични през следващите седмици.
Според компанията при устно задаване на въпрос системата може да отговори със звуков отговор за милисекунди, което позволява по-плавен разговор. При демонстрацията на модела изследователите от OpenAI и главният технологичен директор Мира Мурати проведоха разговор с новия ChatGPT, като използваха само гласовете си, показвайки, че инструментът може да отговори. По време на презентацията се оказа, че чатботът също така превежда реч от един език на друг почти мигновено и в един момент изпя част от история при поискване.
„Това е първият път, в който правим огромен скок във взаимодействието и лекотата на използване“, каза Мурати пред Bloomberg News. „Ние наистина правим възможно сътрудничеството с инструменти като ChatGPT“.
Актуализацията ще предостави на безплатните потребители редица функции, които досега бяха ограничени до тези с платен абонамент за ChatGPT, като например възможността да търсят отговори на запитвания в интернет, да говорят на чатбота и да чуват отговора му на различни гласове, както и да му заповядват да запаметява детайли, които чатботът може да извика в бъдеще.
Пускането на GPT-4o е на път да разтърси бързо развиващия се пейзаж на изкуствения интелект, където GPT-4 остава златен стандарт. Все повече стартиращи компании и големи технологични компании, включително Anthropic, Cohere и Google на Alphabet Inc., наскоро пуснаха модели на ИИ, които според тях съвпадат или превъзхождат резултатите на GPT-4 в определени показатели.
Съобщението на OpenAI идва и ден преди конференцията за разработчици Google I/O. Очаква се Google, която е ранен лидер в областта на изкуствения интелект, да използва събитието, за да представи още актуализации на изкуствения интелект, след като се надпреварва да не изостава от подкрепяната от Microsoft Corp. OpenAI.
В рядка публикация в блога си в понеделник главният изпълнителен директор на OpenAI Сам Алтман заяви, че докато първоначалната версия на ChatGPT е подсказвала как хората могат да използват езика за взаимодействие с компютрите, при използването на GPT-4o усещането е „усезаемо различно“.
„Усещането е като за изкуствен интелект от филмите и все още е малко изненадващо за мен, че е истински“, казва той. „Достигането на време за реакция и изразителност на човешко ниво се оказва голяма промяна.“
Два пъти по-бързо Вместо да разчита на различни модели на изкуствения интелект за обработка на различни входни данни, GPT-4o - буквата „о“ означава „omni“ - комбинира глас, текст и визия в един модел, което му позволява да бъде по-бърз от своя предшественик. Например, ако подадете на системата заявка за изображение, тя може да отговори с изображение. Компанията заяви, че новият модел е два пъти по-бърз и значително по-ефективен.
„Когато имате три различни модела, които работят заедно, внасяте много забавяне в преживяването и това нарушава потапянето в преживяването“, каза Мурати. „Но когато имате един модел, който естествено обосновава аудиото, текста и визията, тогава премахвате цялата латентност и можете да взаимодействате с ChatGPT по-скоро така, както взаимодействаме сега.“
Но новият модел се сблъска с някои трудности. Звукът често прекъсваше, когато изследователите говореха по време на демонстрацията. Системата за изкуствен интелект също така изненада аудиторията, когато след като инструктира изследовател в процеса на решаване на алгебрична задача, тя се включи с глас, звучащ като флирт: „Уау, това е доста добър костюм, който си облякъл.“
OpenAI започва да въвежда новите възможности на GPT-4o за работа с текст и изображения за някои платени потребители на ChatGPT Plus и Team днес и скоро ще предложи тези възможности на корпоративните потребители. Компанията ще предостави новата версия на своя асистент в „гласов режим“ на потребителите на ChatGPT Plus през следващите седмици.
Като част от актуализациите си OpenAI заяви, че също така дава възможност на всеки да получи достъп до нейния магазин GPT Store, който включва персонализирани чатботове, създадени от потребителите. Преди това той беше достъпен само за клиенти, които плащат.
През последните седмици спекулациите за следващото пускане на OpenAI се превърнаха в игра в Силициевата долина. Мистериозен нов чатбот предизвика вълнение сред наблюдателите на изкуствения интелект, след като се появи в уебсайт за сравнителни тестове и изглеждаше, че съперничи на GPT-4. Олтман предложи намигващи препратки към чатбота в X, подхранвайки слуховете, че зад него стои неговата компания. В понеделник служител на OpenAI потвърди в социалната платформа X, че тайнственият чатбот наистина е GPT-4o.
Компанията работи по широк спектър от продукти, включително гласови технологии и видео софтуер. OpenAI разработва и функция за търсене за ChatGPT, съобщи Bloomberg.
В петък компанията потуши някои от слуховете, като заяви, че няма да пусне скоро GPT-5 - дългоочаквана версия на своя модел, за която някои в технологичния свят очакват, че ще бъде радикално по-способна от сегашните системи за изкуствен интелект. Тя също така заяви, че на събитието в понеделник няма да бъде представен нов продукт за търсене - инструмент, който може да се конкурира с Google. Акциите на Google поскъпнаха след новината.
Но след края на събитието Алтман побърза да продължи спекулациите. „Скоро ще имаме още неща за споделяне“, написа той в X.