Google представи нова версия на водещия си модел за изкуствен интелект, който според компанията е два пъти по-бърз от предишната версия и ще захранва виртуални оператори, които помагат на потребителите.
Новият модел, Gemini 2.0, може да генерира изображения и звук на различни езици и да помага при търсене в Google и при проекти за програмиране, съобщи компанията в сряда. Новите възможности на Gemini „дават възможност да се създават оператори, които могат да мислят, да запомнят, да планират и дори да предприемат действия от ваше име“, каза Тулси Доши, директор на отдел „Управление на продукти“ в компанията, на брифинг с репортери.
Google на Alphabet Inc. работи, за да гарантира, че най-новата вълна от инструменти за изкуствен интелект, предлагани от OpenAI и други стартъпи, няма да отслаби влиянието ѝ върху търсенето и рекламата. Досега компанията е запазила пазарния си дял в търсенето, но OpenAI вплита все повече функции за търсене в ChatGPT, оказвайки натиск върху лидера в бранша. Крайната цел и на двете компании е да създадат общ изкуствен интелект, или софтуер, който може да изпълнява задачи толкова добре или по-добре от хората.
„Искаме да изградим тази технология - там е истинската стойност“, каза в интервю Корай Кавукчуоглу, главен технологичен директор на лабораторията за изкуствен интелект Google DeepMind. „И по пътя към това се опитваме да изберем правилните приложения, да изберем правилните проблеми за решаване.“
Освен в експерименталните продукти, Google включи повече изкуствен интелект в своята търсачка, която продължава да бъде нейната основна сила. Компанията съобщи, че тази седмица ще започне да тества Gemini 2.0 в търсенето и в AI Overviews - резюметата на базата на изкуствен интелект, които се показват в горната част на търсенето в Google. Това ще подобри скоростта и качеството на резултатите от търсенето на все по-сложни въпроси, като например сложни математически уравнения. В сряда компанията също така предостави на разработчиците достъп до експериментална версия на Gemini 2.0 Flash, нейния бърз и ефективен модел на изкуствен интелект, който според Google може да обработва по-добре изображения и да се доближава до човешката способност за разсъждение.
Google дебютира с нова уеб функция, наречена deep research „дълбоко проучване“, която според компанията ще позволи на потребителите на Gemini да използват изкуствен интелект, за да навлязат в теми с подробни доклади. Функцията, обявена за асистент за изследвания, задвижван от ИИ, ще бъде достъпна в сряда за потребителите на Gemini Advanced, платения абонаментен продукт на Google за ИИ. Междувременно потребителите на Gemini по целия свят ще могат да се възползват от оптимизирания чатбот на експерименталния Gemini 2.0 Flash в интернет, съобщиха от компанията. През новата година моделът ще се появи в повече продукти на Google.
Представените в сряда продукти показват как водещият изследдователски център за изкуствен интелект на Google - Google DeepMind - играе все по-ключова роля в разработването на продукти. Центъра разширява тестовете на Project Astra - изкуствен интелект, който използва камерата на смартфон за обработка на визуални данни. В изискано пространство, напомнящо домашна библиотека, с високи рафтове със заглавия за компютърно програмиране и пътуване, служителите на Google показаха как Astra може да синтезира информация. Скрита врата, вмъкната в рафтовете, разкри малка художествена галерия, където моделът размишляваше върху това как картината „ Писъкът“ на норвежкия художник Едвард Мунк е уловила собствената му тревожност и общата параноя на неговата епоха.
Но моделът все пак показа някои недостатъци. По време на демонстрация на живо с репортер на Bloomberg той не успя да каже дали на рафта има романи.
Изследователят от DeepMind Грег Уейн заяви, че Astra се е усъвършенствал, откакто бе представен за първи път на забележителната конференция за разработчици на Google по-рано тази година, и вече може да отговаря разговорно със същата скорост, с която би отговорил човек. Веднъж моделът се е затруднил с името на главния изпълнителен директор на DeepMind Демис Хасабис, тълкувайки го като искане за информация за сирийската столица Дамаск, но сега се справя с тази и други заявки с лекота, каза Уейн в интервю.
„Мотото на основателите е разработване на изкуствен интелект с очи, уши и глас, който да ви помага в реалния или в цифровия свят“, каза Уейн.
Компанията тества и експериментален уеб базиран асистент Mariner, предназначен да помага на потребителите да попълват количките си за онлайн пазаруване и да организират дигиталния си живот. По време на демонстрация с репортер на Bloomberg директорът на Google за управление на продукти Джаклин Конзелман използва Mariner, който е разширение в браузъра Chrome, за да добави продукти от рецепта в количката си за пазаруване в магазина за хранителни стоки Safeway. Засега Mariner не предлага спестяване на време, тъй като потребителите наблюдават как асистентът изпълнява задачите. Компанията иска да държи потребителите в течение при вземането на ключови решения, като например извършването на покупка, заяви в интервю Хелън Кинг, старши директор по отговорностите на Google DeepMind.
„Много хора казват: „Да, но това е просто количка за пазаруване“, казва тя. „Но когато на вратата ви се появят 100 тоалетни ролки, защото асистентът е успял да пропусне някъде една нула, вие ще бъдете по-малко склонни да мислите, че това е просто количка за пазаруване“.
На брифинг с репортерите компанията демонстрира още два модела изкуствен интелект, с които заяви, че експериментира вътрешно и с групи от доверени потребители. Първият, наречен Jules, е задвижван от ИИ помощник за инженери, който се фокусира върху отстраняването на грешки в софтуерния код и справянето с рутинни задачи по програмиране. Google показа и неназован все още модел за видеоигри, който има за цел да помага на играчите, като разсъждава за играта и предлага съвети в разговор в реално време. Компанията нарече това усилие „ранен експериментален етап“, предназначен да демонстрира някои от преживяванията на агентите с изкуствен интелект, възможни с Gemini 2.0.
Инвеститорите изразиха загриженост, че възвръщаемостта от скъпите инвестиции в изкуствен интелект на Google и нейните конкуренти може да намалее. Но Кавукчуоглу, ръководител на DeepMind, се опита да разсее всякакви предположения за забавяне на напредъка.
„Сравнявам къде бяхме преди година и къде сме сега“, каза Кавукчуоглу, като добави, че флаш моделът, който компанията пуска, е „много по-способен от всичко, което имахме преди година, на част от цената“.