Последната вълна от технологии за изкуствен интелект може да имитира гласа на почти всеки - президент, роднина или клиент на банка.
Това е проблемът и възможността, с които се занимава стартиращата компания за аудиотехнологии Pindrop Security Inc. с десетилетна история. Компанията отдавна предоставя услуги за гласова проверка на автентичността на банки и застрахователи. Миналата седмица тя пусна нов продукт, за който твърди, че може да засича реч, генерирана от изкуствен интелект, както в телефонни разговори, така и в цифрови медии. Тя предлага тази функция на медийни организации, правителствени агенции и социални мрежи.
Pindrop е една от все по-големия брой компании, ориентирани към сигурността, които се стремят да се борят със заплахата от фалшификати и измами с изкуствен интелект. Сред тях са компании като Protect AI Inc. и Tools For Humanity Corp. на Сам Олтман или Worldcoin, която идентифицира хора с помощта на сканиране на очите им.
Със специализация в областта на аудиото Pindrop влезе в заглавията на медиите през януари, когато откри източника на deep fake на президента Джо Байдън, който призоваваше хората да не гласуват на първичните избори в Ню Хемпшир чрез обаждане по телефона. Мащабът на атаките се увеличава: Компанията заяви, че е регистрирала повече от петкратно увеличение на броя на опитите за атаки, насочени към нейни клиенти, от миналата година насам.
„Доста е лесно да се съберат гласов клонинг и подправящ софтуер, за да изглеждат ефективно като някой друг по телефона“, казва Рейчъл Тобак, главен изпълнителен директор на SocialProof Security.
Pindrop привлече средства от редица известни инвеститори, сред които Andreessen Horowitz и GV. Тази година компанията набра 100 млн. долара дългово финансиране от Hercules Capital Inc. Последната оценка на компанията е 925 млн. долара.
Съоснователят Виджай Баласубраманиян започва да се замисля за проблема с аудиофалшификатите, след като се опитва да си купи костюм, докато пътува в Индия като докторант. Американската му банка му се обажда, за да потвърди транзакцията около 3 ч. сутринта негово време, и го пита за номера на социалната му осигуровка. Без да може да провери кой е обаждащият се и без много информация от банката, той прекратил разговора.
„Това е лудост“, спомня си Баласубраманиян, когато пътува със самолет обратно към САЩ. „Телефоните съществуват от толкова отдавна, още от времето на Александър Греъм Бел, а ние все още нямаме начин да идентифицираме какво се намира от другата страна на разговора.“ (Той така и не купува костюма.)
Технологията на Pindrop работи чрез анализиране на звука, за да определи дали гласът е наистина човешки, или само подобен на човешки. Хората говорят, като издават специфични звуци, които образуват думи, казва Баласубраманиян. Но машините не произвеждат звуци по същия начин като хората и понякога генерират варианти, които не отговарят на физическите ограничения на начина, по който човешката уста произвежда звук. Тъй като всяка секунда от гласовия аудиозапис съдържа 8000 семпли, има хиляди точки, в които изкуственият интелект може да допусне грешка.
„С получаването на все повече и повече аудиоматериали започвате да виждате тези аномалии“, казва Баласубраманиян, който допълва, че тъй като всички хора издават звуци по един и същи начин, софтуерът им за откриване е езиково агностичен.
Компанията твърди, че новият ѝ инструмент може да идентифицира аудио, генерирано от изкуствен интелект, с 99% точност, но в индустрията все още се водят дебати относно ограниченията на откриването на изкуствен интелект. За учители, изследователи и потребители на социални медии откриването на текстове и изображения, създадени от ИИ, е примамлив проблем с напредването на технологията. През март, когато OpenAI пусна инструмент, който може да възпроизвежда гласовете на хората, компанията предложи в публикация в блога си предприятията постепенно да се откажат от гласово базираната идентификация за достъп до банкови сметки и друга чувствителна информация.
Джон Чеймбърс, бившият ръководител на Cisco Systems Inc., е член на управителния съвет на Pindrop и изтъква гласовата идентификация като необичайно сигурна форма на удостоверяване онлайн. Чеймбърс инвестира в стартъпа чрез своята фирма JC2 Ventures. „В бъдеще гласът ще бъде основният начин за идентификация в областта на киберсигурността“, каза той. Когато гласът се съчетае с биометрични данни и данни за използваното устройство, „ще бъде почти невъзможно някой да го разбие напълно“, каза той.
Някои представители на бранша изразиха опасения относно увеличаването на броя на компаниите, занимаващи се с борба с проблемите на изкуствения интелект. Ако не бъдат приети закони за намаляване на количеството лични данни, достъпни онлайн, индустрията може да се окаже в капана на вечната борба между добрия и лошия изкуствен интелект, каза Джеймс Е. Лий от Центъра за изследване на кражбата на самоличност.
С развитието на технологиите за сигурност се развиват и заплахите. Възможно е злонамерените играчи да обучат алгоритъм, който да избягва проверките, които компании като Pindrop използват за идентифициране на deep fake материали, казва Андрю Грото, експерт по киберсигурност в Станфордския университет. „В крайна сметка се оказвате в тази надпревара във въоръжаването, тази игра на котка и мишка между защитниците и участниците в заплахите“, казва Грото.
Наближава едно от най-очакваните събития за стартиращи предприемачи Founders Today. До 31 август всяка start up или scale up компания, която иска да представи своя бизнес на голямата трибуна на Founders Today, да прикове вниманието на инвеститорите и да се запознае с едни от най-големите и важни имена в предприемаческата екосистема, може да кандидатства в конкурса тук.
Шестимата големи победители ще спечелят медийни пакети за комуникация в Investor Media Group и ексклузивна менторска сесия с утвърден български предприемач.
Ако имате start up, не се колебайте – представете го и кандидатствайте във Founders Today.