БАН с пробив при обработката и разпознаването на реч, подава ръка на бизнеса
Проф. дмн Стоян Михов, Институт по комуникационни и информационни технологии на БАН, "Бизнес старт", 30.12.2022 г.
Обновен: 12:58 | 2 януари 2023
Речта е най-естественият способ за комуникация между хората и все повече измества клавиатурата и мишката в комуникацията с машините. Българските учени развиват тези технологии за българския език като последните разработки са говоряща програма, медицински диктофон и административен „интелигентен стенограф“. Tрите иновации са на базата на оригинални технологии за машинна обработка на реч и са базирани на последните достижения на дълбокото машинно самообучение. Това каза проф. дмн Стоян Михов, Институт по комуникационни и информационни технологии на БАН, в ефира на предаването "Бизнес старт" с водещ Христо Николов.
Едно от приложенията е насочено основно за хора със зрителни увреждания.
"Един от основните начини за достъп до информация е чрез глас - хората със зрителни увреждания не могат да използват екран или мишка и единственият ефективен начин е с Брайл или с глас. С помощта на екранните четци хората се научават да работят с компютър или смартфон вече изключително ефективно, в много случаи по-добре от зрящите."
Тези инструменти вече помагат да се правят корекции и редакции на текстове, работа с таблични калкулации, и като цяло напълно ефективна работа за хората със зрителни увреждания, каза Михов. Всичко написано на практика може да се превърне в реч чрез разработеното приложение, и докато то има досат правилно произношение, все още не може да възпроизвежда текст с емоции.
"В новия проект речта, която се синтезира, трудно се различава от естествената реч. По естественост достигаме нивото на обикновен човек, което прави речта по-приятна и по-лесна за възприемане."
Друга иновация е медицински диктофон, който разпознава речта на лекари и може автоматично да попълва документи като амбулаторни листи, епикризи и други, като информацията влиза и в медицинската здравна система. След тестовете в реални условия на прототип на диктофона, отзивите са били предимно положителни като лекарите не само са спестявали време от административни задачи, но се е повишило и качеството на попълнената информация, разказа Михов.
Подобно е приложението за административен „интелигентен стенограф“, което е било тествано с записи от Народното събрание за последните десет години. Приложението изготвя стенограми и протоколи от срещи и е постигнало ниво на грешки при думи под 3%, което е по-добро от западните аналози, каза Михов. Освен за администрация, то би могло да се използва и в други сфери и да се обучи да разпознава специфична терминология или технически жаргон.
Има сериозен интерес от бизнеса в различни области към тези иновации, разказа Михов, като се работи с две от най-големите фирми за медицински софтуер, които са направили и тествали интеграциията на медицинския диктофон с техните системи. Работи се с компании за IVR услуги, които се използват в кол-центровете.
Имаме опит с няколко компании, които са склонни да инвестират в създаването на продукт за по-широко ползване от прототип, като някои от тях имат доста добър успех, но като цяло бизнесът трябва да разбере, че трябва да инвестира в тези процеси, а не да чака научните среди да излизат с готови продукти, каза Михов.
"Повечето фирми в България очакват да им се предостави директно готов завършен продукт, което не е целта на изследователски институт като нашия. Ние обикново стигаме до прототип, който може да покаже какви са възможностите и да се тества. Оттам нататък се изисква допълнително инвестиране, за да стане продукт за съответните клиенти. В този момент, поне през последните години, имаше съществен проблем, тъй като повечето фирми очакват веднага да го получат и да могат да го ползват, което няма как да стане, тъй като на нас не ни е работа - за да го направим на продукт, трябва да наемем например софтуерни специалисти или разработчици; тази дейност е доста далеч от научно-изследователската дейност."
Повече за новите разработки в областта на синтеза и разпознаването на българска реч може да гледате във видеото.
Всички гости на предаването "Бизнес старт" може да намерите тук.