fallback

Бизнес старт

Всеки делник от 7:30 часа
Водещи: Роселина Петкова и Христо Николов

БАН с пробив при обработката и разпознаването на реч, подава ръка на бизнеса

Проф. дмн Стоян Михов, Институт по комуникационни и информационни технологии на БАН, "Бизнес старт", 30.12.2022 г.

12:24 | 30 декември 2022
Обновен: 12:58 | 2 януари 2023
Автор: Даниел Николов

Речта е най-естественият способ за комуникация между хората и все повече измества клавиатурата и мишката в комуникацията с машините. Българските учени развиват тези технологии за българския език като последните разработки са говоряща програма, медицински диктофон и административен „интелигентен стенограф“. Tрите иновации са на базата на оригинални технологии за машинна обработка на реч и са базирани на последните достижения на дълбокото машинно самообучение. Това каза проф. дмн Стоян Михов, Институт по комуникационни и информационни технологии на БАН, в ефира на предаването "Бизнес старт" с водещ Христо Николов.

Едно от приложенията е насочено основно за хора със зрителни увреждания.

"Един от основните начини за достъп до информация е чрез глас - хората със зрителни увреждания не могат да използват екран или мишка и единственият ефективен начин е с Брайл или с глас. С помощта на екранните четци хората се научават да работят с компютър или смартфон вече изключително ефективно, в много случаи по-добре от зрящите."

Тези инструменти вече помагат да се правят корекции и редакции на текстове, работа с таблични калкулации, и като цяло напълно ефективна работа за хората със зрителни увреждания, каза Михов. Всичко написано на практика може да се превърне в реч чрез разработеното приложение, и докато то има досат правилно произношение, все още не може да възпроизвежда текст с емоции.

"В новия проект речта, която се синтезира, трудно се различава от естествената реч. По естественост достигаме нивото на обикновен човек, което прави речта по-приятна и по-лесна за възприемане."

Друга иновация е медицински диктофон, който разпознава речта на лекари и може автоматично да попълва документи като амбулаторни листи, епикризи и други, като информацията влиза и в медицинската здравна система. След тестовете в реални условия на прототип на диктофона, отзивите са били предимно положителни като лекарите не само са спестявали време от административни задачи, но се е повишило и качеството на попълнената информация, разказа Михов.

Подобно е приложението за административен „интелигентен стенограф“, което е било тествано с записи от Народното събрание за последните десет години. Приложението изготвя стенограми и протоколи от срещи и е постигнало ниво на грешки при думи под 3%, което е по-добро от западните аналози, каза Михов. Освен за администрация, то би могло да се използва и в други сфери и да се обучи да разпознава специфична терминология или технически жаргон.

Има сериозен интерес от бизнеса в различни области към тези иновации, разказа Михов, като се работи с две от най-големите фирми за медицински софтуер, които са направили и тествали интеграциията на медицинския диктофон с техните системи. Работи се с компании за IVR услуги, които се използват в кол-центровете.

Имаме опит с няколко компании, които са склонни да инвестират в създаването на продукт за по-широко ползване от прототип, като някои от тях имат доста добър успех, но като цяло бизнесът трябва да разбере, че трябва да инвестира в тези процеси, а не да чака научните среди да излизат с готови продукти, каза Михов.

"Повечето фирми в България очакват да им се предостави директно готов завършен продукт, което не е целта на изследователски институт като нашия. Ние обикново стигаме до прототип, който може да покаже какви са възможностите и да се тества. Оттам нататък се изисква допълнително инвестиране, за да стане продукт за съответните клиенти. В този момент, поне през последните години, имаше съществен проблем, тъй като повечето фирми очакват веднага да го получат и да могат да го ползват, което няма как да стане, тъй като на нас не ни е работа - за да го направим на продукт, трябва да наемем например софтуерни специалисти или разработчици; тази дейност е доста далеч от научно-изследователската дейност."

Повече за новите разработки в областта на синтеза и разпознаването на българска реч може да гледате във видеото.

Всички гости на предаването "Бизнес старт" може да намерите тук.

 

fallback
fallback