S-ADAPT

Vrsta projekta: Domaći

Period realizacije: 2020-2022

Budžet projekta: € 200 000,00

Rukovodilac: prof. dr Vlado Delić

Web sajt: https://www.ktios.ftn.uns.ac.rs/sadapt

Speaker/Style Adaptation for Digital Voice Assistants Based on Image Processing Methods

Projekat S-ADAPT će istraživati metode korišćene u obradi slike bazirane na dubokom učenju i primeniti ih na govor u cilju unapređenja funkcionalnosti digitalnih govornih asistenata, koji se zasnivaju na tehnologijama automatskog prepoznavanja govora (ASR) i sintezi govora na osnovu teksta (TTS). Projekat je posebno usmeren na postizanje potpune fleksibilnosti jedine postojeće aplikacije digitalnog govornog asistenta na srpskom jeziku, što u pogledu ASR znači mogućnost da se aplikacija adaptira na glas različitih govornika, govornih stilova i uslova u kojima se govor snima (mikrofon, ambijentalna buka), dok u pogledu TTS to podrazumeva mogućnost produkcije sintetizovanog govora proizvoljnim glasom u proizvoljnom govornom stilu. Sa ovim ciljem, Projekat će koristiti najsavremenije metode transfera stila slike, koji se baziraju na adaptaciji domena, a koje karakteriše korišćenje male količine materijala specifičnog domena što ih čini pogodnim za praktičnu primenu.