ИСПИТИВАЊЕ ТАЧНОСТИ АУТОМАТСКОГ ПРЕПОЗНАВАЊА ГОВОРНИКА НА ГОВОРНИМ СИГНАЛИМА ТЕЛЕФОНСКОГ КВАЛИТЕТА

  • Ivan Jokić Fakultet tehničkih nauka, Univerzitet u Novom Sadu
  • Vlado Delić Fakultet tehničkih nauka, Univerzitet u Novom Sadu
  • Nikša Jakovljević Fakultet tehničkih nauka, Univerzitet u Novom Sadu
  • Milan Dobrović Telekom Srbija
  • Stevan Jokić Fakultet tehničkih nauka, Univerzitet u Novom Sadu
Кључне речи: аутоматско препознавање говорника, мел-фреквенцијски кепстрални коефицијенти, модел мешавине Гаусових расподела, скривени Марковљев модел, HTK, ITU-T STL2005, ITU-T препорука G.729, ехо у VoIP

Сажетак

У овом раду извршено је испитивање тачности идентификације говорника на говорним сигналима телефонског квалитета. Имплементација коришћеног препознавача говорника извршена је употребом HTK (енгл. Hidden Markov models ToolKit – HTK). Утицај разматраних телефонских канала на преношени говорни сигнал посматран је кроз њихове основне особености, типове примењених кодека и ефеката који су последица самог стања преносног канала. Поменути ефекти су посматрани кроз фактор вероватноће грешке приликом преноса, док је за VoIP телефонске канале анализирана и појава еха. Симулације рада одговарајућих кодека као и различитих вероватноћа појаве грешака приликом преноса извршене су коришћењем јавно доступне софтверске библиотеке алата, ITU-T STL2005, док је појава еха симулирана применом ефекта Delay/Echo-Simple програмског пакета Sony Sound Forge 9.0.
Објављено
2019-01-15
Bрој часописа
Секција
Чланци