MODEL SISTEMA ZA EKSTRAKCIJU INFORMACIJA IZ TEKSTOVA PISANIH NA SRPSKOM JEZIKU

  • Staša Vujičić Stanković Univerzitet u Beogradu, Matematički fakultet
Кључне речи: ekstrakcija informacija bazirana na ontologijama, semantički veb, obrada prirodnih jezika, srpski jezik

Сажетак

U ovom radu je predstavljena narastajuća potreba za nadogradnjom postojećih sistema za ekstrakciju, izdvajanje relevantnih informacija za korisnika, semantičkim podacima i tehnologijama. Takođe su predstavljeni i problemi vezani za obradu sve većeg broja dokumenata u digitalnom obliku pisanih na srpskom jeziku. Pored problema koji potiču iz same prirode srpskog, morfološki bogatog jezika, sagledani su i problemi nedostatka semantičkih resursa i alata za srpski jezik. U skladu sa navedenim, prikazan je razvoj modela sistema za ekstrakciju informacija vođenu ontologijama za tekstove na srpskom jeziku zasnovan na integraciji postojećih resursa koji su razvijeni za obradu kako tekstova na srpskom jeziku, tako i onih koji su namenjeni obradi tekstova na engleskom jeziku; prilagođavanju postojećih tehnika i alata i novim načinima njihove primene u cilju prevazilaženja navedenih problema. Glavni doprinos razvoja ovog modela jeste podsticanje razvoja sistema za izdvajanje informacija relevantnih za korisnika, bazirano na ontologijama, za različite oblasti i primene.
Објављено
2019-01-15
Bрој часописа
Секција
Чланци