УТВРЂИВАЊЕ ИДЕНТИТЕТА АУТОРА НА ОСНОВУ АНАЛИЗЕ ТЕКСТА

  • Marko Gogić Fakultet organizacionih nauka, Univerzitet u Beogradu
Кључне речи: Форензичка лингвистика; стилометрија; машинско учење; лингвистички маркери; атрибуција ауторства

Сажетак

За разлику од „обичних“, сајбер криминалци не морају да брину да ће случајно оставити отиске прстију или трагове ДНК који би одали њихов идентитет. Уместо тога они могу слободно да се крећу кроз сајбер простор и користе друштвене мреже, онлајн блогове или мејлове за размену илегалног материјала, слање претећих порука или „фишинг“, кријући се притом иза својих дигиталних, псеудо­идентитета које могу лако да промене. Али оно што не може лако да се промени jeсу индивидуалне језичке карактеристике које попут отисака прстију остају утиснуте у електронском текстуалном материјалу. Управо јединствена језичка обележја појединца представљају биометријску грађу на основу које форензичка лингвистика може да утврдити идентитет аутора неке претеће поруке или захтева за откуп. Метода форензичке лингвистике која се користи у ту сврху назива се стилометрија. Обиље доступног електронског текстуалног материјала, уз одсуство класичних биометријских трагова у сајбер простору, намеће потребу за све већом применом стилометрије ради решавања низа практичних проблема. Циљ овог рада је да испита валидност постојећих стилометријских решења за идентификацију аутора кроз анализу текста заснованих на примени алгоритама машинског учења. У ту сврху у раду ће бити приказан историјски развој стилометрије, уз анализу и критички осврт на постојеће радове који приказују најбоља решења из ове области.
Објављено
2019-01-15
Bрој часописа
Секција
Чланци