Проналажење тема у рецензијама хотелских услуга

  • Нађа Булајић QCerris
  • Sandro Radovanović Fakultet organizacionih nauka, Univerzitet u Beogradu
Кључне речи: Моделовање тема, Латентна Дирихлеова алокација, Машинско учење

Сажетак

Латентна Дирихлеова алокације (ЛДА) је један од начина статистичког моделовања тема. У оквиру ЛДА модела, документи су представљени као мешавина тема, док сваку тему чине речи са вероватноћама за сваку реч да припада датој теми. У овом раду, ЛДА ће бити представљен помоћу примера који се односи на идентификовање тема у скупу рецензија остављених од стране посетиоца хотела. Поменуте рецензије су преузете са Tripadvisor апликације и смештене у скуп података под називом „Trip Advisor Hotel Review“, где се детаљном анализом преко 20.000 рецензија откривају главне теме које најчешће карактеришу хотеле. Скуп података је процесиран и прилагођен потребама истраживања у циљу добијања бољих резултата, након чега су формирани речник података и корпус који је коришћен као улазни параметар за прављење модела. Добијени модел се састоји од листе тема и након визуелизације модела, свака од тих тема је именована. На самом крају рада, описане су ситуације у којима овај модел може наћи примену и тиме донети користи како корисницима апликације, тако и самом менаџменту хотела.

Објављено
2023-08-16
Bрој часописа
Секција
Информационо инжењерство