Квантификација категоричких атрибута за примену алгоритама машинског учења
Сажетак
Овај рад истражује различите методе квантификације категоричких атрибута за примену алгоритама машинског учења. Категорички атрибути представљају информације које најчешће описују квалитативне карактеристике, често пристутне у реалним скуповима података, попут пола, боје, образовног нивоа, позиције у фирми и слично. Квантификација таквих атрибута је важна јер већина алгоритама машинског учења захтева нумеричке улазе. Игнорисање категоричких (квалитативних) атрибута може значајно да смањи количину информација у скуповима података и последично да утиче на квалитет изграђених модела. У овом раду ће бити описане и примењене неке од популарних метода за квантификацију попут One-hot encoding-а, Target encoding-a, Count encoding-a и других. У оквиру експерименталне евалуацијеОве методе биће примењене над неколико скупова података који садрже различите типове категоричких атрибута, а затим ће се након примена алгоритама машинског учења сагледати и њихове перформансе. Резултати истраживања пружиће дубље разумевање метода за квантификацију и њихових ефеката на перформансе алгоритама.