Анализа и евалуација промене концепта излазне променљиве у машинском учењу
Сажетак
Модели машинског учења се сусрећу са променама у расподелама података, које могу утицати на перформансе и поузданост модела. Промене у подацима су најчешће узроковане догађајима из окружења и променама у корисничким преференцијама. Дешава се да су у реалном окружењу промене изненадне и ефикасно прилагођавање модела на исте изостаје. Описани проблем се назива промена концепта излазне променљиве (енг. Concept drift), док уочавање, праћење и решавање проблема промене концепта излазне променљиве побољшава стабилност модела. Технике за уочавање промена омогућавају континуалну анализу, али и прилагођавање модела променама.
У раду је дата свеобухватна дефиниција промене концепта излазне променљиве, уз истицање разлике између ове промене и промене у расподели улазних података, циљног атрибута и предикција, као и јасна дистинкција типова промене концепта излазне променљиве.
Истраживање је спроведено над скуповима података банке Banca Intesa ad Beograd, припремљеним тако да прате различите значајне догађаје у протекле четири године, са циљем симулације динамичног окружења у ком банка послује. Додатно, решаван је проблем бинарне класификације предвиђања продаје готовинских кредита, као једног од најзначајнијих производа банке. Истраживање се темељи на коришћењу одабраних метода за уочавање промене у расподелама улазних података, циљног атрибута, предикција и промене концепта излазне променљиве, које одговарају датом проблему бинарне класификације, моделу машинског учења и јавно су доступне.
Циљ истраживања је испитати постојање промена концепта излазне променљиве за одговарајући скуп података и одговарајући модел машинског учења. Уочавање свих врста промена омогућава боље разумевање животног циклуса модела и временског оквира у ком користимо модел машинског учења. За крај, дат je предлог корекције уочених промена.