ANALIZA APACHE HADOOP-A I MOGUĆNOSTI UPOTREBE
Сажетак
U ovom radu urađena je analiza i ispitane mogućnosti upotrebe Apache Hadoop aplikativnog framework-a, zajedno sa njegovim propratnim alatima. Osim toga, data je i detaljnija analiza alternativnog framework-a za procesiranje podataka u distribuiranom okruženju, poznatog i kao Apache Spark. Takođe, opisani su hardverski, softverski i sigurnosni zahtjevi neophodni za uspostavljanje tipičnog Hadoop klastera, prema Cloudera-inoj referentnoj specifikaciji. Kao praktični dio, implementirana je relativno kompleksna aplikacija za kategorizaciju Web vijesti, korištenjem Apache Spark aplikativnog framework-a i principa mašinskog učenja. Specifikacija implementirane aplikacije data je odgovarajućim UML dijagramima, a navedeni su i ilustrativni primjeri kategorizacije novih Web vijesti.