Grupiranje podataka: pristupi, metode i primjene

M080 (2+1+1) - 5 ECTS bodova

 

OSNOVNE INFORMACIJE

zupanije2Kolegij Grupiranje podataka: pristupi, metode i primjene izvodi se u ljetnom semestru.  Cilj kolegija je studente upoznati s osnovnim pristupima, metodama grupiranja podataka te mogućim primjenama.

  • Sadržaj kolegija možete dohvatiti na sljedećem linku (pdf).

 NASTAVNIKKONZULTACIJE
VODITELJ KOLEGIJA iprof.dr.sc.Kristian Sabo Utorkom od 12-13h
     

 

OSNOVNA LITERATURA

  1. Osnovna literatura:

    1. K.Sabo, R.Scitovski, I.Vazler, Grupiranje podataka- klasteri, OML 10(2010), 149--178 (pdf)

    2. J.Kogan, Introduction to Clustering Large and High-Dimensional Data, Cambridge University Press, 2007.


 

RASPORED PREDAVANJA I VJEŽBI

19.6. 2017. KONAČNI REZULTATI KOLOVIJA S PRIJEDLOGOM OCJENE (.xls) Upis ocjene će biti 28-06-2017 u 9:00 u D-2.
 
Izvedbeni program kolegija Grupiranje podataka: pristupi, metode i primjene realizira se s fondom od 60 sati (tjedno 2 sata predavanja i 1 sat vježbi i 1 sat seminara). Pohađanje predavanja i vježbi je obaveno.
 TERMINPREDAVAONICA
PREDAVANJA  Utorak 8:00-10:00  RP2
VJEŽBE I SEMINARI  Utorak 10:00-12:00  RP2

 

PRAVILA POLAGANJA ISPITA

Ispit se sastoji od pismenog i usmenog dijela, a polaže se nakon odslušanih predavanja. Prihvatljivi rezultati postignuti na kolokvijima, koje studenti pišu tijekom semestra, zamjenjuju pismeni dio ispita. Studenti mogu utjecati na ocjenu tako da tijekom semestra pišu domaće zadaće ili izrade seminarski rad. Domaće zadaće sadrže proširenje gradiva, a očekuje se samostalan i kreativan rad.Seminarski radovi shvaćaju se kao proširenje domaćih zadaća.

PISMENI ISPIT

Pismeni i usmeni ispit je obavezan za studente koji nisu položili kolegij preko kolokvija.

USMENI ISPIT

Usmeni ispit je obavezan za sve studente koji kolegij polažu preko pismenog ispita. Na usmenom ispitu se, u ovisnosti od ocjene s pismenog ispita, formira konačna ocjena.

 

NASTAVNI MATERIJALI

 

  • NASTAVNI MATERIJALI S PREDAVANJA
Naslov predavanjaOpis predavanjaMaterijali

 28-2-2016

Predavanje 1.

 

 Pravila polaganja ispita. Definicija particije skupa i klastera. Problem klasifikacije. Primjeri

     (pdf)

      (nb)

 

Predavanje 2.

 

Izvod formule za broj elemenata skupa svih particija konačnog skupa koje sadrže k klastera -- Stirlingov broj druge vrste. Kvazimetričke funkcije i funkcije sličnosti. Točka-reprezentant skupa jednodimenzionalnih podataka.  Reprezentant skupa jednodimenzionalnih podataka u smislu LS kvazimetričke funkcija, l1-metričke funkcije, Bregmanovih divergencija (Itakura-Saito i Kullbach-Leibler divergencije). Težinski reprezentant jednodimenzionalnih podataka. 

(pdf)   

 

 

Predavanje 3.

 

Težinski medijan jednodimenzionalnih podataka  (svojstva i algoritam).  Kvazimetričke funkcije u R^n. Obični i težinski  reprezentant podataka iz R^n u smislu LS i Mahalanobis kvazimetričkih funkcija i odgovarajuća svojstva.  Separacija u smislu LS i Mahalanobis kvazimetričkih funkcija. Svojstvo Mahalanobis kvazimetričke funkcije inducirane skupom podataka. (pdf)

 

 

Predavanje 4.

 

Obični i težinski reprezentant podataka u smislu euklidske metrike - geometrijski medijan.  Implementacija i analiza Weiszfeldovog algoritma. Obični i težinski medijan podataka u R^n. Reprezentant podataka na kružnici. Jedna metoda globalne optimizacije Lipschitzove funkcije: DIRECT. Numerički primjeri. Upoznavanje s bazom Machine Learning Repository. Numerički primjeri.

(pdf)   

 

Predavanje 5.

 Pravac i ravnina reprezentanti podataka. Projekcija podataka na glavne smjerove. Numerički primjeri. (pdf)

 

Predavanje 6.

  Kružnica reprezentant podataka. Numerički primjeri.

 (pdf)

 

Predavanje 7.

 Kolokvij i analiza kolokvija.  

 

Predavanje 8.

Standaradizacija podataka. Klasteriranje na osnovi centra. Dualni problem.

Jednodimenzionalni k-means algoritam.

 (pdf)

 

Predavanje 9.

 Vježbe u Mathematici. Zaglađeni jednodimenzionalni k-means.

 (pdf)

(nb)

 

Predavanje 10.

 Višedimenzionalni k-means algoritam

 

 

Predavanje 11.

 Ocjene optinmalne vrijednosti funkcije cilja. Primjeren broj klastera.  

 

Predavanje 12.

 Hijerarhijske metode za klasteriranje  

 

Predavanje 13.

 Spektralne metode klasteriranja.  

 

Predavanje 14.

 Drugi kolokvij (6.6.2017.)  

 

 

  • SEMINARI:
  • PRIMJERI KOLOKVIJA : 2012/2013-Kol1(pdf)  2012/2013-Kol2(pdf)

 

 

OBAVIJESTI

Konačni rezultati kolokvija od 6-6-2016. (xls

Studenti čija su imena označena crvenom bojom trebaju polagati popravni kolokvij koji će se održati 24-6-2016 u 10:00 u Dvorani 2. Ostali studenti su položili ispit i mogu doći na upis ocjene 28-6-2016 u10 10:00 u Dvorani 22. Pri tome temeljem kolokvija student može ostvariti najviše ocjenu dobar(3). Za višu ocjenu trebat će izraditi seminarski rad.