NASTAVNI MATERIJALI




Sažetak predavanja i vježbi - odgovarajući radni nastavni materijali Prateći ilustrativni programi
Predavanja i vježbe 1 (26-2-2014) (pdf) -- Sažetak: Sadržaj predmeta. Način polaganja ispita. Uvod i motivacija. Problem klasifikacije i problem klasteriranja. Metoda k-najbližih susjeda. Skup svih particija konačnog skupa koje sadrže k klastera.
  • Zadatak 1 i Zadatak 2: metoda k-najbližih susjeda  (nb)
Predavanja i vježbe 2 (5-3-2014) (pdf) -- Sažetak: Izvod formule za broj elemenata skupa svih particija konačnog skupa koje sadrže k klastera -- Stirlingov broj druge vrste. Kvazimetričke funkcije i funkcije sličnosti. Točka -- reprezentant skupa jednodimenzionalnih podataka.  Reprezentant skupa jednodimenzionalnih podataka u smislu LS kvazimetričke funkcija, l1-metričke funkcije, Bregmanovih divergencija (Itakura-Saito i Kullbach-Leibler divergencije). Težinski reprezentant jednodimenzionalnih podataka.   
Predavanja i vježbe 3 (12-3-2014) (pdf) -- Sažetak: Težinski medijan jednodimenzionalnih podataka  (svojstva i algoritam).  Kvazimetričke funkcije u R^n. Obični i težinski  reprezentant podataka iz R^n u smislu LS i Mahalanobis kvazimetričkih funkcija i odgovarajuća svojstva.  Separacija u smislu LS i Mahalanobis kvazimetričkih funkcija.
  • Modul za određivanje težinskog medijana jednodimenzionalnih podata. Prikaz skupa točaka ravnine koji su jednako udaljeni od čvrste točke u smislu različitih kvazimetričkih funkcija (nb)
Predavanja i vježbe 4 (19-3-2014) (pdf) -- Sažetak: Svojstvo Mahalanobis kvazimetričke funkcije inducirane skupom podataka. Obični i težinski reprezentant podataka u smislu euklidske metrike - geometrijski medijan. Weiszfeldov algoritam. Obični i težinski medijan podataka u R^n. Reprezentant podataka na kružnici. Numerički primjeri.
  • Mahalanobis kvazimetrička funkcija- ilustracije, Weiszfeldov algoritam i numerički primjeri (nb)
Predavanja i vježbe 5 (26-3-2014) (pdf) -- Sažetak: Pravac i ravnina reprezentant podataka u R^n. Analiza glavnih smjerova. Projekcija podataka iz R^n u jednodimenzionalni i dvodimenzionalni potprostor -- redukcija dimenzije podataka. Numerički primjeri
  • Numerički primjeri: Projekcije podataka u jednodimenzionalni i dvodimenzionalni potprostor-sintetički podaci i podaci IRIS (nb)
Predavanja i vježbe 6 (2-4-2014) (pdf) -- Sažetak: Kružnica- reprezentant podataka u R^2: Algebarska implicitna aproksimacija kružnicom i LS kružnica. Numerički primjeri i eksperimenti. 
  • Moduli za algebarsku implicitnu aproksimaciju kružnicom i LS kružnicu. Numerički primjer (nb)
Predavanja i vježbe 7 (9-4-2014) -- Sažetak: Kolovij 1 (pdf) , analiza kolokvija  
Predavanja i vježbe 8 (16-4-2014)  (pdf)-- Sažetak: Standardizacija podataka. Problem grupiraranja (klasteriranja) jednodimenzionalnog skupa podataka u smislu LS kvazimetričke funkcije. Dualni problem.   k-means algoritam, svojstva.
  • Modul za standardizaciju podataka(nb)
Predavanja i vježbe 9 (23-4-2014) (pdf) -- Sažetak: Problem težinskog grupiranja jednodimenzionalnog skupa podataka u smislu LS kvazimetričke funkcije. Jednodimenzionalno grupiranje podataka koji su dobiveni projekcijom podataka iz R^n na prvi glavni smjer.   Višestuko slučajno pokretanje k-means algoritma i utvrđivanje broja lokalno optimalnih rješenja.   Ilustrativni primjeri.
  • Mathematica modul - težinski k-means (nb)
  • Primjer-projekcija podataka u jednodimenzionalni potprostor
Predavanja i vježbe 10 (30-4-2014) (pdf) -- Sažetak: Zaglađeni k-means algoritam. Problem težinskog grupiranja jednodimenzionalnog skupa u smislu l1 metričke funkcije. Problem dvodimenzionalnog i všedimenzionalnog grupiranja podataka u smislu različitih kvazimetričkih funkcija. 
  •  Riješeni primjeri i zadaci (nb)
Predavanja i vježbe 11 (7-5-2014) -- Sažetak:  Matrični pristup za klasteriranje u smislu LS kvazimetričke funkcije. Spektralna relaksacija. Ky Fanov teorem. Ocjena donje međe kriterijske funkcije cilja.
Izlaganje seminara: Hijerarhijske metode klasteriranja.
 
Predavanja i vježbe 12 (14-5-2014) -- Sažetak:  Primjeren broj klastera u particiji.  
Predavanja i vježbe 13 (21-5-2014) -- Sažetak:  Spektralne metode klasteriranja. Elementi teorije grafova  
Predavanja i vježbe 14 (4-6-2014) -- Sažetak:  Kolovij 2  
Predavanja i vježbe 15 (??-??-2014) -- Sažetak:  Izlaganje seminara: Modificirana globalna k-means metoda, Sammonovo preslikavanje.  



Osnovna literatura

 

Dopunska literatura

  • A. Ben-Israel, C. Iyigun, Probabilistic distance clustering, J. Classification 25 (2008), 5–26.
  • I. Dhillon, A Unified View of Kernel k-means, Spectral Clustering and Graph Cuts, UTCS Technical Report #TR-04-25, 2005.
  • H. Zha, X. He, C. Ding, H. Simon, M. Gu, Spectral Relaxation for k-means Clustering, Advances in Neural Information Systems, 2002.
  • A. K. Jain, Data clustering: 50 years beyond K-means, Pattern Recognition Letters 31 (2010), 651–666.
  • G. Gan, C. Ma, J. Wu, Data clustering: theory, algorithms, and applications, SIAM, Philadelphia, 2007.
  • B. S. Everitt, S. Landau, M. Leese, Cluster analysis, Wiley, London, 2001.
  • M. Teboulle, A unified continuous optimization framework for center-based clustering methods, Journal of Machine Learning Research 8(2007), 65-10.
  • C. Iyigun, Probabilistic Distance Clustering, Dissertation, Graduate School - New Brunswick, Rutgers, 2007.
  • D. Bahdir, C. Iyigun, A Classification algorithm using Mahalanobis distance clustering of dana with applications on biomedical dana set, Dissertation, Graduate School of Natural and Applied Sciences, MEDU, 2011.