GRUPIRANJE PODATAKA: PRISTUPI, METODE I PRIMJENE, M062 (2+1+1) - 5 ECTS bodova



CILJEVI KOLEGIJA Studente upoznati s osnovnim pristupima, metodama grupiranja podataka, te mogućim primjenama.
POTREBNO PREDZNANJE Preddiplomski studij.
SADRŽAJ KOLEGIJA
1. Uvod i motivacija. Definiranje problema i osnovna svojstva. Razni primjeri iz primjena.
2. Reprezentant konačnog skupa iz R u smislu najmanjih kvadrata (LS) i u smislu najmanjih apsolutnih odstupanja (LAD). Reprezentan konačnog skupa podataka iz Rn: centroid, medijan, geometrijski medijan. Primjena Mahalanobis kvazimetričke funkcije. Reprezentan podataka na jediničnoj kružnici.
3.

Grupiranje na osnovi jednog, dva i više obilježja. LS-kriterij. Dualni problem. Transformacija podataka. LAD-kriterij. Grupiranje podataka s težinama. Primjena Mahalanobis kvazimetričke funkcije. Svojstva: monotonost, stabilnost.

4. Metode za grupiranje podataka. K-means algoritam. EM (Expectation Maximization) algoritam. K-medoid metoda. Metoda aglomeracije.
5. Primjereni broj grupa u particiji: Indeksi.
6. Matrični pristup i primjena Ky Fan-ovog teorema.
7. Primjena teorije grafova za grupiranje podataka.
8. Vjerojatnosni i statistički aspekti grupiranja podataka.
IZVOĐENJE NASTAVE I VREDNOVANJE ZNANJA Predavanja i vježbe su ilustrirani gotovim programima. Vježbe su djelomično auditorne, a djelomično laboratorijske uz korištenje računala. Predavanja, vježbe i seminari su obavezni. Ispit se sastoji od pismenog i usmenog dijela, a polaže se nakon odslušanih predavanja. Prihvatljivi rezultati postignuti na kolokvijima, koje studenti pišu tijekom semestra, zamjenjuju pismeni dio ispita. Studenti mogu utjecati na ocjenu tako da tijekom semestra pišu domaće zadaće ili izrade seminarski rad. Domaće zadaće sadrže proširenje gradiva, a očekuje se samostalan i kreativan rad. Seminarski radovi shvaćaju se kao proširenje domaćih zadaća.