Grupiranje podataka i primjene
M059 i MI002 (2+1+1) - 5 ECTS bodova
OSNOVNE INFORMACIJE
Kolegij Grupiranje podataka i primjene izvodi se u drugom semestru diplomskog studija matematike i računarstva. Cilj kolegija je studente upoznati s osnovnim pristupima, metodama grupiranja podataka te mogućim primjenama.
- Sadržaj kolegija možete dohvatiti na sljedećem linku (pdf).
NASTAVNIK | KONZULTACIJE | |
---|---|---|
VODITELJ KOLEGIJA | Srijedom, 11-13h | |
ASISTENT |
Osnovna literatura:
-
R. Scitovski, K. Sabo, F. Martínez-Álvarez, Š. Ungar, Cluster Analysis and Applications, Springer, 2021.
- R. Scitovski, K. Sabo, Klaster analiza i prepoznavanje geometrijskih objekata, Sveučilište u Osijeku, Odjel za matematiku, 2020. http://www.mathos.unios.hr/index.php/odjel/nasa-izdanja?getBook=857
Literatura koja se dodatno preporučuje:
- R.Scitovski, M.Briš Alić, Grupiranje podataka, Sveučilište u Osijeku, Odjel za matematiku, 2016. http://www.mathos.unios.hr/index.php/odjel/nasa-izdanja?getBook=633
- J. Kogan, Introduction to Clustering Large and High-Dimensional Data, Cambridge University Press, 2007.
- R.Scitovski, K.Sabo, D.Grahovac, Globalna optimizacija, Sveučilište u Osijeku,Odjel za matematiku, 2017. http://www.mathos.unios.hr/index.php/odjel/nasa-izdanja?getBook=709
- R.Scitovski, Numerička matematika - izmijenjeno i dopunjeno izdanje, Sveučilište u Osijeku, Odjel za matematiku, 2015. http://www.mathos.unios.hr/index.php/odjel/nasa-izdanja?getBook=541
Raspored predavanja, seminara i vježbi
TERMIN | PREDAVAONICA | |
---|---|---|
Predavanja i vježbe | Utorak 17:00-19:00 | D-8 |
Predavanja i vježbe | Srijeda 12:00-14:00 | D-8 |
PRAVILA POLAGANJA ISPITA
Ispit se sastoji od pismenog i usmenog dijela, a polaže se nakon odslušanih predavanja. Prihvatljivi rezultati postignuti na kolokvijima (minimalno po 40 bodova iz svakog kolokvija), koje studenti pišu tijekom semestra, zamjenjuju pismeni dio ispita. Na kraju semestra studenti koji u jednom kolokviju nisu postigli minimalni broj bodova mogu pisati popravni kolokvij.Putem kolokvija studenti mogu postići najviše ocjenu dobar (3).
Studenti mogu povećati ocjenu tako da tijekom semestra pišu domaće zadaće ili izrade seminarski rad. Domaće zadaće sadrže proširenje gradiva, a očekuje se samostalan i kreativan rad. Seminarski radovi shvaćaju se kao proširenje domaćih zadaća.
PISMENI ISPIT
Pismeni ispit je obavezan za sve studente koji predmet nisu položili putem kolokvija.
USMENI ISPIT
Na usmenom ispitu se, u ovisnosti od ocjene s kolokvija, domaćih zadaća, pismenog ispita i seminara, formira konačna ocjena.
NASTAVNI MATERIJALI
- NASTAVNI MATERIJALI S PREDAVANJA
Naslov predavanja | Opis predavanja | Materijali |
---|---|---|
Predavanje 1 | Najbolji reprezentant u R. Najbolji LS-reprezentant. | literatura |
Predavanje 2 | Najbolji \ell_1 reprezentant. Najbolji težinski reprezentant. | literatura |
Predavanje 3 | Bregman divergence | literatura |
Predavanje 4 | Reprezentant podataka s 2 ili više atributa. LS-reprezentant | literatura |
Predavanje 5 | Reprezentant podataka s 2 ili više atributa. \ell_1-reprezentant | literatura |
Predavanje 6 | Grupiranje podataka. Stirlingova formula. Optimalna k-particija. Princip minimalnih udaljenosti i Voronoijev dijagram | literatura |
Predavanje 7 | k-means algoritam | literatura |
Predavanje 8 | Grupiranje podataka s jednim ili više atributa | literatura |
Predavanje 9 | Dualni problem za podatke s jednim ili više atributa i LS-kvazimetričku funkciju | literatura |
Predavanje 10 | Funkcija cilja F i veza \F sa F | literatura |
Predavanje 11 | Transfformacija skupa i funkcije. Matrica pripadnosti i funkcija cilja | literatura |
Predavanje 12 | Coordinate Descent algorithm. K-means algorithm | literatura |
Predavanje 13 | Inkementalni algoritam | literatura |
Predavanje 14 | Aglomeracijski hijerarhijski algoritmi | literatura |
Predavanje 15 | Indeksi | literatura |
Predavanje 16 | DBSCAN-algoritam | DBSCAN1 |
Predavanje 17 | Mahalanobis klastering | literatura |
Predavanje 18 | Fuzzy klastering | literatura |
- NASTAVNI MATERIJALI S Vježbi
Naslov predavanja | Opis predavanja | Materijali |
---|---|---|
Vježbe 1 | Najbolji reprezentant u R. Najbolji LS-reprezentant. | Reprezentant-1 |
Vježbe 2 | Najbolji $\ell_1$ reprezentant. Najbolji težinski reprezentant. | |
Vježbe 3 | Najbolji reprezentant u R^2. Najbolji LS-reprezentant. | Reprezentant-2 |
Vježbe 4 | Najbolji reprezentant u R^2. Najbolji \ell_1-reprezentant. | Reprezentant-n |
Vježbe 5 | Grupiranje podataka. Princip minimalnih udaljenosti i Voronoijev dijagram | Voronoi |
Vježbe 6 | k-means algoritam | k-means |
Vježbe 7 | Grupiranje podataka s jednim ili više atributa | Komparacija |
Vježbe 8 | Usporedba dviju particija. Usporedba funkcije cilja \F i F | Komparacija |
Vježbe 9 | Transformacija skupa i funkcije | Transformacija |
Vježbe 10 | Coordinate Descrnt Algorithm | CDA |
Vježbe 11 | Inkementalni algoritam | Incremental |
Vježbe 12 | Aglomeracijski hijerarhijski algoritmi | Aggl. Nesting |
Vježbe 13 | Indeksi | k-means |
Vježbe 14 | DBSCAN-algoritam web-stranica: http://clusters.mathos.unios.hr/ | |
Vježbe 15 | Mahalanobis klastering Mahalanobis | TLS |
Vježbe 16 |
k-means M-k-means Fuzzy c-means GKc-means |
- Primjeri kolokvija iz prethodnih godina:
2017/2018- Kol1 | 20172018 - Kol2 |
2018/2019 - Kol1 | 2018/2019 - Kol2 |
2019/2020 - Kol1 | 2019/2020 - Kol2 |
2020/2021 - Kol1 | 2020/2021 - Kol2 |
2021/2022 - Kol1 |
Domaće zadaće za studente koji preferiraju bolju ocjenu
Studenti koji žele postići bolju ocjenu iz ovog predmeta mogu izraditi neke od navedenih domaćih zadaća. Domaće zadaće pišu se u LaTeX2e (Š.Ungar, 2019) i šalju u pdf formatu na e-mail adresu Ova e-mail adresa je zaštićena od spambota. Potrebno je omogućiti JavaScript da je vidite. . Pri tome treba koristiti zadani stil. Ako su ilustracije ili primjeri izrađeni korištenjem programskog sustava Mathematica, priložite i odgovarajuću .nb datoteku. U "subject" e-mail-a stavite "DZ-GPP".
Točnost rješenja i autentičnost provjeravaju nastavnici, koji takodjer za rješeni zadatak dodjeljujeubroj bodova.
Zadaci (pdf) Stil (tex) Rezultati ()
OBAVIJESTI
[14-1-2022] Obnovljeni su programi: k-means and M-k-means.nb, Fuzzy-c-means and GKc-means.nb i prezentacija: Hard-Fuzzy.pdf
[13-1-2022] Drugi kolokvij iz predmeta Grupiranje podataka i primjene održat će se u Utorak, 18-1-2022 u 17:00 u D2, a popravni rok bit će u utorak 25-1-2022 u 17:00 u D2. Domaće zadaće za studente koji preferiraju bolju ocjenu mogu se predati do 25-1-2022 u 12:00
[30-12-2021] Dodani su novi zadaci za Domaću zadaću za studente koji preferiraju bolju ocjenu.
[9-11-2021] Prvi kolokvij iz predmeta Grupiranje podataka i primjene održat će se u Srijedu, 17-11-2021 u 12:00
[9-6-2021] Zadaci i rješenja Kolokvija održanog 7. lipnja 2021.: (pdf) Rezultate kolokvija, zajedno sa rezultatima domaćih zadaća te prijedloge ocjene možete vidjeti na kraju obavijesti (pri čemu je potrebno biti logiran). Za uvid i pitanja, molim Vas da se javite na email Ova e-mail adresa je zaštićena od spambota. Potrebno je omogućiti JavaScript da je vidite.. Studentima koji su na svakom kolokviju skupili barem 40 bodova priznaje se položen pismeni ispit te su im predložene ocjene. Pritom je temeljem rezultata kolokvija bilo moguće dobiti najviše ocjenu dobar (3). Studenti koji prihvaćaju ove ocjene trebaju doći na upis ocjene u ponedjeljak 28. lipnja 2021. u Dvoranu 18 (prizemlje) u 8:00. Studenti koji nisu zadovoljni s ocjenom, mogu pristupiti usmenom ispitu, koji će se održati 29. lipnja 2021. učionica D9 u 11 sati. Pritom se trebaju prijaviti na Ova e-mail adresa je zaštićena od spambota. Potrebno je omogućiti JavaScript da je vidite. najkasnije do 16. lipnja 2021.
Transformacija podataka i Coordinate Descent Algorithm
You are not authorised to post comments.