Odjel za matematiku

Grupiranje podataka i primjene

M059 i MI002 (2+1+1) - 5 ECTS bodova

 

OSNOVNE INFORMACIJE

zupanije2Kolegij Grupiranje podataka i primjene izvodi se u drugom semestru diplomskog studija matematike i računarstva.  Cilj kolegija je studente upoznati s osnovnim pristupima, metodama grupiranja podataka te mogućim primjenama.

  • Sadržaj kolegija možete dohvatiti na sljedećem linku (pdf).

 

 NASTAVNIKKONZULTACIJE
VODITELJ KOLEGIJA

prof.dr.sc. K. Sabo

prof.dr.sc. R. Scitovski

 Srijedom, 11-13h
 ASISTENT  

 

 

    Osnovna literatura:

  1. R. Scitovski, K. Sabo, F. Martínez-Álvarez, Š. Ungar, Cluster Analysis and Applications, Springer, 2021.

  2. R. Scitovski, K. Sabo, Klaster analiza i prepoznavanje geometrijskih objekata, Sveučilište u Osijeku, Odjel za matematiku, 2020. http://www.mathos.unios.hr/index.php/odjel/nasa-izdanja?getBook=857

   Literatura koja se dodatno preporučuje:

  1. R.Scitovski, M.Briš Alić, Grupiranje podataka, Sveučilište u Osijeku, Odjel za matematiku, 2016. http://www.mathos.unios.hr/index.php/odjel/nasa-izdanja?getBook=633
  2. J. Kogan, Introduction to Clustering Large and High-Dimensional Data, Cambridge University Press, 2007.
  3. R.Scitovski, K.Sabo, D.Grahovac, Globalna optimizacija, Sveučilište u Osijeku,Odjel za matematiku, 2017. http://www.mathos.unios.hr/index.php/odjel/nasa-izdanja?getBook=709
  4. R.Scitovski, Numerička matematika - izmijenjeno i dopunjeno izdanje, Sveučilište u Osijeku, Odjel za matematiku, 2015. http://www.mathos.unios.hr/index.php/odjel/nasa-izdanja?getBook=541

 

Raspored predavanja, seminara i vježbi

 TERMINPREDAVAONICA
Predavanja i vježbe  Utorak          17:00-19:00  D-8
Predavanja i vježbe  Srijeda         12:00-14:00   D-8

 

PRAVILA POLAGANJA ISPITA

Ispit se sastoji od pismenog i usmenog dijela, a polaže se nakon odslušanih predavanja. Prihvatljivi rezultati postignuti na kolokvijima (minimalno po 40 bodova iz svakog kolokvija), koje studenti pišu tijekom semestra, zamjenjuju pismeni dio ispita. Na kraju semestra studenti koji u jednom kolokviju nisu postigli minimalni broj bodova mogu pisati popravni kolokvij.Putem kolokvija studenti mogu postići najviše ocjenu dobar (3).

Studenti mogu povećati ocjenu tako da tijekom semestra pišu domaće zadaće ili izrade seminarski rad. Domaće zadaće sadrže proširenje gradiva, a očekuje se samostalan i kreativan rad. Seminarski radovi shvaćaju se kao proširenje domaćih zadaća.

PISMENI ISPIT

Pismeni ispit je obavezan za sve studente koji predmet nisu položili putem kolokvija.

USMENI ISPIT

Na usmenom ispitu se, u ovisnosti od ocjene s kolokvija, domaćih zadaća, pismenog ispita i seminara, formira konačna ocjena.

NASTAVNI MATERIJALI

  • NASTAVNI MATERIJALI S PREDAVANJA
Naslov predavanjaOpis predavanjaMaterijali
Predavanje 1  Najbolji reprezentant u R. Najbolji LS-reprezentant.  literatura
Predavanje 2 Najbolji \ell_1  reprezentant.  Najbolji težinski reprezentant. literatura 
Predavanje 3 Bregman divergence literatura
Predavanje 4  Reprezentant podataka s 2 ili više atributa. LS-reprezentant literatura
Predavanje 5  Reprezentant podataka s 2 ili više atributa. \ell_1-reprezentant literatura 
Predavanje 6 Grupiranje podataka. Stirlingova formula. Optimalna k-particija. Princip minimalnih udaljenosti i Voronoijev dijagram literatura 
Predavanje 7  k-means algoritam literatura 
Predavanje 8  Grupiranje podataka s jednim ili više atributa literatura 
Predavanje 9  Dualni problem za podatke s jednim ili više atributa i LS-kvazimetričku funkciju literatura 
Predavanje 10 Funkcija cilja F i veza \F sa F literatura
Predavanje 11  Transfformacija skupa i funkcije. Matrica pripadnosti i funkcija cilja literatura 
Predavanje 12 Coordinate Descent algorithm. K-means algorithm literatura
Predavanje 13  Inkementalni algoritam  literatura
Predavanje 14 Aglomeracijski hijerarhijski algoritmi literatura
Predavanje 15 Indeksi literatura
Predavanje 16 DBSCAN-algoritam DBSCAN1
Predavanje 17 Mahalanobis klastering literatura 
Predavanje 18 Fuzzy klastering literatura
  • NASTAVNI MATERIJALI S Vježbi
Naslov predavanjaOpis predavanjaMaterijali
Vježbe 1  Najbolji reprezentant u R. Najbolji LS-reprezentant.  Reprezentant-1
Vježbe 2 Najbolji $\ell_1$  reprezentant.  Najbolji težinski reprezentant.   
Vježbe 3 Najbolji reprezentant u R^2. Najbolji LS-reprezentant.  Reprezentant-2
Vježbe 4 Najbolji reprezentant u R^2. Najbolji \ell_1-reprezentant.  Reprezentant-n
Vježbe 5 Grupiranje podataka. Princip minimalnih udaljenosti i Voronoijev dijagram Voronoi
Vježbe 6 k-means algoritam k-means 
Vježbe 7  Grupiranje podataka s jednim ili više atributa Komparacija 
Vježbe 8 Usporedba dviju particija. Usporedba funkcije cilja \F i F Komparacija 
Vježbe 9 Transformacija skupa i funkcije Transformacija
Vježbe 10 Coordinate Descrnt Algorithm CDA
Vježbe 11  Inkementalni algoritam Incremental
Vježbe 12 Aglomeracijski hijerarhijski algoritmi Aggl. Nesting
Vježbe 13 Indeksi k-means 
Vježbe 14 DBSCAN-algoritam   web-stranica: http://clusters.mathos.unios.hr/                

DBSCAN1

DBSCAN2

Vježbe 15   Mahalanobis klastering                       Mahalanobis TLS 
 Vježbe 16

 k-means     M-k-means     Fuzzy c-means    GKc-means

Hard-Fuzzy.pdf

k-means and M-k-means.nb

Fuzzy-c-means and GKc-means.nb

  • Primjeri kolokvija iz prethodnih godina:
 2017/2018- Kol1    20172018 - Kol2    
2018/2019 - Kol1  2018/2019 - Kol2
2019/2020 - Kol1  2019/2020 - Kol2
2020/2021 - Kol1  2020/2021 - Kol2
2021/2022 - Kol1  

 

Domaće zadaće za studente koji preferiraju bolju ocjenu

Studenti koji žele postići bolju ocjenu iz ovog predmeta mogu izraditi neke od navedenih domaćih zadaća. Domaće zadaće pišu se u LaTeX2e (Š.Ungar, 2019) i šalju u pdf formatu na e-mail adresu Ova e-mail adresa je zaštićena od spambota. Potrebno je omogućiti JavaScript da je vidite. . Pri tome treba koristiti zadani stil. Ako su ilustracije ili primjeri izrađeni korištenjem programskog sustava Mathematica, priložite i odgovarajuću .nb datoteku. U "subject" e-mail-a stavite "DZ-GPP".
Točnost rješenja i autentičnost provjeravaju nastavnici, koji takodjer za rješeni zadatak dodjeljujeubroj bodova.

Zadaci (pdf)    Stil (tex)    Rezultati ()

 

OBAVIJESTI

[14-1-2022] Obnovljeni su programi: k-means and M-k-means.nb, Fuzzy-c-means and GKc-means.nb i prezentacija: Hard-Fuzzy.pdf

[13-1-2022] Drugi kolokvij iz predmeta Grupiranje podataka i primjene održat će se u Utorak, 18-1-2022 u 17:00 u D2, a popravni rok bit će u utorak 25-1-2022 u 17:00 u D2. Domaće zadaće za studente koji preferiraju bolju ocjenu mogu se predati do 25-1-2022 u 12:00

[30-12-2021] Dodani su novi zadaci za Domaću zadaću za studente koji preferiraju bolju ocjenu.

[9-11-2021]  Prvi kolokvij iz predmeta Grupiranje podataka i primjene održat će se u Srijedu, 17-11-2021 u 12:00 

[9-6-2021] Zadaci i rješenja Kolokvija održanog 7. lipnja 2021.: (pdf) Rezultate kolokvija, zajedno sa rezultatima domaćih zadaća te prijedloge ocjene možete vidjeti na kraju obavijesti (pri čemu je potrebno biti logiran). Za uvid i pitanja, molim Vas da se javite na email Ova e-mail adresa je zaštićena od spambota. Potrebno je omogućiti JavaScript da je vidite.. Studentima koji su na svakom kolokviju skupili barem 40 bodova priznaje se položen pismeni ispit te su im predložene ocjene. Pritom je temeljem rezultata kolokvija bilo moguće dobiti najviše ocjenu dobar (3). Studenti koji prihvaćaju ove ocjene trebaju doći na upis ocjene u ponedjeljak 28. lipnja 2021. u Dvoranu 18 (prizemlje) u 8:00. Studenti koji nisu zadovoljni s ocjenom, mogu pristupiti usmenom ispitu, koji će se održati 29. lipnja 2021. učionica D9 u 11 sati. Pritom se trebaju prijaviti na Ova e-mail adresa je zaštićena od spambota. Potrebno je omogućiti JavaScript da je vidite. najkasnije do 16. lipnja 2021.

 

 

Transformacija podataka i Coordinate Descent Algorithm

You are not authorised to post comments.

Comments powered by CComment