Tárgyfelelős: Dr. Fogarassyné dr. Vathy Ágnes egyetemi docens
A tárgy a következő tárgyak ismeretét tételezi fel, azokra épít:
-
Tematika
Az alábbi témakörökkel kapcsolatos ismereteket sajátítják el egyéni képzési tervüket és érdeklődésüket is figyelembe véve a hallgatók:
T1. Alap és haladó osztályozó algoritmusok
- osztályozási problémák megoldási módszerei (pl. döntési fa alapú módszerek, Bayes osztályozás, k-nn osztályozó, lineáris diszkriminancia analízis, bináris és multinominális logisztikus regresszió, Support Vector Machines, a kernel trükk, Maximal Margin Classifier, Support Vector Classifier)
- embedded osztályozási módszerek (bagging, boosting, stacking)
T2. Alap és haladó regressziós algoritmusok
- regressziós technikák (pl. lineáris regresszió, nemlineáris regresszió, Ridge, Lasso, Elastic Net, orthogonal regression, Decision Tree Regressor, k-nn regresszor)
T3. Kiértékelés
- osztályozási módszerek pontosságának mérése
- regressziós modellek kiértékelése
- modellek összehasonlítása
- a modellek validálása: túlillesztés, validálási technikák
T4: Kis és nagy adathalmazok problémája
- a dimenzionalitás átka
- előrejelző változók fontosságának mérése
- jellemzőszelekciós módszerek, a szelekciós bias
- hiperparaméter-hangolás
Az értékelés egy, a fenti témakörökhöz kapcsolódó egyéni projekt feladat kidolgozása alapján történik.
Irodalom:
1. Max Kuhn, Kjell Johnson: Applied Predictive Modelling, Springer (2013), p. 615
2. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: An Introduction to Statistical Learning, Springer (2017), p. 440
3. Field Cady: The Data Science Handbook, Wiley (2017), Chapter 8.