Tárgyfelelős: Czúni László egyetemi docens
A tárgy a következő tárgyak ismeretét tételezi fel, azokra épít:
-
Tematika
Az alábbi témakörökkel kapcsolatos ismereteket sajátítják el egyéni képzési tervüket és érdeklődésüket is figyelembe véve a hallgatók:
· A gépi látás fogalma
· Tanulási és neurális mechanizmusok a biológiai látásban
· Globális és lokális képi jellemzők
· Detektálás Haar Cascade-del
· Gyakori osztályozási módszerek: logisztikus regresszió, döntési fák, SVM
· DNN-ek és CNN-ek a felismerésben és szegmentálásban
· Adat annotálás és augmentáció
· Zero-shot learning és few-shot learning
· Contrastive learning: ajánlott cikk
· Advesarial attacks
· Autoencoders
· Figyelem mechanizmusok
· Visual transformers
Az értékelés egy, a fenti témakörökhöz kapcsolódó egyéni projekt feladat kidolgozása alapján történik.
Irodalom
· Czúni-Tanács: Képi információ mérése, 2011
· Kató-Czúni: Számítógépes látás, 2011
· Ian Goodfellow, Yoshua Bengio, Deep Learning (Adaptive Computation and Machine Learning series), ISBN-13: 978-0262035613, The MIT Press
· Himanshu Singh - Practical Machine Learning and Image Processing For Facial Recognition, Object Detection, and Pattern Recognition Using Python-Apress (2019)
· Mohamed Elgendy - Deep Learning for Vision Systems (2020, Manning Publications)
· Khosla, P., Teterwak, P., Wang, C., Sarna, A., Tian, Y., Isola, P., ... & Krishnan, D. (2020). Supervised contrastive learning. Advances in neural information processing systems, 33, 18661-18673.
· Rádli, R., & Czúni, L. (2022). Improving the Efficiency of Autoencoders for Visual Defect Detection with Orientation Normalization. In VISIGRAPP (4: VISAPP) (pp. 651-658).
· Akhtar, N., Mian, A., Kardan, N., & Shah, M. (2021). Advances in adversarial attacks and defenses in computer vision: A survey. IEEE Access, 9, 155161-155196.
· Khan, S., Naseer, M., Hayat, M., Zamir, S. W., Khan, F. S., & Shah, M. (2022). Transformers in vision: A survey. ACM computing surveys (CSUR), 54(10s), 1-41.