Tárgyfelelős: Dr. Czúni László egyetemi docens
A tárgy a következő tárgyak ismeretét tételezi fel, azokra épít:
-
Tematika
Az alábbi témakörökkel kapcsolatos ismereteket sajátítják el egyéni képzési tervüket és érdeklődésüket is figyelembe véve a hallgatók:
• A gépi látás fogalma
• Tanulási és neurális mechanizmusok a biológiai látásban
• Globális és lokális képi jellemzők
• Detektálás Haar Cascade-del
• Gyakran használt általonos osztályozási módszerek: logisztikus regresszió, döntési fák, SVM
• DNN-ek és CNN-ek a felismerésben és szegmentálásban
• Adat annotálás és augmentáció
• Autoencoders, GANs, advesarial attacks
• Contrastive learning
• Zero-shot learning és few-shot learning
• Figyelem mechanizmusok, Visual transformers
Az értékelés egy, a fenti témakörökhöz kapcsolódó egyéni projekt feladat kidolgozása alapján történik.
Irodalom
· Czúni-Tanács: Képi információ mérése, 2011
· Kató-Czúni: Számítógépes látás, 2011
· Szemenyei Márton, Varnyú Dóra, Deep Learning a Vizuális Informatikában
· Ian Goodfellow, Yoshua Bengio, Deep Learning (Adaptive Computation and Machine Learning series), ISBN-13: 978-0262035613, The MIT Press
· Himanshu Singh - Practical Machine Learning and Image Processing For Facial Recognition, Object Detection, and Pattern Recognition Using Python-Apress (2019)
· Mohamed Elgendy - Deep Learning for Vision Systems (2020, Manning Publications)
· Khosla, P., Teterwak, P., Wang, C., Sarna, A., Tian, Y., Isola, P., ... & Krishnan, D. (2020). Supervised contrastive learning. Advances in neural information processing systems, 33, 18661-18673.
· Rádli, R., & Czúni, L. (2022). Improving the Efficiency of Autoencoders for Visual Defect Detection with Orientation Normalization. In VISIGRAPP (4: VISAPP) (pp. 651-658).
· Akhtar, N., Mian, A., Kardan, N., & Shah, M. (2021). Advances in adversarial attacks and defenses in computer vision: A survey. IEEE Access, 9, 155161-155196.
· Khan, S., Naseer, M., Hayat, M., Zamir, S. W., Khan, F. S., & Shah, M. (2022). Transformers in vision: A survey. ACM computing surveys (CSUR), 54(10s), 1-41.