Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση διπλωματικής εργασίας κ. Αλέξανδρου Παπαδόπουλου - Σχολή ΗΜΜΥ
Αναγνώσεις: 204 / Συνδρομές: 0

  • Συντάχθηκε 08-10-2025 11:49 Πληροφορίες σύνταξης

    Ενημερώθηκε: 08-10-2025 13:51

    Τόπος:
    Σύνδεσμος τηλεδιάσκεψης
    Έναρξη: 09/10/2025 09:00
    Λήξη: 09/10/2025 10:00

     

    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
    Πρόγραμμα Προπτυχιακών Σπουδών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    Αλέξανδρου Παπαδόπουλου

    με θέμα

    Σύγκριση Αρχιτεκτονικών Νευρωνικών Δικτύων για τη Διάγνωση Καρκίνου του Δέρματος
    Neural Νetwork Αrchitectures for Skin Cancer Detection

    Εξεταστική Επιτροπή
    Καθηγητής Βασίλειος Διγαλάκης (επιβλέπων)
    Καθηγητής Μιχαήλ Λαγουδάκης
    Αναπληρωτής Καθηγητής Ευάγγελος Καλογεράκης (Σχολή ΗΜΜΥ)

    Περίληψη
    Η βαθιά μάθηση έχει μεταμορφώσει την ιατρική απεικόνιση, ιδίως στον τομέα της αυτοματοποιημένης διάγνωσης ασθενειών, με τα Συνελικτικά Νευρωνικά Δίκτυα (CNNs) να κυριαρχούν παραδοσιακά στην ανάλυση εικόνας. Η πρόσφατη άνοδος των αρχιτεκτονικών τύπου Μετασχηματιστή, συμπεριλαμβανομένων των Vision Transformers (ViTs), εισάγει ένα ισχυρό νέο παράδειγμα για την αναγνώριση εικόνων. Η παρούσα διατριβή παρουσιάζει μια συστηματική σύγκριση προσαρμοσμένων αρχιτεκτονικών CNN και ViT, οι οποίες έχουν αναπτυχθεί εξ ολοκλήρου από την αρχή για την ταξινόμηση δερματολογικών εικόνων. Εξετάζεται ο αντίκτυπος βασικών επιλογών σχεδιασμού, όπως το βάθος του δικτύου και οι τεχνικές κανονικοποίησης, με στόχο τη μεγιστοποίηση της προγνωστικής ακρίβειας, λαμβάνοντας παράλληλα υπόψη τους υπολογιστικούς περιορισμούς. Τα μοντέλα αξιολογούνται στο σύνολο δεδομένων HAM10000, μια συλλογή από περισσότερες από 10.000 δερματοσκοπικές εικόνες επτά κατηγοριών δερματικών βλαβών, χρησιμοποιώντας ένα ολοκληρωμένο σύνολο μετρικών που περιλαμβάνει την ακρίβεια επικύρωσης, την απώλεια, τη βαθμολογία Macro F1 και τον αριθμό παραμέτρων. Η μελέτη παρέχει κρίσιμες, τεκμηριωμένες γνώσεις σχετικά με τους αρχιτεκτονικούς συμβιβασμούς που είναι εγγενείς σε κάθε προσέγγιση, λειτουργώντας ως μεθοδικός οδηγός για την ανάπτυξη αποτελεσματικών και εξειδικευμένων μοντέλων για απαιτητικές εφαρμογές ιατρικής απεικόνισης.

    Abstract 
    Deep learning has transformed medical imaging, particularly for automated disease diagnosis, with Convolutional Neural Networks (CNNs) traditionally dominating image analysis. The recent rise of Transformer architectures, including Vision Transformers (ViTs), offers a powerful new paradigm for image recognition. This thesis provides a systematic comparison of custom designed CNN and ViT architectures built from scratch for dermatological image classification. It explores the impact of fundamental design choices, such as network depth and regularization techniques, to maximize predictive accuracy, while considering computational constraints. These models are benchmarked on the HAM10000 dataset, a collection of over 10,000 dermatoscopic images across seven skin lesion categories, using a comprehensive suite of metrics including validation accuracy, loss, Macro F1-score, and parameter count. This study offers critical, evidence-based insights into the architectural trade-offs inherent to each approach, serving as a methodical guide for developing effective, specialized models for challenging medical imaging tasks.

     


© Πολυτεχνείο Κρήτης 2012