Συντάχθηκε 08-06-2026 10:22
Ενημερώθηκε:
08-06-2026 10:28
Τόπος:
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 10/06/2026 17:30
Λήξη: 10/06/2026 18:30
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Χρήστου Κωσταδήμα
με θέμα
Βαθιά Μάθηση για Αυτοματοποιημένη Ποσοτικοποίηση Νευρωνικής Μορφολογίας και Υγείας σε Εικόνες Μικροσκοπίας
Deep Learning for Automated Quantification of Neuronal Morphology and Health in Microscopy Images
Εξεταστική Επιτροπή
Καθηγητής Μιχαήλ Ζερβάκης (Επιβλέπων)
Αναπληρωτής Καθηγητής Ευάγγελος Καλογεράκης
Δρ. Νικόλαος-Κοσμάς Χλης
Περίληψη
Η βιοϊατρική έρευνα στις μέρες μας έχει σημειώσει σημαντική πρόοδο χάρη στη χρήση διαφοροποιημένων βλαστοκυττάρων (human induced pluripotent stem cells), τα οποία αποτελούν μια ανανεώσιμη και γενετικά προσαρμόσιμη πηγή εξειδικευμένων κυτταρικών συστημάτων. Ωστόσο, η διαδικασία διαφοροποίησης είναι εξαιρετικά χρονοβόρα και επιρρεπής σε μορφολογική μεταβλητότητα. Τα βλαστοκύτταρα ενδέχεται να διαφοροποιηθούν σε τρεις κατηγορίες: υγιή νευρωνικά δίκτυα, δίκτυα με αυξημένο κυτταρικό θάνατο ή δίκτυα που εμφανίζουν σχηματισμό κυτταρικών συσσωματωμάτων (clusters). Μεταξύ αυτών των μορφολογικών αποτελεσμάτων, μόνο ο σχηματισμός υγιών νευρωνικών δικτύων πληροί τα πρότυπα που απαιτούνται για τα πειράματα που αποσκοπούν στην ανάπτυξη φαρμάκων. Ο ποιοτικός έλεγχος για τη διασφάλιση της ποιότητας των δειγμάτων βασίζεται επί του παρόντος στη χειροκίνητη επιθεώρηση εικόνων μικροσκοπίας, ενδεχομένως με την πρόσθετη χρήση fluorescent labeling (staining). Ωστόσο, αυτές οι χειροκίνητες μεθοδολογίες παρουσιάζουν περιορισμούς, καθώς είναι εγγενώς χρονοβόρες και επιρρεπείς σε ανθρώπινα σφάλματα. Τεχνικές όπως το fluorescent labeling αυξάνουν σημαντικά την πολυπλοκότητα και τον χρόνο προετοιμασίας της πειραματικής διαδικασίας, ενώ παράλληλα ενέχουν κινδύνους τοξικότητας για τα ζωντανά κύτταρα, θέτοντας σε κίνδυνο την ακεραιότητα του δείγματος. Συγκεκριμένα, η προτεινόμενη ροή εργασίας χρησιμοποιεί ένα βελτιστοποιημένο συνελικτικό νευρωνικό δίκτυο τύπου U-net για την ακριβή κατάτμηση εικόνας (image segmentation) των διαφοροποιημένων κυττάρων. Αντί για μια τυποποιημένη αρχιτεκτονική, το μοντέλο αναπτύχθηκε κατόπιν διεξοδικών δοκιμών διαφορετικών συναρτήσεων απώλειας (loss functions) και μεγεθών δικτύου, ώστε να επιτυγχάνεται η βέλτιστη κατάτμηση τόσο μεμονωμένων νευρώνων όσο και κυτταρικών συσσωματωμάτων. Μετά την κατάτμηση των εικόνων, εξάγεται ο συνολικός αριθμός των pixels που αντιστοιχούν σε νευρώνες και ο αριθμός των pixels που αντιστοιχούν σε συσσωματώματα. Αυτά τα δεδομένα, σε συνδυασμό με χαρακτηριστικά που εξάγονται από το ιστόγραμμα των εικόνων γκρίζας κλίμακας (grayscale images), τροφοδοτούν έναν ταξινομητή Random Forest. ΄Ετσι, το μοντέλο αποφασίζει εάν η αντίστοιχη εικόνα απεικονίζει ένα well με υγιείς νευρώνες, συσσωματώματα (clusters) ή υπολείμματα από νεκρά κύτταρα (dead cells). Η μεθοδολογία αυτή εφαρμόζεται well-by-well, παρέχοντας μια ολοκληρωμένη ποιοτική αξιολόγηση της πειραματικής διάταξης. Με αυτόν τον τρόπο, το μοντέλο ταξινομεί κάθε μεμονωμένη εικόνα μικροσκοπίας (η οποία έχει ληφθεί από ένα συγκεκριμένο well) σε μία από τις τρεις κατηγορίες: υγιείς νευρώνες, συσσωματώματα (clusters) ή υπολείμματα νεκρών κυττάρων. Διαχωρίζοντας με ακρίβεια τις εικόνες υγιών νευρώνων, το εργαλείο παρέχει τα απαραίτητα δεδομένα για τη μεταγενέστερη λήψη αποφάσεων σε επίπεδο well, συμβάλλοντας έτσι σε μια ολοκληρωμένη ποιοτική αξιολόγηση της πειραματικής διάταξης και διασφαλίζοντας ότι μόνο τα wells που παρουσιάζουν υγιή νευρωνικά δίκτυα προκρίνονται για περαιτέρω βιολογικές δοκιμές. Για την επιλογή του βέλτιστου μοντέλου κατάτμησης (segmentation), πραγματοποιήθηκε εκτενής αξιολόγηση 192 διαφορετικών παραμετροποιήσεων. Η κορυφαία διαμόρφωση του βελτιστοποιημένου μοντέλου U-Net πέτυχε συνολική μέση ακρίβεια εικονοστοιχείων (mean pixel accuracy) 97,78%. Η μέση ακρίβεια του προσκηνίου (foreground accuracy) η οποία λαμβάνει υπόψη μόνο τους νευρώνες και τα συσσωματώματα, υπολογίστηκε στο 82,95%, ενώ η διάμεση τιμή (median) του Dice Score διαμορφώθηκε στο 0,95 για τα συσσωματώματα (clusters) και στο 0,70 για τους μεμονωμένους νευρώνες. Επιπλέον, το ενσωματωμένο μοντέλο απόφασης Random Forest επέδειξε εξαιρετική αξιοπιστία στην ταξινόμηση των δειγμάτων, επιτυγχάνοντας F1-score 0,97 σε νέα δεδομένα δοκιμής (unseen test data). Τα αποτελέσματα αυτά υποδεικνύουν ότι το αυτοματοποιημένο σύστημα μπορεί να αντικαταστήσει αποτελεσματικά τη χειροκίνητη επιθεώρηση, παρέχοντας μια στιβαρή λύση υψηλής απόδοσης για τον ποιοτικό έλεγχο στις διαδικασίες σχεδιασμού φαρμάκων, διασφαλίζοντας την ακεραιότητα βιολογικών δοκιμών.
Abstract
Biomedical research nowadays has advanced considerably thanks to the use of differentiated human induced pluripotent stem cells, which offer renewable, genetically customizable source of specialized cellular systems. However, the differentiation process is significantly time consuming and prone to morphological variability. Stem cells in each well differentiate into three categories: healthy neuronal networks, increased cell death and clustered cell formations. Among these morphological outcomes, only the formation of healthy, intricate neuronal net works meets the standards required for drug discovery assays. To ensure the required purity, quality control currently relies on manual inspection of microscopy images, potentially in addition to fluorescent labeling (staining). Nonetheless, these manual methodologies come with limitations: they are inherently time-consuming and susceptible to human error. Also, techniques such as fluorescent labeling add significant complexity and time to the experimental setup, while potentially presenting toxicity risks to living cells that jeopardize sample integrity. To overcome these limitations, this thesis proposes an automated, label-free quality control pipeline. The work focuses on the post-differentiation stage to assess if stem cells have successfully differentiated into neurons in each well. By analyzing images without the need for staining, our AI-driven approach provides a faster and highly reliable evaluation of the culture’s quality for downstream assays. Specifically, the proposed workflow employs a customized U-Net architecture optimized for the precise segmentation of differentiated cells. To ensure high performance on complex cellular morphologies, several model depths and loss functions were evaluated, ultimately arriving at a configuration tailored to segment both individual neurons and dense clusters with high fidelity. After segmenting the images, the numbers of total pixels that correspond to neurons and the number of pixels that correspond to clusters are extracted. These spatial features are combined with intensity features extracted from the histogram of the microscopy images and are fed to a Random Forest classifier. In this way, the model classifies each individual microscopy image (acquired from a specific well) into one of three categories: healthy neurons, clusters, or dead cell debris. By accurately identifying and separating images of healthy neurons from those containing dead cells or clusters, the tool provides the essential data required for informed subsequent well-level decision-making, thereby contributing to a comprehensive quality assessment of the experimental setup and ensuring that only wells containing healthy neuronal networks are promoted to downstream assays. To select the optimal segmentation model, we extensively benchmarked 192 configurations. The top-performing optimized U-Net achieved an overall mean pixel accuracy of 97.78%. We further evaluated its performance on foreground elements (neurons and clusters), reaching a mean foreground accuracy of 82.95%. Specifically, the model achieved a median Dice Score of 0.95 for clusters and 0.70 for individual neurons. Furthermore, the integrated Random Forest decision model demonstrated exceptional reliability in culture classification, achieving an F1-score of 0.97 on unseen test data. These results indicate that the automated system can effectively replace manual inspection, providing a ro bust, high-throughput solution for quality control in drug discovery workflows while ensuring the integrity and reproducibility of biological assays.
Meeting ID: 954 649 5567
Password: 956799