Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση Διπλωματικής Εργασίας κας Φιλίας Μαυρικάκη - Σχολή ΗΜΜΥ
Αναγνώσεις: 187 / Συνδρομές: 0

  • Συντάχθηκε 25-02-2026 12:23 Πληροφορίες σύνταξης

    Ενημερώθηκε: -

    Τόπος:
    Σύνδεσμος τηλεδιάσκεψης
    Έναρξη: 03/03/2026 17:00
    Λήξη: 03/03/2026 18:00

    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
    Πρόγραμμα Προπτυχιακών Σπουδών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    Φιλίας Μαυρικάκη

    με θέμα
    Ομοσποδιακή Βαεσιανή Μάθηση για Επιδημιολογική Μοντελοποίηση
    Federated Bayesian Learning for Epidemiological Modeling

    Εξεταστική Επιτροπή
    Καθηγητής Βασίλειος Σαμολαδάς (επιβλέπων)
    Καθηγητής Θρασύβουλος Σπυρόπουλος 
    Καθηγητής Γεώργιος Χαλκιαδάκης     

    Περίληψη
    Η πρόσφατη κρίση του COVID-19 κατέδειξε την επιτακτική ανάγκη για ακριβή και έγκαιρη επιδημιολογική μοντελοποίηση. Τα σύγχρονα υπολογιστικά μοντέλα, και συγκεκριμένα η Μικροσκοπική Προσέγγιση Μαρκοβιανών Αλυσίδων (Microscopic Markov Chain Approach - MMCA), προσφέρουν τη δυνατότητα λεπτομερούς προσομοίωσης της εξάπλωσης ιών, λαμβάνοντας υπόψη κρίσιμες παραμέτρους όπως η ηλικιακή διαστρωμάτωση του πληθυσμού, τα μοτίβα κινητικότητας και η κατάσταση της νόσου σε ατομικό επίπεδο. Ωστόσο, η αποτελεσματικότητα αυτών των μοντέλων εξαρτάται άμεσα από την πρόσβαση σε εξαιρετικά ευαίσθητα, μικροσκοπικά δεδομένα υγείας και μετακίνησης.
    Εδώ προκύπτει μια θεμελιώδης σύγκρουση: η ανάγκη για συλλογή δεδομένων σε κεντρικούς διακομιστές για την εκπαίδευση των μοντέλων προσκρούει στις αυστηρές νομοθετικές ρυθμίσεις προστασίας προσωπικών δεδομένων (όπως ο GDPR). Παράλληλα, οι παραδοσιακές μέθοδοι Μηχανικής Μάθησης (Machine Learning) και Ομοσπονδιακής Μάθησης (Federated Learning) που βασίζονται στην ανταλλαγή παραγώγων (gradients) μέσω της καθόδου κλίσης (Gradient Descent), καθίστανται ανεπαρκείς. Ο λόγος είναι ότι οι σύγχρονοι επιδημιολογικοί προσομοιωτές (όπως ο EpiSim.jl) παρουσιάζουν στοχαστική και μη-διαφορίσιμη συμπεριφορά, καθιστώντας αδύνατο τον άμεσο υπολογισμό παραγώγων.
    Η παρούσα διπλωματική εργασία προτείνει και υλοποιεί Μπεϋζιανή Ομοσπονδιακή Μάθηση (Bayesian Federated Learning - BFL), με σκοπό  τη βελτιστοποίηση επιδημιολογικών προσομοιώσεων σε κατανεμημένα περιβάλλοντα που διασφαλίζουν την ιδιωτικότητα. Η προσέγγιση αυτή επιλύει το πρόβλημα της εκτίμησης παραμέτρων (parameter estimation) χωρίς να απαιτείται η μεταφορά των πρωτογενών δεδομένων των ασθενών.
    Κεντρικός πυλώνας της μεθοδολογίας είναι η χρήση της Προσεγγιστικής Μπεϋζιανής Υπολογιστικής (Approximate Bayesian Computation - ABC) βασισμένης σε Ακολουθιακές Μεθόδους Μόντε Κάρλο (Sequential Monte Carlo - SMC). Ο αλγόριθμος Federated ABC-SMC που αναπτύχθηκε, επιτρέπει την εκτίμηση των εκ των υστέρων κατανομών (posterior distributions) των επιδημικών παραμέτρων μέσω της σύγκρισης προσομοιωμένων δεδομένων με τα πραγματικά τοπικά δεδομένα.
    Η αρχιτεκτονική του συστήματος ακολουθεί μια τοπολογία αστέρα (star topology) και διακρίνεται σε τρεις βασικές οντότητες: τον Κεντρικό Συντονιστή(Coordinator), ο οποίος διαχειρίζεται τον πληθυσμό των υποψήφιων παραμέτρων (particles) και συντονίζει τη διαδικασία συμπερασματολογίας, τους  Εργάτες Προσομοίωσης (Simulation Workers) οι οποίοι εκτελούν τον προσομοιωτή EpiSim.jl (υλοποιημένο σε γλώσσα Julia) για να παράγουν συνθετικά δεδομένα βάσει των προτεινόμενων παραμέτρων και τους  Ομοσπονδιακούς Κόμβους (Federated Sites) που αποτελούν τους τοπικούς φορείς που κατέχουν τα ευαίσθητα πραγματικά δεδομένα. Οι κόμβοι αυτοί λαμβάνουν τα αποτελέσματα της προσομοίωσης, τα συγκρίνουν τοπικά με τα δεδομένα τους και επιστρέφουν στον Συντονιστή μόνο μία κλιμακωτή τιμή σφάλματος (distance metric), προστατεύοντας έτσι την ιδιωτικότητα των ατόμων (αρχιτεκτονική "Code-to-Data").
    Για την αντιμετώπιση του υψηλού υπολογιστικού κόστους των προσομοιώσεων, το σύστημα υλοποιήθηκε με χρήση του πλαισίου κατανεμημένου υπολογισμού Ray.io. Αυτό επέτρεψε την ασύγχρονη και παραλληλοποιημένη εκτέλεση χιλιάδων προσομοιώσεων, μειώνοντας δραματικά τον χρόνο εκτέλεσης (από ημέρες σε ώρες). Αναπτύχθηκε επίσης μια διεπαφή (wrapper) σε Python για τη διασύνδεση του αλγορίθμου ABC-SMC με τον προσομοιωτή EpiSim.jl.
    Η εγκυρότητα του πλαισίου πιστοποιήθηκε με χρήση πραγματικών δεδομένων COVID-19 και κινητικότητας από την Ισπανία. Τα πειραματικά αποτελέσματα έδειξαν ότι o αλγόριθμος συγκλίνει με επιτυχία στις πραγματικές τιμές των παραμέτρων (ground truth), όπως ο ρυθμός μετάδοσης (β) και οι παράγοντες κοινωνικής αποστασιοποίησης.Η ακρίβεια της εκτίμησης διατηρείται υψηλή ακόμη και όταν τα δεδομένα είναι διαμοιρασμένα σε πολλαπλούς κόμβους (σενάρια 2 και 4 κόμβων). Η ιδιωτικότητα διασφαλίζεται καθώς καμία πληροφορία σε επίπεδο ατόμου ή τοπικού πληθυσμού δεν εξέρχεται από τους ομοσπονδιακούς κόμβους. Συμπερασματικά, η εργασία αυτή γεφυρώνει το χάσμα μεταξύ των προηγμένων επιδημιολογικών αλγορίθμων και των απαιτήσεων ιδιωτικότητας, προσφέροντας ένα προσαρμόσιμο και ασφαλές μοντέλο για την επιτήρηση πανδημιών σε εθνικό ή διεθνές επίπεδο.

    Abstract 
    The recent COVID-19 crisis highlighted the urgent need for accurate and timely epidemiological modeling.  Modern epidemiological modeling increasingly relies on high-resolution simulators, such as the Microscopic Markov Chain Approach (MMCA), which require granular mobility and health data to accurately estimate epidemic dynamics.They provide detailed  understanding for age-classified transmission and mobility information. However, it relies on the analysis of sensitive localized data. Epidemiological simulators exhibit stochastic, non-differentiable dynamics. Centralized methods can't ensure privacy, while Federated Learning algorithms  that rely on a gradient descent, are incompatible.
    This thesis proposes a solution for the problem of parameter estimation of state-of-the-art epidemiological modeling in a federated setting. A central pillar of the methodology is the use of Approximate Bayesian Computation based on Sequential Monte Carlo (ABC-SMC) methods.  We introduce a variation of this algorithm (ABC-SMC) using Federated architecture to estimate the posterior distributions of epidemic parameters enabling likelihood-free inference without transferring raw data between sites. The proposed architecture employs a star-topology federated system in which local nodes execute simulations using the EpiSim.jl epidemiological simulator, while a central coordinator aggregates distance metrics to approximate posterior parameter distributions. To validate this system, we created distinct federated sites that work as client nodes by using Real-world data from Covid-19 in Spain. To address the high computational cost of simulations, the system was implemented using the Ray.io distributed computing framework. This enabled asynchronous and parallel execution of thousands of simulations, dramatically reducing execution time (from days to hours). A Python wrapper interface was also developed to connect the ABC-SMC algorithm with the EpiSim.jl simulator.
    The validity of the framework was verified using real COVID-19 and mobility data from Spain. Experimental results showed that the algorithm successfully converges to the true parameter values (ground truth), such as the transmission rate and social distancing factors. Estimation accuracy remains high even when data are distributed across multiple nodes (2-site and 4-site scenarios). Privacy is preserved, as no individual-level or local population information leaves the federated sites. In conclusion, this work bridges the gap between advanced epidemiological algorithms and privacy requirements, offering an adaptable and secure model for pandemic surveillance at national or international scale. The results show that the Federated ABC-SMC algorithm successfully recovers our observed data without the raw data being shared. This work connects the known algorithms used for epidemiological modeling and the safety, regarding privacy, of a federated environment. 



© Πολυτεχνείο Κρήτης 2012