Συντάχθηκε 30-03-2026 10:13
Ενημερώθηκε:
30-03-2026 10:17
Τόπος:
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 01/04/2026 11:00
Λήξη: 01/04/2026 12:00
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Γεωργίου Ευαγγελόπουλου
με θέμα
Διερεύνηση και Ανάπτυξη Αποτελεσματικού Federated Learning για την Πρόβλεψη της Ατμοσφαιρικής Ρύπανσης
Investigating and Developing Efficient Federated Learning for Air Pollution Prediction
Εξεταστική Επιτροπή
Αναπληρωτής Καθηγητής Βασίλειος Σαμολαδάς (επιβλέπων)
Καθηγητής Γεώργιος Χαλκιαδάκης
Επίκουρος Καθηγητής Νικόλαος Γιατράκος
Περίληψη
Η ατμοσφαιρική ρύπανση αποτελεί εδώ και καιρό σημαντική απειλή για τη δημόσια υγεία στην περιοχή της Δυτικής Μακεδονίας στην Ελλάδα, μια απειλή που αποδίδεται στην εξόρυξη λιγνίτη και στα έντονα μολυσμένα αέρια που εκπέμπονται κατά την καύση του για την παραγωγή ηλεκτρικής ενέργειας. Ενώ οι σύγχρονες συσκευές του Διαδικτύου των Πραγμάτων (IoT) προσφέρουν δυνατότητες λεπτομερούς παρακολούθησης, οι συμβατικές κεντρικοποιημένες προσεγγίσεις μηχανικής μάθησης που χρησιμοποιούνται για την πρόβλεψη της ποιότητας του αέρα αντιμετωπίζουν δυσκολίες όσον αφορά το απόρρητο των δεδομένων και σημαντικά ζητήματα εύρους ζώνης (bandwidth) κατά την κλιμάκωση σε μεγάλες ποσότητες συλλεγόμενων δεδομένων.
Αυτή η διπλωματική εργασία προτείνει και αξιολογεί ένα πλαίσιο Ομόσπονδης Μάθησης (Federated Learning - FL) με προστασία του απορρήτου για την πρόβλεψη της συγκέντρωσης PM2.5 στην ατμόσφαιρα. Χρησιμοποιώντας μια αρχιτεκτονική Long Short-Term Memory (LSTM), το μοντέλο εκπαιδεύτηκε σε έξι διαφορετικούς σταθμούς ατμοσφαιρικών μετρήσεων που βρίσκονται στο Αμύνταιο, τον Φιλώτα, την Κοιλάδα, την Κάτω Κώμη, τα Πετρανά και την Ποντοκώμη, χρησιμοποιώντας ιστορικά ωριαία δεδομένα που καλύπτουν την περίοδο 2019-2025.
Τα πειραματικά αποτελέσματα δείχνουν ότι η προσέγγιση του ομόσπονδου μοντέλου LSTM επιτυγχάνει Μέσο Απόλυτο Σφάλμα (MAE) 1,75 μg/m³. Συγκρίνοντας το με την κεντρικοποιημένη προσέγγιση (MAE 1,41 μg/m³), παρατηρούμε έναν συμβιβασμό (trade-off) περίπου 0,34 μg/m³. Αν και ελαφρώς υψηλότερη, η απόδοση του μοντέλου παραμένει συγκρίσιμη με το κεντρικοποιημένο «χρυσό πρότυπο» (MAE 1,41 μg/m³). Επιπλέον, η σύγκριση του μοντέλου LSTM με τις αρχιτεκτονικές GRU και SimpleRNN βοηθά στην επιβεβαίωση του LSTM ως ανώτερου μοντέλου, καθώς παρέχει μεγαλύτερη σταθερότητα κατά τη διαδικασία ενσωμάτωσης (aggregation) με τυπική απόκλιση 0,019.
Όσον αφορά την αποδοτικότητα του δικτύου, η μελέτη διαπιστώνει ότι ενώ η Ομόσπονδη Μάθηση (FL) παρέχει ουδέτερο κόστος εύρους ζώνης για ωριαίες αναφορές, αποδίδει μια θεωρητική μείωση του εύρους ζώνης κατά 98,1% εάν μεταβαίναμε σε μετρήσεις επιπέδου λεπτού. Αυτά τα ευρήματα επιβεβαιώνουν ότι η Ομόσπονδη Μάθηση προσφέρει μια κλιμακώσιμη λύση, συμβατή με τους κανόνες απορρήτου, για την περιβαλλοντική παρακολούθηση σε ετερογενείς βιομηχανικές περιοχές.
Abstract
Air pollution has long posed a major public health threat in the region of Western Macedonia in Greece, a threat that is attributed to lignite mining and heavily polluted gases that are emitted during lignite burning to produce electricity. While modern Internet of Things (IoT) devices offer granular monitoring capabilities, conventional centralized machine learning approaches used for air quality prediction struggle with data privacy and major bandwidth concerns when scaling to large amounts of collected data.
This thesis proposes and evaluates a privacy preserving Federated Learning (FL) Framework for forecasting PM2.5 concentration in the atmosphere. Making use of a Long Short-Term Memory (LSTM) architecture, the model was trained across six different atmospheric measuring stations located in Amyntaio, Filotas, Koilada, Kato Komi, Petrana and Pontokomi, using historical hourly data spanning 2019-2025.
Experimental results showcase that the Federated LSTM model approach achieves a Mean Absolute Error (MAE) of 1.75 μg/m³. Comparing that to the centralized approach (MAE 1.41 μg/m³) we observe a trade-off of approximately 0.34 μg/m³. While slightly higher, the model's performance remains comparable to the centralized 'gold standard' (MAE 1.41 μg/m³). Furthermore, comparing the LSTM model against GRU and SimpleRNN architectures helps us confirm LSTM as the superior model as it provides more stability during the aggregation process with a standard deviation of 0.019.
In terms of network efficiency, the study establishes that while FL provides neutral bandwidth costs for hourly reporting, it yields a theoretical bandwidth reduction of 98.1% if we were to switch to minute level measurements. These findings confirm that Federated Learning offers a scalable, privacy-compliant solution for environmental monitoring in heterogeneous industrial regions.