Συντάχθηκε 12-06-2026 12:03
Τόπος:
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 16/06/2026 12:00
Λήξη: 16/06/2026 13:00
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Βασιλικής Νέτσιου
με θέμα
Ομοσπονδιακή Μάθηση και Αυτοματοποίηση Ροών Εργασίας CEP/CEF μέσω Τελεστών του RapidMiner Studio
Federated Learning and CEP/CEF Workflow Automation through RapidMiner Studio Operators
Εξεταστική Επιτροπή
Καθηγητής Αντώνιος Δεληγιαννάκης (επιβλέπων)
Αναπληρωτής Καθηγητής Βασίλειος Σαμολαδάς
Επίκουρος Καθηγητής Νικόλαος Γιατράκος
Περίληψη
Η αυξανόμενη πολυπλοκότητα των κατανεμημένων συστημάτων επεξεργασίας ροών δεδομένων, σε συνδυασμό με την ανάγκη για μηχανική μάθηση με διαφύλαξη της ιδιωτικότητας, δημιουργεί σημαντικές προκλήσεις στη διαμόρφωση και ενορχήστρωση ετερογενών τεχνολογιών. Το Federated Learning επιτρέπει την εκπαίδευση μοντέλων σε κατανεμημένους κόμβους χωρίς τη συγκέντρωση των πρωτογενών δεδομένων, ενώ οι τεχνικές Complex Event Processing/Forecasting (CEP/CEF) επιτρέπουν την αναγνώριση και πρόβλεψη σύνθετων γεγονότων σε πραγματικό χρόνο. Ωστόσο, η ενσωμάτωση αυτών των προσεγγίσεων σε υποδομές streaming απαιτεί συνήθως χειροκίνητη παραμετροποίηση, εξειδικευμένες τεχνικές γνώσεις και άμεση αλληλεπίδραση με τη γραμμή εντολών.
Η παρούσα διπλωματική εργασία αντιμετωπίζει αυτές τις προκλήσεις μέσω της ανάπτυξης custom operators για το RapidMiner Studio, μια οπτική πλατφόρμα μηχανικής μάθησης. Οι τελεστές επιτρέπουν στους χρήστες να διαμορφώνουν οπτικά πειράματα federated learning και να ενσωματώνουν μηχανή CEP/CEF σε κατανεμημένες ροές εργασίας streaming, μειώνοντας την ανάγκη για χειροκίνητη παραμετροποίηση χαμηλού επιπέδου. Η προτεινόμενη αρχιτεκτονική διαχωρίζει το επίπεδο ελέγχου από το επίπεδο επεξεργασίας δεδομένων, επιτρέποντας τον σχεδιασμό και την εκτέλεση σύνθετων ροών εργασίας μέσω οπτικού περιβάλλοντος, ενώ παραμένουν διαθέσιμες ρυθμίσεις που εξαρτώνται από την εκάστοτε υποδομή, όπως οι Kafka brokers, οι απομακρυσμένες διαδρομές αρχείων και τα SSH credentials.
Η πειραματική αξιολόγηση επιβεβαίωσε ότι η προτεινόμενη προσέγγιση απλοποιεί επιτυχώς την ενορχήστρωση κατανεμημένων συστημάτων streaming μέσω οπτικού περιβάλλοντος.
Abstract
The increasing complexity of distributed data stream processing systems, combined with the need for privacy-preserving machine learning, creates significant challenges in configuring and orchestrating heterogeneous technologies. Federated Learning enables model training across distributed nodes without centralizing raw data, while Complex Event Processing and Forecasting (CEP/CEF) techniques allow real-time pattern recognition and prediction over event streams. However, integrating these approaches into streaming infrastructures typically requires manual configuration, specialized technical knowledge, and direct interaction with command-line interfaces.
This diploma thesis addresses these challenges through the development of custom operators for RapidMiner Studio, a visual machine learning platform. The operators allow users to visually configure federated learning experiments and to integrate a CEP/CEF engine into distributed streaming pipelines, reducing the amount of manual low-level configuration required. The proposed architecture separates the control layer from the data processing layer, enabling the design and execution of complex streaming workflows through a drag-and-drop environment while still exposing deployment-specific settings such as Kafka brokers, remote paths, and SSH credentials when needed.
The experimental evaluation confirmed that the proposed approach successfully simplifies the orchestration of distributed streaming systems through a visual environment.