Συντάχθηκε 16-12-2025 11:08
Ενημερώθηκε:
16-12-2025 11:11
Τόπος:
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 17/12/2025 11:00
Λήξη: 17/12/2025 12:00
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Κωνσταντίνου Ρεβύθη
με θέμα
Οπτικοποίηση Δεδομένων Ροής στο Jupyter-Lab
Visualization of Streaming Data on JupyterLab
Εξεταστική Επιτροπή
Αναπληρωτής Καθηγητής Βασίλειος Σαμολαδάς (επιβλέπων)
Καθηγητής Αντώνιος Δεληγιαννάκης
Καθηγητής Μίνως Γαροφαλάκης
Περίληψη
Σκοπός της παρούσας διπλωματικής εργασίας είναι η ανάπτυξη ενός εργαλείου για την οπτικοποίηση ροών δεδομένων πραγματικού χρόνου (real-time data stream visualization) εντός του περιβάλλοντος JupyterLab. Σχεδιασμένο για απόδοση χαμηλής καθυστέρησης (low-latency), το εργαλείο διευκολύνει την άμεση οπτικοποίηση εισερχόμενων ροών δεδομένων, ενώ υποστηρίζει αξιόπιστες συνδέσεις με απομακρυσμένες, συνεχείς διεργασίες μέσω Kafka. Επιπλέον, παρέχει στους χρήστες τη δυνατότητα να εκτελούν ερωτήματα και να προβαίνουν σε συνάθροιση (aggregation) των οπτικοποιημένων δεδομένων διαδραστικά, χωρίς να διαταράσσεται η ενεργή ροή.
Για την επίτευξη του σκοπού αυτού, η έρευνα εντοπίζει και επεκτείνει λύσεις αιχμής (state-of-the-art) για την οπτικοποίηση ροών δεδομένων στο JupyterLab. Ως θεμελιώδες πλαίσιο επιλέχθηκε το TensorWatch, ένα εργαλείο αποσφαλμάτωσης και οπτικοποίησης σχεδιασμένο για την επιστήμη δεδομένων. Βασιζόμενη σε αυτό το θεμέλιο, η εργασία εστιάζει στη βελτίωση της ευχρηστίας και στην εισαγωγή νέων λειτουργιών που επιτρέπουν στους χρήστες να ενσωματώνουν, να οπτικοποιούν και να αλληλεπιδρούν εύκολα με δεδομένα από ποικίλες πηγές και μορφές.
Η σημασία της παρούσας εργασίας έγκειται στη δημιουργία ενός συστήματος που απλοποιεί την εξερεύνηση και την παρακολούθηση δεδομένων σε πραγματικό χρόνο. Μέσω της παροχής άμεσης οπτικής ανάδρασης, οι χρήστες είναι σε θέση να κατανοούν καλύτερα τα δεδομένα τους και να λαμβάνουν τεκμηριωμένες αποφάσεις πιο αποδοτικά. Δεδομένου ότι τα δεδομένα ροής έχουν συχνά βραχύβια αξία, η ικανότητα ταχείας οπτικοποίησης και ανάλυσής τους είναι καθοριστικής σημασίας για τη μεγιστοποίηση της χρησιμότητάς τους.
Λέξεις-κλειδιά: JupyterLab, Οπτικοποίηση, Tensorwatch, Kafka, Matplotlib, Ροή Δεδομένων, Ανάλυση Δεδομένων, Μεγάλα Δεδομένα, Python3
Abstract
The aim of this thesis is to develop a tool for real-time data stream visualization within the JupyterLab environment. Engineered for low-latency performance, the tool facilitates the immediate visualization of incoming data streams, while supporting robust connections to remote continuous processes via Kafka. Furthermore, it empowers users to interactively query and aggregate visualized data without disrupting the active stream.
To achieve this, the research identifies and extends state-of-the-art solutions for data stream visualization in JupyterLab. TensorWatch, a debugging and visualization tool designed for data science, was selected as the foundational framework. Building on this foundation, the work focuses on enhancing usability and introducing new features that enable users to easily integrate, visualize, and interact with data from various sources and
formats.
The significance of this work lies in creating a system that simplifies real-time data exploration and monitoring. By providing immediate visual feedback, users can better understand their data and make informed decisions more efficiently. Since streaming data often has short-lived value, the ability to visualize and analyze it quickly is crucial for maximizing its usefulness.
Keywords: JupyterLab, Visualization, Tensorwatch, Kafka, Matplotlib, Streaming, Data-analyses, Big-data, Python3