Συντάχθηκε 15-12-2025 13:10
Ενημερώθηκε:
15-12-2025 13:11
Τόπος: Λ - Κτίριο Επιστημών/ΗΜΜΥ, 145Π-58
Έναρξη: 22/12/2025 09:00
Λήξη: 22/12/2025 10:00
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Κωνσταντίνου Μπέκου
με θέμα
Ανάλυση Γκαουσσιανών Στοχαστικών Διαδικασιών με Περιοδικούς Πυρήνες
Analysis of Gaussian Processes with Periodic Kernels
Εξεταστική Επιτροπή
Καθηγητής Διονύσιος Χριστόπουλος (επιβλέπων)
Καθηγητής Μιχαήλ Λαγουδάκης
Καθηγητής Αθανάσιος Λιάβας
Περίληψη
Η παρούσα Διπλωματική Εργασία ασχολείται με την επίλυση ενός προβλήματος Ανάλυσης Χρονοσειράς (Time Series Analysis), στα πλαίσια της Μηχανικής Μάθησης με Επίβλεψη (Supervised Machine Learning), εφαρμόζοντας Παλινδρόμηση Γκαουσσιανών Διαδικασιών (Gaussian Process Regression), με χρήση πυρήνων (kernels) με περιοδικές συνιστώσες. Η χρονοσειρά που αποτελεί το σύνολο δεδομένων αυτής της εφαρμογής είναι οι μηνιαίοι μέσοι όροι των ημερήσιων μετρήσεων του πλήθους των ηλιακών κηλίδων (sunspots). Πρόκειται για ένα από τα πιο χαρακτηριστικά φαινόμενα της ηλιακής δραστηριότητας, το οποίο παρατηρείται και καταγράφεται για περισσότερο από δύο αιώνες. Η χρονοσειρά παρουσιάζει συμπεριφορά που επαναλαμβάνεται κάθε έντεκα (11) περίπου έτη.
Η μέθοδος Παλινδρόμησης Γκαουσσιανών Διαδικασιών που εφαρμόζουμε, επιδιώκει εκτός από ακριβείς σημειακές προβλέψεις —όπως όλα τα μοντέλα παλινδρόμησης— να υπολογίσει και αντίστοιχα διαστήματα πρόβλεψης (prediction intervals). Τα διαστήματα αυτά αντιπροσωπεύουν ένα εύρος τιμών, το οποίο αναμένεται να περιέχει την πραγματική τιμή της διαδικασίας, με κάποια προκαθορισμένη πιθανότητα. Οι Γκαουσσιανές διαδικασίες αξιοποιούν την υπάρχουσα γνώση σχετικά με τη συμπεριφορά των δεδομένων και τις μεταξύ τους συσχετίσεις, ώστε να συμπληρώσουν αυτήν την πληροφορία σε ενδιάμεσες και μελλοντικές χρονικές στιγμές, επιτυγχάνοντας έτσι καλύτερη προσέγγιση της συνάρτησης στόχου. Ο καθορισμός των συσχετίσεων, μεταξύ τιμών της μοντελοποιούμενης συνάρτησης, επιτελείται με την βοήθεια της συνάρτησης πυρήνα. Αυτή αποτελεί την κεντρική «μηχανή» στο εκπαιδευόμενο μοντέλο. Κατάλληλοι πυρήνες πρέπει να έχουν ιδιότητες συμβατές με τη συνάρτηση που μοντελοποιείται. Σε αυτήν την εργασία εξετάζονται ευρέως χρησιμοποιούμενοι πυρήνες με περιοδικά χαρακτηριστικά καθώς και ένας πυρήνας βασισμένος στο μοντέλο του στοχαστικού ταλαντωτή (Brownian oscillator). Ο πυρήνας αυτός αποτελείται από ημιτονοειδείς συναρτήσεις με εκθετικά μειούμενο πλάτος. Η προσαρμογή των ελεύθερων παραμέτρων των πυρήνων στα δεδομένα πραγματοποιείται με τη μέθοδο εκτίμησης μέγιστης πιθανοφάνειας (Maximum Likelihood Estimation), καθώς και με δύο άλλες καινοτόμες μεθόδους που αξιοποιούν τη δειγματική συνάρτηση αυτοσυσχέτισης (sample autocorrelation function) των δεδομένων εκπαίδευσης.
Εν συντομία, τα μοντέλα που εξετάσθηκαν στα πλαίσια αυτής της εργασίας, αντικατοπτρίζουν αποτελεσματικά τις απότομες μεταβολές (σε μικρές χρονικές αποστάσεις) και τις περιοδικές συσχετίσεις (για γειτονικούς Ηλιακούς Κύκλους) των τιμών της χρονοσειράς. Επίσης, αποδεικνύονται ικανά να παράγουν ακριβείς προβλέψεις του πλήθους των ηλιακών κηλίδων σε χρονικό ορίζοντα μέχρι και πενήντα (50) μηνών. Οι προγνώσεις αυτές μπορούν να αξιοποιηθούν σε διάφορους τομείς που επηρεάζονται από την ηλιακή δραστηριότητα, όπως για παράδειγμα, στην πρόληψη προβλημάτων στις δορυφορικές επικοινωνίες και στις τηλεπικοινωνίες υψηλής συχνότητας.
Abstract
This Diploma thesis deals with the solution of a Time Series Analysis problem, within the framework of Supervised Machine Learning, by applying Gaussian Process Regression, using kernels with periodic components. The dataset used in this application consists of the monthly averages of daily measurements of the number of sunspots. This is one of the most characteristic indicators of solar activity, which has been observed and recorded for more than two centuries, exhibiting a behavior that approximately repeats every eleven (11) years.
The Gaussian Process Regression method applied in this work aims, in addition to generating accurate point predictions to also compute corresponding prediction intervals. These intervals represent a range of values that is expected to contain the true value of the process with a predefined probability. Gaussian processes exploit existing knowledge about the behavior of the data and their mutual correlations in order to interpolate this information at intermediate and future time points, thereby achieving a better approximation of the target function. The specification of the correlations between values of the modeled function is accomplished through the kernel function, which constitutes the central “engine” of the trained model. Suitable kernels must possess properties compatible with the function being modeled. In this thesis, widely used kernels with periodic characteristics are examined, as well as a kernel based on the Brownian oscillator model. This kernel consists of sinusoidal functions with exponentially decaying amplitude. The fitting of the free parameters of the kernels to the data is performed using Maximum Likelihood Estimation, as well as two other innovative methods that exploit the sample autocorrelation function of the training data.
In summary, the models developed in the context of this work effectively capture —via their kernels— the short-time fluctuations (over small temporal scales) and the periodic correlations (across consecutive Solar Cycles) exhibited by the time series. Most importantly, they are shown to accurately predict the number of sunspots over a forecasting horizon of up to fifty (50) months. These forecasts can be utilized in various fields affected by solar activity, such as the prevention of problems in satellite communications and high-frequency telecommunications.