Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση Διπλωματικής Εργασίας κ. Κωνσταντίνου Όντρια - Σχολή ΗΜΜΥ
Αναγνώσεις: 77 / Συνδρομές: 0

  • Συντάχθηκε 29-04-2026 10:19 Πληροφορίες σύνταξης

    Ενημερώθηκε: -

    Τόπος:
    Σύνδεσμος τηλεδιάσκεψης
    Έναρξη: 04/05/2026 18:00
    Λήξη: 04/05/2026 19:00

    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
    Πρόγραμμα Προπτυχιακών Σπουδών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    Κωνσταντίνου Όντρια

    με θέμα
    Βραχυπρόθεσμη Πρόβλεψη Χρηματοοικονομικών Δεδομένων με Χρήση Μοντέλων Χρονοσειρών και Μεθόδων Μηχανικής Μάθησης
    Short-Term Forecasting of Financial Market Data Using Time Series Models and Machine Learning Methods

    Εξεταστική Επιτροπή
    Καθηγητής Διονύσιος Χριστόπουλος (επιβλέπων)
    Καθηγητής Μιχαήλ Λαγουδάκης
    Δρ. Σοφία Τσακιρίδου (Σχολή ΗΜΜΥ, ΕΔΙΠ)

    Περίληψη
    Οι χρηματοοικονομικές αγορές έχουν παραδοσιακά θεωρηθεί ως ένας από τους βασικούς δείκτες οικονομικής δραστηριότητας, με τις αγορές μετοχών να προσελκύουν ιδιαίτερη προσοχή, καθώς οι τιμές των μετοχών αντανακλούν την αγοραία αξία μιας επιχείρησης, την αναμενόμενη μελλοντική της κερδοφορία, τις προοπτικές ανάπτυξης και τους επενδυτικούς κινδύνους που αντιμετωπίζει, καθώς και τις ευρύτερες οικονομικές συνθήκες. Συνεπώς, η προσπάθεια πρόβλεψης των τιμών καθώς και των αποδόσεων των μετοχών θεωρείται μία από τις πιο σύνθετες προκλήσεις στη σύγχρονη χρηματοοικονομική οικονομική θεωρία. Σύμφωνα με την Υπόθεση της Αποτελεσματικής Αγοράς (Fama, 1970), οι χρηματοοικονομικές αγορές είναι πληροφοριακά αποτελεσματικές, γεγονός που συνεπάγεται ότι οι τιμές των μετοχών ενσωματώνουν πλήρως όλες τις δημόσια διαθέσιμες πληροφορίες, με αποτέλεσμα οι επενδυτές να μην μπορούν να επιτυγχάνουν συστηματικά υπερβάλλουσες αποδόσεις. Παραδοσιακά, για σκοπούς πρόβλεψης χρησιμοποιούνται οικονομετρικά μοντέλα χρονοσειρών, όπως το μοντέλο Αυτοπαλίνδρομου Ολοκληρωμένου Κινητού Μέσου Όρου (Autoregressive Integrated Moving Average – ARIMA). Ωστόσο, δεδομένου ότι τα χρηματοοικονομικά δεδομένα συχνά παρουσιάζουν το φαινόμενο της συσσώρευσης της μεταβλητότητας (volatility clustering), εφαρμόζονται συχνά επεκτάσεις όπως τα μοντέλα ARIMA-GARCH για την καλύτερη αποτύπωση της δυναμικής της αγοράς. Παράλληλα, τα τελευταία χρόνια τεχνικές μηχανικής μάθησης εφαρμόζονται ολοένα και περισσότερο στην πρόβλεψη χρηματοοικονομικών δεδομένων. Ιδιαίτερα, ο αλγόριθμος Extreme Gradient Boosting (XGBoost) έχει αναδειχθεί σε ένα ισχυρό εργαλείο πρόβλεψης, λόγω της ικανότητάς του να διαχειρίζεται μη γραμμικές σχέσεις και χώρους χαρακτηριστικών υψηλών διαστάσεων. 
    Παρακινούμενη από τις  παραπάνω εξελίξεις, η παρούσα διπλωματική εργασία αξιολογεί την ακρίβεια πρόβλεψης των μοντέλων ARIMA, ARIMA-GARCH και XGBoost χρησιμοποιώντας δεδομένα μετοχών πέντε μεγάλων αμερικανικών εταιρειών, οι οποίες αντιπροσωπεύουν διαφορετικούς τομείς της οικονομίας. Συγκεκριμένα, εξετάζονται μετοχές των εταιρείων Apple Inc. (AAPL), Microsoft Corp. (MSFT), Exxon Mobil Corp. (XOM), JPMorgan Chase & Co. (JPM), και The Coca-Cola Company (KO). Οι προβλέψεις των ημερήσιων λογαριθμικών αποδόσεων πραγματοποιούνται με τη χρήση ενός πλαισίου κυλιόμενης πρόβλεψης ενός βήματος ώστε να προσομοιωθούν ρεαλιστικές συνθήκες πρόβλεψης εκτός δείγματος, ενώ η ακρίβεια των μοντέλων αξιολογείται με τη χρήση μετρικών ακρίβειας πρόβλεψης. Τα αποτελέσματα δείχνουν ότι η ακρίβεια πρόβλεψης εξαρτάται τόσο από τα χαρακτηριστικά των μετοχών που περιλαμβάνονται στο υπό εξέταση χαρτοφυλάκιο όσο και από τις προδιαγραφές του εκάστοτε μοντέλου. Παρότι το μοντέλο ARIMA είναι ικανό να αποτυπώσει γραμμικές σχέσεις, το υβριδικό μοντέλο ARIMA–GARCH αποτελεί απαραίτητη επέκταση του βασικού μοντέλου ARIMA, καθώς επιτρέπει τη βελτίωση των προβλέψεων λαμβάνοντας υπόψη και το φαινόμενο της συσσώρευσης μεταβλητότητας. Τέλος, το μοντέλο XGBoost επιτυγχάνει ελαφρώς υψηλότερη ακρίβεια στις προβλέψεις του σε σύγκριση με τα υπόλοιπα μοντέλα, ιδιαίτερα όταν το σύνολο χαρακτηριστικών ιδιοτήτων εμπλουτίζεται με  πρόσθετα χαρακτηριστικά (engineered features) και εξωτερικούς δείκτες της αγοράς. Ωστόσο, τα κέρδη ως προς την ακρίβεια πρόβλεψης παραμένουν οριακά σε σύγκριση με το μοντέλο αναφοράς του τυχαίου περιπάτου (random walk). Τα αποτελέσματα δείχνουν ότι, παρότι το μοντέλο μηχανικής μάθησης μπορεί να προσφέρει μια ελάχιστα αυξημένη προβλεπτική ικανότητα, η συνολική συμπεριφορά των αποδόσεων των μετοχών παραμένει συμβατή με την Υπόθεση της Αποτελεσματικής Αγοράς.

    Abstract 
    Financial markets have traditionally been perceived as one of the major indicators of economic activity, with the equity markets attracting particular attention, as stock prices reflect the market value of a company, its expected future profitability, growth potential, and risk, as well as broader economic conditions. Therefore, forecasting stock prices and returns is considered one of the most important challenges in today's financial economics. According to the Efficient Market Hypothesis (Fama 1970), financial markets are informationally efficient, implying that asset prices fully reflect all publicly available information; this means that investors cannot systematically generate abnormal profits. Traditionally, econometric time series models, such as the Autoregressive Integrated Moving Average (ARIMA) model, are used for forecasting purposes. However, considering that financial data often exhibit volatility clustering, extensions such as ARIMA–GARCH models are frequently applied to better capture market dynamics. Furthermore, in recent years, machine learning techniques have also been increasingly applied in financial forecasting. In particular, Extreme Gradient Boosting (XGBoost) has emerged as a powerful predictive tool, owing to its ability to handle non-linear relationships and high-dimensional feature spaces. 
    Motivated by these developments, this dissertation evaluates the forecasting performance of ARIMA, ARIMA–GARCH, and XGBoost models, using daily stock data from five major U.S. corporations representing various sectors of the economy: Apple Inc. (AAPL), Microsoft Corp. (MSFT), Exxon Mobil Corp. (XOM), JPMorgan Chase & Co. (JPM), and The Coca-Cola Company (KO). Forecasts of daily log-returns are generated using a rolling one-step-ahead framework to simulate realistic out-of-sample prediction conditions, and model performance is evaluated using standard forecasting accuracy metrics. The results indicate that predictive accuracy depends on the characteristics of the assets included in the portfolio and the specifications used in the model. Although the ARIMA model can capture linear relationships, the ARIMA-GARCH hybrid model is a necessary extension of the baseline ARIMA model, which can provide enhanced predictions by also accounting for volatility clustering. Finally, the XGBoost model provides slightly higher predictive accuracy compared to the other models, especially if the feature set is enriched with engineered variables and external market indicators. However, the predictive accuracy gains are marginal compared to the random walk model. Overall, the results indicate that even if the machine learning model can provide some predictive accuracy, the overall behavior of the stocks is consistent with the Efficient Market Hypothesis.



© Πολυτεχνείο Κρήτης 2012