04
Ιουν
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Ιωάννη Περίδη
με θέμα
Δενδρική Αναζήτηση Μόντε Κάρλο Καθοδηγούμενη από Βαθιά Μάθηση για Αυτόνομη Οδήγηση Χωρίς Λωρίδες Κυκλοφορίας
Deep Learning-Guided Monte Carlo Tree Search for Lane-Free Autonomous Driving
Εξεταστική Επιτροπή
Καθηγητής Γεώργιος Χαλκιαδάκης (Σχολή ΗΜΜΥ)
Καθηγητής Μιχαήλ Γ. Λαγουδάκης (Σχολή ΗΜΜΥ)
Καθηγητής Ιωάννης Παπαμιχαήλ (ΠΚ, Σχολή ΜΠΔ)
Περίληψη
Η διαχείριση οδικής κυκλοφορίας έχει γίνει ιδιαίτερα περίπλοκη λόγω της αύξησης των τεχνολογιών αυτόνομης οδήγησης. Τα παραδοσιακά συστήματα κυκλοφορίας με λωρίδες, ενώ είναι δομημένα και οικεία, συχνά αντιμετωπίζουν προβλήματα με την βελτιστοποίηση και τον δυναμικό έλεγχο ροής, οδηγώντας σε συμφόρηση και αναποτελεσματικότητες. Αντίθετα, τα περιβάλλοντα κυκλοφορίας χωρίς λωρίδες προσφέρουν μια ελπιδοφόρα εναλλακτική λύση επιτρέποντας στα οχήματα να εκτελούν ελιγμούς πλάγια σε ολόκληρο το οδόστρωμα χωρίς τους περιορισμούς των λωρίδων, πράγμα που θα μπορούσε να ενισχύσει σημαντικά την χωρητικότητα των δρόμων και την ροή της κυκλοφορίας.
Η διπλωματική αυτή διερευνά τη χρήση της Δενδρικής Αναζήτησης Μόντε Κάρλο (Monte Carlo Tree Search - MCTS) και των τεχνικών βαθιάς επιβλεπόμενης μάθησης για την προώθηση των τεχνολογιών αυτόνομης οδήγησης. Η MCTS είναι ιδιαίτερα κατάλληλη για δυναμικά και απρόβλεπτα περιβάλλοντα, όπως η αυτόνομη οδήγηση, λόγω των ισχυρών δυνατοτήτων λήψης αποφάσεων σε περίπλοκα σενάρια. Σε συνδυασμό με τα Βαθιά Νευρωνικά Δίκτυα (Deep Neural Networks - DNNs), τα οποία διακρίνονται στην αναγνώριση μοτίβων και το προγνωστικό μοντελοποίηση από μεγάλα σύνολα δεδομένων, αυτές οι τεχνολογίες θα μπορούσαν ενδεχομένως να επαναστατήσουν τα συστήματα διαχείρισης κυκλοφορίας.
Μια αναπαράσταση του MCTS σε πλαίσιο Μαρκοβιανής Διαδικασίας Λήψης Αποφάσεων (Markov Decision Process) αναπτύχθηκε ειδικά για σενάρια οδήγησης χωρίς λωρίδες, βελτιώνοντας τις παραδοσιακές προσεγγίσεις MCTS για να χειρίζονται καλύτερα τις λεπτομερείς απαιτήσεις αυτού του περιβάλλοντος. Η διπλωματική αυτή βασίζεται στο υπάρχον μοντέλο MCTS που ανέπτυξε ο Παντελής Γιανκουλίδης στην διπλωματική του εργασία το 2023, εστιάζοντας αρχικά στην βελτίωση του τρόπου επεξεργασίας των πληροφοριών μιας κατάστασης. Αυτές οι βελτιώσεις αύξησαν σημαντικά την λειτουργική αποδοτικότητα και αποτελεσματικότητα του πλαισίου MCTS, επιτρέποντας του να διαχειρίζεται πιο επιδέξια καταστάσεις υψηλής πυκνότητας κυκλοφορίας.
Περαιτέρω πρόοδος επιτεύχθηκε με την ένταξη ενός νευρωνικού δικτύου στο πλαίσιο MCTS για να καθοδηγεί τη φάση επιλογής. Αυτή η ένταξη αξιοποίησε τις προγνωστικές ικανότητες των DNNs, επιτρέποντας πιο ενημερωμένη λήψη αποφάσεων και ταχύτερη εξερεύνηση κατά τη διαδικασία αναζήτησης δέντρου. Επιπλέον, διερευνήθηκε μια αυτόνομη προσέγγιση νευρωνικού δικτύου, σχεδιασμένη να λειτουργεί χωρίς τα εξερευνητικά οφέλη της MCTS, για να αξιολογήσει τη συγκριτική της αποτελεσματικότητα στη λήψη αποφάσεων.
Η ενδελεχής πειραματική αξιολόγηση της προσέγγισής μας, δεικνύει ότι το βελτιωμένο πλαίσιο MCTS, υποστηριζόμενο από την καθοδήγηση του νευρωνικού δικτύου, βελτίωσε σημαντικά τα αποτελέσματα διαχείρισης της κυκλοφορίας. Καίριες μετρήσεις όπως η ασφάλεια, μέσω της μείωσης των ποσοστών σύγκρουσης, και η αποδοτικότητα, με τη βελτιστοποίηση της ταχύτητας και της ροής της κυκλοφορίας, επισημαίνουν τα ουσιαστικά οφέλη αυτής της ενσωματωμένης προσέγγισης. Αυτά τα αποτελέσματα υπογραμμίζουν το δυναμικό του συνδυασμού της MCTS με τις τεχνολογίες νευρωνικών δικτύων για να επαναστατήσουν τις διαδικασίες λήψης αποφάσεων σε αυτόνομα οχηματικά περιβάλλοντα.
Abstract
Vehicular traffic management has become increasingly complex due to the rise in autonomous driving technologies. Traditional lane-based traffic systems, while structured and familiar, often struggle with optimization and dynamic flow control, leading to congestion and inefficiencies. By contrast, lane-free traffic environments offer a promising alternative by allowing vehicles to maneuver laterally across the entire roadway without the constraints of lanes, which could significantly enhance road capacity and traffic fluidity.
This thesis explores the use of Monte Carlo Tree Search (MCTS) and supervised deep learning techniques to advance autonomous driving technologies. MCTS is well-suited for dynamic and unpredictable environments, such as autonomous driving, due to its robust decision-making capabilities in complex scenarios. Combined with Deep Neural Networks (DNNs), which excel in pattern recognition and predictive modeling from large datasets, these technologies could potentially revolutionize traffic management systems.
A representation of MCTS in a Markov Decision Process (MDP) framework specifically tailored for lane-free traffic scenarios is developed, enhancing traditional MCTS approaches to better handle the demands of this environment. This thesis builds upon the existing MCTS model developed in a 2023 diploma thesis by Pantelis Giankoulidis, focusing initially on refining how the algorithm processes state information. Our enhancements significantly improved the operational efficiency and effectiveness of the MCTS framework, enabling it to handle high-density traffic situations more adeptly.
Further advancements were achieved by integrating a neural network into the MCTS framework to guide the selection phase. This integration utilized the predictive capabilities of DNNs, allowing for more informed decision-making and faster exploration during the tree search process. Additionally, we investigated a standalone neural network approach, designed to function without the exploratory benefits of MCTS, to evaluate its comparative effectiveness in decision-making.
Our thorough experimental evaluation demonstrates that the enhanced MCTS framework, supported by neural network guidance, markedly improves upon the lane-free vehicles’ behaviour. Key metrics such as safety, through reduced collision rates, and efficiency, by optimizing speed, highlighted the substantial benefits of this integrated approach. These results underscore the potential of combining MCTS with neural network technologies to aid the decision-making in autonomous vehicular driving environments.