Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση διπλωματικής εργασιας κ. ΜΑΓΓΑΝΑ ΓΡΗΓΟΡΙΟΥ, Σχολή ΜΠΔ
Αναγνώσεις: 124 / Συνδρομές: 0

  • Συντάχθηκε 06-10-2025 10:59 Πληροφορίες σύνταξης

    Ενημερώθηκε: -

    Τόπος:
    Σύνδεσμος τηλεδιάσκεψης
    Έναρξη: 08/10/2025 18:30
    Λήξη: 08/10/2025 19:30

    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Σχολή Μηχανικών Παραγωγής και Διοίκησης
    Πρόγραμμα Προπτυχιακών Σπουδών

     

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    Τετάρτη, 8 Οκτωβρίου 2025, 18:30
    https://tuc-gr.zoom.us/j/96115087236?pwd=OMiAtOcVgGKHYlS3TSPyxJIWaUsqH9.1

    Ονοματεπώνυμο: ΜΑΓΓΑΝΑΣ ΓΡΗΓΟΡΙΟΣ

    Θέμα: Ενεργειακά αποδοτικός έλεγχος γραμμών παραγωγής με χρήση Ενισχυτικής Μάθησης

    Title: Energy efficient control of production lines with the use of Reinforcement Learning

    Εξεταστική Επιτροπή

    • ΙΩΑΝΝΙΔΗΣ ΕΥΣΤΡΑΤΙΟΣ, Αναπληρωτής Καθηγητής (επιβλέπων)
    • ΔΟΪΤΣΙΔΗΣ ΕΛΕΥΘEΡΙΟΣ, Αναπληρωτής Καθηγητής
    • ΤΣΙΝΑΡΑΚΗΣ ΓΕΩΡΓΙΟΣ, ΕΔΙΠ

    Περίληψη

    Η βελτιστοποίηση των γραμμών παραγωγής είναι ένα μείζον ζήτημα στον τομέα της βιομηχανίας. Νέες αναδυόμενες τεχνολογίες όπως η Ενισχυτική Μάθηση (Reinforcement Learning, RL) επιτρέπουν την εφαρμογή νέων προσεγγίσεων στο πρόβλημα του βέλτιστου ελέγχου της παραγωγής σε όλους του τους τομείς, περιλαμβανομένου του προγραμματισμού παραγωγής, της διαχείρισης εργασιών συντήρησης και ασφάλειας, της εφοδιαστικής αλυσίδας κλπ. Η υπάρχουσα έρευνα σε αυτό το πεδίο εστιάζει στην εκπαίδευση πρακτόρων σε περιβάλλοντα προσομοιώσεων που μιμούνται τη συμπεριφορά υπαρκτών συστημάτων παραγωγής. Σε αυτή την εργασία, αναπτύχθηκε μια απλή γραμμή παραγωγής με 2 μηχανές, ενδιάμεσες αποθηκευτικές μονάδες και ουρά αναμονής πελατών, στην οποία εφαρμόστηκε ένας πράκτορας Ενισχυτικής Μάθησης σαν κύριος ελεγκτής που χρησιμοποιεί τη μέθοδο Βελτιστοποίησης Πλησιέστερης Πολιτικής (Proximal Policy Optimization, PPO). Αυτός ο πράκτορας έπειτα εκπαιδεύεται σε διαφορετικά σενάρια που προσομοιώνουν μεταβολές στις περιβαλλοντικές παραμέτρους, όπως αυξημένη ζήτηση προϊόντων ή κόστους παραγωγής. Παρ’όλο που η εκπαίδευση γίνεται σε μικρότερη κλίμακα από μια πραγματική βιομηχανία, η διαδικασία έδειξε αποτελεσματικό έλεγχο των μηχανών της γραμμής παραγωγής και, σε κάποιους από τους πράκτορες, αντοχή στις συνθήκες των πιο απαιτητικών σεναρίων. Αυτά τα ευρήματα ενδέχεται να βοηθήσουν στη μελλοντική ανάπτυξη πρακτόρων Ενισχυτικής Μάθησης για χρήση στον βιομηχανικό έλεγχο και να δείξουν το δρόμο για την αντιμετώπιση πιο προκλητικών ζητημάτων.

    Abstract

    Optimization of the production processes is a major topic in industrial engineering. New technologies such as Reinforcement Learning (RL) have emerged, allowing for novel approaches to the issue of optimal production control in all its aspects, including production planning, maintenance and safety administration, logistics etc. Research on this field focuses on training of agents in simulation environments mimicking the behavior of their real-world counterparts. In this thesis, a simple 2-machine environment with intermediate buffers and a client queue is developed and fitted with an RL agent as its master controller, using the Proximal Policy Optimization (PPO) method. This agent is then trained on a number of different scenarios, simulating environment variable fluctuations often met in real-world production systems, such as increased demand or production costs. Though in a smaller scale than a real industrial facility, training showed effective control of the production line and, in some of the trained agents, resilience in more demanding scenarios. These findings may assist in the future development of RL agents for use in the field of industrial control and pave the way for more challenging problems to be tackled.



© Πολυτεχνείο Κρήτης 2012