BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//TUC//Events//EN
CALSCALE:GREGORIAN
BEGIN:VTIMEZONE
TZID:Europe/Athens
TZNAME:EEST
DTSTART:19700329T030000
RRULE:FREQ=YEARLY;BYDAY=-1SU;BYMONTH=3
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0300
TZNAME:EET
DTSTART:19701025T040000
RRULE:FREQ=YEARLY;BYDAY=-1SU;BYMONTH=10
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
CREATED:20260603T125726Z
LAST-MODIFIED:20260603T125726Z
DTSTAMP:20260612T234945Z
UID:1781297385@tuc.gr
SUMMARY:Παρουσίαση Διπλωματικής Εργασίας κας
  Αλεξάνδρας Γκαραγκάνη - Σχολή ΗΜΜΥ
LOCATION:
DESCRIPTION:https://www.tuc.gr/el/to-polytechnei
 o/ilektronikes-ypiresies/imerologio/
 imerologio-ekdiloseon-1?tx_tucevents
 2_tuceventsdisplay%5Baction%5D=show&
 tx_tucevents2_tuceventsdisplay%5Bcon
 troller%5D=Event&tx_tucevents2_tucev
 entsdisplay%5Bevent%5D=8439&cHash=ad
 2578e708a177c0e0d1bda27f47b34f\nΠΟΛΥ
 ΤΕΧΝΕΙΟ ΚΡΗΤΗΣ\n Σχολή Ηλεκτρολόγων 
 Μηχανικών και Μηχανικών Υπολογιστών\
 n Πρόγραμμα Προπτυχιακών Σπουδών\n Π
 ΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ\n ΓΚ
 ΑΡΑΓΚΑΝΗ ΑΛΕΞΑΝΔΡΑΣ\n με θέμα\n Βελτ
 ιστοποίηση Φιλικών προς το Δίκτυο Συ
 στάσεων με Χρήση Ενισχυτικής Μάθησης
  για Χρήστες με Μνήμη\n Using Reinfo
 rcement Learning to Optimize Network
 -friendly Recommendations for Users 
 with Memory\n Εξεταστική Επιτροπή\n 
 Καθηγητής Θρασύβουλος Σπυρόπουλος (ε
 πιβλέπων)\n Καθηγητής Μιχαήλ Ζερβάκη
 ς\n Καθηγητής Μιχαήλ Λαγουδάκης\n Πε
 ρίληψη\n Η ελαχιστοποίηση του κόστου
 ς μετάδοσης περιεχομένου από το δίκτ
 υο, διατηρώντας παράλληλα την ικανοπ
 οίηση του χρήστη αποτελεί πρόκληση γ
 ια τις σύγχρονες πλατφόρμες περιεχομ
 ένου. Οι υπάρχουσες υλοποιήσεις Συστ
 ημάτων Συστάσεων Φιλικά προς το Δίκτ
 υο αντιμετωπίζουν αυτήν την πρόκληση
  κατευθύνοντας τους χρήστες προς απο
 θηκευμένο, χαμηλού κόστους περιεχόμε
 νο. Είναι γεγονός ωστόσο, ότι η συντ
 ριπτική πλειοψηφία τους υποθέτει ένα
  στατικό μοντέλο χρήστη, στο οποίο η
  πιθανότητα αποδοχής μιας σύστασης π
 αραμένει αμετάβλητη καθ΄ όλη τη διάρ
 κεια μιας συνεδρίας. Αυτή η απλοποίη
 ση δεν είναι ρεαλιστική, ένας χρήστη
 ς που λαμβάνει επανειλημμένα συστάσε
 ις χαμηλής ποιότητας θα χάσει τελικά
  την εμπιστοσύνη του στο σύστημα, πι
 θανόν αγνοώντας τις συστάσεις και κα
 ταφεύγοντας σε αναζήτηση ακριβού περ
 ιεχομένου μέσω της μπάρας αναζήτησης
 . Αυτό λοιπόν το πρόβλημα κληθήκαμε 
 να αντιμετωπίσουμε στην παρούσα διπλ
 ωματική εργασία, επεκτείνοντας το πλ
 αίσιο των Markov Decision Processes 
 (MDP) για Συστάσεις Φιλικές προς το 
 Δίκτυο. Μοντελοποιήσαμε την εμπιστοσ
 ύνη του χρήστη ως μεταβλητή κατάστασ
 ης που εξελίσσεται κατά τη διάρκεια 
 μιας συνεδρίας με βάση την ποιότητα 
 των συστάσεων εξετάζοντας δύο μοντέλ
 α. Το πρώτο είναι το μοντέλο Σταθερή
 ς Εμπιστοσύνης, που χρησιμεύει ως βά
 ση σύγκρισης. Το δεύτερο, πρόκειται 
 για ένα απλό μοντέλο Μεταβαλλόμενης 
 Εμπιστοσύνης, στο οποίο η πιθανότητα
  προσοχής του χρήστη αυξάνεται μετά 
 από συστάσεις υψηλής σχετικότητας κα
 ι μειώνεται με συστάσεις χαμηλής. Το
  τελευταίο μοντέλο εφαρμόζει μια νέα
  στρατηγική, όπου η βέλτιστη πολιτικ
 ή συστήνει ακριβά αλλά υψηλής σχετικ
 ότητας αντικείμενα στην αρχή μιας συ
 νεδρίας για να χτίσει εμπιστοσύνη, δ
 ημιουργώντας έναν χρήστη που δυναμικ
 ά αυξάνει την εμπιστοσύνη του στο Σύ
 στημα Συστάσεων. Για μεγάλους καταλό
 γους περιεχομένου που οι επιλυτές MD
 P δεν μπορούν να διαχειριστούν υπολο
 γιστικά, προτείνουμε μια προσέγγιση 
 Q-Learning χωρίς μοντέλο, που προσεγ
 γίζει τη βέλτιστη πολιτική. Επικυρών
 ουμε την εγκυρότητα του μοντέλου μας
  μέσω προσομοιώσεων σε συνθετικούς κ
 αταλόγους, καθώς και σε πραγματικούς
 , στις οποίες εφαρμόζουμε διάφορα σύ
 νολα παραμέτρων για να αποτυπώσουμε 
 διαφορετικές συμπεριφορές.\n Abstrac
 t \n Minimizing the network cost of 
 content delivery while maintaining u
 ser satisfaction is a challenge for 
 content platforms. Existing work on 
 Network-Friendly Recommendation Syst
 ems (NF-RS) address this by moving u
 sers toward cached content, but the 
 majority assumes a static user model
 , where the probability of accepting
  a recommendation remains constant t
 hrough a session. This is unrealisti
 c because a user who repeatedly rece
 ives low-quality cached recommendati
 ons will lose trust in the system an
 d eventually ignore it, resorting to
  expensive content retrieved from th
 e search bar. In this thesis, we ext
 end the Markov Decision Process (MDP
 ) framework for Network-Friendly Rec
 ommendations by modeling trust as a 
 variable that evolves during a sessi
 on based on the quality of recommend
 ations. We consider two models: a Fi
 xed-Trust model, our baseline, and a
 n Adaptive-Trust model, where the us
 er’s attention probability rises aft
 er high-utility suggestions and fall
 s after poor ones. The latter model 
 introduces the invest and exploit st
 rategy, where the optimal far-sighte
 d policy recommends costly but high-
 utility items early in a session to 
 build trust, creating a user that is
  able to increase her confidence to 
 our Recommender System. For large co
 ntent catalogs the exact MDP solvers
  could not computationally handle, w
 e propose a model-free Q-Learning ap
 proach that approximates the optimal
  policy. We validate our framework t
 hrough extensive simulations over sy
 nthetic and real-world catalog topol
 ogies, on which we apply a number of
  different parameter sets to capture
  different behaviors.\n  \n
STATUS:CONFIRMED
ORGANIZER;RSVP=FALSE;CN=TUC;CUTYPE=TUC:mailto:webmaster@tuc.gr
DTSTART:20260605T123000
DTEND:20260605T133000
TRANSP:OPAQUE
CLASS:DEFAULT
END:VEVENT
END:VCALENDAR