07
Οκτ
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Παναγιώτας Κούτρα
με θέμα
Ανάλυση Μέσων Κοινωνικής Δικτύωσης Εστιασμένης στην Ανίχνευση Troll
Social Media Analysis Targeting Troll Detection
Εξεταστική Επιτροπή
Καθηγητής Σωτήριος Ιωαννίδης (επιβλέπων)
Καθηγητής Μιχαήλ Λαγουδάκης
Καθηγητής Θρασύβουλος Σπυρόπουλος
Περίληψη
Τα μέσα κοινωνικής δικτύωσης έχουν μεταμορφώσει τον τρόπο με τον οποίο οι άνθρωποι αλληλεπιδρούν, μοιράζονται πληροφορίες και εκφράζουν απόψεις, ωστόσο έχουν εισάγει σημαντικές προκλήσεις, ιδίως την αύξηση της συμπεριφοράς τρολαρίσματος. Το τρολάρισμα περιλαμβάνει τη δημοσίευση μηνυμάτων με καυστικό λόγο, μηνυμάτων που έχουν σκοπό να διαταράξουν τον διαδικτυακό διάλογο, που διαδίδουν παραπληροφόρηση και καλλιεργούν ένα τοξικό περιβάλλον. Η παρούσα διπλωματική εργασία ασχολείται με την δημιουργία μεθόδων ανίχνευσης τρολ χρησιμοποιώντας τεχνικές τεχνητής νοημοσύνης (AI)
και του natural language processing (NLP).
Η ανίχνευση τρολ προσεγγίζεται μέσω του text classification , η οποία κατηγοριοποιεί περιεχόμενο από τα μέσα κοινωνικής δικτύωσης ως τρολ και μη τρολ χρησιμοποιώντας διάφορους αλγορίθμους μηχανικής μάθησης. Η παρούσα εργασία συγκρίνει τις τεχνικές Logistic Regression, Naive Bayes, SVM και το pre-trained μοντέλο DeBERTa. Τα αποτελέσματα δείχνουν ότι το μοντέλο DeBERTa υπερτερεί των άλλων μεθόδων, αξιολογώντας το performance τους με τις μετρικές accuracy, precision, F1-score, και το recall.
Επιπλέον, η παρούσα έρευνα εξετάζει τις δυνατότητες γενίκευσης του μοντέλου DeBERTa δοκιμάζοντας το σε άγνωστα δεδομένα από διαφορετικές πηγές μέσω προβλέψεων. Το μοντέλο παρουσιάζει ικανοποιητικές επιδόσεις σε zero-shot predictions και ακριβής σε one-shot predictions.
Η τελική φάση επικεντρώνεται στην ανάπτυξη ενός γενικού μοντέλου που προβλέπει με ακρίβεια τη συμπεριφορά του τρολαρίσματος σε διαφορετικά σύνολα δεδομένων με διαφορετικούς τύπους τρολ. Εφαρμόζεται Scale-invariant Fine-Tuning (SiFT) για τη βελτίωση των επιδόσεων του μοντέλου και παρουσιάζει
σημαντική βελτίωση
Abstract
Social networks have transformed the way people interact, share information, and express opinions; however, they have introduced significant challenges, notably the rise of trolling behavior. Trolling involves posting inflammatory or disruptive messages that degrade online discourse, spread misinformation, and foster a toxic environment. This thesis addresses the challenge of troll detection using artificial intelligence (AI) and natural language processing (NLP) techniques.
Troll detection is approached through text classification, which distinguishes between troll and nontroll content using various machine learning algorithms. This study compares Logistic Regression, Naive Bayes, SVM, and the pre-trained DeBERTa model. The results show that DeBERTa outperforms the other methods in terms of accuracy, precision, F1-score, and recall.
Furthermore, the thesis examines the generalization capabilities of the DeBERTa model by testing it on unseen data from different sources through zero-shot and one-shot predictions. The model shows satisfactory performance in zero-shot predictions and good results in one-shot predictions.
The final phase focuses on developing a general model that accurately predicts trolling behavior across different datasets. Scale-invariant fine-tuning (SiFT) was applied to improve the model’s performance and showed significant improvement.
Keywords: Troll Detection, Natural Language Processing, Machine Learning, DeBERTa, Text Classification
Meeting ID: 984 7644 5915
Password: 296402