01
Μαρ
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Σωτηρίου Μιχαήλ
με θέμα
Μελέτη ενός Περιστροφικά Αμετάβλητου και Υλοποιήσιμου σε Υλικό Συνελικτικού Νευρωνικού Δικτύου με Χρήση Αριθμητικής CORDIC
Study of a Rotationally Invariant Hardware Implementable Convolutional Neural Network using CORDIC Arithmetic
Εξεταστική Επιτροπή
Καθηγητής Απόστολος Δόλλας(επιβλέπων)
Αναπληρωτής Καθηγητής Σωτήριος Ιωαννίδης
Καθηγητής Μιχαήλ Ζερβάκης
Περίληψη
Στην παρούσα διπλωματική εργασία παρουσιάζεται μια προσέγγιση για την ενίσχυση της αμετάβλητης ως προς την περιστροφή των εικόνων εισόδου συμπεριφοράς των Νευρωνικών Δικτύων Συνελικτικής Επεξεργασίας (CNN), μέσω της ενσωμάτωσης ενός νέου αλγορίθμου Log-CORDIC για την προεπεξεργασία εικόνας. Αυτός ο αλγόριθμος προεπεξεργασίας εικόνας παρουσιάζει πλεονεκτήματα έναντι των υφιστάμενων αλγορίθμων μετασχηματισμού εικόνων από καρτεσιανή σε πολική μορφή, μέσω των υπολογιστικών πλεονεκτημάτων του αλγορίθμου CORDIC (Coordinate Rotation Digital Computer). Τα αποτελέσματα του νέου αλγορίθμου μελετώνται και συγκρίνονται με τις υπάρχουσες μεθόδους μετασχηματισμού, μαζί με τις βελτιώσεις της αποδοτικότητάς του, και διαπιστώνεται η ικανότητά του να ενισχύει το αμετάβλητο της περιστροφής σε ένα CNN, ενσωματώνοντάς σε ένα τροποποιημένο νευρωνικό δίκτυο SqueezeNet. Εστιάζοντας στα σύνολα δεδομένων CIFAR-10 και MNIST, τα πειράματα με αυτό το προσαρμοσμένο νευρωνικό δίκτυο SqueezeNet αποδεικνύουν βελτίωση της ακρίβειας ταξινόμησης για εικόνες με ποικίλους προσανατολισμούς.
Abstract
Introduced in this thesis is an approach in enhancing the rotational invariance of Convolutional Neural Networks (CNNs), through integrating the novel Log-CORDIC algorithm for image pre-processing. This image pre-processing algorithm presents an advantage over existing cartesian-to-polar transform algorithms for images, through the computational advantages of the Coordinate Rotation Digital Computer (CORDIC) algorithm. The results of the novel algorithm are studied and compared with existing transform methods, along with its efficiency improvements, and its ability to enhance rotational invariance in a CNN is ascertained by integrating it into the pipeline of a customized SqueezeNet neural network. Focusing on the CIFAR-10 and MNIST datasets, experiments with this customized SqueezeNet neural network demonstrate an improvement in classification accuracy for images with varied orientations.
Meeting ID: 938 1994 8064
Password: 217340