Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση Μεταπτυχιακής Εργασίας κας Μαρίας Χρυσάνθη, Σχολή ΜΗΧΟΠ
Αναγνώσεις: 50 / Συνδρομές: 0

  • Συντάχθηκε 25-06-2026 14:41 Πληροφορίες σύνταξης

    Ενημερώθηκε: -

    Τόπος: Μ3 - Κτίριο ΜΗΧΟΠ, Μ3.108, ΔΙΑ ΖΩΣΗΣ
    Σύνδεσμος τηλεδιάσκεψης
    Έναρξη: 02/07/2026 13:00
    Λήξη: 02/07/2026 14:00

    Τίτλος εργασίας: Πολυμεταβλητή γεωστατιστική μοντελοποίηση και εφαρμογές στην εκτίμηση φυσικών πόρων.
     

    Τίτλος εργασίας στα αγγλικά: Multivariate Geostatistical Modelling and Applications in Natural Resources Evaluation.

     

    Tριμελής εξεταστική επιτροπή:

    1. Επικ. καθηγητής Εμμανουήλ Βαρουχάκης, σχολής ΜΗΧΟΠ (Επιβλέπων)

    2. Καθηγητής Μιχαήλ Γαλετάκης, σχολής ΜΗΧΟΠ

    3.Καθηγητής Διονύσιος Χριστόπουλος, σχολής ΗΜΜΥ

     

    Abstract

    Kriging-based modelling has been shown to provide the most representative predictions when an appropriate covariance model is selected. However, identifying such a model remains a deterministic process, the investigation of which is constrained by the set of covariance models available to the researcher. This issue has been recognized by many researchers. To increase the available permissible models a novel hybrid methodology was introduced for constructing families of covariance functions. This methodology gave rise to the Hybrid Spectral Ornstein–Uhlenbeck (HSOU) covariance model, which is derived with modifications from the covariance function characterising the stochastic process of the same name and constitutes the principal tool upon which the present study is based.

    This thesis proposes a novel methodology that combines the HSOU covariance model with Gaussian transformation and anisotropy investigation to develop a representative stochastic model for bivariate cokriging interpolation and uses conditional simulations for uncertainty quantification. The HSOU model was employed to characterise spatial variability in both Euclidean and non-Euclidean spaces. The main analysis focused on two spatial interpolation models commonly recommended in the literature for similar applications. The first model, Ordinary Cokriging (OCK), was formulated with two unbiasedness constraints. The second model, Rescaled Ordinary Cokriging (RCK), combines the weights of both variables into a single constraint.

    The estimates produced by each model are obtained in a normalised space. To satisfy the assumption of normally distributed data, the variables are transformed using the recently proposed Gaussian Anamorphosis through Kernel Cumulative Distribution Estimator (KCDE) method. Back-transformation is subsequently applied only to the models that achieve the best validation metrics. At the same time, a new objective function is proposed for identifying an appropriate Linear Coregionalization Model (LCM). This objective function was designed to favour LCMs that yield improved validation performance for the primary variable without ignoring the auxiliary variable.

    Model performance is assessed through leave-one-out cross-validation (LOOCV) using Pearson's correlation coefficient (ρ), Root Mean Square Error (RMSE) and Mean Error (ME). Uncertainty quantification is performed through conditional Monte Carlo simulations. From the simulations the 5th and the 95th percentiles are derived. These two will define the confidence interval of the estimation at the 90% confidence level.  

    The proposed methodology was tested on two datasets. The first was a soil sample dataset from Ireland, with lead as the primary variable and zinc as the auxiliary. The second dataset is from one of the biggest iron mines in the world, the Carajás iron mine. In this case study, we use alumina as the primary variable and iron as the secondary variable. In both cases, the HSOU covariance model produced invertible cokriging matrices for every investigated configuration.

    In the Irish case study, the heterotopic configuration provided more data pairs for variogram modelling and supported anisotropy investigation, which proved to be particularly important in this application. Logarithmic transform of the data was tested along with KCDE. KCDE achieved a closer approximation to Gaussian behaviour than the logarithm transformation based on Kolmogorov-Smirnov tests. The RCK model generally outperformed OCK in terms of validation metrics both in the original data space and transformed space. For RCK, in the transformed domain, logarithmic transformation produced a slightly higher correlation coefficient ρ = 71% for the primary variable, compared to ρ = 68% for KCDE, but an inferior RMSE (0.84 compared to 0.73 for KCDE, both unitless). Following back-transformation, the KCDE-based RCK model achieved the best LOOCV performance, with ρ = 63%, RMSE = 380.27 ppm and near-zero mean error for lead. Euclidean distance remained the most effective metric for the Irish dataset.

    In the Carajás case study, the KCDE transformation converted strongly non-Gaussian and negatively correlated variables into a normalized dataset suitable for RCK. The RCK model again improved the validation metrics of the primary variable relative to OCK. The variogram of the iron content contributed to the improved alumina content prediction by means of cokriging methodology. Manhattan distance yielded the best performance in the transformed space with ρ = 61%, whereas Chebyshev distance proved more representative after back-transformation, achieving an RMSE of 4.7% and nearly zero bias.

    In both datasets, conditional simulations demonstrated that uncertainty increases in regions where the primary variable is sparsely sampled and predictions rely predominantly on the auxiliary variable - which was the motivation to include it in the objective function. The simulations provided reliable maps of uncertainty through the percentiles X5% and X95% and the derived 90% confidence interval.

    Overall, the thesis demonstrates that HSOU-based RCK, when combined with appropriate transformation techniques, anisotropy investigation, and simulations, provides a practical methodology for multivariate mineral resource prediction and uncertainty quantification in heterotopic datasets that benefit from the use of non-Euclidean distance metrics.

    Περίληψη

    Η μοντελοποίση τυχαίων πεδίων με τη μέθοδο kriging είναι αποδεδειγμένα η πιο αντιπροσωπευτική, όταν έχει επιλεχθεί το κατάλληλο μοντέλο συνδιασποράς. Ωστόσο, η εύρεση του μοντέλου αυτού είναι μια αιτιοκρατική διαδικασία, της οποίας η διερεύνηση βασίζεται στα διαθέσιμα μοντέλα που έχει ο ερευνητής. Η υβριδική φασματική μέθοδος (hybrid spectral method) συνεισφέρει στη δημιουργία νέων συνδιασπορών και αυξάνει τις διαθέσιμες συναρτήσεις. Από αυτή τη μέθοδο προέκυψε το μοντέλο συνδιασποράς Hybrid Spectral Ornstein–Uhlenbeck (HSOU), το οποίο προέρχεται με τροποποιήσεις από τη συνδιασπορά που χαρακτηρίζει την ομώνυμη στοχαστική διαδικασία και αποτελεί το κύριο εργαλείο πάνω στο οποίο βασίστηκε η παρούσα εργασία.

    Στην εν λόγω μεταπτυχιακή εργασία προτείνεται μια νέα μεθοδολογία που συνδυάζει το νέο μοντέλο HSOU με γκαουσσιανή αναμόρφωση και διερεύνηση ανισοτροπικής συμπεριφοράς, με στόχο την ανάπτυξη ενός αντιπροσωπευτικού στοχαστικού μοντέλου πολυμεταβλητής χωρικής παρεμβολής (cokriging interpolation) για τυχαίο πεδίο δύο μεταβλητών με ετεροτοπική κάλυψη του χώρου. Παράλληλα, η μεθοδολογία ενσωματώνει υπό συνθήκη προσομοιώσεις για την ποσοτικοποίηση της αβεβαιότητας των εκτιμήσεων. Το μοντέλο HSOU χρησιμοποιήθηκε για τη μοντελοποίηση της χωρικής συσχέτισης σε Ευκλίδειο και μη Ευκλίδειο χώρο. Η κύρια ανάλυση έγινε με τη χρήση δύο διαφορετικών μοντέλων χωρικής παρεμβολής όπως προτείνει η βιβλιογραφία για παρόμοιες εφαρμογές. Το πρώτο μοντέλο κανονικού συνδυαστικoύ kriging (ordinary cokriging, OCK) που εξετάστηκε είχε δύο συνθήκες αμεροληψίας, ενώ το δεύτερο μοντέλο κανονικοποιημένου συνδυαστικού kriging (rescaled cokriging, RCK) συνδυάζει τα βάρη των εξεταζόμενων μεταβλητών σε μια συνθήκη.

    Η  διερεύνηση των εξεταζόμενων μοντέλων συνηθίζεται να πραγματοποιείται σε πεδίο τιμών που ακολουθούν την κανονική κατανομή. Για να ικανοποιηθεί αυτή η προϋπόθεση, τα δεδομένα κανονικοποιούνται μέσω της νέας μεθόδου γκαουσσιανής αναμόρφωσης (Kernel Cumulative Distribution Estimator method). Η αντιστροφή του μετασχηματισμού εφαρμόζεται μόνο στα μοντέλα που επιτυγχάνουν τα καλύτερα μέτρα επαλήθευσης. Ταυτόχρονα προτείνεται μια νέα αντικειμενική συνάρτηση (objective function) για την εύρεση του κατάλληλου γραμμικού μοντέλου (linear coregionalisation model) το οποίο αλλάζει την κλίμακα των συναρτήσεων συνδιασποράς που προκύπτουν σε πολυμεταβλητό πεδίο (direct και cross-covariances). Η αντικειμενική συνάρτηση έχει ως στόχο την εύρεση κατάλληλου μοντέλου πολυμεταβλητής χωρικής εξάρτησης. Η συνάρτηση σχεδιάστηκε έτσι ώστε το επιλεγμένο μοντέλο πολυμεταβλητής χωρικής εξάρτησης να δίνει καλύτερα μέτρα επαλήθευσης για την κύρια μεταβλητή χωρίς να αγνοεί τη συνεισφορά της βοηθητικής μεταβλητής.

    Η αξιολόγηση των μοντέλων που κατασκευάστηκαν στην εργασία πραγματοποιείται μέσω επαλήθευσης τύπου leave-one-out (LOOCV), χρησιμοποιώντας τον συντελεστή συσχέτισης Pearson ρ, τη ρίζα του μέσου τετραγωνικού σφάλματος (Root Mean Square Error, RMSE) και το μέσο σφάλμα (Mean Error, ME). Η ποσοτικοποίηση της αβεβαιότητας της εκτίμησης γίνεται μέσω προσομοιώσεων Monte Carlo υπό τη συνθήκη (conditional simulations) η τιμή του δείγματος να διατηρείται σταθερή στα σημεία δειγματοληψίας.

    Η προτεινόμενη μεθοδολογία δοκιμάστηκε σε δύο σετ δεδομένων. Το πρώτο αφορά γεωχημικά δεδομένα εδάφους από την Ιρλανδία με κύρια μεταβλητή τη συγκέντρωση του μόλυβδου και βοηθητική μεταβλητή τη συγκέντρωση του ψευδαργύρου -εκφρασμένες σε ppm, ενώ το δεύτερο προέρχεται από το μεταλλείο σιδήρου Carajás με κύρια μεταβλητή τη περιεκτικότητα κατά βάρος (% w/w) σε αλουμίνα και βοηθητική μεταβλητή τη περιεκτικότητα κατά βάρος του σιδήρου (% w/w).

    Στο δείγμα που προέρχεται από τη μεταλλευτική περιοχής της Ιρλανδίας, η ετεροτοπική διάταξη παρείχε περισσότερα ζεύγη δεδομένων για τη μοντελοποίηση των βαριογραμμάτων και υποστήριξε την ανισοτροπική διερεύνηση. Η προσέγγιση που ακολουθήθηκε για τους μετασχηματισμούς των δεδομένων έφερε να συγκρίνει τον ευρέως διαδεδομένο λογαριθμικό μετασχηματισμό με την καινοτόμο μέθοδο KCDE. Η τελευταία μετασχηματίζει τα δεδομένα με μεγαλύτερη εγγύτητα στην κανονική κατανομή, όπως επιβεβαιώνει το τέστ Κolmogorov-Smirnov. Όσον αφορά τα εκτιμητικά μοντέλα, το μοντέλο RCK υπερείχε γενικά του OCK ως προς τα μέτρα επαλήθευσης και είχε καλύτερη απόδοση στον αρχικό χώρο των τιμών. Στη μετασχηματισμένη κλίμακα, ο λογαριθμικός μετασχηματισμός παρήγαγε ελαφρώς υψηλότερη συσχέτιση (ρ = 71%, έναντι ρ = 68% για την KCDE), αλλά υποδεέστερο RMSE (0,84 έναντι 0,73 για τον KCDE, αμφότερα αδιάστατα μεγέθη). Μετά την αντιστροφή του μετασχηματισμού, το μοντέλο RCK βασισμένο στην KCDE παρουσίασε τα βέλτιστα μέτρα LOOCV, με ρ = 63%, RMSE = 380,27 ppm και πρακτικά μηδενικό μέσο σφάλμα. Για αυτό το σετ δεδομένων, η ευκλείδεια απόσταση έδωσε τα καλύτερα μέτρα επαλήθευσης ξεπερνώντας όλες τις μη ευκλείδειες αποστάσεις.

    Στην περίπτωση του μεταλλείου Carajás, ο μετασχηματισμός KCDE μετέτρεψε έντονα μη γκασουσσιανές και αρνητικά συσχετισμένες μεταβλητές σε γκαουσσιανές, ώστε να είναι κατάλληλες για την  προτεινόμενη μεθοδολογία cokriging. Σε αυτό το πεδίο, το μοντέλο RCK βελτίωσε τους δείκτες επαλήθευσης της κύριας μεταβλητής σε σχέση με το μοντέλο OCK. Ιδιαίτερη εδώ ήταν η βαριογραφία, όπου το βαριόγραμμα του σιδήρου συνέβαλε στη μοντελοποίηση της περιεκτικότητας κατά βάρος σε αλουμίνα, της οποίας το βαριόγραμμα παρουσίαζε έντονο φαινόμενο κόκκου. Και σε αυτό το πεδίο εξετάστηκαν μη Ευκλείδειες αποστάσεις. Η απόσταση Manhattan παρουσίασε την καλύτερη απόδοση στην κλίμακα του μετασχηματισμού με ρ = 61%, ενώ η απόσταση Chebyshev αποδείχθηκε πιο αντιπροσωπευτική μετά την αντιστροφή του μετασχηματισμού, με RMSE = 4,7% και σχεδόν μηδενική μεροληψία.

    Η αβεβαιότητα των εκτιμήσεων και για τα δύο σετ δεδομένων αποτυπώθηκε μέσω των εκατοστημορίων X5%, X95%, καθώς και του παραγόμενου διαστήματος εμπιστοσύνης 90%. Οι υπό συνθήκη προσομοιώσεις έδειξαν ότι η αβεβαιότητα αυξανόταν σε περιοχές όπου η κύρια μεταβλητή έχει αραιή δειγματοληψία και οι προβλέψεις βασίζονταν κυρίως στη βοηθητική μεταβλητή.

    Συνολικά, η εργασία παρουσιάζει ότι η μέθοδος RCK βασισμένη στο μοντέλο συνδιασποράς HSOU μπορεί να χρησιμοποιηθεί για την αξιόπιστη πολυμεταβλητή ανάλυση και εκτίμηση ορυκτών πόρων. Σε συνδυασμό με τον κατάλληλο μετασχηματισμό αναμόρφωσης, τη διερεύνηση ανισοτροπίας και την εφαρμογή μεθόδων προσομοίωσης για την ποσοτικοποίηση της αβεβαιότητας το προτεινόμενο μοντέλο προσεγγίζει με μεγαλύτερη αξιοπιστία το υπό εξέταση φαινόμενο.

     

     

     



© Πολυτεχνείο Κρήτης 2012