Extremum problems with total variation distance metric on the space of probability measures and applications
Date
2015-03Author
Τζωρτζής, Ιωάννης Α.Publisher
Πανεπιστήμιο Κύπρου, Πολυτεχνική Σχολή / University of Cyprus, Faculty of EngineeringPlace of publication
ΚύπροςGoogle Scholar check
Keyword(s):
Metadata
Show full item recordAbstract
Η βελτιστοποίηση προβλήματων με ακρότατα που χρησιμοποιούν ως μετρική απόστασης την ολική κύμανση στο χώρο των μέτρων πιθανοτήτων είναι θεμελιώδους σημασίας στον στοχαστικό έλεγχο, στη θεωρία πληροφορίας και της επικοινωνίας, στη μαθηματική χρηματοοικονομία, στη θεωρία αποφάσεων και στατιστικής και στην θεωρία πιθανοτήτων. Μεταξύ άλλων, η έρευνα τέτοιων προβλημάτων χρησιμοποιεί έννοιες απο την θεωρία μέτρου και πιθανοτήτων, απο την θεωρία βελτιστοποίησης συναρτήσεων, και έχει εφαρμογές στο στοχαστικό έλεγχο ελαχιστομεγίστων μέσω δυναμικού προγραμματισμού, στην προσέγγιση κατανομών πιθανοτήτων μεγάλων διαστάσεων απο κατανομές πιθανοτήτων μικρότερων διαστάσεων, κλπ. Στην παρούσα διατριβή, η διατύπωση και η επίλυση προβλημάτων βελτιστοποίησης με μετρική απόστασης την ολική κύμανση, η συζήτηση πιθανών εφαρμογών τους, καθώς και η εφαρμογή τους στον στοχαστικό έλεγχο ελαχιστομεγίστων και στην προσέγγιση διαδικασιών Markov, ερευνώνται.
Το πρώτο μέρος της διατριβής ασχολείται με την διατύπωση και επίλυση προβλημάτων με ακρότατα, στα οποία τα συστήματα ελέγχου εκπροσωπούνται απο κατανομές πιθανοτήτων σε αφηρημένους χώρους, και τα κριτήρια κόστους εκπροσωπούνται απο την μετρική της ολικής κύμανσης στο χώρο των μέτρων πιθανοτήτας και υπόκεινται σε γραμμικούς συναρτησιακούς περιορισμούς στο χώρο των μέτρων πιθανοτήτας και αντίστροφα, δηλαδή, με τους ρόλους της μετρικής ολικής κύμανσης και των γραμμικών συναρτησιακών να εναλλάσσονται. Χρησιμοποιώντας έννοιες των προσημασμένων μέτρων, οι βέλτιστες λύσεις τέτοιων προβλημάτων λαμβάνονται σε κλειστή μορφή και οι ιδιότητες τους ερευνώνται και συζητούνται. Τα αποτελέσματα προκύπτουν χρησιμοποιώντας αφηρημένους χώρους, ενώ οι ιδέες τους συζητούνται επίσης για αριθμήσιμους χώρους εφοδιασμένους με την διακριτή τοπολογία.
Το δεύτερο μέρος της διατριβής ασχολείται με την βελτιστοποίηση στοχαστικών στρατηγικών ελέγχου σε πεπερασμένο και σε άπειρο χρονικό ορίζοντα, μέσω δυναμικού προγραμματισμού χρησιμοποιώντας ως απόσταση αβεβαιότητας την ολική κύμανση της δεσμευμένης κατανομής της ελεγχόμενης διαδικασίας. Το στοχαστικό πρόβλημα ελέγχου διατυπώνεται χρησιμοποιώντας την θεωρία ελαχιστομεγίστων, κατά την οποία η διαδικασία ελέγχου ελαχιστοποιεί το κριτήριο κόστους ενώ η δεσμευμένη κατανομή απο το σύνολο της ολικής κύμανσης, το μεγιστοποιεί. Χρησιμοποιώντας συγκεκριμένα αποτελέσματα του πρώτου μέρους, νέες εξισώσεις δυναμικού προγραμματισμού εξάγονται, οι οποίες εκτός απο τους κλασικούς όρους συμπεριλαμβάνουν επίσης και τον ταλαντωτή ημι-νόρμα που κωδικοποιεί το επίπεδο της αβεβαιότητας. Επιπρόσθετα, όσον αφορά τα στοχαστικά προβλήματα με άπειρο χρονικό ορίζοντα, νέοι αλγόριθμοι παρουσιάζονται για τον υπολογισμό των βέλτιστων στρατηγικών ελέγχου.
Το τρίτο μέρος της διατριβής ασχολείται με το πρόβλημα προσέγγισης μιας πεπερασμένης διαδικασίας Markov με ένα μεγάλο αριθμό καταστάσεων απο μία διαδικασία χαμηλότερων διαστάσεων, ως προς ορισμένα μέτρα προσέγγισης της κατανομής της διαδικασίας Markov από κατανομές χαμηλότερων διαστάσεων. Αντλώντας αποτελέσματα απο το πρώτο μέρος, το πρόβλημα προσέγγισης μιας πεπερασμένης διαδικασίας Markov απο μια άλλη διαδικασία (μη-απαραίτητα Markov) με λιγότερες καταστάσεις διατυπώνεται ως ένα πρόβλημα βελτιστοποίησης, με το κριτήριο κόστους να υπόκειται σε κριτήρια ακρίβειας ορισμένα απο το μέτρο απόστασης της ολικής κύμανσης. Η συμπεριφορά των πιθανοτήτων μετάβασης της προσεγγιζόμενης διαδικασίας και οι προτεινόμενοι αναδρομικοί αλγόριθμοι έιναι καινούργιοι, και μπόρουν να εφαρμοστούν σε μια σειρά προβλημάτων που εκτείνονται απο την βέλτιστη αναγωγή καταστάσεων έως και την βέλτιστη συνάθροιση καταστάσεων.