Computational studies of the function and evolution of nuclear pore complex subunits across eukaryotes
Date
2023-11-23Publisher
Πανεπιστήμιο Κύπρου, Σχολή Θετικών και Εφαρμοσμένων Επιστημών / University of Cyprus, Faculty of Pure and Applied SciencesPlace of publication
CyprusGoogle Scholar check
Keyword(s):
Metadata
Show full item recordAbstract
Το σύμπλοκο του πυρηνικού πόρου παρουσιάζει διαφορετική σύνθεση στους ευκαρυωτικούς οργανισμούς, με ορισμένα από τα δομικά του στοιχεία, τις νουκλεοπορίνες, να απαντώνται ειδικά σε συγκεκριμένους ταξινομικούς κλάδους. Πολλές μελέτες στη βιβλιογραφία περιγράφουν τη σύσταση του συμπλόκου σε σημαντικούς οργανισμούς-μοντέλα. Λόγω του κομβικού του ρόλου στη βιωσιμότητα των κυττάρων, πειραματικές προσεγγίσεις όπως η αποσιώπηση της μεταγραφής γονιδίων, μπορεί να συμπληρωθούν αποτελεσματικά από υψηλής ποιότητας υπολογιστικές διαδικασίες.
Στην παρούσα εργασία, χρησιμοποιώντας μια εκτεταμένη συλλογή δεδομένων, δημιουργούμε μια βιβλιοθήκη πρωτεϊνικών αλληλουχιών νουκλεοπορινών και τους αντίστοιχους, εξαρτώμενους-από-τη-θέση, πίνακες βαθμολόγησης (PSSM) για κάθε οικογένεια. Επικυρώνοντας ευρέως τα προφίλ σε διαφορετικές ρυθμίσεις, προτείνουμε ότι μπορούν να χρησιμοποιηθούν για την ανίχνευση νουκλεοπορινών σε διαφορετικά πρωτεώματα (proteomes) με υψηλότερη ευαισθησία και ειδικότητα, σε σύγκριση με τις υπάρχουσες μεθόδους. Αυτή η βιβλιοθήκη αλληλουχιών και τα υποκείμενα δεδομένα αλληλουχίας μπορούν να χρησιμοποιηθούν για την ανίχνευση νουκλεοπορινών σε πρόσφατα χαρακτηρισμένα πρωτεώματα και γενικά στη μεγάλης-κλίμακας ανάλυση αλληλουχιών πρωτεϊνών.
Επιπλέον, εξετάζουμε και επαληθεύουμε το τρέχον φυλογενετικό προφίλ της υπερ-οικογένειας των νουκλεοπορινών χρησιμοποιώντας τεχνικές σύγκρισης ομοιότητας αλληλουχιών και χαρακτηρίζοντας τη φυλογενετική κατανομή τους. Με βάση τα αποτελέσματά μας, επιβεβαιώνουμε τη μέχρι σήμερα βιβλιογραφία και θέτουμε τις βάσεις για περαιτέρω εργασίες που θα παρέχουν σημαντική πληροφόρηση για την πλήρη σκιαγράφηση του συμπλόκου των πυρηνικών πόρων μέχρι τις εξελικτικές απαρχές του και τον τρόπο με τον οποίο εξελίχθηκε στη συνέχεια στους ευκαρυωτικούς οργανισμούς.
Τέλος, χρησιμοποιώντας υπολογιστική μεθοδολογία σε συνδυασμό με διάφορα δεδομένα omics, καθώς και πρωτεϊνικές αλληλουχίες, πληροφορίες αλληλεπίδρασης πρωτεϊνών και βιβλιογραφίας, διερευνούμε – με επίκεντρο πιθανά γεγονότα σύντηξης γονιδίων - τον τρόπο με τον οποίο οι νουκλεοπορίνες μπορούν να αλληλεπιδρούν με πρωτεΐνες που δεν σχετίζονται με τις λειτουργίες του πυρηνικού πόρου. Αυτό μας επιτρέπει να υποθέσουμε και προτείνουμε πιθανές νέες λειτουργίες για τις υπομονάδες του συμπλόκου. Έχουμε επαληθεύσει υπολογιστικά 49 αρχιτεκτονικές πρωτεϊνικών αλληλουχιών νουκλεοπορινών, με διάφορα επίπεδα εμπιστοσύνης, τις οποίες προτείνουμε ως πιθανές αλληλεπιδράσεις μέσω λειτουργικής συσχέτισης. Αυτές οι πληροφορίες θέτουν τη βάση για μελλοντικές πειραματικές εργασίες για την πλήρη επαλήθευση της ύπαρξης αυτών των πρωτεϊνικών αλληλεπιδράσεων, η οποία με τη σειρά της μπορεί να τεκμηριώσει τη συμμετοχή των νουκλεοπορινών σε βιολογικά μονοπάτια και λειτουργίες που δε σχετίζονται με την πυρηνική μεταφορά.
Τα πρωτότυπα ευρήματά μας στην παρούσα μελέτη ανοίγουν νέους δρόμους για περαιτέρω έρευνα, τόσο για τη χρήση των εργαλείων μας και των προφίλ των οικογενειών πρωτεϊνών για την υψηλής απόδοσης ταυτοποίηση των νουκλεοπορινών σε πρόσφατα αλληλουχημένα γονιδιώματα, αλλά και για το σχεδιασμό εργαστηριακών πειραμάτων για την πλήρη αποκρυπτογράφηση της λειτουργικότητας του συμπλόκου των πυρηνικών πόρων στους Ευκαρυώτες. Επιπλέον, πιστεύουμε ότι οι εξελικτικές πληροφορίες που προκύπτουν από αυτή τη μελέτη, αν και σε αρχικό στάδιο, μπορούν να επεκταθούν για να διαχωρίσουν την εξελικτική προέλευση του πυρηνικού πόρου και να ρίξουν επίσης φως στην εξελικτική σχέση του με άλλα ενδομεμβρανικά σύμπλοκα. Τέλος, προβλέπουμε ότι η μεθοδολογία μας μπορεί να εφαρμοστεί και σε άλλα ευκαρυωτικά μακρομοριακά σύμπλοκα τα οποία μπορεί να συμμετέχουν σε βιολογικά μονοπάτια πέραν της καθιερωμένης γνωστής τους λειτουργίας. The nuclear pore complex exhibits different manifestations across eukaryotes, with certain components being restricted to specific clades. Several studies have been conducted to delineate the nuclear pore complex composition in various model organisms. Due to its pivotal role in cell viability, traditional lab experiments, such as gene knockdowns, can prove inconclusive and need to be complemented by high-quality computational processes.
In this work, using an extensive data collection, we create a robust library of nucleoporin protein sequences and their respective family-specific position-specific scoring matrices. By extensively validating each profile in different settings, we propose that the created profiles can be used to detect nucleoporins in proteomes with high sensitivity and specificity compared to existing methods. This library of profiles and the underlying sequence data can be used for the detection of nucleoporins in target proteomes.
Moreover, we examine and verify the current phylogenetic profiling of the vast nucleoporin protein superfamily using sequence similarity techniques and by unraveling the phylogenetic distribution of nucleoporins. Based on our results, we confirm the to-date literature and set the basis for further work that will provide invaluable information in fully delineating the nuclear pore complex back to its origins and how it evolved throughout the evolutionary line.
Finally, using computational methodology in combination with various omics, sequence, protein interaction and literature data, we investigate the existence of possible gene fusion events and how nucleoporins interact with proteins that are otherwise unrelated to the nuclear pore complex, allowing us to infer new moonlighting functionalities for the complex subunits. We have computationally verified 49 nucleoporin multi-domain architectures with various confidence levels, which we propose as possible interaction partners through functional association. This information will set the basis for future experimental work to fully verify the existence of these proteins as nucleoporin interaction partners, which in turn verifies the involvement of nucleoporins in non-nuclear transport biological pathways and functions unrelated to nucleocytoplasmic transport.
Our original findings on this study open new paths for further research, both in using our tools and protein family profiles for high-throughput identification of nucleoporins in newly sequenced genomes, but also to design traditional laboratory experiments to fully unravel the functionality of the nuclear pore complex in eukaryotes. Furthermore, we are confident that the evolutionary information derived from this study, although at primitive stages, can be further expanded to disentangle the evolutionary origins of the pore and also shed light on its evolutionary relationship with other endomembrane complexes. Finally, we anticipate that our data and computational pipeline can also be applied to other eukaryotic macromolecular complexes that may present the same behavior, functioning in other pathways than their conventional roles.