Probing the role of rare codons in coding sequences of Escherichia coli
Date
2015-05Author
Theodosiou, Athina Ch.Publisher
Πανεπιστήμιο Κύπρου, Σχολή Θετικών και Εφαρμοσμένων Επιστημών / University of Cyprus, Faculty of Pure and Applied SciencesPlace of publication
CyprusGoogle Scholar check
Keyword(s):
Metadata
Show full item recordAbstract
Βασικός στόχος της έρευνάς μας ήταν να ανακαλύψουμε και να περιγράψουμε το βιολογικό ρόλο της ύπαρξης των σπάνιων κωδικονίων (που ονομάζουμε Rare Codon Clusters–RCCs), χρησιμοποιώντας πλήρη στοιχεία του γονιδιώματος της E. coli σε συνδυασμό με τις λειτουργικές και δομικές πληροφορίες που είναι διαθέσιμες. Εν συντομία, αναπτύξαμε νέες μεθόδους και εργαλεία λογισμικού για την ανίχνευση των RCCs και στη συνέχεια διερευνήσαμε τα πιθανά πρότυπα συσχετισμού των RCCs (για παράδειγμα παρουσία, απουσία, θέση) με δομικά και λειτουργικά χαρακτηριστικά των γονιδίων και των αντίστοιχων πρωτεϊνών.
Αναπτύξαμε ένα νέο και ευέλικτο διαδικτυακό διακομιστή (LaTcOm) μαζί με μια αυτόνομη έκδοση του λογισμικού, με στόχο να αντιμετωπίσουμε ελλείψεις των υφιστάμενων μεθόδων και να παρέχουμε επίσης νέα εργαλεία και δυνατότητες για την ανίχνευση των RCCs. Η συγκριτική ανάλυση που εφαρμόστηκε στο σύνολο των κωδικών γονιδίων της E. coli αποκάλυψε ότι δεν υπάρχει καμία σαφής συμφωνία μεταξύ των διαφόρων προσεγγίσεων. Παρόλα αυτά, η καλύτερη θετική συσχέτιση βρέθηκε μεταξύ των εργαλείων %MinMax και MSS. Για να αποφευχθούν προβλήματα που σχετίζονται με τη χρήση κυλιόμενου παραθύρου, προτείνουμε πως το MSS μπορεί να χρησιμοποιηθεί εναλλακτικά για την ανίχνευση των RCCs.
Στην ανάλυση σχετικά με την κατανομή των RCCs επιβεβαιώσαμε πως υπάρχει προτίμηση στις περιοχές αυτές να βρίσκονται στα 5’ και 3’ άκρα των γονιδίων και επιπρόσθετα υπάρχει στατιστικά σημαντική διαφορά της κατανομής της απόστασης των πρώτων RCCs από το 5’ άκρο με την κατανομή των τελευταίων RCCs από το 3’ άκρο. Αυτό υποδεικνύει πιθανότατα πως υπάρχει διαφορετικός λειτουργικός ρόλος της ύπαρξης των RCCs στα δύο άκρα.
Επιπρόσθετα, βρήκαμε πως η παρουσία των RCCs σχετίζεται κυρίως με εκκρινόμενες πρωτεΐνες, με πρωτεΐνες που αλληλεπιδρούν με την κυτταρική μεμβράνη ή με το εξωτερικό κυτταρικό τοίχωμα (διαμεμβρανικές εσωτερικής μεμβράνης, διαμεμβρανικές εξωτερικού τοιχώματος (β-βαρέλια)). Από την άλλη, η απουσία των RCCs σχετίζεται κυρίως με κυτταροπλασματικές πρωτεΐνες, με πρωτεΐνες που σχετίζονται με το ριβόσωμα και με τον μεταβολισμό. Ακόμη, δείξαμε πως τα RCCs σχετίζονται με τις πρωτεΐνες με πολλαπλά αυτοτελή δομικά στοιχεία (domains) και προτείνουμε πως μπορούν να χρησιμοποιηθούν σαν ένδειξη των ορίων τους. Πιθανόν η καθυστέρηση της μετάφρασης σε αυτές τις θέσεις να είναι αναγκαία για το σωστό δίπλωμα αυτών των πρωτεϊνών.
Ακόμη μια κύρια πρωτότυπη προσπάθεια της εργασίας αυτής ήταν η συσχέτιση των RCCs με τοπολογικά και δομικά χαρακτηριστικά των διαμεμβρανικών α-ελικοειδών πρωτεϊνών (αHTMP) με πειραματικά επιβεβαιωμένες τρισδιάστατες δομές. Βρήκαμε πως τα RCCs βρίσκονται κατά προτίμηση σε περιπλασματικές περιοχές των αHTMP δείχνοντας πως υπάρχει μια σύνδεση μεταξύ της επιβράδυνσης τους ριβοσώματος και τις βιογένεσης των αHTMP. Προτείνουμε πως το σήμα αυτό σχετίζεται με τον μηχανισμό εισαγωγής και τοπολογίας των πρωτεϊνών αυτών στην μεμβράνη.
Τα αποτελέσματά μας τονίζουν την σημαντικότητα των RCCs σε συγκεκριμένες περιοχές των κωδικών γονιδίων της E. coli. Αναμένουμε πως θα αποτελέσουν πηγή έμπνευσης για περαιτέρω αναλύσεις βασικής έρευνας για την κατανόηση αυτών των μηχανισμών και θα προτείνουν προβλέψεις που θα αξιοποιηθούν στο μέλλον σε εφαρμογές βιοτεχνολογίας, όπως για παράδειγμα στο σχεδιασμό γονιδίων για έκφραση σε ετερόλογους οργανισμούς. Within this project our main research goal was to unravel possible roles for RCCs in E. coli using complete genome data combined with functional and structural information available in disparate resources. Briefly, we developed novel methods and tools for RCC detection and consequently investigate patterns correlating RCCs (presence/absence, position etc.) in E. coli genes/proteins with their structural and functional features.
We have implemented a novel flexible web server (LaTcOm) along with a standalone version, aiming to address shortcomings of existing methods and to also provide new tools and features for RCC detection. The benchmarking we applied on the E. coli set revealed that there is no clear evidence of concordance between the different approaches. Nevertheless, the best positive correlation was found between %MinMax and MSS. To avoid window bias issues, we propose that MSS can be alternatively used for detecting rare codon clusters.
We confirm previous findings that RCCs are preferentially located at the 5’ and 3’ terminal sites and additionally, demonstrate a statistically significant difference between the distribution of distances of the first RCCs from 5’ terminals and the last RCCs from the 3’ terminal site. RCCs were found to lay closer to the 5’ terminal, than to the 3’ terminal site possibly indicating a different functional role for their existence at the two sites.
Moreover, we analysed the RCC detection results for the complement of genes encoded in the E. coli genome and identified that the existence of RCCs is related with secreted, inner and outer membrane proteins (inner transmembrane and outer membrane β-barrels). Interestingly, we reveal that most of the sequences with no detected RCCs are found in the cytoplasm, are involved with the ribosome or with metabolic processes. In addition, we demonstrated that RCCs and multidomain proteins are associated well and we propose that RCC coordinates can be used as indicators for domain boundaries. We suggest that translation slowdown at these sites is necessary for correct protein folding.
Another main innovation of our project was our effort to correlate RCCs to topological and structural features of E. coli α-helical transmembrane proteins (αHTMP) with experimentally derived atomic structures. We demonstrate the preferential position of RCCs in periplasmic loops of αHTMPs, indicating that a coupling exists between RCC-mediated ribosomal attenuation and biogenesis of αHTMPs. We propose that the signal at the periplasmic region may be related to the insertion mechanism and topology of the transmembrane protein in the membrane.
Our results highlight the importance of RCCs at specific locations of coding genes in E. coli. We anticipate that these results will inspire further basic research towards understanding the fine details of these mechanisms and provide predictions that may be exploited in future biotechnological applications, as for example for rationally designing heterologous gene expression studies.