Accelerating bioinformatics and biomedical applications via massively parallel and reconfigurable systems
Ημερομηνία
2014-12Συγγραφέας
Papadopoulos, Agathoklis I.Εκδότης
Πανεπιστήμιο Κύπρου, Πολυτεχνική Σχολή / University of Cyprus, Faculty of EngineeringPlace of publication
CyprusGoogle Scholar check
Keyword(s):
Metadata
Εμφάνιση πλήρους εγγραφήςΕπιτομή
Οι συνεχείς προσπάθειες για βελτίωση της παρεχόμενης ιατροφαρμακευτικής περίθαλψης μέσω καλύτερων τεχνικών διάγνωσης, παρακολούθησης και θεραπείας και κατά συνέπεια της βελτίωσης του βιοτικού επιπέδου της σύγχρονης κοινωνίας, δεσμέυονται άρρηκτα με τα υπάρχοντα υπολογιστικά σύστηματα υψηλής απόδοσης. Τα συστήματα αυτά είναι απαραίτητα για την εκτέλεση των υπολογιστικά απαιτητικών εφαρμογών βιοπληροφορικής και βιοϊατρικής που χρησιμοποιούν ερευνητές παγκόσμια για να δημιουργήσουν καλύτερα φάρμακα, νέες μη-επεμβατικές τεχνικές διάγνωσης και υψηλότερης ακριβείας μεθόδους πρόληψης. Τα συστήματα αυτά όμως βασίζονται σε ακριβές και υψηλής ενεργειακής κατανάλωσης τεχνολογίες, όπως φάρμες υπολογιστών και συμπλέγματα ομογένων υπολογιστικών κόμβων. Νέες αναδυόμενες τεχνικές επιτρέπουν πλέον την εγκατάσταση μονάδων αναδιατασσόμενης λογικής (FPGAs) και μονάδων επεξεργασίας γραφικών (GPUs), που μπορούν να συνεργάζονται με κλασσικούς επεξεργαστές (CPUs) για να πετύχουν ακόμη καλύτερα αποτελέσματα. Τα ετερόγενη υπολογιστικά συστήματα μπορούν να συνδυάσουν την σχεδιαστική ευελιξία των μονάδων αναδιατασσόμενης λογικής και την υψηλή ταχύτητα υπολογιστών των μονάδων επεξεργασίας γραφικών με την ευχρησία των πολυνυματικών επεξεργαστών. Οι εφαρμογές βιοπληροφορικής και βιοϊατρικής μπορούν να κερδίσουν υψηλότερες επιδόσεις εκμεταλλευόμενες τις δυνατότητες των συστημάτων αυτών.
Η διατριβή αυτή παρουσιάζει την μεθοδολογία που έχει αναπτυχθεί για να αξιολογήσει τις πραγματικές δυνατότητες των πολυνυματικών επεξεργαστών, των μονάδων αναδιατασσόμενης λογικής και των μονάδων επεξεργασίας γραφικών ως υπολογιστικούς επιταχυντές για εφαρμογές βιοπληροφορικής και βιοϊατρικής. Στα πλαίσια της διατριβής αυτής, έχουν υλοποιηθεί κώδικες λογισμικού και αρχιτεκτονικές υλικού της εφαρμογής CAST (ανάλυση περιοχών χαμηλής πληροφορίας σε πρωτεΐνες) για όλες τις τεχνολογίες επιτάχυνσης για να έχουμε δίκαιη σύγκριση κάθε τεχνολογίας με τις υπόλοιπες. Στόχος είναι να παρουσιαστούν οι δυνατότητες και οι περιορισμοί της κάθε νέας τεχνολογίας όταν επιλεχθούν ως υπολογιστικές μονάδες για τις εφαρμογές - CAST κ.α. -που μελετήσαμε. Η διατριβή κλείνει με την παρουσίαση της πρώτης υβριδικής CPU/GPU/FPGA πλατφόρμας για εφαρμογές βιοπληροφορικής και βιοϊατρικής. Τα ετερογένη αυτά υβριδικά συστήματα, προβλέπονται να προσφέρουν πολύ περισσότερη ευελιξία και υπολογιστική ισχύ σε χαμηλότερη κατανάλωση ενέργειας από τα υφιστάμενα υπολογιστικά συστήματα. The quest for advancement in healthcare diagnosis, monitoring and therapy, all key aspects of improving the quality of life, becomes heavily dependent on high-performance, real-time computation systems. These systems are necessary to perform extremely complicated algorithms used by bioinformatics engineers and doctors worldwide that will lead to the development of more effective drugs, non-invasive diagnostic techniques and preventive medicine. Such technology though, comes in the form of homogeneous supercomputers or large clusters, which are large, expensive and energy devouring, as they rely on software flexibility to facilitate the execution of multiple applications. However, recent advancements allow the integration of reconfigurable hardware (FPGAs) and graphics processing units (GPUs), alongside with general-purpose processors (CPUs). Such heterogeneous systems can combine the flexibility of the FPGA hardware fabric, the raw speed of GPUs, and the generality of CPUs. Biomedical and bioinformatics applications can therefore take advantage of the inherent flexibility and available parallelism, with significant performance gains.
This thesis presents a methodology for designing and evaluating multi-core CPUs, GPUs, and FPGAs as parallel and reconfigurable accelerators for bioinformatics and biomedical applications. Software implementations and hardware architectures for a selected case study application (CAST for low-complexity region analysis in proteins) were designed and implemented for all computing engines. We highlight the benefits and issues of our parallelization methodology through an overview of the challenges we faced when mapping CAST and the other selected case study applications on each computing platform. A multi-threaded software version of CAST was implemented to fairly evaluate state-of-the-art multi-core CPUs against GPUs and FPGAs. Then computation structures were developed for accelerating CAST on GPUs. Furthermore, a key contribution of this thesis is to show how reconfigurable hardware platforms can be utilized to achieve higher performance per watt for bioinformatics applications. Multi-FPGA implementations were explored as well. Lastly, a guide to build a hybrid CPU/GPU/FPGA heterogeneous system for bioinformatics and biomedical applications is provided, as it is anticipated that the integration of FPGAs and GPUs alongside with multicore CPUs, can provide a blend of flexibility and processing power, an advantage not found in existing systems.