Η βιοπληροφορική (bioinformatics) είναι ένα διεπιστημονικό πεδίο που αναπτύσσει μεθόδους και εργαλεία λογισμικού για την κατανόηση βιολογικών δεδομένων. Ως ένα διεπιστημονικό πεδίο της επιστήμης, η βιοπληροφορική συνδυάζει την υπολογιστική επιστήμη, τη στατιστική, τα μαθηματικά και τη μηχανική για να αναλύσει και να ερμηνεύσει βιολογικά δεδομένα. Η βιοπληροφορική έχει χρησιμοποιηθεί για in silico (υπολογιστικές) αναλύσεις βιολογικών ερωτημάτων χρησιμοποιώντας μαθηματικές και στατιστικές τεχνικές.
Ο όρος βιοπληροφορική περικλείει το μέρος των βιολογικών ερευνών όπου ο προγραμματισμός είναι μέρος της μεθοδολογίας, και αναφέρεται σε ειδικές διοχετεύσεις (pipelines) ανάλυσης που χρησιμοποιούνται συχνά, ειδικά στο πεδίο της γενομικής. Συχνές χρήσεις της βιοπληροφορικής περιλαμβάνουν την αναγνώριση υποψήφιων γονιδίων και μονονουκλεοτιδικών πολυμορφισμών (SNPs). Συχνά αυτή η αναγνώριση γίνεται με σκοπό την κατανόηση της γενετικής βάσης μιας ασθένειας, μοναδικών προσαρμογών, επιθυμητών ιδιοτήτων (ειδικά στα γεωργικά είδη) ή τις διαφορές μεταξύ πληθυσμών.
Η βιοπληροφορική έχει γίνει ένα σημαντικό τμήμα πολλών πεδίων της βιολογίας. Στην πειραματική μοριακά βιολογία, βιοπληροφορικές τεχνικές όπως είναι η ανάλυση εικόνας και σήματος, επιτρέπουν την εξόρυξη χρήσιμων αποτελεσμάτων από τεράστιο αριθμό ακατέργαστων δεδομένων. Στο πεδίο της γενετικής και της γενωμική, βοηθάει στην αλληλούχιση και το σχολιασμό γονιδιωμάτων και των παρατηρηθεισών μεταλλαγών τους. Παίζει σημαντικό ρόλο στην εξόρυξη κειμένου (text mining) από τη βιολογική βιβλιογραφία και στην ανάπτυξη βιολογικών και γονιδιακών οντολογιών για να οργανωθούν και διερωτηθούν τα βιολογικά δεδομένα. Έχει ρόλο και στην ανάλυση της γονιδιακή και πρωτεϊνικής έκφρασης και ρύθμισης. Βιοπληροφορικά εργαλεία βοηθούν στη σύγκριση γενετικών και γονιδιωματικών δεδομένων και πιο γενικά στην κατανόηση των εξελικτικών πτυχών της μοριακής βιολογίας. Σε ένα άλλο επίπεδο ενσωμάτωσης, βοηθάει στην ανάλυση και την καταγραφή των βιολογικών μονοπατιών και δικτύων που αποτελούν σημαντικό μέρος της βιολογίας συστημάτων. Στη δομική βιολογία, βοηθάει στην προσομοίωση και μοντελοποίηση του DNA[1], RNA[1][2], πρωτεϊνών[3] καθώς και βιομοριακών αλληλεπιδράσεων.[4][5][6]
Ακολουθίες
Οι υπολογιστές έγιναν απαραίτητοι στη μοριακή βιολογία όταν πρωτεϊνικές ακολουθίες έγινε διαθέσιμες, αφότου ο Frederick Sanger προσδιόρισε την ακολουθία της ινσουλίνης στις αρχές της δεκαετίας του 1950. Η σύγκριση πολλαπλών ακολουθιών με το χέρι αποδείχθηκε μη πρακτική. Πρωτοπόρος στο πεδίο ήταν η Margaret Oakley Dayhoff, την οποία αποκάλεσε «μητέρα και πατέρα της βιοπληροφορικής», ο David Lipman, διευθυντής του National Center for Biotechnology Information (NCBI).[7] Η Dayhoff συγκρότησε την πρώτη βάση δεδομένων με πρωτεϊνικές ακολουθίες, την οποία αρχικά δημοσίευσε ως βιβλίο[8], και πρωτοπόρησε σε μεθόδους στοίχισης ακολουθιών και μοριακής εξέλιξης.[9]
Τα σύμβολα
Τα βιολογικά μακρομόρια, όπως το DNA, το RNA και οι πρωτεΐνες, μπορούν να θεωρηθούν ως ακολουθίες συμβόλων, δηλαδή συμβολοσειρές. Για παράδειγμα το DNA μπορεί να θεωρηθεί ως μια ακολουθία χιλιάδων νουκλεοτιδίων ή βάσεων. Υπάρχουν τέσσερα είδη βάσεων και αντίστοιχα τέσσερα είδη νουκλεοτιδίων: η αδενίνη, η θυμίνη, η γουανίνη και η κυτοσίνη. Αντιστοιχίζοντας σε καθεμία απ' αυτές ένα σύμβολο, π.χ. «A» για την αδενίνη, «T» για τη θυμίνη, «G» για τη γουανίνη και «C» για την κυτοσίνη, μπορούμε να κατασκευάσουμε τέτοιες συμβολοσειρές (π.χ. «...AAGATCGGTAC...»). Κατά παρόμοιο τρόπο, οι πρωτεΐνες μπορούν να περιγραφούν ως ακολουθίες αμινοξέων. Αυτού του είδους η αναπαράσταση είναι ιδιαίτερα πρόσφορη για επεξεργασία σε ηλεκτρονικό υπολογιστή που μπορεί να μας δώσει χρήσιμα αποτελέσματα.
Βιοπληροφορικές σπουδές στην Ελλάδα
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής, MSc in Data Science & Information Technologies, Specialization: Bioinformatics – Biomedical Data Science [1]