Bioinformatika je vědní disciplína, která se zabývá metodami pro shromažďování, analýzu a vizualizaci rozsáhlých souborů biologických dat, zejména dat molekulárně-biologických.
Dostupné bioinformatické nástroje a databáze jsou shromážděny v Tools and Data Services Registry[1] (bio.tools) evropské bioinformatické infrastruktury ELIXIR. České bioinformatické nástroje a databáze v bio.tools sdružuje konsorcium ELIXIR-CZ.
Oblasti bioinformatického výzkumu
Anotace genomu
Snaha o nacházení genů, míst interakce s proteiny a dalších významných oblastí v sekvenci DNA je nazývána anotací genomu. Zabývá se jí více vědních oborů, především molekulární biologie. Bioinformatika se snaží na základě vlastností laboratorně (např. sekvenovánímmRNA) nalezených oblastí předpovědět pozice dalších oblastí výpočetními metodami. U prokaryot lze s úspěchem použít metody založené na znalostech vlastností promotorů a dalších hraničních oblastí genů, tzv. ab initio metody. U eukaryot je použití těchto metod náročnější, protože mají mnohem složitější strukturu genomu. Dalšími často volenými nástroji jsou pravděpodobnostní modely (např. Skryté Markovovy Modely (Hidden Markov modelss) či metody strojového učení (Vhodné jsou např. support vector machines).
Sekvenční analýzy
Základním úkonem, potřebným v mnoha bioinformatických aplikacích, je zarovnání sekvencí a analýza jejich podobnosti (sequence alignment), povětšinou se jedná o sekvence nukleových kyselin či aminokyselin v bílkovině. Několik sekvencí je třeba nejdříve přiložit k sobě tak, aby si prvky na jednotlivých pozicích co nejvíce odpovídaly a bylo tak možné vyhodnotit míru podobnosti. Základními algoritmy pro tento úkon jsou Smith-Waterman a Needleman-Wunsch. Při hledání a porovnávání dlouhých sekvencí na úrovni genomu je třeba využívat jisté heuristiky, protože základní algoritmy jsou příliš pomalé. Příkladem programu pro rychlé vyhledávání na dlouhých sekvencích s využitím heuristiky je BLAST.
Analýzy úrovně genové exprese
Molekulární biologové laboratorními metodami měří úroveň exprese jistých genů, tedy jaké množství mRNA je z daného genu v daném období transkribováno. Často používanými metodami jsou reverzní transkripce do cDNA (metoda EST), microarray či SAGE (serial analysis of gene expression). Výsledky těchto analýz jsou rozsáhlé soubory dat s velkou úrovní šumu, bioinformatika data upravuje do použitelné podoby.
Analýzy genové regulace
Reakce buňky na změny v prostředí jsou z velké části založeny na genové regulaci. Komplexním systémem informačních drah je informace o podnětu z vnějšího prostředí (např. hormon nebo podnět z chemoreceptoru) přenesena do jádra, kde ovlivní míru exprese jednotlivých genů. Buňka tak začne produkovat proteiny, potřebné v dané situaci.
Bioinformatika zkoumá principy této regulace. Je například možné porovnat microarray data z buňky v běžném stavu a buňky vystavené vlivu léčiva a zjistit tak přesně, které geny byly léčivem ovlivněny.
Analýza genové regulace je velmi důležitou součástí výzkumu rakoviny.
Předpověď struktury proteinů
Struktura proteinu z velké části determinuje její funkci, proto je jeho znalost důležitá. Experimentální zjištění tohoto tvaru (např. pomocí rentgenové krystalografie) je však drahé, pomalé a ne vždy možné. Proto se bioinformatika snaží získat prostorové uspořádání proteinů jinak.
Primární strukturu proteinu (pořadí aminokyselin) lze jednoduše získat například sekvenací mRNA pro daný protein.
Sekundární,
terciární (popř.
kvarterní) strukturu se bioinformatika a teoretická chemie snaží předpovědět na základě znalosti primární struktury. Používaných technik je mnoho, základní přístupy jsou tyto:
Využití fyzikálně-chemických vlastností jednotlivých aminokyselin či molekul - tzv. ab initio metody (například snaha určit celkovou energii, jakou molekula potřebuje pro zaujetí určitého tvaru a najít tvar s minimální potřebnou energií)
Využití biologických znalostí - například předpověď struktury proteinu na základě znalosti struktury proteinu z homologního genu či proteinu s podobnou funkcí
Využití experimentálně zjištěných tvarů proteinů - především metody strojového učení
Kombinace několika z těchto přístupů
Zatímco při předpovědi sekundární struktury bývá dosaženo poměrně dobrých výsledků, (Současné metody mají úspěšnost přes 70%) předpověď terciární struktury je náročnější a méně přesná.
Srovnávací genomika
Srovnávací genomika se snaží porozumět vztahům genů či jiných částí genomu napříč organismy a lépe tak porozumět procesu evoluce, případně přispět k anotaci genomů na základě znalostí vztahů mezi nimi. Jelikož genomy jsou rozsáhlé a mají složitou strukturu, vyžaduje tvorba srovnávacích syntenických map hlubší analýzu a automatizaci výpočtů.
Přírodovědecká fakulta Masarykovy univerzity nabízí bakalářský i navazující magisterský obor Bioinformatika a chemoinformatika v rámci programu Biochemie[3]
Přírodovědecká fakulta Univerzity Palackého nabízí bakalářský i navazující magisterský obor Bioinformatika na Katedře Informatiky ve spolupráci s katedrami Biochemie a Fyzikální chemie[5]
↑ Studijní obor Bioinformatika a biocomputing na FIT VUT v Brně. www.fit.vutbr.cz [online]. [cit. 2011-08-29]. Dostupné v archivu pořízeném z originálu dne 2011-03-16.
↑ Propagační web oboru Biomedicínská technika a bioinformatika na FEKT VUT v Brně. jdi.na.biomedicinu.cz [online]. [cit. 2011-01-11]. Dostupné v archivu pořízeném dne 2010-01-11.
↑ Biomedicína - Biomedicínské Inženýrství a Informatika na FEL ČVUT Praha. biomedicina.fel.cvut.cz [online]. [cit. 2011-01-11]. Dostupné v archivu pořízeném dne 2011-01-14.