Genomika: badania strukturalne i funkcjonalne genomiki

Genomika: strukturalne i funkcjonalne studia genomiki!

Termin genom został wprowadzony przez H. Winklera (1920) w celu oznaczenia pełnego zestawu genów chromosomalnych i dodatkowych chromosomów obecnych w organizmie, w tym wirusa.

Termin genomika wymyślona przez TH Rodericka (1987) oznacza mapowanie i sekwencjonowanie w celu analizy struktury i organizacji genomów. Ale obecnie genomika obejmuje sekwencjonowanie genomów, oznaczanie pełnego zestawu białek kodowanych przez organizm oraz funkcjonowanie genów i szlaków metabolicznych w organizmie.

Badanie genomiki dzieli się na dwie następujące domeny:

1. Genomika strukturalna zajmuje się ustaleniem kompletnej sekwencji genomów lub kompletnego zestawu białek wytwarzanych przez organizm. Poszczególne etapy obejmują: (i) budowę map genetycznych i fizycznych o wysokiej rozdzielczości, (ii) sekwencjonowanie genomu oraz (iii) określenie kompletnego zestawu białek w organizmie. Obejmuje również określenie trójwymiarowych struktur danych białek.

2. Genomika funkcjonalna bada funkcjonowanie genów i szlaków metabolicznych, tj. Wzorców ekspresji genów w organizmach.

Sekwencjonowanie genomów:

Sekwencjonowanie genomów jest bardzo wyrafinowanym i wymagającym technicznie procesem. Za jednym razem można sekwencjonować fragment o wielkości 500-600 bp. Przeciwnie, genomy są wyjątkowo duże, np. 4, 2 x 10 6 dla E. coli i 3, 2 x 10 9 bp dla ludzi. Dlatego sekwencja genoksyn musi zostać uzyskana w bardzo dużej liczbie małych kawałków, części te są następnie składane w sekwencję dla genomu.

Fragmenty użyte do sekwencjonowania są generowane przez rozbicie genomowego DNA na fragmenty w losowych punktach. W rezultacie lokalizacja fragmentu w genomie musi być określona doświadczalnie. Wszystkie fragmenty uzyskane z genomowego DNA organizmu są klonowane w odpowiednim wektorze, co generuje bibliotekę genomową organizmu. Dwa podejścia do sekwencjonowania genomów są następujące: (a) sekwencjonowanie klonu po klonie i (b) sekwencjonowanie typu shot-gun.

(a) Klonowanie według sekwencji klonów:

W tej metodzie fragmenty są najpierw zestawiane w kontigi zwane również sekwencjonowaniem kontrabasu BAC. Kontig składa się z serii klonów zawierających zachodzące na siebie fragmenty DNA, które przekształcają określony region chromosomu lub nawet całego chromosomu. Zwykle konstruuje się je przy użyciu BAC (bakteryjnego sztucznego chromosomu) i klonów kosmidowych.

Ogólnym podejściem do tworzenia kontigów jest identyfikacja klonów, które mają sąsiednie segmenty DNA z chromosomu, np. Chodzenie chromosomów, skoki chromosomowe itd. Zatem członkowie kontigu muszą zawierać ten sam nakładający się region, aby umożliwić dokładne określenie ich położenia. - w conting. Ostatecznym celem procedur mapowania fizycznego jest uzyskanie pełnego kontigu dla każdego chromosomu genomu.

Sklonowane fragmenty DNA kontigu można skorelować z lokalizacjami wzdłuż chromosomu uzyskanego z połączenia lub mapowania cytogenetycznego. Można to osiągnąć przez identyfikację członków kontigu, które zawierają inserty mające takie geny, które zostały już zmapowane przez łączenie lub metody cytologiczne. To pozwoliłoby na wyrównanie innych członków kontigu wzdłuż chromosomu. Alternatywnie, RFLP (polimorfizm długości fragmentów restrykcyjnych) i inne markery DNA można stosować do korelowania lokalizacji w mapie sprzężenia z elementami kontigu.

(b) Sekwencjonowanie w strzelaniu:

W tym podejściu losowo wybrane klony są sekwencjonowane do czasu przeanalizowania wszystkich klonów w bibliotece genomowej. Oprogramowanie asemblera organizuje tak otrzymaną sekwencję nukleotydową w sekwencję genomu. Ta strategia działa bardzo dobrze w przypadku genomów prokariotycznych, które mają mało powtarzalnego DNA. Ale genomy eukariotyczne mają wiele powtarzających się sekwencji, które powodują zamieszanie w wyrównaniu sekwencji. Problemy te są rozwiązywane przez wykorzystanie ogromnych mocy obliczeniowych, specjalistycznego oprogramowania i unikanie regionów bogatych w powtarzalne DNA (np. Regiony centromerowe i telomeryczne).

Kompilacja sekwencji genomu:

Projekty sekwencjonowania genomu wymagały opracowania technologii o wysokiej przepustowości, które generują dane w bardzo szybkim tempie. Wymagało to użycia komputerów do zarządzania tym zalewem informacji i zrodziło nową dyscyplinę zwaną bioinformatyką. Bioinformatyka zajmuje się przechowywaniem, analizą, interpretacją i wykorzystaniem informacji o systemach biologicznych (działania takie jak kompilacja sekwencji genomowych, identyfikacja genów, przypisywanie funkcji do zidentyfikowanych genów, przygotowywanie baz danych itp.).

W celu zapewnienia, że ​​sekwencja nukleotydowa genomu jest kompletna i pozbawiona błędów, genom jest sekwencjonowany więcej niż jeden raz. Gdy genom organizmu zostanie zsekwencjonowany, skompilowany i sprawdzony (poprawianie błędów), rozpoczyna się następny etap genomiki, mianowicie adnotacja.

Przewidywanie i liczenie genów:

Po uzyskaniu sekwencji genomu i sprawdzeniu jej dokładności, następnym zadaniem jest znalezienie wszystkich genów kodujących białka. To jest pierwszy krok w adnotacji. Adnotacja to proces, który identyfikuje geny, ich sekwencje regulacyjne i ich funkcje. Identyfikuje również geny kodujące niebiałkowe, w tym geny kodujące r-RNA, t-RNA i małe jądrowe RNA. Ponadto mobilne elementy genetyczne i powtarzalne rodziny sekwencji są identyfikowane i charakteryzowane.

Lokalizowanie genów kodujących białka odbywa się poprzez kontrolę sekwencji, za pomocą oprogramowania komputerowego lub oka. Geny kodujące białka są identyfikowane przez ramki odczytu (ORF). ORF ma szereg kodonów, które określają sekwencję aminokwasów, zaczyna się od kodonu inicjacji (zwykle ATG) i kończy się kodonem terminacyjnym (TAA) TAG lub TGA). ORF są zwykle identyfikowane przez komputer i stanowią skuteczną metodę dla genomów bakterii.

Geny genomów eukariotycznych (w tym ludzki genom) mają kilka cech, które sprawiają, że wyszukiwanie bezpośrednie jest mniej użyteczne. Po pierwsze, większość genów eukariotycznych ma wzór eksonów (regionów kodujących) naprzemiennie z intronami (regiony niekodujące). W rezultacie geny te nie są zorganizowane jako ciągłe ORF. Po drugie, geny u ludzi i innych eukariontów są często szeroko rozstawione, zwiększając tym samym szanse na znalezienie fałszywych genów. Ale nowsze wersje oprogramowania do skanowania ORF dla genomów eukariotycznych sprawiają, że skanowanie jest bardziej wydajne.

Po analizie sekwencji genomowej i przewidywaniu genów, każdy gen jest badany pojedynczo w celu zidentyfikowania funkcji kodowanego produktu genu i podzielony na grupy funkcjonalne. Ta analiza obejmuje kilka programów. Na przykład można przeszukiwać bazy danych, takie jak Bank Genów, aby znaleźć podobne geny wyizolowane z innych organizmów. Przewidywane ORF można porównać do tych ze znanych, dobrze scharakteryzowanych genów bakteryjnych. Na koniec można szukać takich sekwencji nukleotydowych dla motywów funkcjonalnych, które kodują domeny białkowe zaangażowane w określone funkcje.

Tak więc celem analizy genomu jest określenie funkcji wszystkich genów i zrozumienie, w jaki sposób te geny współdziałają w rozwoju i funkcji organizmu.

Funkcjonalna genomika:

Można go zdefiniować jako określenie funkcji wszystkich produktów genowych kodowanych przez genom organizmu. Obejmuje on następujące parametry: (1) kiedy i gdzie poszczególne geny ulegają ekspresji (profilowanie ekspresji), (ii) funkcje określonych genów poprzez selektywną mutację pożądanych genów oraz (iii) interakcje zachodzące między białkami i między białkami i inne cząsteczki. Funkcjonalna genomika próbuje za jednym razem zbadać wszystkie geny obecne w genomie. Dlatego techniki stosowane w genomice funkcjonalnej umożliwiają wysokowydajną analizę, która umożliwia bardzo szybkie gromadzenie danych.

(i) Profilowanie wyrażeń:

Określenie typów komórek / tkanek, w których gen ulega ekspresji, a także kiedy ulega ekspresji gen jest nazywany profilowaniem ekspresji. Celem genomiki funkcjonalnej jest badanie wzorca ekspresji wszystkich genów obecnych w genomie w tym samym czasie; nazywa się to profilowaniem globalnej ekspresji. Można to zrobić na poziomie RNA lub na poziomie białka. Na poziomie RNA można albo użyć bezpośredniego pobierania próbek, albo macierzy DNA.

Na poziomie białka można zastosować dwukierunkową elektroforezę, a następnie spektrometrię masową lub macierze białek. Globalne profilowanie ekspresji zapewnia wgląd w złożone zjawiska biologiczne, w tym różnicowanie, odpowiedź na stres, wystąpienie choroby itp. Zapewnia również nowy sposób definiowania fenotypów komórkowych.

(ii) Oznaczanie funkcji genów:

Ważnym aspektem funkcjonalnej genomiki jest określenie funkcji określonych genów / sekwencji anonimowych. Potencjalnym sposobem osiągnięcia tego jest klonowanie genu, mutacja go in vitro i ponowne wprowadzenie zmutowanego genu do organizmu gospodarza i analiza jego działania. Genom pod zmutowanymi bibliotekami został opracowany w kilku modelowych organizmach, takich jak bakterie, drożdże, rośliny i ssaki. Jest to czasami określane jako genomika mutacyjna. Taką bibliotekę można wygenerować na jeden z trzech poniższych sposobów:

(a) Systematyczne mutacje każdego pojedynczego genu w czasie, które będą generować bank specyficznych zmutowanych szczepów.

(b) W podejściu losowym, geny mutuje się w sposób bezkrytyczny, a poszczególne mutacje są następnie scharakteryzowane i skatalogowane.

(c) W tym podejściu stosuje się grupę technik w celu zapobiegania ekspresji określonych / grup genów.

(iii) Oddziaływania z białkami:

Funkcja genowa odzwierciedla zachowanie kodowanych przez nie białek. To zachowanie może być postrzegane jako seria interakcji między różnymi białkami oraz między białkami i innymi cząsteczkami. Oddziaływania z białkami są badane przy użyciu technik o wysokiej przepustowości. Wiele opartych na bibliotekach metod mapowania interakcji białkowych pozwala na jednoczesne przesiewanie setek lub tysięcy białek. Te interakcje można badać in vitro lub in vivo. Dane dotyczące interakcji białek z różnych źródeł są asymilowane w bazach danych.