Przyczyny i metodologie sekwencjonowania genomu

Sekwencjonowanie genomów jest wyrafinowane, złożone i wymaga specjalistycznej technologii. Segment 500-800 bp może być zsekwencjonowany. Jednak genomy są bardzo duże, np. E. coli o rozmiarach 4, 2 x 10 6 pz i 3, 2 x 10 9 pz dla ludzi.

Dlatego do sekwencjonowania potrzebne są małe segmenty. Takie segmenty są wytwarzane przez losowe łamanie genomowego DNA na małe fragmenty. Takie fragmenty zwykle pokrywają się z innymi fragmentami na ich końcach. Fragmenty są klonowane w wektorze w celu wygenerowania biblioteki genomowej organizmu.

Powody kompletnego sekwencjonowania genomu:

(i) Dostarcza informacji dla podstawy do odkrycia genów i zapewnia inwentarz genów.

(ii) Przedstawia możliwe związki między genami.

(iii) Sekwencjonowanie genomów zapewnia zestaw narzędzi do dalszych eksperymentów.

(iv) Informacje genetyczne organizmu są udostępniane z sekwencji genów.

(v) Kompletne sekwencjonowanie genetyczne organizmu dostarcza wszystkich informacji genetycznych potrzebnych do stworzenia organizmu.

Metodologie stosowane w sekwencjonowaniu genomu:

(i) Kierowane sekwencjonowanie kontigu bakteriobójczych sztucznych chromosomów (BAC):

Bakteryjne sztuczne chromosomy to po prostu plazmidy przeznaczone do klonowania bardzo długich segmentów (tj. 100 000 do 300 000 bp) DNA. Wektory te są używane do tworzenia bibliotek genomowych, w których rozmiar wstawki wynosi 80-100 kb. Fragmenty DNA tysięcy par zasad są klonowane do wektora BAC.

Biblioteka genomowa jest przeszukiwana przez zlokalizowanie wspólnych klonów restrykcyjnych zwanych kontigami. Członkowie kontigu zawierają pewne pokrywające się regiony, aby umożliwić dokładne określenie ich położenia w kontigu.

Ostatecznym celem fizycznych metod mapowania jest otrzymanie pełnego kontigu dla każdego chromosomu genomu. Zmapowane kontigi są sekwencjonowane poprzez rozbijanie dużych fragmentów DNA na małe segmenty. Każdy klon contig jest sekwencjonowany. Sekwencję nukleotydową identyfikuje się samodzielnie na podstawie klonu do momentu sekwencjonowania całego genomu.

(ii) Losowe sekwencjonowanie shotgunu lub podejście oddolne:

Możliwe jest klonowanie w jednym organizmie dowolnego pożądanego genu z innego organizmu poprzez strzelanie. Cały ten genom pierwszego organizmu jest trawiony endonukleazą restrykcyjną, aby wytworzyć losową mieszaninę fragmentów.

Losowe (shotgimowe) biblioteki genomowego DNA konstruuje się w małych, tj. 2, 0 kb i pożywce, tj. Wektorach plazmidowych o długości 10 kb, razem z biblioteką BAC z dużą wstawką genomu (80-100 kb). Fragmenty wstawia się do wektora plazmidowego i rekombinowane plazmidy transformuje się w pożądaną komórkę gospodarza.

W sekwencjonowaniu strzałów losowo wybrane klony są sekwencjonowane aż do analizy klonów w bibliotece genomowej. Innymi słowy, możemy powiedzieć, że w przypadkowych strzałach chromosomy sekwencjonowania pistoletów są podzielone na sekcje, a następnie część genomowego DNA dzieli się na miliony małych segmentów, a wszystkie segmenty są sekwencjonowane w sposób bezstronny.

Obszary nakładających się DNA są dopasowane, co tworzy większe i większe segmenty genomowego DNA. Sekwencjonowanie DNA przeprowadza się na obu końcach wstawek losowo wybranych klonów z obu bibliotek plazmidów o małym i średnim insercie w celu zapewnienia co najmniej trzykrotnego pokrycia genomu.

Małe fragmenty DNA są losowo wstawiane do różnych cząsteczek plazmidu. W przypadku nakładających się wstawek wszystkie one pochodzą z tego samego miejsca genomu, ale z różnych regionów przesuniętych względem lewej lub prawej strony względem siebie.

Nakładające się fragmenty są wyrównane albo w cotowanie albo w sekwencję dla danego obszaru (metoda z pistoletem strzałowym). Genomy prokariotyczne mają niewiele odpowiedniego DNA i sekwencjonowanie pistoletów strzałowych daje dobre wyniki. Eukarionty noszą wiele powtarzających się sekwencji.

To wszystko prowadzi do zamieszania. Jednak nakładanie się fragmentów jest wykorzystywane w fazie montażu przez ćwiczenia obliczeniowe. Program komputerowy identyfikuje nakładające się sekwencje i łączy je w jedno ciągłe rozciąganie. Proces ten został z powodzeniem zastosowany do sekwencjonowania wszystkich sekwencji genomów drobnoustrojów opublikowanych przez Celera Genomics.