Genomica: structurele en functionele studies van genomica

Genomica: structurele en functionele studies van genomica!

De term genoom werd geïntroduceerd door H. Winkler (1920) om de volledige reeks chromosomale en extra chromosomale genen aan te geven die aanwezig zijn in een organisme, inclusief een virus.

De term genomics die is bedacht door TH Roderick (1987), betekent mapping en sequencing om de structuur en de organisatie van genomen te analyseren. Maar tegenwoordig omvat genomica sequencing van genomen, bepaling van de complete set van eiwitten gecodeerd door een organisme, en het functioneren van genen en metabole routes in een organisme.

De studie van genomica is onderverdeeld in de volgende twee domeinen:

1. Structurele genomica houdt zich bezig met de bepaling van de volledige sequentie van genomen of de complete set van eiwitten die door een organisme wordt geproduceerd. De verschillende betrokken stappen zijn: (i) constructie van genetische en fysieke kaarten met hoge resolutie, (ii) Sequentiebepaling van het genoom en (iii) bepaling van de complete set van eiwitten in een organisme. Het omvat ook de bepaling van de driedimensionale structuren van de betreffende eiwitten.

2. Functionele genomica bestudeert het functioneren van genen en metabole routes, dat wil zeggen de genexpressiepatronen in organismen.

Reeksen van Genomen:

Sequencing van genomen is een zeer geavanceerd en technisch veeleisend proces. In één keer kan een fragment van 500-600 bp worden gesequenced. Daarentegen zijn genomen erg groot, bijvoorbeeld 4, 2 x 106 voor E. coli en 3, 2 x 109 bp voor mensen. Daarom moet de sequentie van genoxne worden verkregen in een extreem groot aantal kleine stukjes, waarna deze stukjes worden samengevoegd tot een sequentie voor het genoom.

De stukken die worden gebruikt voor het bepalen van de sequentie worden gegenereerd door het genomische DNA op willekeurige punten in fragmenten te breken. Als een resultaat moet de locatie van het fragment in het genoom experimenteel worden bepaald. Alle fragmenten verkregen uit genomisch DNA van een organisme worden gekloneerd in een geschikte vector, dit genereert een genomische bibliotheek van het organisme. De twee benaderingen voor het bepalen van de sequentie van genomen zijn: (a) kloonsequentiebepaling en (b) schotsequentiebepaling.

(a) Clone-by Clone Sequencing:

In deze methode worden de fragmenten eerst uitgelijnd in contigs, ook wel aangeduid als gerichte sequentiebepaling van BAC contigs. Een contig bestaat uit een reeks klonen die overlappende stukken DNA bevatten die een specifiek gebied van een chromosoom of zelfs het gehele chromosoom omzetten. Ze worden meestal geconstrueerd met behulp van BAC (bacterieel kunstmatig chromosoom) en cosmideklonen.

De algemene benadering bij het maken van contigs is om de klonen te identificeren die aangrenzende DNA-segmenten van het chromosoom hebben, bijv. Chromosoombewegingen, chromosoomspringen, enz. De leden van een contig moeten dus hetzelfde overlappende gebied bevatten om de precieze bepaling van hun locatie mogelijk te maken in het conting. Het uiteindelijke doel van fysieke mappingprocedures is om een ​​volledige contig te verkrijgen voor elk chromosoom van het genoom.

De gekloneerde DNA-fragmenten van een contig kunnen worden gecorreleerd met locaties langs een chromosoom verkregen uit koppeling of cytogenetische mapping. Dit kan worden bereikt door leden van de contig te identificeren die inserts bevatten met dergelijke genen die al in kaart zijn gebracht door koppeling of cytologische werkwijzen. Dit zou de uitlijning van de andere leden van de contig langs het chromosoom mogelijk maken. Als alternatief kunnen RFLP (restrictiefragmentlengte-polymorfisme) en andere DNA-markers worden gebruikt om de locaties in een koppelingskaart te correleren met de leden van een contig.

(b) Shot-Gun Sequencing:

In deze benadering worden willekeurig geselecteerde klonen gesequenced totdat alle klonen in de genoombibliotheek zijn geanalyseerd. Assembler-software organiseert de aldus verkregen nucleotidesequentie-informatie in een genoomsequentie. Deze strategie werkt heel goed met prokaryote genomen die weinig repetitief DNA hebben. Maar eukaryote genomen hebben veel herhaalde sequenties die verwarring creëren in de uitlijning van de sequentie. Deze problemen worden opgelost door het gebruik van enorme rekenkracht, gespecialiseerde software en het vermijden van dergelijke regio's die rijk zijn aan repetitief DNA (bijvoorbeeld centromere en telomeren regio's).

Genoomsequentie Compilatie:

Genoomsequencing-projecten vereisten de ontwikkeling van high-throughput-technologieën die zeer snel gegevens genereren. Dit maakte het gebruik van computers noodzakelijk om deze overvloed aan informatie te beheren en heeft een nieuwe discipline voortgebracht, bioinformatica genaamd. Bioinformatica houdt zich bezig met opslag, analyse, interpretatie en gebruik van de informatie over biologische systemen (activiteiten zoals compilatie van genoomsequenties, identificatie van genen, functies toewijzen aan de geïdentificeerde genen, voorbereiding van databases, etc.).

Om ervoor te zorgen dat de nucleotidesequentie van een genoom compleet en foutvrij is, wordt het genoom meer dan eenmaal gesequenced. Nadat het genoom van een organisme is gesequenced, gecompileerd en nagelezen (corrigeren van de fouten), begint de volgende fase van genomica, namelijk annotatie.

Gene voorspelling en tellen:

Nadat een genoomsequentie is verkregen en gecontroleerd op nauwkeurigheid, is de volgende taak om alle genen te vinden die coderen voor eiwitten. Dit is de eerste stap in annotatie. Annotatie is een proces dat genen identificeert, hun regulatoire sequenties en hun functie (s). Het identificeert ook niet-eiwit coderende genen, inclusief genen die coderen voor r-RNA, t-RNA en kleine nucleaire RNA's. Daarnaast worden mobiele genetische elementen en repetitieve sequentiefamilies geïdentificeerd en gekarakteriseerd.

Het lokaliseren van eiwit-coderende genen wordt gedaan door de sequentie te inspecteren, met behulp van een computersoftware of met het oog. Eiwit-coderende genen worden geïdentificeerd door open leesframes (ORF's). Een ORF heeft een reeks codons die een aminozuursequentie specificeren, het begint met een initiatiecodon (gewoonlijk ATG) en eindigt met een terminatiecodon (TAA) TAG of TGA). ORF's worden meestal door een computer geïdentificeerd en zijn een effectieve methode voor bacteriële genomen.

Genen in eukaryote genomen (inclusief het menselijk genoom) hebben verschillende kenmerken die direct zoeken minder handig maken. Ten eerste hebben de meeste eukaryote genen een patroon van exons (coderende gebieden) afgewisseld met introns (niet-coderende gebieden). Als gevolg hiervan zijn deze genen niet georganiseerd als continue ORF's. Ten tweede zijn genen in mensen en andere eukaryoten vaak ver uit elkaar geplaatst, waardoor de kans op het vinden van valse genen groter wordt. Maar nieuwere versies van ORF-scansoftware voor eukaryote genomen maken het scannen efficiënter.

Nadat een genomische sequentie is geanalyseerd en genen zijn voorspeld, wordt elk gen één voor één onderzocht om de functie van het gecodeerde genproduct te identificeren en geclassificeerd in functionele groepen. Deze analyse omvat verschillende programma's. Men kan bijvoorbeeld in databases zoals Gene Bank zoeken om soortgelijke genen te vinden die zijn geïsoleerd van andere organismen. De voorspelde ORF's kunnen worden vergeleken met die van bekende, goed gekarakteriseerde bacteriële genen. Ten slotte kan men op zoek naar dergelijke nucleotidesequenties voor functie-motieven die coderen voor eiwitdomeinen die betrokken zijn bij specifieke functies.

Het doel van genoomanalyse is dus om de functies van alle genen te bepalen en om te begrijpen hoe deze genen interageren in de ontwikkeling en functie van het organisme.

Functionele genomica:

Het kan worden gedefinieerd als de bepaling van de functie van alle genproducten gecodeerd door het genoom van een organisme. Het omvat de volgende parameters: (1) wanneer en waar bepaalde genen tot expressie worden gebracht (expressieprofilering), (ii) de functies van specifieke genen door het selectief muteren van de gewenste genen, en (iii) de interacties die plaatsvinden tussen eiwitten en tussen eiwitten en andere moleculen. Functionele genomica probeert alle in het genoom aanwezige genen in één keer te onderzoeken. Daarom maken de technieken die worden gebruikt in functionele genomica een analyse van hoge doorvoer mogelijk die een zeer snelle gegevensaccumulatie mogelijk maakt.

(i) Expressie profilering:

Bepaling van de celtypen / weefsels waarin een gen tot expressie wordt gebracht, evenals het gen dat tot expressie wordt gebracht, wordt expressieprofilering genoemd. Het doel van functionele genomica is om het expressiepatroon van alle genen aanwezig in het genoom tegelijkertijd te bestuderen; dit wordt globale uitdrukkingsprofilering genoemd. Dit kan zowel op RNA-niveau als op eiwitniveau worden gedaan. Op RNA-niveau kan men bemonstering met rechtstreekse sequentie of DNA-reeksen gebruiken.

Op het eiwitniveau kan men ofwel tweedimensionale elektroforese gebruiken, gevolgd door massaspectrometrie of eiwitarrays. Wereldwijde expressieprofilering biedt inzicht in complexe biologische verschijnselen, waaronder differentiatie, reactie op stress, het begin van een ziekte, enz. Het biedt ook een nieuwe manier om cellulaire fenotypen te definiëren.

(ii) Bepaling van de genenfunctie:

Een belangrijk aspect van functionele genomica is het bepalen van de functie van specifieke genen / anonieme sequenties. Een krachtige manier om dit te bereiken is om het gen te klonen, het in vitro te muteren en het gemuteerde gen opnieuw in het gastheerorganisme te introduceren en het effect ervan te analyseren. Genoom onder mutante bibliotheken zijn ontwikkeld in verschillende modelorganismen zoals bacteriën, gist, planten en zoogdieren. Dit wordt soms mutatie-genomica genoemd. Een dergelijke bibliotheek kan op een van de volgende drie manieren worden gegenereerd:

(a) Een systematische mutatie van elk afzonderlijk gen één op een tijdstip dat een bank van specifieke mutante stammen zal genereren.

(b) Bij de willekeurige benadering worden genen gemuteerd zonder onderscheid worden individuele mutaties vervolgens gekarakteriseerd en gecatalogiseerd.

(c) In deze benadering wordt een groep technieken gebruikt om de expressie van specifieke / groepen van genen te voorkomen.

(iii) Proteïne-interacties:

De genfunctie weerspiegelt het gedrag van de door hen gecodeerde eiwitten. Dit gedrag kan worden gezien als een reeks interacties tussen verschillende eiwitten, en tussen eiwitten en andere moleculen. Eiwitinteracties worden bestudeerd met behulp van high throughput-technieken. Een aantal op de bibliotheek gebaseerde methoden voor het in kaart brengen van eiwitinteracties maakt het mogelijk om honderden of duizenden eiwitten tegelijk te screenen. Deze interacties kunnen in vitro of in vivo worden bepaald. Eiwitinteractiegegevens uit verschillende bronnen worden geassimileerd in databases.