Estructura del genoma - vet. · PDF filePara identificar y cartografiar de manera sistemática todos los genes del genoma de un ... Fibroblasto humano Célula tumoral del ratón Los

1

GGGEEENNNÓÓÓMMMIIICCCAAA (Una guía de lectura introductoria al tema)

La genómica es el campo de la genética que intenta comprender el contenido, la

organización, la función y la evolución de la información genética contenidos en el genoma

completo. Su principal objetivo de estudio es la caracterización molecular de los genomas

completos.

La genómica integra las disciplinas tradicionales: citología, genética mendeliana,

cuantitativa, molecular, de poblaciones y nuevas disciplinas como la bioinformática.

Para identificar y cartografiar de manera sistemática todos los genes del genoma de un

organismo se procedió a:

Identificar mutaciones espontáneas o generar colecciones de mutantes usando agentes

químicos o físicos.

Generar mapas genéticos mediante análisis de ligamiento utilizando las cepas mutantes.

Durante la década de 1980 los genetistas comenzaron a utilizar la tecnología del ADN

recombinante como una aproximación al análisis genético, cartografiando secuencias de ADN

clonadas en cromosomas específicos. La mayor parte de estas secuencias no eran genes, sino

marcadores como polimorfismos de longitud de fragmentos de restricción (RFLP), polimorfismo de

un único nucleótido (SNP) y otros. Una vez asignados a un cromosoma, estos marcadores se

utilizaban en árboles genealógicos para establecer un ligamiento entre los marcadores y

enfermedades genéticas. Este método denominado clonación posicional se utilizó para

cartografiar, aislar, clonar y secuenciar los genes de distintas enfermedades.

1 2

3 4

5

Figura 1. Organismos modelo utilizados

para identificar mutaciones y generar

mapas genéticos: 1. Maíz, 2. Drosophila,

3. E. coli, 4. Ratón y 5. Levadura.

2

A mediados de 1980 ya se habían asignado más de 3.500 genes y marcadores a

cromosomas humanos. Actualmente se han secuenciado centenares de genomas de procariotas

y eucariotas, y hay más de mil proyectos en ejecución.

La Genómica incluye diversos campos

Genómica Estructural

Genómica Funcional

Genómica Comparativa

La Genómica Estructural incluye la construcción de los datos de la secuencia del genoma,

el descubrimiento de los genes y su localización y la construcción de mapas genéticos.

La Genómica Funcional estudia la función biológica de los genes, su regulación y sus

productos.

La Genómica Comparativa compara secuencias de genes y proteínas de diferentes

genomas para elucidar las relaciones funcionales y evolutivas.

3

La Proteómica es una extensión de la Genómica y su objetivo es el estudio de las proteínas

presentes en una célula, en un tejido, en un fluido en un momento dado bajo determinadas

condiciones. Define el conjunto completo de proteínas codificadas por un genoma. Incluye:

Identificación de todas las proteínas expresadas en una célula bajo determinadas

condiciones.

La naturaleza y el alcance de cualquier modificación pos-traduccional de las proteínas.

Las interacciones proteína-proteína.

La localización subcelular de las proteínas.

4

GENÓMICA ESTRUCTURAL

La Genómica estructural se ocupa de la secuenciación y la comprensión del contenido

del genoma. A menudo, uno de los primeros pasos en la caracterización de un genoma es

preparar mapas genéticos y físicos de sus cromosomas. Estos mapas proporcionan información

sobre las localizaciones relativas de genes, los marcadores moleculares y los segmentos

cromosómicos, que suelen ser esenciales para posicionar los segmentos cromosómicos y alinear

tramos del ADN secuenciado en una secuencia del genoma completo.

MAPAS GENÉTICOS

Los mapas genéticos (mapas de ligamiento) proporcionan una aproximación a grandes

rasgos de las localizaciones de los genes en relación con las de otros genes conocidos.

Estos mapas se basan en la función genética de recombinación. Para la construcción de

los mapas se cruzan individuos heterocigotos en dos o más loci genéticos y se determina la

frecuencia de recombinación mediante el examen de la progenie. Si la frecuencia de

recombinación entre dos loci es del 50%, entonces los loci están ubicados en cromosomas

diferentes o están muy separados en el mismo cromosoma. Si la frecuencia de recombinación es

menos del 50%, los loci están localizados muy próximos en el mismo cromosoma (pertenecen al

mismo grupo de ligamiento). Para los genes ligados, la frecuencia de recombinación es

proporcional a la distancia física entre los loci.

Las distancias en los mapas

genéticos son medidas en

porcentaje de recombinación

(centimorgans, cM) o unidades

de mapa (um).

Marcadores de ADN

Distancia en un

mapa genético

Figura 2. Los mapas

genéticos se basan

en la frecuencia de

recombinación.

5

Durante muchos años, los genes podían detectarse sólo observando su influencia en un

rasgo (fenotipo) y la construcción de mapas genéticos estaba limitada por la disponibilidad de

rasgos de un locus individual que podrían examinarse por la evidencia de la recombinación. Al

final, esta limitación se superó con el desarrollo de técnicas moleculares, como el análisis de

polimorfismos de la longitud del fragmento de restricción, la reacción en cadena de la polimerasa

(PCR) y la secuenciación de ADN, mejorando los mapas genéticos.

Los mapas genéticos tienen varias limitaciones, la primera es la baja resolución o el detalle.

Segundo, no siempre se corresponden con precisión a las distancias físicas entre los genes. Los

mapas genéticos se basan en las frecuencias de entrecruzamiento o recombinación, que varían

de un cromosoma a otro, de modo que las distancias de un mapa genético son sólo

aproximaciones de distancias físicas reales a lo largo de un cromosoma. A pesar de estas

limitaciones, los mapas genéticos han sido fundamentales para el desarrollo de los mapas físicos y

la secuenciación de genomas completos.

MAPAS CITOGENÉTICOS

Los mapas citogenéticos o

cromosómicos constituyen una etapa

intermedia entre los mapas genéticos y

los mapas físicos.

Figura 3. Comparación del mapa citogenético del

cromosoma 1 del búfalo (BBU1) a la izquierda y la

alineación con la secuencia de montaje del

cromosoma 1 y 27 del bovino (BTA1 BTA27) a la

derecha. Los marcadores comunes a ambos están

unidos por una línea sólida de color negro

o una línea roja sólida (circulo). Las líneas rojas

indican los marcadores que se orientan de forma

secuencial pero invertida.

6

Con el avance de las técnicas de bandeo cromosómico, la citogenética cuenta con una

herramienta de mayor precisión en la individualización de los cromosomas, facilitando su

agrupamiento y clasificación morfológica.

El estudio citogenético en animales domésticos se ha desarrollado rápidamente en los

últimos años. Hoy en día es utilizado como elemento de diagnóstico que permiten detectar un

gran número de patologías. A su vez el bandeo cromosómico, ha permitido precisar la

localización de genes aportando información al mapa genético. Por otro lado permiten realizar

estudios evolutivos de especies relacionadas entre sí.

La construcción de los mapas citogenéticos o cromosómicos se realizan utilizando técnicas

que no incluyen la reproducción sexual (meiosis) y, por lo tanto, asignan una localización según las

regiones citogenéticas (además, estos mapas presentan la ventaja de no requerir del uso de

marcadores polimórficos). Esas técnicas son:

Hibridación in situ,

Híbridos de células somáticas

Híbridos de radiación.

Hibridación In Situ.

Cuando una secuencia de ADN, en este caso referida como una “sonda” de ADN (en

inglés, probe), es marcada con isótopos radioactivos o fluorescencia, podemos hibridarla con su

secuencia complementaria en el ADN genómico de un cromosoma específico y observar la

marca directamente sobre el extendido cromosómico con un microscopio óptico. Las células

deben estar fijas y los cromosomas esparcidos en un portaobjetos y expuestos a una solución de

pH elevado para romper el apareamiento de bases y permitir el acceso a las sondas. La

hibridación in situ fluorescente (FISH) es una técnica muy sensible siempre que se cuente con

sondas lo suficientemente grandes (y homólogas) y que se suprima la fluorescencia de fondo. La

sensibilidad de esta variante de la técnica de hibridación in situ es que permite localizar una

secuencia con una precisión de hasta 30 Mb y de detectar anormalidades cariotípicas en

cromosomas metafásicos tanto como interfásicos. Los fluorocromos más empleados son:

fluoresceína (FITC), rodamina (XRITC) y Texas Red.

La hibridación in situ es la técnica de elección

para la localización rápida de los transgenes.

Figura 4. Cromosoma 4 que presenta una duplicación de

la banda q21 detectado con la técnica FISH

7

Fibroblasto humano Célula tumoral del ratón

Los fibroblastos

humanos y las células

tumorales de ratón se

mezclaron en presencia

de polietilenglicol

…y dan origen a

células híbridas

denominadas

heterocarion

Heterocarion

Célula híbrida

con núcleos

fusionados

Líneas celulares

Figura 5. La hibridación

de células somáticas

puede utilizarse para

determinar cuál es el

cromosoma que

contiene el gen de

interés.

Por último, el pintado de cromosomas (del inglés chromosome painting) es una variante del

FISH que emplea una mezcla de sondas de ADN derivada de un cromosoma entero o de una

región cromosómica de interés. Se utiliza para obtener patrones de regiones homólogas entre

diferentes especies y es una forma muy directa de evaluar la cantidad de rearreglos que se

produjeron entre dos especies en el curso de la evolución.

Híbridos de Células Somáticas

Para esta técnica se utilizan

células híbridas (viables) derivadas

de la fusión in vitro de células

somáticas de especies diferentes

de mamíferos. Aunque se

desconoce la razón, se observa

que los cromosomas que se van

perdiendo en las células híbridas

pertenecen exclusivamente a uno

de los conjuntos parentales. Por

ejemplo, los híbridos

humano/roedor tienden a perder

(a través de los sucesivos cultivos y

en forma preferencial) los

cromosomas humanos y quedarse

con una mayoría de cromosomas

de roedor. Debido a esto, es

posible derivar un panel de células

híbridas que representen cada cromosoma humano en forma única, sobre un conjunto de

cromosomas de roedor. Por lo tanto, todos los genes de origen roedor son retenidos (y se expresan

normalmente), mientras que sólo los genes presentes en el único cromosoma humano que quedó

retenido en ese híbrido podrán ser localizados por medio del uso de sondas moleculares o el

análisis de expresión. De esta manera, detectando patrones de presencia o ausencia de

marcadores (o expresión de genes) y correlacionando con los cromosomas presentes en el

híbrido, se puede asignar un gen humano a un cromosoma en particular. Los híbridos de células

somáticas humano/ratón, con un complemento limitado de cromosomas humanos (intactos), han

sido muy usados para localizar genes humanos en los últimos 20 años, a pesar de ser muy

inestables.

8

Híbridos de Radiación (HR)

Otra técnica desarrollada para obtener mapas de alta resolución son los paneles de

híbridos de radiación (Radiation Hybrid –RH), enfoque descripto por Goss y Harris en 1975. Las dos

grandes ventajas de este sistema son que pueden mapearse marcadores o genes no polimórficos

(se evalúa sólo la presencia o ausencia de un marcador) y que se logra una resolución mayor que

con los mapas de ligamiento, constituyendo un puente entre éstos y los mapas físicos. Estos

paneles de células híbridas se construyen a partir de células donantes (de la especie a ser

mapeada) que han sido irradiadas letalmente (ya sea con rayos g o X) para causar la

fragmentación de sus cromosomas (por roturas de doble cadena). Las células así irradiadas son

fusionadas con líneas celulares receptoras deficientes para un marcador de selección, como ser

la timidina quinasa (TK–) o la hipoxantina fosforibosil transferasa (HPRT–). Usando condiciones de

selección con medios apropiados, sobrevivirán sólo aquellas células que contengan, por lo menos,

algún fragmento cromosómico proveniente de las células dadoras.

El concepto teórico es que aquellos loci que se encuentran muy próximos unos de otros

serán retenidos en el mismo fragmento cromosómico después de la radiación. Esta característica

es similar al principio de ligamiento genético que hemos visto en los mapas meióticos. Como en los

paneles de ADN obtenidos con cruzas de animales, la información de los paneles HR es

acumulativa y puede proveer datos para el ordenamiento (de alta resolución) de regiones no

polimórficas o no separables por los mapas de ligamiento.

Figura 6. Híbridos de radiación. Construcción de clones de híbridos de radiación (HR) a partir de células

donantes con un único cromosoma humano (híbrido mono-cromosómico) y células receptoras de hámster.

Cada clon (abajo) presenta una colección diferente (al azar) de fragmentos del cromosoma humano

original. Los 6 loci hipotéticos (A a F) se marcan como + (presencia) o - (ausencia), dando una idea del

ordenamiento en el cromosoma original

9

Cuando se evalúa un marcador (por Southern blot, FISH o PCR), el patrón de presencia (+)

o ausencia (–) a través del panel, define el emplazamiento del mismo: aquellos marcadores con el

mismo patrón de + y – estarán localizados en el mismo “bin” o posición. Estos estudios se conocen

como “patrones de retención de marcadores” y nos ayudan a determinar la ubicación de un gen

o marcador. En estos casos, la unidad para medir la distancia en el mapa es el Ray o el centiRay

(cR).

MAPAS FÍSICOS

Los mapas físicos están basados en el análisis directo del ADN y ponen los genes respecto

a distancias medidas en el número de pares de bases, kilobases o megabases. Un tipo común de

mapa físico es el que conecta piezas aisladas de ADN genómico que fue clonado en bacterias o

levaduras. Una de las ventajas es que, por lo general, los mapas físicos tienen resolución mayor y

son más exactos que los mapas genéticos.

Hay varias técnicas para crear mapas físicos, entre las que se incluyen el mapeo de

restricción, que determina las posiciones de sitios de restricción en el ADN; el mapeo del sitio de

secuencia específica (sequence-tagged site, STS), que localiza las posiciones de secuencias

cortas únicas de ADN en un cromosoma; la hibridación in situ fluorescente (fluorescent in situ

hybridization, FISH), por el cual pueden mapearse los marcadores visualmente en sus

localizaciones cromosómicas y la secuenciación de ADN.

Mapa genético Secuencia de

ADN

Mapa físico Cromosoma

Clones de ADN alineados

Figura 7. Los

mapas físicos a

menudo se utilizan

para ordenar los

fragmentos de

ADN clonados.

10

VISUALIZACION DE LOS FRAGMENTOS DE ADN

Para la visualización de fragmentos de ADN se encuentran disponibles numerosas técnicas, entre

las que se pueden mencionar:

1. La electroforesis es una técnica bioquímica estándar para la separación de moléculas sobre la

base del tamaño y la carga eléctrica. Hay varios tipos. Se prepara un gel poroso de agarosa que

se funde en una solución buffer. Al enfriarse se solidifica. En uno de los extremos del gel se realizan

indentaciones (pocillos) para contener las soluciones con fragmentos de ADN y se somete a una

corriente eléctrica que pasa a través del gel. Dado que el grupo fosfato del ADN tiene carga

negativa, los fragmentos de ADN migran hacia el extremo positivo del gel. La distancia que

recorre cada fragmento depende de su tamaño. Luego se produce la tinción del gel con un

colorante específico como bromuro de etidio.

La electroforesis es muy utilizada en la tecnología de ADN recombinante.

2. Otra técnica es la Southern blot, sirve para transferir los fragmentos desnaturalizados

monocatenarios provenientes de un gel a un medio sólido delgado. Estos fragmentos son cortados

por una o más enzimas de restricción. Se puede identificar que clones de una biblioteca

contienen una determinada secuencia de ADN y para caracterizar el tamaño de los fragmentos.

También se puede utilizar para determinar si un clon contiene todo un gen o solo parte de el.

Los fragmentos se separan por electroforesis en gel, lo que produce una serie de bandas.

Se tiñe el ADN en el gel con bromuro de etidio y se fotografía o escanea para determinar el

número y peso molecular de los fragmentos. El ADN se debe desnaturalizar en fragmentos de

cadena sencilla con un tratamiento alcalino. Se cubre el gel con una membrana de nitrocelulosa.

Los fragmentos de ADN del gel se transfieren a la membrana colocando la membrana y el gel

sobre un pabilo (esponja) sumergida parcialmente en una solución tampón. Se colocan varias

capas de papel de celulosa secante. La acción capilar arrastra el tampón por el gel y de esta

manera se transfieren los fragmentos de ADN del gel al filtro de nitrocelulosa. Después de la

transferencia al gel se coloca en una solución de hibridación de una sonda marcada en forma

radiactiva o química. La sonda se unirá a todos los fragmentos de ADN en la membrana que

posee secuencias complementarias. Luego se lava la membrana para sacar la sonda no unida y

la sonda unida se detecta por autorradiografía u otro método para sondas marcadas.

11

3. El Nothern blot es la transferencia de ARN también de un gel a un soporte sólido mediante un

proceso denominado. La hibridación puede revelar el tamaño de una molécula de ARN

mensajero particular, su abundancia o los tejidos en los que se transcribe.

4. El Western blot es la transferencia de la proteína de un gel a una membrana. La sonda puede

ser un anticuerpo, utilizado para determinar el tamaño de una proteína y el patrón de expresión.

5. Hibridación in situ (explicada anteriormente)

6. Footprinting del ADN

Muchas secuencias del ADN actúan como sitios de fijación para proteínas por ej. las

secuencias consenso en promotores que son los sitios a menudo sitios de fijación para los factores

de transcripción. Esta técnica se utiliza para determinar las secuencias de ADN fijadas a estas

proteínas.

7. Mutagénesis

Una manera muy eficaz para estudiar los genes es provocar mutagénesis y estudiar los efectos

en el organismo.

5

Figura 8. Técnica de Southern blot

para transferir los fragmentos

desnaturalizados monocatenarios

provenientes de un gel a un

medio sólido delgado.

12

8. Animales transgénicos

En ratones y otros mamíferos el ovocito es lo

suficientemente grande como para inyectar el ADN

de manera directa. En el estado de dos pronúcleos

antes de la fecundación. Antes de la fecundación se

puede inyectar el ADN en uno de ellos y así unas

copias de ADN son inyectadas y se integran al azar

mediante un proceso denominado recombinación

no homóloga. Los embriones se implantan luego en

una hembra seudopreñada, madre sustituta.

Figura 9. Animales transgénicos. Los animales alterados son

transgénicos y el ADN aportado extraño se denomina

transgen.

9. Ratones con desactivación génica ¨Knock-out¨

Es una variante que consiste en producir ratones en los

que se les desactiva un gen normal. Sus fenotipos ratones

con desactivación permiten determinar la función de un

gen. La manera habitual es insertar un gen neo que

confiere resistencia al antibiótico G418. La inserción

rompe el gen blanco y proporciona un marcador

conveniente para hallar copias del gen desactivado.

Después de transferir el gen desactivado a las células

embrionarias se seleccionan mediante el agregado del

antibiótico G418. Solo sobrevivirán las células con el gen

desactivado.

Figura 10. Knock-out. Dentro del ratón la copia normal del gen

puede intercambiarse con la desactivada a través de la

recombinación.

13

Reacción en Cadena de la Polimerasa para amplificar el ADN (PCR)

Permite amplificar los fragmentos de ADN miles a millones de veces en el transcurso de

unas pocas horas. Puede utilizarse con cantidades pequeñas de ADN original incluso una sola

molécula. La PCR ha revolucionado la biología molecular y es hoy una de las técnicas

moleculares más utilizadas.

La base de la PCR es la replicación catalizada por una ADN polimerasa, que tiene dos

requisitos esenciales: un molde de ADN monocatenario a partir del cual puede copiarse una

nueva cadena de ADN y un cebador al que pueden agregarse los nuevos nucleótidos. Debido a

que una molécula de ADN consta de 2 cadenas de nucleótidos cada una puede servir como

molde para producir una nueva molécula de ADN, la cantidad de ADN se duplica con cada

replicación. El punto de partida de la síntesis de ADN en el molde es determinado por la elección

de los cebadores. Los cebadores utilizados en la PCR son los fragmentos cortos de ADN, de

manera típica de 17 a 25 nucleótidos de longitud, que son complementarios a las secuencias

conocidas en el molde. Para cada cadena se utiliza un cebador diferente.

Para llevar a cabo la PCR se comienza con:

una solución que incluye el ADN blanco (ADN por ser amplificado),

la ADN polimerasa,

los cuatro desoxirribonucleósidos trifosfatos

los cebadores que son complementarios a las secuencias cortas en cada cadena

de ADN blanco

los iones magnesio y otras sustancias que son necesarias para que se produzca la

reacción.

Una reacción en cadena de la polimerasa incluye 3 pasos:

Paso 1: una solución de ADN se calienta entre 90ºC y 100ºC para romper los puentes de

hidrógeno entre las dos cadenas de nucleótidos y producir así los moldes monocatenarios

necesarios. La mezcla de la reacción se mantiene a esta temperatura durante sólo uno o

dos minutos.

Paso 2: la solución de ADN se enfría con rapidez a una temperatura entre 30ºC y 65ºC y se

mantiene así durante un minuto o menos. Los cebadores se adhieren a sus secuencias

complementarias en las cadenas molde.

Paso 3: la solución se calienta entre 60ºC y 70ºC, temperatura a la cual la ADN polimerasa

puede sintetizar cadenas nuevas de ADN mediante el agregado de nucleótidos a los

cebadores. En el transcurso de unos pocos minutos se producen dos moléculas nuevas de

ADN bicatenario por cada molécula original de ADN.

Luego se repite cada ciclo completo. Con cada ciclo, la cantidad de ADN se duplica; de

modo que éste aumenta en forma geométrica. Una molécula de ADN aumenta a más de 10.000

14

moléculas en 10 ciclos de PCR, a más de un millón de moléculas en 20 ciclos y a más de mil

millones de moléculas en 30 ciclos. Cada ciclo se completa en el término de unos pocos minutos;

por tanto, en unas pocas horas se obtiene una amplificación grande de ADN.

Figura 11. Pasos de la PCR

Dos innovaciones importantes facilitaron el uso de la PCR:

El descubrimiento de la ADN polimerasa que es estable a las temperaturas elevadas

(polimerasa Taq).

El desarrollo de cicladores térmicos automatizados, es decir, máquinas que provocan los

cambios de temperaturas rápidos requeridos para los diferentes pasos de la PCR.

En la actualidad la PCR se utiliza con frecuencia en lugar de la clonación génica, pero

tiene varias limitaciones. El uso de PCR requiere el conocimiento previo de parte de la secuencia

del ADN para permitir la construcción de cebadores. Otra limitación es que el tamaño de los

fragmentos que pueden amplificarse por la polimerasa Taq estándar suele ser menor de 2000 pb.

A pesar de sus limitaciones la PCR se utiliza habitualmente en una amplia gama de aplicaciones

moleculares.

5

15

SECUENCIACION

SECUENCIACIÓN DEL ADN

En cierto sentido, un ADN clonado o no, no está

completamente caracterizado hasta que se conoce su

secuencia nucleotídica. La capacidad de secuenciar ADN ha permitido grandes avances en el

conocimiento de la organización del genoma y de los genes, incluyendo su estructura, función y

mecanismos de regulación.

Los primeros métodos para la secuenciación rápida de ADN se desarrollaron entre 1975 y

1977. Frederick Sanger y col. crearon el método de secuenciación dideoxi basado en la

elongación del ADN; Allan Maxam y Walter Gilbert desarrollaron un

segundo método basado en la degradación química del ADN. El

método de Sanger se convirtió con rapidez en el procedimiento

estándar para la secuenciación de cualquier fragmento purificado

de ADN.

Método químico de Maxam y Gilbert

Un fragmento de ADN se marca radioactivamente en sus extremos con gamma 32P ó

gamma 32S dATP por acción de la polinucleótido quinasa. La técnica consiste en romper estas

moléculas marcadas con reacciones químicas específicas para cada una de las cuatro bases.

Cuatro alícuotas de la misma muestra se tratan bajo condiciones distintas, posteriormente el

tratamiento con piperidina rompe la molécula de ADN a nivel de la base modificada.

Los productos de estas cuatro reacciones se resuelven en función de su tamaño en geles

de poliacrilamida donde la secuencia puede leerse en base al patrón de bandas radioactivas

obtenidas. Esta técnica permite la lectura de unas 100 bases de secuencia.

16

Base nitrogenada

Figura 12. Método químico de

Maxam y Gilbert.

Método enzimático de Sanger

En este método se utilizan pocos reactivos tóxicos y cantidades menores de radioactividad

que en el método de Maxam-Gilbert, y su característica particular es el uso de

didesoxinucleótidos trifosfato (ddNTPs) como

terminadores de la cadena de ADN. Los ddNTPs

son desoxinucleótidos de los 4 nucleótidos

diferentes (dATP,dTTP, dCTP y dGTP) que carecen

de uno de los grupos hidroxilo, de manera que

cuando uno de estos nucleótidos se incorpora a

una cadena de ADN en crecimiento, esta

cadena no puede continuar elongándose ya que la enzima ADN polimerasa necesita un extremo

3’ OH para añadir el siguiente nucleótido, y el ddNTP, marcado en forma radioactiva o química,

incorporado carece de este grupo hidroxilo. Al terminar la elongación de la cadena, se producen

varios fragmentos de ADN de longitud variable, los cuales son desnaturalizados por calor y

separados por tamaño (con una resolución de un solo nucleótido) mediante electroforesis en gel

17

de poliacrilamida - urea. Cada una de las cuatro reacciones de síntesis se corre en calles

individuales (A, T, G y C) y se visualizan las bandas de ADN mediante autorradiografía o luz

ultravioleta. Las bandas obtenidas en el gel corresponden a los fragmentos de ADN de diferentes

longitudes

Una banda en una calle indica un fragmento de ADN que es el resultado de una

terminación de la cadena tras la incorporación de un didesoxinucleótido (ddATP, ddGTP, ddCTP o

ddTTP). El nucleótido terminal puede ser identificado de acuerdo al didesoxinucleótido que se

añadió en la reacción que dio lugar a esa banda. Las posiciones relativas entre las cuatro calles

se utilizan entonces para leer la secuencia de ADN.

ADN

monocatenario que

debe ser

secuenciado

Los cuatro

ddNTP

Secuencia de la cadena

obtenida complementaria Secuencia de la cadena

molde original

Autorradiograma de la electroforesis en gel

Figura 13. El método de

didesoxi de secuenciación

de ADN se basa en la

terminación de la síntesis de

ADN.

18

Secuenciación automática de Sanger

Durante muchos años, la secuenciación del ADN se realizó sobre todo en forma manual y

era una técnica laboriosa y costosa. En la actualidad, la secuenciación se lleva a cabo mediante

aparatos automatizados que utilizan colorantes fluorescente y escáneres de láser para los miles de

secuencias de pares de bases en unas pocas horas.

Figura 14. Esquema de la secuenciación por el método automático de electroforesis capilar con la secuencia

obtenida.

Los ddNTP utilizados en la reacción automatizada se marcan cada uno con un colorante

fluorescente distinto. Las cuatro reacciones pueden tener lugar en el mismo tubo de ensayo y

pueden colocarse en el mismo pocillo durante la electroforesis, dado que cada dNTP se marca en

forma distintiva. Los aparatos de secuenciación recién desarrollados llevan a cabo la electroforesis

en tubos capilares que contienen gel. Los fragmentos de diferentes tamaños producidos por la

reacción de secuenciación se separan dentro de un tubo y al migrar pasan por delante de un haz

de láser y un detector.

Cuando los fragmentos pasan por el láser, sus colorantes fluorescentes se activan y la

fluorescencia resultante se detecta por un escáner óptico. Cada colorante emite fluorescencia de

una longitud de onda característica que se lee en el escáner óptico. Para la interpretación, la

información ingresa en una computadora y los resultados se imprimen como un conjunto de picos

19

en un gráfico (Fig. 14). Los aparatos de secuenciación automatizados pueden contener 96 tubos

capilares o más, lo que permite leer secuencias de 50.000 a 60.000 pb en unas pocas horas.

Secuenciación automática en geles desnaturalizantes de acrilamida/bisacrilamida

La secuenciación automática mediante geles desnaturalizantes, se realiza polimerizando

un gel de acrilamida/bisacrilamida entre dos cristales montados adecuadamente sobre el

cassette que sirve de soporte para los mismos y que posteriormente se acoplará en el

secuenciador automático para proceder a la carga de la muestras.

El número de muestras que podemos cargar en cada gel, viene determinado por el

número de pocillos que posee el peine (de dientes de tiburón) que utilicemos. Hay peines de

cuatro tamaños distintos: de 36, 48, 64 y 96 pocillos.

La electroforesis se desarrolla durante 7 horas, y se puede realizar una lectura de unos

700pb aproximadamente, dependiendo siempre de la calidad del ADN, de la correcta

cuantificación del mismo, de la utilización del “primer” adecuado, y de la polimerización correcta

del gel de acrilamida/bis principalmente.

Cuando las muestras a secuenciar tienen una longitud no superior a 400pb, podemos

disminuir el tiempo de la electroforesis a 3.5 horas, aumentando la velocidad de barrido del laser, y

el resultado es igualmente optimo.

Figura 15. Esquema de los geles desnaturalizantes.

Secuenciadores automáticos capilares

Existen instrumentos de electroforesis capilar que proporcionan una alternativa al sistema

basado en geles de acrilamida/bisacrilamida donde el soporte ha sido sustituido por un polímero

que se inyecta de forma automática en un capilar antes de cargar la muestra a secuenciar; las

muestras se van analizando una a una. Este tipo de secuenciadores se utiliza para lecturas no

superiores a unos 450pb.

20

El equipo funciona de forma completamente automática inyectando las muestras (que se

preparan exactamente igual que durante la secuenciación en geles y se colocan en una placa

de 96 pocillos), en un capilar previamente cargado con un cierto polímero que funciona como lo

hace la matriz de acrilamida-bisacrilamida-urea de los geles de secuencia, permitiendo resolver

fragmentos de ADN de cadena sencilla que se diferencian en una única base.

A una altura determinada el laser detecta la fluorescencia emitida por cada cadena

sencilla de ADN fluorescente y traduce esta emisión de fluorescencia en la secuencia

correspondiente. Una vez desarrollada la electroforesis de la primera muestra, el capilar se vacía

rellenándose nuevamente con polímero fresco. Se inyecta a continuación una segunda muestra,

se procede a desarrollar nuevamente la electroforesis y así sucesivamente.

Figura 16. Secuenciador ABI Prism 310

LAS PRINCIPALES VENTAJAS DE ESTOS NUEVOS EQUIPOS SON:

Automatización completa de todo el proceso, no siendo necesaria siquiera la presencia

de un técnico que cargue las muestras en los diferentes capilares del equipo.

Rapidez en el análisis de cada muestra: dado el pequeño diámetro de los capilares, se

pueden aplicar voltajes mayores que en los geles de acrilamida:bisacrilamida:urea, por lo

que pueden leerse del orden de 450 nucleótidos en el plazo de una hora mientras que esta

misma longitud de secuencia necesita unas 2-4 horas en un secuenciador en gel.

El tiempo necesario del proceso es, para la polimerización del mismo, unas dos horas y

para la preelectroforesis, una hora aproximadamente.

21

Corte de ADN

con enzima de

restricción

Introducción del

plásmido

recombinante a

la bacteria

SECUENCIACIÓN DE TODOS LOS GENES DEL GENOMA

El genoma o secuencia completa de ADN de un organismo constituye la información

genética heredable de un organismo.

Secuenciar es determinar el orden en que se enlazan las bases de dicha secuencia. Ese

trozo de ADN puede corresponder a un gen, un genoma, o a una parte de ellos. Los avances de

las técnicas de secuenciación del ADN permiten hoy en día leer el ADN a gran velocidad lo que

ha llevado a abordar proyectos a gran escala como el Proyecto Genoma Humano. Además se

dispone ya de la secuencia completa de ADN de muchos genomas de animales, plantas y

microorganismos.

Se usan dos métodos diferentes para secuenciar genomas:

A- Método clon a clon

B- Método Hierarchical Shotgun Sequencing (secuenciación de la perdigonada jerárquica) y

Shotgun Sequencing (secuenciación de la perdigonada).

A- Método clon a clon:

Se realiza la construcción de una biblioteca con fragmentos clonados que incluyen el ADN de

todo el genoma de un organismo, que luego se ensamblan en mapas genéticos y físicos.

Figura 17. Estrategia general para clonar un gen.

Un trozo de ADN es manipulado con enzimas de

restricción e introducido en un plásmido el cual a

su vez es introducido en una bacteria. Al cultivar la

bacteria se obtienen múltiples copias del ADN de

interés.

El clonado se realiza con distintos tipos

de enzimas de restricción y vectores: Las

enzimas de restricción son proteínas aisladas

de bacterias cuya función es cortar ADN.

Cada enzima reconoce un sitio particular del

ADN, es decir que reconoce una secuencia

particular de nucleótidos. Esa secuencia

específica se denomina “sitio de restricción”.

Una vez que la enzima reconoce estos sitios,

se posiciona sobre la molécula de ADN y

corta dentro o en torno de esa secuencia.

22

Cortes con extremos romos Cortes con extremos cohesivos

Figura 18. Las enzimas según el

corte se clasifican en: Enzimas que

generan “extremos romos” y

Enzimas que generan “extremos

cohesivos”.

Los vectores son moléculas transportadoras que transfieren y replican fragmentos

de ADN que llevan insertados. Para que sirva de vector, una molécula debe ser capaz de

replicarse junto con el fragmento de ADN que transporta. También tiene que tener secuencias de

reconocimiento que permitan la inserción del fragmento de ADN a clonar.

Para insertar un fragmento de ADN al vector, se utiliza una enzima de restricción, y se

mezcla con fragmentos de ADN producidos con la misma enzima.

Los vectores que transportan un fragmento insertado se denominan vectores

recombinantes.

Hay muchos vectores de clonación, que es una molécula de ADN replicante y estable a la

cual puede adherirse un fragmento de ADN extraño para la introducción en una célula. Difieren

en la especificidad de la célula huésped, el tamaño de los insertos que pueden transportar y en el

número de copias que producen y el número y tipo de genes marcadores que contienen.

Tipos de Vectores:

Vectores procariotas:

1. Plásmidos: (ADN episómico). Para secuencias cortas de 10.000 bases (10 Kb). Son circulares y

existen naturalmente en las bacterias. Contienen orígenes de replicación y pueden por eso

replicarse independientemente del cromosoma bacteriano.

Figura 19. pUC19 vector plásmido típico de clonación.

El método de inserción más sencillo es a

través de las enzimas de restricción.

Un segundo método para insertar ADN en un

plásmido es mediante una cola homopolimérica o

tailing donde se crean extremos cohesivos

complementarios sobre las piezas del ADN con

http://es.wikipedia.org/wiki/Mol%C3%A9cula

http://es.wikipedia.org/wiki/%C3%81cido_desoxirribonucleico

http://es.wikipedia.org/wiki/Clonaci%C3%B3n

http://es.wikipedia.org/wiki/Enzima_de_restricci%C3%B3n

http://es.wikipedia.org/wiki/C%C3%A9lula

http://es.wikipedia.org/wiki/Gen

23

extremos romos. Primero, se corta el plásmido y el ADN extraño con una enzima de restricción. Si la

enzima de restricción produce extremos cohesivos, estos se eliminan por una enzima que digiere el

ADN monocatenario. De manera alternativa el plásmido y el ADN extraño pueden cortarse por

una enzima de restricción que produce extremos romos. Una vez que el plásmido y el ADN extraño

tienen extremos romos, los extremos cohesivos monocatenarios son agregados por una enzima

transferasa terminal.

Un tercer método de inserción de fragmentos consiste en utilizar la enzima ligasa T4, capaz

de conectar dos piezas cualquiera de extremos romos de ADN y se denomina clonación

mediante el uso de conectores.

Una vez insertado el plásmido debe introducirse en las células bacterianas. Esta tarea suele

cumplirse mediante la transformación y que es la capacidad de las bacterias de captar el ADN

del ambiente externo. Muchas veces la transformación es un proceso natural, y otros deben

tratarse en forma química o física previamente. Los plásmidos dentro de la célula se replican y

multiplican.

2. Bacteriófagos: (gran capacidad para invadir bacterias, se utiliza para ADN complementario y

genómico). Ofrecen ciertas ventajas y el más común es el bacteriófago λ que infecta E. Coli. Una

de sus ventajas es la elevada eficiencia para transferir el ADN a las bacterias. Una segunda

ventaja es que cerca de la tercera parte del genoma λ no es esencial para la infección ni para la

reproducción. Estos genes no esenciales que comprenden alrededor de 15 Kb pueden ser

reemplazados por hasta 23 Kb de ADN extraño. El ADN extraño cortado con EcoRI tendrá

extremos cohesivos que son complementarios con los de los extremos de los genes λ esenciales, a

los cuales puede conectarse mediante la ligasa. El cromosoma λ posee extremos monocatenarios

cortos denominados sitios cos, necesarios para empaquetar en ADN λ dentro de la cabeza de un

fago. Los cromosomas del fago recombinante pueden entonces empaquetarse en la cubierta

proteica y agregarse a E. coli. Los fagos inyectan su ADN recombinante dentro de la célula,

donde se replicará. Sólo los fragmentos de ADN de tamaño adecuado y que contienen genes

esenciales se empaquetarán en las cubiertas del fago.

3. Cósmidos: Los cósmicos combinan las propiedades de los vectores plásmidos y los fagos. Los

fragmentos de ADN grandes de 44 Kb pueden clonarse en cósmicos.

Los cósmicos son plásmidos pequeños que contienen los sitios cos del fago λ; pueden

empaquetarse con las cubiertas virales y transferirse a las bacterias por infección viral. Dado que

se pierden todos los sitios virales menos los sitios cos, un cósmico puede tener más del doble del

ADN extraño que puede transportar el fago vector.

24

El ADN extraño es insertado en los cósmicos del mismo modo que se introduce en los plásmidos.

Figura 20. Vector cósmido.

4. Vectores de expresión: Muchas veces es interesante no solo replicar el gen si no también

producir la proteína que codifica. Uno de los primeros productos comerciales elaborados por

tecnología recombinante fue la proteína insulina. La expresión exitosa es un tema difícil sobre todo

las secuencias que regulan la trascripción y la traducción son diferentes en las bacterias y en los

eucariontes. Para solucionar este problema suele insertarse un gen extraño en un vector de

expresión que, además del origen de replicación, los marcadores seleccionables y los sitios de

restricción, contienen secuencias requeridas para los procesos mencionados.

Vectores eucariotas:

Figura 21. Puede insertarse

un gen extraño en un vector

de expresión; en este

ejemplo un vector de

expresión E. coli.

25

1. YACs: (cromosoma artificial de levadura). Es un material bastante inestable. Para secuencias

de hasta 1 Mb (1000 Kb o 1 millón de bases). Son moléculas de ADN con un origen de replicación

de levadura, que permite que se replique, un par de telómeros que garantizan estabilidad dentro

de la célula y un centrómero.

Figura 22. Vector YAC

2. BAC: Cromosoma artificial de bacterias. Se utilizan para clonar segmentos grandes desde 100

a 500 Kb (100.000 bases a 500.000 bases).

Figura 23. Vector BAC. Cromosoma artificial de

bacteria con distintos sitios de corte de enzimas

de restricción.

El ADN clonado en los BACs es por lo general más pequeño que los YACs. Sin embargo, los

BACs ofrecen ventajas importantes como por ejemplo, son más manipulables para ciertos tipos de

26

Una biblioteca genómica es un

conjunto de clones, cada uno de los

cuales contiene un fragmento de un

genoma de un organismo dado.

Las bibliotecas genómicas se

consiguen clonando los fragmentos

en vectores.

estudios en el laboratorio. Los BACs se usan a gran escala para construir mapas físicos de alta

resolución de los cromosomas, con el fin de establecer la secuencia completa del genoma.

PAPEL DE LA CLONACIÓN GÉNICA

La manipulación y el análisis de los genes con tecnología de ADN recombinante requiere

copias múltiples de las secuencias de ADN utilizadas. La clonación fue un requisito previo para

muchos métodos moleculares, En la actualidad los métodos de amplificación del ADN han

obviado la necesidad de la clonación, aunque sigue siendo muy utilizada para crear secuencias

de genes novedosos y para otras manipulaciones.

¿Como encontrar la secuencia de ADN para ser clonada?

Dado que en una célula puede haber millones de pares de bases de ADN es necesario

clonar para encontrar un gen. Este enfoque clonar primero y buscar después, se denomina

clonación de fragmentos escogidos al azar (Shotgun). Primero se clona un número grande de

fragmentos en conocimiento de que uno o más tienen el ADN de interés y entonces se busca el

fragmento entre los clones. La colección de clones que

contiene todos los fragmentos de ADN provenientes de

una fuente se denomina genoteca o biblioteca

genómica.

Para crear una genoteca genómica se recolectan

las células y se rompen. Así se produce la liberación de

ADN. Este se puede aislar por diferentes métodos. Uno de

ellos utiliza fenol. Una vez extraído el ADN se corta el ADN

con enzimas de restricción y debido a que los sitios de corte son al azar las moléculas de ADN se

cortan en lugares diferentes y se producirán fragmentos superpuestos. Estos se unen a vectores

que pueden transferirse a las bacterias. Esta técnica produce un conjunto de células bacterianas

o bacteriófagos que contienen los fragmentos genómicos superpuestos. Una genoteca puede

contener un número importante de clones para garantizar que todas las secuencias de ADN estén

representadas.

B- Método Hierarchical Shotgun Sequencing (secuenciación de la perdigonada

jerárquica) y Shotgun Sequencing (secuenciación de la perdigonada)

El método de Hierarchical Shotgun Sequencing fue propuesto por James Watson y Francis

Collins, entre otros, contando con la mayor parte de la financiación pública.

Esta metodología resulta la más compleja, con un conocimiento más exhaustivo del

genoma. Básicamente consiste en secuenciar el genoma completo, cromosoma a cromosoma de

27

1 2

un extremo al otro. Se hacen 2 o 3 fragmentos del ADN (fragmentos cortos de 2 Kb, fragmentos de

15-20 Kb y también se pueden hacer fragmentos de 200-300 Kb).

Luego se construye una biblioteca genómica con cada preparación con la utilización de

vectores BAC. Se seleccionan y secuencian clones al azar de estas bibliotecas. Luego se utiliza un

programa para ensamblar y superponer largos tramos de secuencia a partir de los fragmentos

cortos, usando las secuencias de los clones más largos como marco de referencia.

Figura 24. Representación esquemática de la estrategia de secuenciación utilizado por 1. El Proyecto

Genoma Humano financiado con fondos públicos y 2. Por Celera genomics.

El método de Shotgun Sequencing desarrollado por Craig Venter bajo la financiación de

“Celera Genomics” y otras compañías biotecnológicas privadas, emplearían una segunda

técnica, más práctica. Consistiría en la secuenciación de ¨genes expresados¨ en las células

diferenciadas en las que se encuentran activos, partiendo de los ARNm resultantes de su

traducción.

El método Shotgun Sequencing es más rápido y menos costoso, pero es más propenso a los

errores debidos a un montaje incorrecto de la secuencia final.

Hasta el momento se han secuenciado 180 eucariotas (17 mamíferos, 3 especies

de aves, 2 anfibios, 4 especies de peces, 24 especies de insectos, plantas, etc.) y

17 están en proyecto borrador. También se han secuenciado 2149 bacterias.

(Información Marzo 2013)

Fuente http://www.genome.jp/kegg/catalog/org_list.html.

http://www.genome.jp/kegg/catalog/org_list.html

28

Tabla 1. Ejemplos de genomas completos o de borradores de secuencias publicadas.

29

NUEVOS MÉTODOS DE SECUENCIACIÓN

SECUENCIACIÓN DE ALTO RENDIMIENTO

La elevada demanda de secuenciación de bajo costo ha dado lugar a las distintas

tecnologías de secuenciación de alto rendimiento. Estos esfuerzos han sido financiados por

instituciones públicas y privadas así como desarrolladas y comercializadas dentro de la empresa

privada por las compañías de biotecnología. Se pretende que las tecnologías de secuenciación

de alto rendimiento disminuyan los costos de secuenciación de las bibliotecas de ADN más allá de

lo que se puede hacer con el método corriente del terminador marcado basado en la separación

del ADN por electroforesis capilar. Muchos de los nuevos métodos de alto rendimiento usan

métodos que paralelizan el proceso de secuenciación, produciendo miles o millones de

secuencias a la vez.

Figura 25. Evolución de las tecnologías de alto rendimiento. ABI-3730 de Applied Biosystems, posiblemente el

más utilizado en la secuenciación del genoma Humano, con una capacidad de 1 Mb por día (Un millón de

bases). El AB-SOLID actual, en menos de 10 años ha multiplicado por 1000 la capacidad de secuenciación.

30

Amplificación clonal in vitro

Ya que los métodos de detección molecular frecuentemente no son lo suficientemente

sensibles para la secuenciación de una sola molécula, la mayoría de los métodos utilizan un paso

con clonación in vitro para generar muchas copias de cada molécula individual. Uno de los

métodos es la PCR de emulsión, en la que se aíslan las moléculas individuales de ADN junto con

microesferas recubiertas con cebadores en burbujas acuosas dentro de una fase oleosa.

Posteriormente una PCR recubre cada microesfera con copias clonales de la biblioteca de

moléculas aisladas y seguidamente se inmovilizan para ser más tarde secuenciadas. La PCR de

emulsión (Fig. 26) se usa en los métodos publicados por Margulis y colaboradores (comercializado

por 454 Life Sciences, adquirido por Roche), Shendure y Porreca et al. (conocido como

"secuenciación polony ", término formado por polimerasa "pol" y colonia "colony"), y la

secuenciación SOLiD (desarrollada por Agencourt y adquirida por Applied Biosystems). Otro

método para la amplificación clonal in vitro es la "PCR de puente", en la que los fragmentos se

amplifican a partir de los cebadores unidos a una superficie sólida, desarrollados y usados por

Solexa (de la que ahora es propietaria la empresa Illumina) (Fig. 27). Estos métodos producen

ambos muchas localizaciones físicamente aisladas que contienen cada una muchas copias de un

solo fragmento. El método con una única molécula desarrollado por el laboratorio de Stephen

Quake (y más tarde comercializado por Helicos) se salta este paso de amplificación, fijando

directamente las moléculas de ADN a una superficie.

Figura 26. Emulsión de PCR. Una molécula de ADN por perla. La amplificación clonal de miles de copias se

produce en microrreactores en una emulsión.

http://es.wikipedia.org/wiki/Reacci%C3%B3n_en_cadena_de_la_polimerasa

http://es.wikipedia.org/wiki/Secuenciaci%C3%B3n_454

http://es.wikipedia.org/wiki/Applied_Biosystems

http://en.wikipedia.org/wiki/Illumina_(company)

31

1 2

Figura 27. Amplificación en fase sólida. Una molécula de ADN por Cluster.

Secuenciación paralelizada

Una vez que las secuencias clonales de ADN se localizan físicamente en posiciones

separadas de la superficie, se pueden utilizar varios métodos de secuenciación para determinar

las secuencias de ADN de todas las localizaciones en paralelo.

Figura 28.Terminación reversible. 1. Illumina/Solexa; 2. Helicos BioSciences.

32

La "secuenciación por síntesis", como en la popular secuenciación electroforética con

terminador marcado con colorante, usa el proceso de síntesis de ADN por ADN polimerasa para

identificar las bases presentes en la molécula complementaria de ADN. Los métodos de

terminador reversible (usados por Illumina y Helicos) utilizan versiones reversibles de terminadores

marcados con colorante, añadiendo un nucleótido cada vez, y detectando la fluorescencia

correspondiente a esa posición y removiendo posteriormente el grupo de bloqueo para permitir la

polimerización de otro nucleótido.

La Pirosecuenciación (utilizada por

Roche/454) también usa la polimerización

del ADN para añadir nucleótidos,

añadiendo cada vez un tipo diferente y

después detectando y cuantificando el

número de nucleótidos añadidos a una

determinada localización a través de la luz

emitida por la liberación de los pirofosfatos

unidos a ellos.

Figura 29. Roche/454. Pirosecuenciación.

La "secuenciación por ligación" es otro método enzimático de secuenciación que emplea

una ADN ligasa en lugar de una polimerasa para identificar la secuencia objetivo. Se usa en el

método polony y en la tecnología SOLiD que ofrece Applied Biosystems. Este método utiliza un

http://es.wikipedia.org/wiki/ADN_polimerasa

http://es.wikipedia.org/wiki/Pirosecuenciaci%C3%B3n

http://es.wikipedia.org/w/index.php?title=Secuenciaci%C3%B3n_por_ligaci%C3%B3n&action=edit&redlink=1

http://es.wikipedia.org/wiki/ADN_ligasa

33

reservorio de todos los oligonucleótidos posibles de una longitud dada, marcados de acuerdo con

la posición secuenciada. Los oligonucleótidos se templan y ligan; el ligamiento preferente de las

ADN ligasas por su secuencia específica produce una señal correspondiente a la secuencia

complementaria en esa posición concreta. Shendure et al., usaron este método para secuenciar

el genoma de E. coli MG1655.

Figura 30. Life/APG. Secuenciación por Ligación.

34

Real Time (Secuenciación en Tiempo Real)

Es un nuevo método de tecnología que está llevando adenlante Pacific Biosciences. En

esta técnica, los nucleótidos no detienen el procesos de síntesis de ADN. La secuenciación en

tiempo real implica una imagen continua de la incorporación de los nucleótidos marcados

durante la síntesis de ADN.

En la plataforma de Pacific Biosciences moléculas individuales de ADN polimerasa están

unidos a la parte inferior de detectores individuales (ZMW detectors) obteniendo información

mientras los nucleótidos son fosforilados mientras el cebador va traduciendo.

Otros enfoques han propuesto mejorar la relación de mediciones señal-ruido en la

secuenciación en tiempo real con esquemas de detección más convencionales.

Por ejemplo, Life/Visiten ha diseñado ADN polimerasas que se adjunta con un colorante

fluorescente para producir una señal mejorada por la energía de resonancia de fluorescencia

Figura 31. Pacific BioSciences. Secuenciación en Tiempo Real.

Genoma de enriquecimiento

A pesar de las reducciones de costes sustanciales asociados con tecnologías NGS (Next

Generation Sequencing) en comparación con el método automatizado de Sanger, la

secuenciación del genoma completo es todavía un esfuerzo costoso. Una solución provisional a

este problema puede ser el uso de plataformas de NGS para apuntar a regiones de interés

específicas. Esta estrategia se puede utilizar para examinar todos los exones en el genoma, genes

específicos de las familias que constituyen dianas farmacológicas conocidas o las regiones que

están implicados en enfermedades o en efectos farmacogenéticos.

35

El concepto de focalización de regiones específicas del genoma está bien establecido,

con la PCR es el más ampliamente utilizado, aunque en una escala pequeña. PCR acoplado con

secuenciación de Sanger está adecuadamente emparejado para analizar unos cuantos

candidatos genes, pero el acoplamiento de la PCR con las plataformas NGS de alto rendimiento

no es práctico porque la preparación de la muestra requeriría el manejo de decenas de miles de

cebadores de forma individual o en grupos multiplex.

Un artículo de Frazer y sus colegas en colaboración con RainDance Technologies (2009)

informaron la amplificación simultánea de 3.976 productos que utilizan tecnologías de microgotas

PCR.

La producción de grandes cantidades a bajo costo hace que las plataformas de NGS

descritas anteriormente sean útiles para muchas aplicaciones. Estos incluyen el descubrimiento de

la variante por resecuenciación de regiones específicas de interés o genomas en su totalidad, el

asamblado de novo de bacterias y de genomas eucariotas menores, la catalogación de los

transcriptomas de células, tejidos y organismos (ARN-seq), los perfiles en todo el genoma de las

marcas epigenéticas y la estructura de la cromatina usando métodos basados en la seq (CHIP-

seq, metil-seq y ADNsa-seq) y la clasificacion de especies y el descubrimiento de genes pora

estudios de la metagenómica.

Por ejemplo, las plataformas Illumina/Solexa y LIfe/APG son variantes muy adecuadas para

el descubrimiento de resecuenciación de genomas humanos, porque se producen por ciclo

volúmenes gigantescos de bases de alta calidad.

Además, la plataforma, Helicos BioSciences es muy adecuado para aplicaciones que

exigen información cuantitativa de ARN o ARN seq.

El rápido ritmo de los avances tecnológicos en el campo podría cambiar esta información

en un futuro próximo.

Genomas individuales

Los estudios del genoma humano tienen por objeto un catálogo de SNVS (variante de un

simple nucleótido) y la SVS (variantes estructurales) y su asociación a diferencias fenotípica, con el

objetivo final de personalizar la genómica con fines médicos. En 2004, el Consorcio Internacional

de Secuenciación del Genoma Humano publicó la primera, y todavía única, referencia terminada

del genoma humano (actualmente Centro Nacional de Biotecnología de la Información: NCBI). Su

costo fue estimado en US $300 millones.

La genómica individual también está siendo aplicada al estudio de la enfermedad. Por

ejemplo, Mardis et al., reportaron la secuencia de dos genomas del cáncer de leucemia mieloide

agudo mediante la plataforma Illumina/Solexa, y ambos estudios, identificaron mutaciones

somáticas que pueden ser asociada con la enfermedad. Gibbs et al., describieron recientemente

36

la elucidación de las dos variantes alélicas en una familia con una forma recesiva de la

enfermedad de Charcot-Marie-Tooth utilizando la plataforma Life/APG.

Varios proyectos destinados a la secuenciación de más individuos, incluyendo el “Atlas del

genoma del cáncer” y “El proyecto de 1000 Genomas”, también están utilizando las plataformas

Illumina/Solexa y Life/454 para secuenciar genomas enteros.

En comparación con la secuenciación automatizada de Sanger, las plataformas de NGS

han aumentado dramáticamente el rendimiento y redujo sustancialmente los gastos, con varios

grupos presentando informes de costos de reactivos por debajo de $100.000. Sin embargo, existe

una gran variabilidad entre y dentro de plataformas NGS en términos de tamaño del molde y

construcción, largo de lectura, rendimiento y la base y la cobertura del genoma, y dicha

variabilidad hace que sea difícil evaluar la calidad (es decir, la precisión de la cobertura del

genoma y continuidad del genoma) de los genomas basado en consideraciones de costo.

En junio de 2009, Illumina anunció la secuenciación del genoma individual por el precio de

US$ 48.000. Complete Genomics ofrece un servicio similar a un precio de US$ 5.000. Sin embargo, el

logro del ahorro de los costos también puede venir con una disminución de la calidad de la

información.

Las tecnologías de NGS tienen una impresionante gama de aplicaciones, y actualmente se

están desarrollando aún más. Además de las aplicaciones descritas anteriormente, las tecnologías

de NGS están siendo utilizadas para caracterizar las relaciones evolutivas de genomas antiguos y

para dilucidar el papel de secuencias no codificantes en la salud y enfermedades. En un futuro no

muy lejano, es previsible que las tecnologías de NGS pudieran ser utilizadas para obtener datos de

alta calidad a partir de la secuencia un genoma aislado de una sola célula, lo que sería un

avance importante, sobre todo para la genómica del cáncer. Para que esto ocurra, serán

necesarios avances en las técnicas, para aislar eficazmente largas moléculas de ADN intactas, y

en los métodos, para la lectura precisa de la secuencia. El campo del desarrollo de NGS y las

aplicaciones es un área de rápido movimiento de la investigación, que hace de este un momento

emocionante para los estudios genómicos.

Análisis de las secuencias de ADN

Además de la clonación y amplificación las técnicas moleculares se utilizan para analizar

las moléculas de ADN mediante la secuenciación.

Secuenciación del ADN: una técnica poderosa que surge de la tecnología del ADN recombinante

es la capacidad de secuenciar con rapidez las moléculas de ADN. La secuenciación consiste en

determinar la secuencia de bases, permite leer la información brindando información acerca de

la estructura y función de los genes.

37

Aplicaciones de la tecnología del ADN recombinante

Además de proporcionar información valiosa sobre los genes la Tecnología del ADN

recombínate tiene numerosas aplicaciones como la elaboración de productos farmacéuticos

(insulina), y otras sustancias, bacterias especializadas (como producción de etanol a partir de

plantas), plantas y animales de granja diseñados por ingeniería genética y para corregir defectos

genéticos humanos. Algunos fármacos oligonucleótidos (secuencias cortas de ADN sintético o de

ARN pueden utilizarse para tratar enfermedades (terapia génica). Los oligonucleótidos antisentido

son complementarios a los ARN no deseados, como el ARN viral. Cuando se agrega a una célula,

estos ADN antisentido se unen al ARNm viral e inhiben su traducción. Varios fármacos han sido

probados para diferentes tratamientos para el cáncer.

También ha permitido el desarrollo de sondas para detectar mutaciones causantes de

enfermedades. Se dispone de la comprobación prenatal para varios centenares de

enfermedades genéticas. Para muchas enfermedades genéticas las únicas pruebas diagnósticas

disponibles son las que identifican una mutación predisponerte en el ADN, pero muchas

enfermedades genéticas son provocadas por varias mutaciones diferentes y derivar en resultados

pueden ser falsos Salvo la completa secuenciación del gen que es costosa no hay manera de

identificar a todos los individuos predispuestos.

En la terapia génica debían primero localizarse los genes causantes de enfermedades y

desarrollarse vectores. Un método de terapia consiste extraer células del cuerpo agregar los virus

con los genes recombinantes e reintroducir las células en el cuerpo del paciente. En este caso los

vectores se introducen directamente.

Figura 32. Evolución de proyectos y publicaciones

38

Generalidades del análisis genómico

Los proyectos genoma generan grandes cantidades de información sobre la secuencia

del ADN. Estos datos son útiles sólo cuando son analizados. Para identificar y caracterizar las

regiones codificantes de los genes de las secuencias anónimas de ADN se necesitan diversos tipos

de análisis mediante la utilización de programas y bases de datos, como por ejemplo:

Asegurar que la secuencia está completa y es precisa.

Identificar los genes encontrando las pautas de lectura abiertas (ORF: Open Reading

Frames). Empiezan con una secuencia de iniciación: ATG y terminan con una secuencia

de terminación: TAA, TAG o TGA.

Encontrar los sitios promotores de inicio de transcripción y de traducción.

Encontrar los sitios de empalme, los intrones y los exones.

Traducir la secuencia de ADN en una secuencia proteica y compararla con otras proteínas

conocidas.

Figura 33. Sitios de empalme,

intrones y exones.

Para asegurar que la secuencia nucleotídica de un genoma está completa y no contiene

errores, el genoma se secuencia más de una vez. Este proceso se denomina compilación.

Una vez secuenciado, compilado y comprobado la exactitud de un genoma, se realiza

una búsqueda de todos los genes que codifican productos (proteínas y ARN) formados por una

pauta de lectura abierta, tripletes nucleotídicos que se pueden traducir en la secuencia

aminoacídica de una proteína. Este es el primer paso de la anotación, el proceso que identifica

los genes, sus secuencias reguladoras y su función o funciones. La anotación también identifica los

genes que no codifican proteínas y encuentra y caracteriza los elementos genéticos móviles y las

familias de secuencias repetitivas.

El objetivo final del análisis de la secuencia es obtener una descripción funcional completa

de todos los genes del genoma de un organismo.

39

GENÓMICA FUNCIONAL

La Genómica Funcional clasifica los genes de las secuencias dilucidadas por la Genómica

Estructural e identifica sus funciones.

Algunos genes pueden tener funciones previamente asignadas mediante los métodos

clásicos de mutagénesis y de cartografía de ligamiento; pero muchos genes no tienen aún una

función asignada.

La genómica funcional es el estudio simultáneo de todos los genes involucrados en un

estado fisiológico determinado o en un tejido en particular.

Permite comprender la organización y los mecanismos genéticos que en conjunto hacen a

la fisiología de un organismo.

La secuencia de nucleótidos de un gen puede utilizarse para predecir la secuencia de

aminoácidos de la proteína que codifica. Entonces, la proteína puede sintetizarse o aislarse y

estudiarse sus propiedades para determinar su función. Sin embargo, este enfoque bioquímico

para la comprensión de la función génica insume tiempo y es costoso. Un objetivo fundamental

de la genómica funcional fue desarrollar métodos informáticos que permitan identificar la función

génica a partir de la secuencia de ADN sola, evitando el proceso laborioso de aislar y caracterizar

las proteínas individuales.

Después de obtener una secuencia genómica, la siguiente tarea es asignar funciones a los

genes de la secuencia. Algunos genes pueden tener funciones previamente asignadas mediante

los métodos clásicos de mutagénesis y de cartografía de ligamiento; pero muchos genes no

tienen una función bien dirigida asignada.

Una aproximación para asignar funciones a estos genes es la utilización de búsqueda de

homología. Este análisis tiene diversos componentes: búsqueda en bases de datos como GenBank

para encontrar genes parecidos aislados en otros organismos, comparar la secuencia de un ORF

con la de un gen bien caracterizado de otro organismo, rastrear el ORF en busca de motivos

funcionales, regiones del ADN que codifican dominios proteicos como canales de iones, regiones

de unión a ADN o señales de secreción/exportación.

Aplicaciones de la genómica funcional

Caracterizar transcriptomas específico de tejidos.

Determinar patrones de expresión génica asociados a procesos celulares tales como

diferenciación, proliferación y muerte celular.

Estudiar las alteraciones en los perfiles de expresión asociados a procesos patológicos

(infecciones; carcinogénesis, etc.)

Efectuar inferencias funcionales de genes escasamente caracterizados.

40

Predecir redes “sociales” de genes estrechamente relacionadas con procesos biológicos

específicos.

Desde el advenimiento de la genómica moderna, se han desarrollado diversas tecnologías

de gran cantidad de datos que permiten a los investigadores analizar las interacciones genéticas

de miles de genes simultáneamente. Estas tecnologías incluyen de ADN y de expresión proteica,

métodos automatizados para el aislamiento y la disección de grandes complejos proteicos y

búsquedas de alcance genómico de sitios de interacción proteína-DNA. Dado que estas técnicas

se basan en la abundancia de datos proporcionados por la terminación de los proyectos de

secuenciación del genoma, a menudo se denominan técnicas de genómica funcional.

Métodos de análisis de la Genómica Funcional o Transcriptómica

Northern Blot

PCR cuantitativa

Hibridación substractiva

Differential display

Microarrays (Microarreglos de ADN)

SAGE

XX-seq: RNA-Seq, Chl-Seq, CVN-Seq.

Northern Blot

Es una técnica para

transferir fragmentos de ARN

desnaturalizados provenientes

de un gel a un medio sólido. El

ARN es separado en un gel de

agarosa, y posteriormente

transferido a una membrana

de nylon. Después de la

transferencia, se agrega una

sustancia marcada para

permitir la visualización de los

genes.

Figura 34. Técnica de Northern Blot.

41

PCR cuantitativa o PCR en tiempo real

Al igual que la PCR convencional, se utiliza un molde de ADN, cebadores específicos, dNTP

y una ADN polimerasa; a esto se le adiciona una sustancia marcada con fluoróforo.

La PCR cuantitativa se realiza en un termociclador con capacidad de hacer incidir sobre

cada muestra un haz de luz de una longitud de onda determinada y de detectar la fluorescencia

emitida por el fluoróforo excitado.

Tabla 2. Diferencias entre PCR convencional y PRC en tiempo real.

PCR en Tiempo Real PCR

Sensibilidad Alta Baja

Especificidad Alta Baja

Resultados Cuantitativos Si – Fluorescentes específicos No

Método de detección Fluorescencia Electroforesis en gel de

agarosa

Rango de detección Amplio rango Pequeño rango

Tiempo de reacción 1 hs 3-5 hs

Pasos Post-PCR No Electroforesis en gel de

agarosa

Contaminación No Si

Hibridación Substractiva y Differential Display

Tanto la hibridación substractiva como el Differential Display son técnicas comparativas

que no requieren conocimiento previo de los genes involucrados pero es necesario el clonado y

secuenciación para la identificación de los genes expresados diferencialmente.

Figura 35. PCR en Tiempo

Real. A diferencia de la

PCR convencional, los

ciclos se observan desde

el inicio.

42

Microarrays, Microarreglos o microordenaciones de ADN (chips de ADN)

Se utilizan para examinar la expresión de miles de genes simultáneamente. Los

microarreglos de ADN son simplemente trozos de vidrio (chips) sobre los que se aplican nuestras de

ADN siguiendo un patrón ordenado, es decir, una ordenación. A menudo estas

microordenaciones son producidas por máquinas automáticas que ponen gotas microscópicas

de muestras específicas de ADN en posiciones específicas del chip. Las muestras de ADN que se

pueden aplicar pueden ser cualquier tipo de ADN clonado, pero a menudo son oligonucleótidos

cortos sintetizados in vitro.

En un microarreglo de ADN se pueden aplicar más de 30.000 muestras diferentes, lo que

representa miles de genes distintos. Teóricamente, todos los genes del genoma de un organismo

pueden estar presentes en un microarreglo, lo que permite el análisis de la expresión genética de

todo el genoma.

Los microarreglos de ADN se pueden usar para comparar los patrones de expresión

genética en dos o más tejidos diferentes, en un mismo tejido en dos momentos diferentes del

desarrollo, o en células normales respecto de enfermas.

1 2

Figura 36. Expresión diferencial de genes.

1-Hibridación substractiva.

2. Differential Display. Se expresan y comparan

como porcentaje muestras de mRNA en el rumen (1)

y abomaso (4) a las 3 y 13 semanas de edad y

adultos (18 - a 20 meses de edad) en ganado

Holstein.

43

Análisis en Serie de la Expresión Génica (SAGE)

Permite conocer y cuantificar la expresión de genes en la célula o tejido mediante la

medición de los ARNm que están presentes en un momento determinado. Esto permite crear

perfiles de expresión de cada célula o tejido en determinadas situaciones. De esta manera se

pueden comparar estos perfiles y determinar que genes están siendo apagados o activados y así

determinar cual puede ser la causa.

La base de esta técnica esta en el uso de “tags” de ADNc que son pequeños fragmentos

de ARNm que han sido transformadas a ADNc. Se parte de una muestra de ARNm y

Figura 37. Microarrays.

3. Transcribe el ARNm en ADN

complementario más estable y añade

etiquetas fluorescentes verde a ADNc

derivado de las células no tratadas, y de

color rojo a los células tratadas.

4. Se aplica la etiqueta de ADNc al chip,

la unión ocurre cuando se encuentra con

una secuencia complementaria de

bases del chip.

5. Se pone el chip en un escáner y

con cálculos computacionales se

estiman las tasas de rojo a verde.

6. Se determina si algún gen respondió

fuertemente a la droga para promover o reflejar

los daños.

1. Se construye o compra un

microarray o chip, que contiene el

ADN de cadena simple que

representa miles de genes

diferentes.

2. Se obtienen dos muestras de

células, luego de aplicar la droga a

una muestra y se recogen las

moléculas de ARNm.

44

aprovechando la característica del ARNm de tener una cola de adeninas en el extremo 3´ (poli

A), se utiliza un soporte con colas de timinas para provocar la unión de los ARNm al soporte. Estas

timinas cumplen la función de primers para poder sintetizar ADNc a partir del ARNm por medio de

una transcriptasa inversa. Se corta el ADNc a una distancia determinada a partir del soporte de

timinas por medio de una enzima de restricción, dejando extremos adhesivos en el sitio de corte.

En el extremo adhesivo se une una molécula llamada “linker” que posee una enzima de

restricción tipo II que corta nuevamente el ADNc, esta vez dejando un extremo romo. Aquí se

obtiene por primera vez un “tag” de ADN (ARNm), unido a las secuencias que han permitido

hibridaciones. Dos tag para formar un “ditag”, es decir, dos tags junto a dos moléculas linkers.

Posteriormente se procede a amplificar por PCR para obtener mayor cantidad de ditags y

favorecer la secuenciación.

Los ditags se cortan con la primer enzima de restricción para eliminar los linkers y dejar a los

ditags puros y con un extremo adhesivo, permitiendo la unión de estos a una gran hebra de ADNc

(ditags) o concatenado de ADNc. Éste concatenado se pasa luego a un vector de clonamiento

para obtener múltiples copias. Por último se procede a secuenciar este concatenado de ditags,

identificando cuantos tags hay en total de cada ARNm, y se procede a identificar qué proteína

codifican, mediante el uso de una base de datos.

Figura 38. SAGE. Luego de la obtención de los ditaq se realiza clonado, secuenciación y análisis

bioinformático.

45

Figura 39. Comparación de las secuencias de los Tag con bases de datos específicas como SAGE Genie

donde ya se encuentran mapeados los tags con sus respectivos genes y permite la identificación y

caracterización de los transcriptos

ARN-Seq

Figura 40. ARN-Seq. Secuenciación de última generación aplicada al análisis de transcriptomas.

46

El ARN-Seq se refiere al uso de la secuenciación de última generación aplicada al análisis

de transcriptomas. Puede realizarse utilizando distintas plataformas: Ilumina, Roche, Solid.

Independientemente de la plataforma utilizada la información obtenida es la misma. Permite

obtener información, por ejemplo, como lo diferentes alelos de un gen se expresan, detectar

mutaciones post-trascriptacional o identificar las funciones de genes. ARN-Seq proporciona una

medición mucho mas precisa de los niveles de transcriptos y sus isoformas que otros métodos.

La secuenciación a gran escala llevada a cabo en los proyectos genoma constituye la

base de partida de la genómica funcional, que tiene como objetivo la caracterización del

proteoma, esto es el conjunto completo de genes que determinan proteínas en un genoma, y la

caracterización de los patrones de expresión génica. En la actualidad se dispone de numerosas

estrategias para identificar el conjunto de genes funcionalmente activos como los microarreglos

de ADN, SAGE y mas recientemente la secuenciación de alto rendimiento.

47

GENÓMICA COMPARATIVA

La Genómica Comparativa, un nuevo campo de la biología que se desarrolla con rapidez,

compara directamente la información genética de un organismo con la de otro. Es un campo con

muchas aplicaciones tanto en ciencia básica como aplicada, incluyendo el descubrimiento de

genes, el desarrollo de organismos modelo para enfermedades humanas y animales, la

elucidación de la historia evolutiva entre los genes, genomas y especies, y la relación entre los

organismos y su ambiente.

La Genómica Comparativa usa una amplia gama de técnicas y recursos, incluyendo la

construcción y utilización de bases de datos que contengan secuencias nucleotídicas y

aminoacídicas, técnicas citogenéticas de cartografía génica como hibridación in situ fluorescente

(FISH), y métodos experimentales, como mutagénesis. La genómica comparativa utiliza estos

recursos para identificar las semejanzas y las diferencias genéticas entre organismos, para

determinar como estas diferencias contribuyen a las diferencias fenotípicas, de ciclo vital, y para

verificar la historia evolutiva de estas diferencias genéticas.

El análisis de un número cada vez mayor de secuencias genómicas confirma que todos los

seres vivos están relacionados y descienden de un ancestro en común. Todos los organismos

utilizan grupos génicos parecidos para realizar las funciones celulares básicas, como la replicación

del ADN, la transcripción y la traducción. A partir de los organismos modelo se pueden comparar

estas funciones básicas para estudiar enfermedades hereditarias y analizar la interacción entre los

genes.

Para estudiar las homologías entre genomas de especies diferentes se usa el pintado

cromosómico comparativo que utiliza sondas marcadas con fluorescencia de una especie e

hibridando sobre los cromosomas de otra especie.

Figura 41. Los genes ortólogos son aquellos

que descienden de un gen ancestral común

que tienen la misma función en diferentes

especies. Las proteínas que surgen a partir de

la duplicación de un único gen se

denominan parálogas.

Definir el número mínimo de

genes para la vida es una tarea que

implica métodos comparativos y

experimentales. La aproximación

comparativa se basa en la premisa que

es probable que los genes compartidos

48

por organismos alejados sean esenciales para la vida. Comparando los conjuntos de genes

compartidos por organismos diferentes sería posible catalogar los compartidos y desarrollar una

lista de genes que se considerarían indispensables para la vida.

Los genes ortólogos son aquellos que descienden de un gen ancestral común que tienen la

misma función en diferentes especies. Así por ejemplo Mycoplasma genitalium comparte 240

genes ortólogos con Haemophilus influenzae además se identificaron 16 genes cuyas secuencias

son diferentes pero realizan la misma función. Mycoplasma genitalium tiene un genoma con 480

genes que codifican proteína, lo que representa el genoma bacteriano mas pequeño de entre los

casi 150 genomas secuenciados hasta la fecha.

Los genes que pertenecen a familias multigénicas comparten secuencias de ADN similares

pero no idénticas como resultado de una mutación en linaje con un único gen ancestral. Sus

productos a menudo son diferentes con funciones parecidas pero sus genes no siempre se

encuentran en una misma localización del cromosoma.

Las familias multigénicas permiten aportan conocimientos sobre la evolución del genoma.

Las proteínas que surgen a partir de la duplicación de un único gen se denominan parálogas. La

familia de la globina es un ejemplo de familia multigénica paráloga que surgió por duplicación y

dispersión a diferentes sitios cromosómicos.

Las familias multigénicas están presentes en muchos genomas. Además de las amplias y

grandes mutaciones de los genes pequeños bloques de genes pueden duplicarse mediante

diversos mecanismos. La filogenia molecular ha trazado el linaje y las relaciones entre los miembros

de las familias génicas. Uno de los ejemplos mejor estudiados de divergencia es la superfamilia

génica de las globinas. En esta familia hace 800 años se produjo la duplicación de un gen

ancestral que codificaba a una proteína de transporte de oxígeno. De los dos genes generados,

uno evolucionó hasta la mioglobina actual y el otro en el gen de la globina ancestral el que se

duplicó y formó los prototipos de las subfamilias génicas de la α y β globina. Otros patrones se

observan en otras familias génicas las que son intensamente estudiadas en el genoma humano.

Como se observa en la figura 42, en la región media del cromosoma 6 bovino (BTA6) se

han mapeado diferentes QTL asociados a rasgos fenotípicos como producción de leche,

conformación y rasgos funcionales en animales de tambo y composición corporal y crecimiento

en animales de cría. En BTA6, la proporción de los genes de la especie bovina que se han

asignado es relativamente pequeña y se distribuye de manera desigual. Estudios comparativos del

mapeo cromosómico de alta resolución combinados con la información de las secuencias

nucleotídicas pueden ser utilizado para detectar la posición y función, dentro de regiones del

cromosoma, de genes candidatos polimórficos que afectan variables fenotípicas de importancia

económica y fisiológica en bovinos. La alineación comparativa de las secuencias de los

cromosomas ortólogos humanos, de ratón, de gallina y de perro con la secuencia bovina permitió

enriquecer mapas previos del cromosoma BTA6 determinando loci nuevos. Utilizando el análisis de

RH, incluyeron un total de 63 nuevos genes y EST con precisión en relación con la posición de los

49

loci conocidos, por lo tanto, aumentaron la densidad de los genes y ESTs integrados en el mapa

de BTA6.

Figura 42. Mapeo comparativo entre cromosomas de pollo, bovino, humano, ratón y perro.

50

LA PROTEÓMICA

Esta rama se ocupa de Identificar y analizar las proteínas de una célula. El Proteoma define

el conjunto completo de proteínas codificadas por un genoma.

En la mayoría de los genomas secuenciados se desconoce la función de muchos de los

genes recién descubiertos. Muchas veces se le asigna una función por su homología con genes

conocidos. En E coli y S cerevisiae se desconoce la mayor parte de la función de los genes

codificados al igual que en humanos.

A medida que se dispone de más datos de las secuencias de los eucariotas se hace

evidente que su complejidad no esta necesariamente correlacionada con la cantidad de genes.

Por ejemplo Drosophila tiene menos genes que C. elegans pero no es menos complejo que el

nemátodo. La relación entre gen y producto génico es compleja. Los genes pueden tener sitios

múltiples de inicio de la transcripción que produce varios transcriptos distintos. El corte y empalme

alternativo y la edición de las moléculas generan docenas de proteínas diferentes a partir de un

único gen. En humanos se estima que el 40 – 60% producen más de una proteína por ese motivo.

El análisis de la función proteica se ve dificultado por el hecho de que muchas proteínas trabajan

vía interacciones proteína – proteína o como parte integrante de un gran complejo molecular.

La proteómica se utiliza para reconciliar las diferencias entre el número de genes de un

genoma y el número de proteínas (producto final) observadas en la célula. Proporciona

información sobre la función de las proteínas, su estructura, las modificaciones post-

traduccionales, las interacciones proteínicas sus variantes y las relaciones con otras proteínas del

genoma.

La proteómica utiliza técnicas para separar e identificar las proteínas aisladas. La

combinación de técnicas implica un gel de electroforesis bidimensional (2DGE) y espectrometría

de masas. En la primera las proteínas extraídas de una célula se cargan en un gel de

poliacrilamida y se separa según su carga eléctrica. El gel se rota 90º y las proteínas se separan

según su peso molecular. Las modernas técnicas de espectrometría de masas permiten

determinar con precisión la masa de moléculas. Uno de estos métodos se denomina ionización

por láser asistida por matriz (MALDI). Se pueden identificar cientos de proteínas por día y los

bancos de espectrómetros pueden procesar cientos de muestras en un solo día. Nuevos

instrumentos se están desarrollando para el procesado de muestras con más rapidez, sensibilidad

y precisión.

Documents

Estructura del genoma - vet. · PDF filePara identificar y cartografiar de manera sistemática todos los genes del genoma de un ... Fibroblasto humano Célula tumoral del ratón Los