29
EXPOSITORA: VICTORIA MONTOYA

Bioinformatica present

Embed Size (px)

Citation preview

Page 1: Bioinformatica present

EXPOSITORA: VICTORIA MONTOYA

Page 2: Bioinformatica present

El pasado de la bioinformática arrancó cuando propusieron el modelo de doble hélice para explicar la estructura del ADN, dando origen a las interrogantes: ¿cómo almacenar y organizar secuencias de ADN? ¿Cómo hallar intrones y exones en secuencias de ADN genómico? ¿Cuáles son las condiciones necesarias para la transcripción de un determinado gen?

Page 3: Bioinformatica present

¿Cómo conocer más acerca de la estructura de una proteína? ¿Cómo comparar secuencias de proteínas o predecir su estructura? Este es el punto de partida para el desarrollo de esta ciencia, y por consiguiente; es lo que los científicos están estudiando e investigando en la actualidad.

Page 4: Bioinformatica present

Hay dos aproximaciones analíticas importantesen bioinformática: el reconocimiento de patronesy la predicción.

Se ha conseguido un progreso considerable con los métodos de reconocimiento de patrones debido a la disponibilidad de bases de datos de referencia y moldes de plegamiento.

La incompleta comprensión del problema del plegamiento de proteínas determina una barrera a los intentos actuales de predecir la conformación a partir de la secuencia..

Page 5: Bioinformatica present

La homología es un concepto central: se dice que dos secuencias son homólogas si están relacionadas por divergencia de un ancestro común. La esencia del análisis de secuencias es la detección de relaciones homólogas mediante búsquedas en bases de datos de secuencias.

Ortología

•Misma función

•Especies diferentes

Paralogía

Funciones diferentes

Relacionadas en un mismo organismo

Page 6: Bioinformatica present

Siempre que sea posible, debe emplearse un abanico de métodos de análisis diferentes, y los resultados deberían unirse con toda la información biológica disponible.

Page 7: Bioinformatica present
Page 8: Bioinformatica present

Las principales bases de datos de ácidos nucleicos son GenBank, EMBL y DDBJ, cada una recoge una fracción de los datos totales de secuencias producidas en todo el mundo y que intercambian los registros nuevos y los actualizados diariamente.

Page 9: Bioinformatica present

Además de las bases de datos exhaustivas de secuencias de ADN, hay una variedad de recursos genómicos más especializados. Estas llamadas bases de datos boutiquetienen como objeto la genómica de especies concretas y técnicas particulares de secuenciación.

Page 10: Bioinformatica present

El abanico de recursos disponibles en Internet es inmenso y ha tenido un tremendo impacto sobre la capacidad de los científicos para presentar y diseminar los resultados de sus investigaciones.

Page 11: Bioinformatica present
Page 12: Bioinformatica present

Una secuencia de ADN o secuencia genética es una sucesión de letras representando la estructura primaria de una molécula real o hipotética de ADN o banda, con la capacidad de transportar información.

Las posibles letras son A, C, G, y T, que simbolizan las cuatro subunidades de nucleótidos de una banda ADN - adenina, citosina, guanina, timina, respectivamente.

Page 13: Bioinformatica present

Una sucesión de cualquier número de nucleótidos mayor a cuatro es pasible de llamarse una secuencia.

Page 14: Bioinformatica present

Las comparaciones de secuencias sirven para descubrir qué partes de las secuencias son más importantes es decir que están más reservadas, también, para descubrir qué proteínas tienen un origen común, para predecir la estructura de las proteínas y para ayudar a predecir la función de las proteínas.

Page 15: Bioinformatica present

Las bases de datos de secuencias de ADN incluyen datos de secuencias genómicas que contienen un surtido de datos que no pueden tratarse por igual (p.ej., regiones no traducidas (UTR), intrones y exones, mRNA, cDNA y traducciones). Esto afecta a la forma en que deben interpretarse las búsquedas.

Page 16: Bioinformatica present

Las UTR flanquean las regiones codificantes del ARN o del ADN, pero no son traducidas. La traducción de ADN a proteína mediante una tabla de código genético se denomina conceptual, indicando que no tiene validación experimental.

Page 17: Bioinformatica present

En una longitud arbitraria de ADN, no se sabe qué base marca el inicio de la secuencia codificante (CDS), de forma que debe realizarse una traducción en seis pautas. El reto es determinar cuál es la pauta de lectura correcta.

Page 18: Bioinformatica present

La presencia de intrones y exones en los genes eucarióticos puede dar lugar a productos génicos de longitudes diferentes, porque puede que no todos los exones estén incluidos en el transcrito final. (algoritmo de viterbi)

Page 19: Bioinformatica present

Las herramientas públicamente disponibles para el análisis de EST son las de búsqueda, ensamblaje y agrupamiento de secuencias.

Page 20: Bioinformatica present
Page 21: Bioinformatica present

Sólo mediante el empleo de un conjunto de bases de datos y herramientas podemos obtener el máximo de nuestro análisis de secuencias, porque ninguna de las bases es completa y ninguno de los métodos de búsqueda infalible.

Page 22: Bioinformatica present
Page 23: Bioinformatica present

Las consultas a bases de datos pueden tomar la forma de consultas de texto o búsquedas de similitud de secuencias. Para identificar una relación evolutiva entre una secuencia recién determinada y una familia génica conocida debe evaluarse la cantidad de similitud compartida.

Page 24: Bioinformatica present

Un método básico para comparar dos secuencias es el gráfico de puntos (dotplot). Para secuencias idénticas, esto da lugar a una línea diagonal ininterrumpida a través de la gráfica, mientras que secuencias similares originan diagonales discontínuas.

Page 25: Bioinformatica present
Page 26: Bioinformatica present

El algoritmo de Needleman-Wunsch sirve para realizar alineamientos globales de dos secuencias.

Se trata de un ejemplo típico de programación dinámica. Este algoritmo siempre termina y garantiza que la solución devuelta es la óptima.

Page 27: Bioinformatica present

Los predictores avanzados de genes para genomas tanto procariotas como eucariotas, usan típicamente complejos modelos probabilísticos, como los MOM, para combinar información conseguida de una variedad de diferentes medidas de señal y contenido.

Page 28: Bioinformatica present

El sistema GLIMMER es un identificador de genes ampliamente usado y muy preciso para organismos procariotas. Genemark es otra aproximación popular.

Ejemplos notables de estos son: los programas GENSCAN GENEID y CONTRAST, para una eficaz predicción de genes.

Page 29: Bioinformatica present

GRACIAS POR SU AMABLE ATENCION…………