32
IDENTIFICACIÓN IN SILICO Y CARACTERIZACIÓN MOLECULAR, ESTRUCTURAL y CINÉTICA DE ELEMENTOS DE REGULACIÓN DE LA EXPRESIÓN GENÉTICA BASADA EN RIBOSWITCHES. ANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior. Desde el organismo unicelular más primitivo, hasta el más complejo de los animales, son capaces de percibir cambios en su medio y reaccionar de una manera apropiada. Muchas de estas respuestas, en un momento dado, requerirán de cambios en el estado de expresión del genoma: genes que estaban prendidos necesitarán ser apagados y genes latentes necesitarán ser activados. En organismos bacterianos, dicha regulación de la expresión genética se lleva primordialmente al inicio de la transcripción y está mediada comúnmente por proteínas reguladoras, ya sea para inhibirla o favorecerla, de acuerdo a las necesidades metabólicas de la célula. Sin embargo, estudios recientes de genómica comparativa han revelado la existencia de un novedoso sistema de regulación mediante elementos llamados riboswitches (1). Los riboswitches se encuentran en la región 5’ no traducida de los mRNA y pueden plegarse en el espacio formando complejas estructuras tridimensionales de RNA capaces de reconocer, con alta afinidad y especificidad, a pequeños metabolitos como vitaminas o nucleótidos, en total ausencia de proteína (2-4). El mecanismo por el cual la expresión genética es regulada involucra la formación de estructuras alternativas (dependiendo de la presencia o ausencia del metabolito) que causan la terminación prematura de la transcripción o el bloqueo del inicio de la traducción. Los riboswitches se han encontrado casi exclusivamente en organismos bacterianos y regulan muchos procesos incluyendo la biosíntesis de vitaminas como la riboflavina, tiamina y cobalamina, así como el metabolismo de la metionina, lisina, glicina y purinas. La diversidad taxonómica de genomas que contienen riboswitches en adición al hecho de que la interacción directa de los riboswitches con sus ligandos no requiere de factores

PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

IDENTIFICACIÓN IN SILICO Y CARACTERIZACIÓN MOLECULAR, ESTRUCTURAL y CINÉTICA DE ELEMENTOS DE REGULACIÓN DE LA EXPRESIÓN GENÉTICA BASADA EN RIBOSWITCHES.

ANTECEDENTES

Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior. Desde el organismo unicelular más primitivo, hasta el más complejo de los animales, son capaces de percibir cambios en su medio y reaccionar de una manera apropiada. Muchas de estas respuestas, en un momento dado, requerirán de cambios en el estado de expresión del genoma: genes que estaban prendidos necesitarán ser apagados y genes latentes necesitarán ser activados. En organismos bacterianos, dicha regulación de la expresión genética se lleva primordialmente al inicio de la transcripción y está mediada comúnmente por proteínas reguladoras, ya sea para inhibirla o favorecerla, de acuerdo a las necesidades metabólicas de la célula. Sin embargo, estudios recientes de genómica comparativa han revelado la existencia de un novedoso sistema de regulación mediante elementos llamados riboswitches (1). Los riboswitches se encuentran en la región 5’ no traducida de los mRNA y pueden plegarse en el espacio formando complejas estructuras tridimensionales de RNA capaces de reconocer, con alta afinidad y especificidad, a pequeños metabolitos como vitaminas o nucleótidos, en total ausencia de proteína (2-4). El mecanismo por el cual la expresión genética es regulada involucra la formación de estructuras alternativas (dependiendo de la presencia o ausencia del metabolito) que causan la terminación prematura de la transcripción o el bloqueo del inicio de la traducción. Los riboswitches se han encontrado casi exclusivamente en organismos bacterianos y regulan muchos procesos incluyendo la biosíntesis de vitaminas como la riboflavina, tiamina y cobalamina, así como el metabolismo de la metionina, lisina, glicina y purinas. La diversidad taxonómica de genomas que contienen riboswitches en adición al hecho de que la interacción directa de los riboswitches con sus ligandos no requiere de factores adicionales, sugiere que los riboswitches representan uno de los sistemas reguladores más antiguos. Al inicio de nuestra investigación, siete familias de riboswitches habían sido identificadas mediante un proceso arduo de experimentación y búsqueda de motivos conservados en las regiones de regulación de los genes conocidos de las vías metabólicas de estudio. En nuestro grupo nos hemos dado a la tarea de desarrollar un método computacional capaz de identificar nuevos tipos de riboswitches de manera automática explotando la actual disponibilidad de cientos de genomas totalmente secuenciados, con la ventaja adicional de prescindir de la información bioquímica o genética de las diferentes vías metabólicas en donde se desea realizar la determinación de la existencia de posibles riboswitches.

El método que nuestro grupo ha desarrollado (2) está basado en la hipótesis de que ciertos genes ortólogos (genes homólogos funcionalmente equivalentes que han divergido por fenómenos de especiación) pueden compartir un mismo sistema de regulación a pesar de encontrarse en genomas filogenéticamente distantes. En general, la anterior premisa no es cierta cuando la

Page 2: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

regulación de los sistemas se da por proteínas reguladoras que se unen al DNA, sin embargo, para los riboswitches conocidos, esta hipótesis parece ser siempre cierta. Básicamente nuestro método consiste en los siguientes procesos: i) identificar para cada gen de los genomas totalmente secuenciados su correspondient grupo de ortología (COG); ii) Predecir las unidades transcripcionales (operones) de cada genoma; iii) agrupar las regiones de regulación de cada operon en base a los grupos de ortología (COG), de sus correspondientes genes; iv) identificar aquellas firmas o motivos de secuencias cuya frecuencia de aparición sea significativamente mayor a la esperada al azar. Para este fin es utilizando el programa MEME (5); v) Los motivos así encontrados, denominados “motivos semilla”, son utilizados por el programa MAST (6) para identificar a nuevos miembros del regulón que compartieran la misma señal reguladora. Como resultado de este proceso, nuevos miembros son agregados a cada grupo de regiones de regulación, mientras que otros elementos también pueden ser eliminados; vi) A partir de estos nuevos conjuntos de secuencias, nuevos y más representativos motivos son obtenidos, utilizando MEME, seguido por una nueva búsqueda con MAST. Este proceso es repetido iterativamente hasta que ningún nuevo elemento sea agregado o excluido del regulón putativo. Una descripción detallada de este método y la propuesta metodológica para realizar nuevas modificaciones para su optimización son descritas en la sección de Metodologías del presente proyecto.

Cabe resaltar que nuestro método de análisis fue capaz de identificar todos y cada uno de los riboswitches previamente reportados. Adicionalmente nuestro estudio identificó a un conjunto significativo de más de cien motivos altamente conservados en diferentes organismos con potencialidad de ser nuevos riboswitches. Una lista completa de los motivos conservados y genes potencialmente regulados por los mismos, puede encontrarse nuestra servidor de Internet RiBex (7) (http://www.ibt.unam.mx/biocomputo/ribex.html). Consideramos que nuestras predicciones computacionales de riboswitches y elementos de regulación conservadas son de gran valor para dirigir trabajos experimentales que caractericen los diferentes mecanismos de regulación. Interesantemente, este fue el caso de nuestra identificación in silico del riboswitch de glicina, cuya existencia fue paralelamente comprobada experimentalmente por el grupo de Breaker y colaboradores (8).

Los resultados obtenidos en la identificación de riboswitches reveló que ciertos riboswitches presentan una amplia distribución filogenética y pueden existir a la mayoría de las bacterias, como es el caso del riboswitch de la vitamina B-12 (9) , o bien ser específicos de un grupo filogenético en particular, como es el caso de la T-box que regula a las aminoacil-tRNA sintetasas en bacterias Gram positivas (10). La metodología inicialmente desarrollada, contempla la agrupación de regiones de regulación de genes ortólogos sin importar los grupos filogenéticos de sus correspondientes organismos. Pensamos que la sensibilidad de nuestro análisis pudiera mejorar considerablemente si el agrupamiento de regiones de regulación de genes ortólogos se realiza también considerando a la distribución filogenética de sus organismos ya que éstos pudieran encontrarse restringidos

Page 3: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

grupos filogenéticos particulares. En una primera instancia del presente proyecto, contemplamos modificar nuestro protocolo computacional antes mencionado para incluir el estudio clado específico de riboswitches.

Adicionalmente, es importante mencionar que la capacidad predictiva de nuestro método puede verse favorecida importantemente al incluir a un número mayor de genomas en nuestro análisis. El número de genomas totalmente secuenciados y disponibles a la fecha se ha duplicado con respecto al que se disponía al inicio de nuestro estudio de regiones conservadas. Adicionalmente, el incremento en secuencias provenientes de proyectos metagenómicos es aún más impresionante ya que pasó de un par de ellos, a decenas de metagenomas que actualmente se han secuenciado. Pensamos que el tomar ventaja de este importante incremento de secuencias nucleotídicas, tanto de genomas totalmente secuenciados como de metagenomas, pueden ser determinante en la identificación de nuevos riboswitches.

Consideramos que el valor de nuestras predicciones in silico de riboswitches pueden verse ampliamente favorecidos mediante su verificación experimental. En este sentido, nuestro proyecto plantea realizar la caracterización in vivo de los diferentes riboswitches identificados en nuestro estudio mediante la cuantificación por RT-PCR de sus correspondientes transcritos regulados y la mutagénesis sitio específica sobre ciertas posiciones de los riboswitches en estudio, que sean potencialmente relevantes para su plegamiento.

Un componente importante del presente proyecto corresponde a la caracterización molecular y estructural de diferentes riboswitches que nos permitan entender cabalmente sus correspondientes mecanismos de acción. Debido a la complejidad experimental de obtener cristales de RNA y la dificultad metodológica para obtener su correspondiente resolución por estudios de rayos X, a la fecha solamente se ha podido resolver la estructura tridimensional de dos riboswitches. El primero de ellos corresponde al riboswitch de guanina (11) y el segundo al riboswitch de tiamina (12). En este sentido, es importante mencionar que la participación del Dr. Alfredo Torres Larios, del Instituto de Fisiología-UNAM, constituye un elemento central del presente proyecto de investigación ya que el Dr. Torres cuenta con una amplia experiencia en la determinación de estructuras tridimensionales de moléculas de RNA. Dentro de sus más recientes contribuciones a este campo cabe resaltar su trabajo en la determinación del complejo de la enzima treonil-tRNA sintetasa de Escherichia coli con la región de RNA lider de su correspondiente mRNA (13), así como la obtención de la estructura tridimensional del RNA que forma parte del complejo riboprotéico de la ribonucleasa P de Thermotoga maritima (14). Adicionalmente, la caracterización estructural que obtengamos de estudios cristalográficos, será importantemente complementada mediante el estudio de la cinética del plegamiento de los riboswitches en estudio. Con tan motivo, planeamos realizar la síntesis química, tanto de riboswitches conocidos, como de nuevos riboswitches identificados en nuestro análisis teórico, con el fin de introducir nucléotidos modificados en

Page 4: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

posiciones estratégicas de los riboswitches en estudio que emitan energía al encontrarse espacialmente cercanos.

OBJETIVOS:

De acuerdo a lo anteriormente expuesto, los objetivos del presente proyecto de investigación son los siguientes:

1.- Optimizar nuestro método computacional para la identificación de riboswitches y elementos conservados de regulación.

Dicha optimización consistirá en:

a) Modificaciones a nuestro método de computacional para que el agrupamiento de regiones de regulación de genes ortólogos se realice: i.- considerando a todos los organismos simultáneamente; ii.- considerando la distribución filogenética de los organismos de tal forma que solamente se agrupen regiones de regulación de organismos filogenéticamente cercanos.

b) Modificaciones a nuestro método de análisis para que el agrupamiento de regiones de regulación contemple a los más de cuatrocientos genomas totalmente secuenciados y disponibles públicamente.

c) La inclusión en nuestro análisis de regiones de regulación prevenientes de los diferentes proyectos de secuenciación de metagenomas.

2.- Verificación experimental y caracterización funcional y estructural de riboswitches.

Los estudios experimentales contemplados para tales fines incluirán tanto a riboswitches previamente reportados, como aquellos que sean identificados en nuestro análisis in silico y consistirán en:

a) Caracterización in vivo de riboswitches mediante la cuantificación por RT-PCR de los transcritos sujetos a su regulación.

b) Mutagénesis sitio específico sobre los residuos relevantes al plegamiento del riboswitch en estudio y su posterior caracterización.

c) Análisis de la estructura tridimensional de riboswitches mediante su estudio cristalográfico.

d) Caracterización de la cinética de plegamiento de riboswitches mediante su síntesis química y la introducción de nucleótidos modificados.

Page 5: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

RESULTADOS OBTENIDOS QUE SE ENMARCAN DENTRO DE NUESTRO PRESENTE PROYECTO DE INVESTIGACIÓN.

A continuación se mencionan brevemente los resultados relacionados al presente proyecto que nuestros grupos han publicado recientemente. Cabe resaltar que dichas trabajos se han publicado en revistas de muy alto impacto científico entre las que se encuentran: Nature, Nature Structural Biology y Trends in Genetics, entre otras.

ARTÍCULO 1: Conserved regulatory motifs in bacteria: riboswitches and beyond (2). En el artículo se describe nuestro enfoque computacional para la identificación de riboswitches y otros tipos de elementos de regulación conservados a través de grupos filogenéticos distantes. Básicamente el algoritmo consiste en obtener a las diferentes regiones intergénicas de organismos totalmente secuenciados y agruparlas mediante sus relaciones de ortología. Posteriormente, en un proceso reiterativo, se identifican motivos de secuencias sobre-representadas. Nuestro algoritmo fue capaz de identificar a todos los riboswitches previamente reportados en la literatura, en adición a más de cien nuevos elementos de regulación altamente conservados nunca antes descritos.

ARTÍCULO 2: Transcription attenuation: a highly conserved regulatory strategy used by bacteria (15). Así mismo, también nuestro grupo ha desarrollado herramientas computacionales para la predicción de señales de regulación conocidas como atenuadores. El algoritmo elaborado utiliza la información derivada del análisis de de las estructuras secundarias de la región líder de los transcritos de genomas totalmente secuenciados, identifica a aquellas estructuras secundarias mutuamente excluyentes que pudieran corresponder a un antiterminador y a un terminador transcripcional, que son los elementos estructurales esenciales de los atenuadores transcripcionales bacterianos. En base a la predicción de dichos atenuadores a través de su distribución hipergeométrica en las diferentes familias de genes ortólogos, se identificarón aquellos operones en los que este tipo de regulación se encuentra presente de una manera estadísticamente significativa.

ARTÍCULO 3: New insights into regulation of the tryptophan biosynthetic operon in Gram-positive bacteria (16). Nuestro grupo ha identificado señales de regulación de la expresión de los genes relacionados con la biosíntesis del aminoácido triptofano. Los resultados obtenidos a través de la búsqueda computacional de motivos y predicción de estructuras secundarias muestran que de manera adicional a la proteína reguladora TRAP ampliamente caracterizada en Bacillus subtilis, existen otro tipo de elemento regulador conocido como T-box. Dicho elemento, se encuentra ampliamente distribuido en otros miembros del grupo de las bacterias Gram positivas. Un resultado interesante del estudio revela que en algunos casos las T-boxes pueden incrementar su rango de regulación al estar organizadas en tándem. Hemos identificado que este tipo de

Page 6: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

organización es prevalerte en vías metabólicas que involucran un gran costo energético, como la vía de biosíntesis de triptofano.

ARTÍCULO 4: RibEx: a web server for locating riboswitches and other conserved bacterial regulatory elements (17). En este artículo se describe nuestro servidor para la identificación y visualización de riboswitches llamado RibEx (Riboswitch Explorer). Nuestro servidor RibEx permite asociar los motivos conservados a nivel de secuencia primaria con atenuadores transcripcionales o traduccionales, adicionalmente de la identificación de los distintos marcos abiertos de lectura (ORFs) que contiene una secuencia determinada. En dado casa de ORFs regulados no estén caracterizados y su función sea desconocida, RibEx permite su identificación a través de un Blast con la base de datos del Nacional Center of Biotechnology Information (NCBI). La estructura secundaria del RNA del potencial riboswitch es determinada y mostrada para su posterior análisis. RibEx se encuentra disponible en nuestro servidor web http://www.ibt.unam.mx/biocomputo/ribex.html.

ARTÍCULO 5: GeConT: gene context analysis (18). Se describe nuestra interfase de red llamada GeCont diseñada para visualizar el contexto genómico de un grupo de genes ortólogos en todos los genomas actualmente secuenciados y disponibles públicamente. La información gráfica puede ser utilizada para revisar anotación, relaciones funcionales entre genes ortólogos y para verificar el la congruencia del contexto genómico de cualquier conjunto de genes que compartan alguna propiedad biológica particular, como la de aquellos genes que comparte un mismo tipo de regulación por riboswitches. GeCont se encuentra disponible en http://www.ibt.unam.mx/biocomputo/gecont.html

ARTÍCULO 6: Structural basis of translational control by Escherichia coli threonyl tRNA synthetase (19). En este trabajo, por medio de la cristalización del complejo de la treonil-tRNA sintetasa de E. coli y la región lider de su correspondiente mRNA, se define el mecanismo molecular mediante el cual esta enzima autorregula su propia expresión mediante represión traduccional.

. ARTÍCULO 7: Crystal structure of the RNA component of bacterial ribonuclease P (20). En este trabajo se obtiene la estructura tridimensional del elemento de RNA que forma parte del complejo riboproteico de la ribonucleasa P de Thermotoga maritima. La ribonucleasa P es la ribosima encargada del procesamiento del extremo 5' terminal del RNA de transferencia. Este complejo, junto con el complejo ribosomal, es uno de los complejos más conservados evolutivamente y está presente en todos los organismos vivos.

Page 7: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

ORIGINALIDAD Y TRASENDENCIA.

La metodología que hemos diseñado para la identificación de señales en base a familias de genes ortólogos es novedosa y ha sido exitosa en identificar a todos y cada uno de los riboswitches conocidos a si como un conjunto adicional de más de cien elementos conservados de regulación. Consideramos que la optimización del método con las modificaciones antes planteadas presenta gran potencialidad para identificar nuevos riboswitches y elementos de regulación conservados. Dichos elementos serán posteriormente caracterizados mediante técnicas de Biología Molecular y estudios de cristalografía para la determinación de su estructura tridimensional y su cinética de plegamiento.

METODOLOGÍA

1.- Análisis in silico para la identificación de riboswitches y otros elementos de regulación conservados.

1.1. Desarrollo de sistemas automáticos de actualización de bases de datos. Mediante programas escritos en lenguaje de programación Perl, se desarrollaran sistemas automáticos para mantener constantemente actualizada la información de las diferentes bases de datos disponibles en Internet, para su posterior análisis dentro del proyecto y que incluyen entre otras a: i) Las secuencias del DNA genómico de los más de 400 genomas totalmente secuenciados que se obtendrán de la base de datos GenBank; ii) La base de familias de genes ortólogos “Clusters of Orthologous Groups of proteins” (COGs), ambos del “National Center for Biotechnology Information (NCBI); iii) La información referente a las rutas metabólicas de la base de datos del “Kyoto Encyclopedia of Genes and Genomes” (KEGG), entre otras. La información adquirida de los diferentes repositorios de internet será posteriormente procesada para crear bases de datos locales con un formato referencial que facilite nuestros posteriores análisis computacionales.

1.2.- Obtención del conjunto de secuencias mínimas de regulación (MUR). Dado que estudio in silico se centra en analizar regiones de regulación, es necesario en una primera instancia el predecir cada una de los operones de cada genoma contemplado en nuestro estudio. Dicha predicción será realizada de acuerdo a los criterios de direccionalidad y de distancia intergénica establecidos por Moreno-Hagelsieb y colaboradores (21). Para cada operón determinado, se tomará una ventana de secuencia correspondiente a 400 nucleótidos río arriba del inicio de traducción del primer gene, siempre y cuando esta región no coincida con cualquier otro gene conocido. Se ha observado que más del 90% de los elementos de regulación en E. coli caen en este intervalo de secuencia. Este conjunto de secuencias es llamado MUR, por su descripción en inglés “Minimal Upstream Regions” (Regiones Mínimas Río-arriba).

Page 8: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

1.3.- Agrupamiento de MURs en familia de ortólogos. Una de los fundamentos centrales de la metodología computacional planteada consiste en la agrupación de señales de regulación de acuerdo al grupo de ortología al que pertenecen sus correspondientes genes regulados. Por tal motivo utilizaremos a las familias de genes ortólogos definidas en la base de datos COG (Clusters of Orthologous Groups of genes) que consta de 4,873 familias. Dicha base de datos incluye a la fecha exclusivamente a 66 organismos. En la actualidad se encuentran disponibles la secuencia gnómica de más de 400 organismos, mismos que en su mayoría carecen de la asignación de sus genes dentro de los grupos COG. Por lo anterior, realizaremos localmente la asignación de COGs a los genomas que la carezcan mediante la implementación del algoritmo propuesto por Koonin y colaboradores en base al criterio de mejores hits bidireccionales (22). Posterior a ello, la región 5’ de regulación de los operones será agrupada considerando los diferentes COGs a los que pertenecen los genes de la unidad transcripcional.

1.4.- Identificación de riboswitches y otras secuencias de regulación conservadas. Una vez agrupadas las regiones de regulación en base a la ortolog’ia de sus correspondientes genes, en cada grupo se identificaran aquellas firmas o motivos estadísticamente sobre-representados mediante el empleo del programa MEME (por sus siglas en ingles “Multiple expectation maximization for Motif Elicitation”) (5). Estas firmas o motivos iniciales son denominados “motivos semilla” y son expresadas mediante matrices de de peso que posteriormente serán empleadas por el programa MAST (por sus siglas en ingles: “Motif Alignment and Search Tool”) (6) para la identificar de nuevas secuencias genómicas que contengan a los “motivos semilla”. Como resultado de este proceso, nuevos miembros son agregados a cada grupo de regiones de regulación, mientras que otros elementos también pueden ser eliminados. A partir de estos nuevos conjuntos de secuencias, nuevos y más representativos motivos son obtenidos, utilizando MEME, seguido por una nueva búsqueda con MAST. Este proceso es repetido iterativamente hasta que ningún nuevo elemento sea agregado o excluido del regulón putativo.

1.5. Análisis del contexto genómico de los riboswitches identificados. Con el objetivo de evaluar el significado biológico de las nuevas firmas encontradas, se analizará el contexto genómico de los genes que potencialmente tuvieran elementos de regulación en común. Esperamos que en la mayoría de los casos, dichos genes pertenezcan a vías metabólicas en común o bien estar involucrados en procesos celulares similares. Para este propósito, utilizaremos nuestra herramienta de análisis llamada GeCont

2.- Análisis estructural de riboswitches mediante estudios de cristalografía y determinación de patrones de difracción de rayos X.

Page 9: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

ALFREDO. AYUDAME AQUÍ A ESCRIBIR TODO LO CORRESPONDIENTE A ESTA PARTE QUE REALIZARAS TU. 100000 GRACIAS

2.4 Estructura secundaria del RNA En este caso, la señal que se pretende identificar, radica en la molécula de RNA, y depende de la estructura que ésta adopte una vez transcrita. Para ello, los programas que desarrollaremos tendrán que realizar cálculos de energía libre de las posibles estructuras del RNA y diferenciar cuál de ellas tiene la capacidad de constituir un atenuador transcripcional, de acuerdo al siguiente protocolo: Para cada región dentro de nuestra base de datos de secuencias MUR, el programa de cómputo buscará una corrida de t's (rts) que corresponderán a una corrida de u's en el RNA. El tamaño del rts considerado será de 6 nucleótidos (nt), de los cuales al menos 5 tendrán que ser ts. TTTATT o TTTTTC son ejemplos de lo que se considerará como una aceptable rts. El espacio máximo aceptable entre la rts y la primera base codificante del gen río abajo, será de 110 nt. Por cada rts, el programa buscará la estructura secundaria más estable que pudiera ser formada dentro de los primeros 60 nt. Inicialmente, la estructura secundaria que pudiera ser formada de estos 60 nt, será predicha utilizando el programa FoldRNA (GCG Wisconsin Package). Las únicas estructuras secundarias que serán consideradas como posibles terminadores transcripcionales, serán aquellas del tipo tallo-asa. Si la secuencia analizada contiene más de una estructura de tallo-asa, sólo la más cercana a la secuencia rts será considerada en el análisis. Para los casos en los que la estructura secundarias predichas no correspondan a estructuras tipo tallo-asa sencillas (i.e. Estructuras con ramificaciones), los primeros 60 nt son eliminados del análisis y la búsqueda por una nueva estructura secundaria tipo tallo-asa, es repetida de manera recursiva, hasta que el programa encuentre la secuencia que, cuando se pliegue, corresponda al tallo-asa más estable. Adicionalmente, una estructura tallo-asa será considerada como parte de un posible terminador transcripcional solamente si la base de la misma se encuentra a una separación no mayor a 4 nt del rts, el número máximo de asas de la estructura es 3, y si la energía de la estructura es de al menos -0.2 kcal por nucleótido. Para cada terminador encontrado, el programa buscará la presencia de su correspondiente antiterminador. Para ello el programa empezará su análisis utilizando ventanas de 60 nts a partir del centro del asa del terminador. El programa buscará la estructura secundaria tipo tallo-asa más estable, siguiendo el mismo esquema descrito para el análisis del terminador. Una estructura de tallo-asa será considerado como antiterminador si al menos 3 bases de uno de sus tallos sobrelapan con el tallo del

Page 10: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

terminador, el número máximo de asas en él es de 4, y si su energía libre es de al menos una cuarta parte respecto a la del terminador. Un atenuador transcripcional será considerado como la región del RNA que incluye tanto a un terminador como su correspondiente antiterminador transcripcional.

5.- Verificación experimental de resultados.

Adicionalmente a la identificación de riboswitches, nuestro servidor Ribex permite identificar elementos de RNA altamente conservados y potencialmente involucrados en la regulación génica. Tal es el caso del elemento de RNA presente en la secuencia líder del operón pyr en bacterias Gram positivas que ha sido previamente involucrado en la regulación del los genes biosintéticos de pirimidina (23). Recientemente, mediante nuestro servidor RiBex hemos identificado dentro de los genomas totalmente secuenciados, una serie de bacterias que contienen los motivos de secuencia conservados para el reconocimiento del regulador PyrR y que por ende, es probable que compartan este mecanismo de regulación. La comparación de 22 secuencias provenientes del mismo número de especies y 15 géneros distintos muestra que existe una secuencia consenso de 29-34 nucleótidos, con 16 nucleótidos completamente conservados (Figura 2 A y B). Se ha comprobado que ciertos elementos de la secuencia consenso, distribuidos a lo largo del mínimo de 28 nucleótidos que se requieren para que pyr sea reconocido por la proteína, son importantes para el reconocimiento por PyrR (Figura 2C)

Existen estudios sobre los requerimientos de secuencia y estructura secundaria de RNA para unirse a PyrR (mutacionales en PyrR [23] y de unión de la proteína a variantes de RNA [21]). A pesar de ello, no es claro aún el papel que juegan los nucleótidos conservados en la región líder, ni la forma en que eventualmente conforman un plegamiento particular e interaccionan con la proteína, por lo que el entendimiento de las propiedades de reconocimiento y regulación de este tipo de moléculas de RNA requiere de información estructural detallada a alta resolución. Hasta el momento sólo se cuenta con la estructura tridimensional de la proteína PyrR, la cual se ha determinado para diversos organismos como B. subtilis [24], B. caldolyticus [25], M. tuberculosis [26] y T. thermophilus (código PDB 1ufr). Estas estructuras han mostrado que PyrR no está relacionada con otras proteínas envueltas en atenuación transcripcional, sino que existe homología estructural de PyrR con la familia de las fosforribosil transferasas (PRTasas). Las estructuras también han revelado el sitio de unión para UMP, así como la razón de la actividad residual de PyrR como UPRTasa. Esta es debida a la falta de residuos hidrofóbicos clave para estabilizar la unión de uracilo, y a la falta de conservación estructural de un residuo aspartato necesario para estabilizar el estado de transición. Aunque el complejo PyrR-UMP es necesario para la unión al mRNA pyr, y existe un uso potencial de análogos de pirimidina como drogas que podrían actuar para atenuar la transcripción, la proteína no esta optimizada para producir UMP catalíticamente.

Page 11: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

Los datos de cristalografía también han abierto varias interrogantes: no es clara la función estructural de UMP ya que la comparación de las estructuras apo y acomplejadas con UMP no muestran grandes cambios conformacionales; existen también dudas acerca de la unidad biológica de PyrR. PyrR ha cristalizado como dímero [24], tetrámero [25, 26], y hexámero [24]. En estas estructuras PyrR forma dímeros idénticos con superficies convexas cargadas negativamente que unen a los nucleótidos, y cóncavas de carácter básico, formando los sitios putativos de unión a RNA. Sin embargo, en los tetrámeros de B. caldolyticus y M. tuberculosis y el hexámero de B. subtilis, la superficie básica se encuentra en una cavidad interna que no es lo suficientemente grande para acomodar RNA . Por otro lado, la superficie básica del tetrámero de T. thermophilus es externa. Experimentos de cromatografía de exclusión molecular han mostrado que la proteína de B. caldolyticus eluye como tetrámero [25] y que la proteína de B. subtilis puede presentar un peso intermedio entre dímero y hexámero [27]. La solución de la estructura del complejo con mRNA será determinante para conocer la unidad funcional real de este regulador, la manera en que UMP incrementa la afinidad de la proteína por mRNA pyr, y la forma en que la proteína estabiliza la estructura del líder en oposición a la termodinámicamente más estable estructura de antiterminación.

6.- Incorporación de resultados en páginas de Internet. Los resultados obtenidos en nuestro proyecto, predicción de sitios de regulación y modelo de las redes de regulación, se harán del dominio público mediante páginas de Internet. Para ello, estableceremos colaboraciones con las bases de datos existentes de E. coli (RegulonDB) y S. cerevisiae (Comprehensive Yeast Genome Database). Adicionalmente, desarrollaremos páginas propias de Internet con los formatos adecuados para mostrar la información generada en nuestro estudio.

Plan de Trabajo:

Síntesis Química y Purificación de Oligoribonucleótidos

Los sintetizadores modernos utilizan la química del fosfito triéster que emplea monómeros fosforamiditos estables para construir el polímero creciente en un ciclo de cuatro reacciones esenciales: desbloqueo, activación/acoplamiento, capping y oxidación. Estas reacciones robustas permiten tanto a los químicos como a los biólogos moleculares generar fácilmente ribo- y deoxiribo- nucleótidos con una gran variedad de marcajes (radioactivos o no), enlaces modificados y bases no naturales anclados a lo largo de la cadena.

Page 12: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

El ciclo de síntesis se inicia con la remoción del grupo DMT sensible a ácido que protege al hidroxilo 5’ terminal del nucleósido 3’ terminal correspondiente (A, G, C y T para DNA, y A, G, C y U para RNA) que se encuentra anclado a un soporte sólido inerte. El cromóforo resultante (catión tritilo) puede cuantificarse para determinar la carga efectiva del nucleósido o la eficiencia del acoplamiento previo. Una vez liberado, el hidroxilo 5’ es el único nucleófilo reactivo capaz de participar en el siguiente paso (dado que las bases nitrogenadas presentes en la cadena creciente son susceptibles de depurinación ácida, es necesario lavar varias veces con acetonitrilo para eliminar al agente desprotector a la vez que permite incrementar la efectividad del acoplamiento ya que evita la desprotección del monómero que va a agregarse). En el siguiente paso, se adicionan tanto el correspondiente fosforamidito protegido como un agente activante que acelera la velocidad de reacción al formar con el fosforamidito un aducto de mayor reactividad, esta especie reacciona con el hidroxilo 5’ del monómero previamente desprotegido para incrementar en 1 la longitud de la cadena creciente. Un exceso molar tanto del monómero como del activador asegura la completa saturación de los grupos hidroxilos libres. Sin embargo, un pequeño porcentaje de los hidroxilos 5’ libres del nucleósido previo, no se acoplan con el monómero agregado por lo que tienen que ser inactivados mediante una acetilación, para evitar que sean sitios competitivos en los siguientes ciclos de la síntesis. Esta especie bloqueada ya no es reactiva y permanece inerte hasta la terminación de la cadena. En el último paso del ciclo de síntesis, el puente internucleotídico recién formado consta de un grupo fosfito (fósforo trivalente) inestable que debe ser oxidado a un grupo fosfato (fósforo pentavalente) estable, esto ocurre con la adición de una solución de yodo en agua/piridina/THF. Una vez completadas estas cuatro reacciones, se inicia de nueva cuenta con la desprotección del hidroxilo 5’ del monómero recién acoplado y se continúan hasta completar el total de bases deseadas.

Posteriormente a la síntesis, se liberan tanto a la cadena en si del nuevo oligonucleótido como a los diferentes grupos que bloquean las diferentes funcionalidades de las bases nitrogenadas y de los puentes internucleotídicos para tener un agente biológicamente activo. Adicionalmente, esta nueva especie puede ser purificada o no de acuerdo con las necesidades del ensayo a realizar y de las cantidades requeridas para el mismo. La purificación puede realizarse ya sea por HPLC, por Columna de Intercambio o por Gel de Poliacrilamida.

La síntesis química de RNA es idéntica a la utilizada para DNA salvo por la necesidad de un grupo protector adicional en el hidroxilo 2’ de la ribosa. Esta posición usualmente se bloquea con grupos como el terbutildimetilsililo (TBDMS), el (tris(isopropilsilil)oxi)metilo (TOM) o el bis(2-acetoxietoxi)metilo (ACE); que son muy estables a las condiciones de la síntesis. Esta protección adicional implica el ajuste de varios de los parámetros en los protocolos de síntesis de DNA como lo son el incremento en los tiempos de acoplamiento, la velocidad de adición de monómero, la frecuencia de los tiempos de lavado o los tipos de reactivos de capping, dando como resultado eficiencias de acoplamiento de hasta 99% con la desventaja de que solo son reales para oligos de cadena corta (hasta 20-25 nucleotidos)

Page 13: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

Debido a las múltiples variables involucradas en la síntesis química de oligonucleótidos, se propone en primera instancia trabajar solo con aquellas directamente relacionadas con el pegado entre monómeros de RNA :

a) Tiempos de Reacción: La presencia del grupo protector del hidroxilo 2’ genera un mayor impedimento estérico para la aproximación del monómero hacia el hidroxilo 5’ terminal libre de la cadena de RNA creciente por lo que se requiere un mayor tiempo de interacción entre ellos, un lapso muy corto (menor de 60s) implicaría un rendimiento de acoplamiento muy pobre, por lo que se requieren evaluar intervalos mayores. Adicionalmente, a medida que la cadena de RNA se incrementa, se dificulta la reacción con el monómero entrante por lo que se requieren de tiempos aún más prolongados ayudados además por una agitación mecánica que incremente su interacción. Se pretende crear intervalos óptimos de síntesis de acuerdo a la longitud de la cadena creciente (a menor longitud menor intervalo de reacción)

b) Monómeros: Actualmente existen de manera comercial tres tipos de monómeros disponibles para síntesis de química de oligoribonucleótidos diferenciándose básicamente en el tipo de grupo protector presente en el hidroxilo 2’. El más popular de ellos (TBDMS) presenta bajos rendimientos debido a su gran tamaño, sin embargo puede utilizarse en combinación con agentes activantes más efectivos o de mayor disponibilidad (menor costo), sin embargo es un grupo susceptible de migración 3’-> 2’. Un segundo grupo lo representa el grupo TOM, que tiene una mayor velocidad de reacción y rendimientos más altos por acoplamiento, pero su eliminación es menos eficiente. Ambos tipos de monómeros son completamente compatibles con las condiciones normales de síntesis convencional. Un tercer tipo de monómero lo es el grupo ACE que promete ser el más adecuado para la síntesis de RNA dada su alta eficiencia de acoplamiento por ciclo (>99%) en presencia de 5-etil-tio-tetrazol, no obstante, este grupo no es compatible con los esquemas tradicionales de síntesis ya que utiliza a un éter de sililo para proteger al hidroxilo 5’ que no es removible en condiciones de ligera acidez.

c) Uso de Agentes Activantes: Al igual que los monómeros, existen actualmente varias clases de agentes aceleradores de la reacción de acoplamiento entre el monómero entrante y la cadena creciente de RNA. Su uso está justificado por la baja nucleofilia del grupo hidroxilo 5´ por el grupo fosfito del nuevo monómero. Entre los más utilizados se encuentran el 1H-Tetrazol, el 5-(p-Nitrofenil)-1H-Tetrazol y el 5-Etil-Tio-Tetrazol, siendo el tercero el de mejores características de acidez y nucleofilicidad [Tsukamoto, 2005].

Page 14: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

d) Medición de rendimiento por acoplamiento y modificación de programa de síntesis: Una vez ajustados los parámetros antes mencionados, se adaptarán los ciclos y programas “precargados” en los equipos de síntesis a fin de obtener el mayor rendimiento posible en una escala de síntesis adecuada (1mmol) para poder realizar la preparación, en una primera etapa, de RNAs de interferencia y posteriormente la preparación de un riboswitch como tal.

e) Dada la fácil degradación del RNA por causa de la migración 3’→ 2’

(principalmente a causa de variaciones de pH y RNAsas), es necesario adecuar las condiciones de manejo y almacenaje de tal forma que los oligos preparados sean resistentes a estas variaciones. Una opción de primera instancia es mantener bloqueado al hidroxilo 2’ con el grupo protector “de fábrica” eliminándolo justo antes de la utilización del oligo, proceso que bien podría incluirse dentro de la purificación del oligo mismo, dependiendo del método elegido (PAGE, HPLC o Columna de Fase Reversa).

Cabe mencionar que el número de posibles variantes experimentales que involucra la combinación de todas las variantes mencionadas es realmente enorme, por lo que el éxito de la optimización del proceso química de RNA para moléculas grandes (i.e. riboswitches) no es trivial y requerirá de un estudio cuidadosamente planeado y ejecutado.

De aquí para adelante falta modificar y re-ordenar.

2. Desarrollo de sistemas de visualización de las bases de datos y predicción de elementos reguladores. Nuestro grupo se ha caracterizado por el desarrollo de herramientas de análisis. En este sentido, hemos puesto a disposición de la comunidad herramientas de visualización de la información contenida en las bases de datos. Tambien

Nuestro grupo también ha hecho avances significativos en el estudio del mecanismo de regulación conocido como T-box, que opera mediante la terminación/antiterminación del inicio de la transcripción, es una estrategia de regulación común en bacterias. Fue descrita por primera vez en 1992 durante estudios en la regulación transcripcional de la tirosil-tRNA sintetasa de Bacillus subtilis (1). Este mecanismo se basa en que la región líder del RNA mensajero puede doblarse de tal manera que puede formar cualquiera de dos estructuras alternativas de RNA, una de las cuales funciona como un terminador intrínseco de la transcripción. Para que la transcripción prosiga tiene que acumularse tRNAs descargados específicos para cierto aminoácido. Estos tRNAs descargados se aparean con la región líder del mRNA favoreciendo la estructura del

Page 15: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

antiterminador, por lo tanto previniendo la formación del terminador y consecuentemente previniendo la transcripción (2, 3). Hay muchos ejemplos similares donde otros tipos de moléculas sirven como señal regulatoria y se unen al RNA líder para promover la formación de alguna de las estructuras alternativas RNA. Cuando cualquiera de estos tRNAs descargados está presente en una concentración elevada, se une específicamente a la región líder del RNA, y promueve la formación de un antiterminador. Lo anterior tiene como consecuencia un aumento en la transcripción de los genes sujetos a este mecanismo. El mecanismo de regulación por T-box se distribuye extensamente entre el clado de las bacterias Gram-positivas. Se utiliza para regular la transcripción de los genes implicados en biosíntesis y transporte de los aminoácidos, así como su cargado a las moléculas del tRNA (16). Un nivel continuo y elevado de los tRNAs en su forma descargada dentro de la célula, implica una necesidad de aumentar la síntesis de todas las proteínas necesarias para sintetizar el aminoácido en cuestión, de su transporte, o de su cargado sobre el tRNA. Todavía no se han realizado análisis genómicos a gran escala para descubrir cuántos genes y operones de las bacterias Gram-positivas son reguladas por este riboswitch, ni tampoco se ha resuelto critalográficamente su estructura.

METAS ACADEMICAS Publicaremos tres artículos de divulgación internacional, durante la realización del proyecto, que corresponderán, de manera general, con la productividad anual del proyecto, que cubrirán las siguientes métas académicas:

1.- Desarrollar sistemas automáticos de obtención de información disponibles en el Web.

2.- Continuar con el desarrollo sistemas de cómputo para la administración de la información en bases de datos locales de secuencias de regulación (MUR e iMUR), unidades de transcripción (operones) y grupos de ortólogos, así como los resultados de expresión y vías metabólicas de nuestros organismos modelo.

3.- Seguir mejorando los programas para la identificación de señales de regulación a) Señales dependientes de secuencia primaria. B) Señales dependientes de estructura secundaria del mRNA (atenuadores y riboswitches).

4.- Evaluar el significado estadístico de las señales de regulación identificadas en nuestro estudio.

5.- Para cada una de las señales de regulación identificadas, generar modelos de regulación en base a la ubicación de la señal respecto a otros elementos de regulación como son promotores transcripcionales, secuencias palindrómicas , inicio del gene, etc.

Page 16: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

6.- Verificar la congruencia de los modelos construidos en base a la información contenida en la literatura publicada. a) Que correspondan a la expresión de mRNA evaluados mediante microarreglos. b) Que sean congruentes con respecto a las diferentes vías metabólicas de los organismos en estudio. C) Que sean compatibles con los datos provenientes de las redes de interacción entre proteínas.

7.- Verificar experimentalmente nuestras predicciones de los sitios de regulación así como la veracidad de nuestros modelos de regulación. a) Mediante mutagénesis sitio específico y cuantificación de fusiones de regiones de regulación con genes reporteros.

8.- Obtener información estructural detallada a alta resolución del riboswitch de Pyr y de la T-box.

9.- Realizar las colaboraciones requeridas para seguir integrando los resultados de nuestro estudio en algunas de las bases de datos relevantes de regulación genética como la es RegulonDB.

10.- Continuar con la construcción de páginas propias de web con los resultados generados de identificación de señales y modelos de regulación.

METAS EN FORMACION DE RECURSOS HUMANOS Nuestras métas mínimas respecto a la formación de recursos humanos son la elaboración de ocho tesis. Cuatro de licenciatura, dos de maestría y dos de doctorado.

METODOLOGÍA

1. Desarrollo de sistemas automáticos para obtención y procesamiento de bases de datos disponibles en Internet. Un elemento fundamental en el desarrollo del proyecto, es la obtención de la información generada mundialmente en centros de investigación y depositada en diferentes bases de datos. Dicha información es generada continuamente por lo que su distribución y actualización son efectuadas comúnmente a través del Internet. Con el propósito de automatizar los procesos de adquisición de datos, desarrollaremos diferentes programas de cómputo basados en comandos tipo "cron" del sistema operativo LINUX para que esta tarea sea efectuada automáticamente de manera periódica. Es importante mencionar que, en muchas ocasiones, el formato inicial de los datos obtenidos, tendrá que ser modificado para optimizar su uso en pasos posteriores del análisis, por lo que la plataforma de adquisición de información será seguida por un proceso para almacenarla en un formato compatible con nuestras bases de datos locales. De acuerdo al lo propuesto en nuestro proyecto, la información que será adquirida corresponde a: Secuencias genómicas y sus correspondientes anotaciones Actualmente contamos con más de 400 genomas totalmente secuenciados y se espera que en los próximos tres años contemos con más de mil secuencias genómicas, mismas que serán obtenidas del servidor de ftp del National Center for Biotechnology Information NCBI (ftp://ftp.ncbi.nih.gov). Las

Page 17: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

anotaciones de función de los genes de dichos genomas serán obtenidos de la sección Protein Translation Table PTT, que acompaña a los archivos de secuencia nucleotídica. Estas anotaciones son actualizadas períodicamente en NCBI, por lo que será necesario considerar los cambios introducidos en secuencias de organismos previamente obtenidas y depositadas en nuestras bases locales. Familias de genes ortólogos. La relación de ortología entre los genes de algunos de los genomas totalmente secuenciados se encuentra disponible la base de datos COG (Clusters of Orthologous Groups of proteins) en el servidor de ftp del NCBI. Dicha relación es construida de acuerdo al algoritmo propuesto por Koonin y colaboradores (15). Con el objeto de completar la determinación de ortología en los genomas para los cuales no existe dicha información, implementaremos el algoritmo antes mencionado y completaremos el análisis de manera local. Resultados de expresión provenientes de estudios con microarreglos. Serán obtenidas principalmente de las bases de datos del European Bioinformatics Institute (http://www.ebi.ac.uk/Databases/microarray.html) y de las universidades de Stanford (http://genome-www5.stanford.edu), y Yale (ftp://info.med.yale.edu/microarray), entre otros. Bases de datos de vías metabólicas. La información referente a las diferentes vías metabólicas de los organismos será obtenida de la base de datos KEGG (Kyoto Encyclopedia of Genes and Genomes), de Japón, a través de su sitio en Internet (http://www.genome.ad.jp/kegg/metabolism.html). Bases de datos de interacciones entre proteínas. Utilizaremos la base de datos MIPS (Munich Information Center for Protein sequences) a través de su servidor http://mips.gsf.de y DIP (Database for Interacting Proteins) http://dip.doe-mbi.ucla.edu. Base de datos de organismos modelo. Como se describirá posteriormente, los organismos modelo que inicialmente contemplaremos en nuestro estudio son Escherichia coli y Saccharomyces cerevisiae. Obtendremos la información específica de dichos organismos en sus correspondientes páginas de Internet, RegulonDB (http://www.cifn.unam.mx/Computational_Genomics/regulondb), Comprehensive Yeast Genome Database (http://mips.gsf.de/genre/proj/yeast/index.jsp) y Saccharomyces Genome Database (http://genome-www.stanford.edu/Saccharomyces).

INFRAESTRUCTURA

I. Infraestructura del Instituto de Biotecnología El Instituto de Biotecnología cuenta con más de 10,000 m2 de laboratorios y tiene equipo por valor superior a los diez millones de dólares; la mayor parte de este equipo se encuentra en Unidades de Apoyo Técnico de uso común. Las unidades de apoyo técnico con las que cuenta el Instituto de Biotecnología son las siguientes: i) Unidad de Síntesis Química y Determinación de Secuencia de Macromoléculas Biológicas, ii) Unidad de Bioterio, iii) Unidad de Anticuerpos, iv) Unidad de escalamiento y Planta Piloto, v) Unidad de Microscopía, vi) Unidad de Invernadero y vii) Unidad de Cómputo.

II.- Equipo de cómputo Nuestro grupo cuenta con seis estaciones de trabajo con el sistema operativo Linux. La capacidad de dichas estaciones varía.

Page 18: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

Contamos desde computadoras con procesadores Pentium II a 450 MHz, hasta estaciones de trabajo con doble procesador Xeon a 2 GHz. Las computadoras están conectadas entre sí a 100 Mbs mediante la red Ethernet de nuestro Instituto. Dicha red cuenta con cerca de mil nodos y diversos periféricos conectados a estas redes, tales como impresoras láser, impresoras de color, y unidades de respaldo de datos. La red del instituto se conecta por fibra óptica a la Sistema Red UNAM y a través de el a la red mundial. Recientemente el Instituto ha adquirido un cluster de 66 nodos de computadoras Pentium IV a 2.8 GHz y conectados entre sí a 100 Mbps y a 1Gbps de salida del Instituto.

III.- Software De acuerdo su origen, los programas de cómputo que utilizamos en nuestros estudios se pueden dividir en: Del dominio público, como los utilizados para hacer búsquedas en bases de datos de secuencias nucleotídicas o de aminoácidos, como los programas BLAST, o FASTA o de patrones conservados como el programa HMMER. Comerciales, como el paquete GCG (Genetics Computer Inc., Universidad de Wisconsin) instalado en el servidor central de nuestro Instituto, utilizado para realizar análisis de secuencias nucleicas y de aminoácidos. Desarrollados en nuestro grupo con propósitos específicos en nuestros proyectos de investigación, como los elaborados para el análisis de la curvatura estática del DNA a partir de los algoritmos de Satchwell o Bolshoy, programas para la visualización de la similitud entre proteomas, para la predicción de señales de regulación (atenuadores, promotores, sitios de metilación, etc., etc.), entre otros.

FORMACION DE RECURSOS HUMANOS Nuestro grupo cuenta con 3 estudiantes de doctorado (programa Ciencias Bioquímicas/Instituto de Biotecnología/UNAM; los cuales estarán involucrados en el proyecto), 2 de maestría (programa Ciencias Bioquímicas/Instituto de Biotecnología/UNAM), 3 tesistas de licenciatura (Biología/Facultad de Ciencias/UNAM, involucrados en el proyecto) y 1 realizando su licenciatura (Licenciatura en Ciencias Genómicas/UNAM). A continuación se presenta una descripción de la participación de los estudiantes que estarán involucrados en este proyecto. Eugenio López Bustos, realizó sus estudios de maestría en del programa Ciencias Bioquímicas/Instituto de Biotecnología/UNAM, actualmente es alumno de doctorado del programa Ciencias Bioquímicas/Instituto de Biotecnología/UNAM y se encuentra desarrollando un proyecto que permita generar sistesis química de moléculas de RNA. Alfredo Morales. Realizó su licenciatura en Biología en la UAM-I y la maestría del programa Ciencias Bioquímicas/Instituto de Biotecnología/UNAM, actualmente es alumno de doctorado del programa Ciencias Bioquímicas/Instituto de Biotecnología/UNAM y se encuetra participando en el proyecto con el desarrollo de metodologías para la caracterización de regiones de regulación mediante la integración a cromosoma por productos de PCR. José Ricardo Ciria Merce. Realizó su maestría en Ciencias de la Computación Instituto de Investigaciones Matemáticas Aplicadas a Sistemas y actualmente es alumno de doctorado del programa Ciencias Bioquímicas/Instituto de Biotecnología/UNAM. Construirá las interfaces de Web necesarias tanto para adquirir la información de distintas bases de datos de Internet (Bases de

Page 19: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

secuencias genómicas y sus anotaciones, de grupos de genes de ortólogos, de vías metabólicas, resultados de microarreglos y bases de datos organismo-específico como RegulonDB y CYGD). Además, desarrollará las páginas Web con las que haremos públicos los resultados obtenidos en el proyecto. Patricia Oliver Ocaño. Estudiante de maestría de Ciencias Bioquímicas/Instituto de Biotecnología/UNAM. Trabaja con análisis de microarreglos de levadura, así como la dilucidación de regulones mediante la comparación de conservación de operones en procariontes. Mario Alberto Matínez Núñez. Estudiante de maestría de Ciencias Bioquímicas/Instituto de Biotecnología/UNAM. Que trabaja en la identifcación computacional de genes paralogos dentro de la base de datos COG y su posterior separación en grupos funcionales distintos. Zuemy Rodriguez. Escamilla. Estudiante de Biología de la Facultad de Ciencias/UNAM que realiza su tesis de licenciatura en el grupo en un proyecto que tiene como objetivo el caracterizar experimentalmente las señales de regulación tipo riboswitch. Ana Gutiérrez Preciado. Viridiana Ávila Magna, Estudiante de Biología de la Facultad de Ciencias/UNAM que realiza su tesis de licenciatura en el grupo en un proyecto que tiene como objetivo identificar computacionalmente estructuras secundarias que sirven como termorreguladores en arqueobacterias, Estudiante de Licenciatura en Ciencias Genómicas/UNAM. Está desarrollando un proyecto sobre la identificación de señales de regulación en operones de biosíntesis de triptofano.

MAJOR EQUIPMENT: List the most important equipment items already available for this project, noting the location and pertinent capabilities of each.

Access to an X-ray facility at the neighboring Instituto de Química, UNAM, which consists of an R-Axis image

plate detector, Rigaku RUH3R rotating anode generator with Osmic optics and an cryosystem for data

collection at 100 K. Data are processed on an Intel Pentium processor PC running Linux. The facility has a

Nikon SZ1400 stereo-zoom microscope and a low-vibration crystallization chamber for growing crystals at 18and 4°C, a Pharmacia AKTA FPLC, dynamic laser light scattering instrument, CD equipment, and mass spectrometer.

Este no lo he tocado. PROGRAMA DE ACTIVIDADES ACTIVIDADES 1o. 2o. 3o. 4o. 5o. 6o. 7o. 8o. 9o. Desarrollo de sistemas automáticos para obtención de datos +++ Construcción de bases de datos locales y predicción de operones +++ +++ Obtención de secuencias MUR e iMURS +++ Agrupamiento de MURs en familia de ortólogos +++ Identificacion de señales secuencia primaria dependiente +++ +++ Identificacion de señales de curvatura estática del DNA +++ +++ Identificacion de señales enn base a la estructura secundaria del RNA +++ +++ +++ Formulación de un mecanismo común de regulación +++ +++ Elaboración de modelos de regulación +++ +++ +++ Verificación del modelo en base con resultados publicados +++ +++ +++ Verificación experimental del modelo +++ +++

Page 20: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

+++ +++ +++ Incorporación de reultados en bases de datos públicas +++ +++ Creación de nuevas páginas de web con resultados del proyecto +++ +++ +++

REFERENCIAS

Reference List

1. Winkler, W. C. 2005. Riboswitches and the role of noncoding RNAs in bacterial metabolic control. Curr.Opin.Chem.Biol. 9:594-602.

2. Abreu-Goodger, C., N. Ontiveros-Palacios, R. Ciria, and E. Merino. 2004. Conserved regulatory motifs in bacteria: riboswitches and beyond. Trends in Genetics 20:475-479.

3. Breaker, R. R. 2004. Genetic control by riboswitches and ribozymes. Abstracts of Papers of the American Chemical Society 228:U172.

4. Thore, S., M. Leibundgut, and N. Ban. 2006. Structure of the eukaryotic thiamine pyrophosphate riboswitch with its regulatory ligand. Science 312:1208-1211.

5. Bailey, T. L. and C. Elkan. 1994. Fitting a mixture model by expectation maximization to discover motifs in biopolymers. Proc.Int.Conf.Intell.Syst.Mol.Biol. 2:28-36.

6. Bailey, T. L. and M. Gribskov. 1998. Combining evidence using p-values: application to sequence homology searches. Bioinformatics. 14:48-54.

7. Abreu-Goodger, C. and E. Merino. 2005. RibEx: a web server for locating riboswitches and other conserved bacterial regulatory elements. Nucleic Acids Research 33:W690-W692.

8. Barrick, J. E., K. A. Corbino, W. C. Winkler, A. Nahvi, M. Mandal, J. Collins, M. Lee, A. Roth, N. Sudarsan, I. Jona, J. K. Wickiser, and R. R. Breaker. 2004. New RNA motifs suggest an expanded scope for riboswitches in bacterial genetic control. Proc.Natl.Acad.Sci.U.S.A 101:6421-6426.

9. Nahvi, A., J. E. Barrick, and R. R. Breaker. 2004. Coenzyme B-12 riboswitches are widespread genetic control elements in prokaryotes. Nucleic Acids Research 32:143-150.

10. Grundy, F. J., S. M. Rollins, and T. M. Henkin. 1994. Interaction between the acceptor end of tRNA and the T box stimulates antitermination in the Bacillus subtilis tyrS gene: a new role for the discriminator base. J.Bacteriol. 176:4518-4526.

11. Batey, R. T., S. D. Gilbert, and R. K. Montange. 2004. Structure of a natural guanine-responsive riboswitch complexed with the metabolite hypoxanthine. Nature 432:411-415.

Page 21: PREDICCIONES DE REDES DE REGULACION …€¦ · Web viewANTECEDENTES Los seres vivos se caracterizan, entre otras cosas, por su capacidad de responder a estímulos de su exterior

12. Thore, S., M. Leibundgut, and N. Ban. 2006. Structure of the eukaryotic thiamine pyrophosphate riboswitch with its regulatory ligand. Science 312:1208-1211.

13. Torres-Larios, A., A. C. Dock-Bregeon, P. Romby, B. Rees, R. Sankaranarayanan, J. Caillet, M. Springer, C. Ehresmann, B. Ehresmann, and D. Moras. 2002. Structural basis of translational control by Escherichia coli threonyl tRNA synthetase. Nature Structural Biology 9:343-347.

14. Torres-Larios, A., K. K. Swinger, A. S. Krasilnikov, T. Pan, and A. Mondragon. 2005. Crystal structure of the RNA component of bacterial ribonuclease P. Nature 437:584-587.

15. Merino, E. and C. Yanofsky. 2005. Transcription attenuation: a highly conserved regulatory strategy used by bacteria. Trends Genet. 21:260-264.

16. Gutierrez-Preciado, A., R. A. Jensen, C. Yanofsky, and E. Merino. 2005. New insights into regulation of the tryptophan biosynthetic operon in Gram-positive bacteria. Trends Genet. 21:432-436.

17. Abreu-Goodger, C. and E. Merino. 2005. RibEx: a web server for locating riboswitches and other conserved bacterial regulatory elements. Nucleic Acids Res. 33:W690-W692.

18. Ciria, R., C. Abreu-Goodger, E. Morett, and E. Merino. 2004. GeConT: gene context analysis. Bioinformatics. 20:2307-2308.

19. Torres-Larios, A., A. C. Dock-Bregeon, P. Romby, B. Rees, R. Sankaranarayanan, J. Caillet, M. Springer, C. Ehresmann, B. Ehresmann, and D. Moras. 2002. Structural basis of translational control by Escherichia coli threonyl tRNA synthetase. Nature Structural Biology 9:343-347.

20. Torres-Larios, A., K. K. Swinger, A. S. Krasilnikov, T. Pan, and A. Mondragon. 2005. Crystal structure of the RNA component of bacterial ribonuclease P. Nature 437:584-587.

21. Moreno-Hagelsieb, G. and J. Collado-Vides. 2002. A powerful non-homology method for the prediction of operons in prokaryotes. Bioinformatics. 18 Suppl 1:S329-S336.

22. Tatusov, R. L., E. V. Koonin, and D. J. Lipman. 1997. A genomic perspective on protein families. Science 278:631-637.

23. Bonner, E. R., J. N. D'Elia, B. K. Billips, and R. L. Switzer. 2001. Molecular recognition of pyr mRNA by the Bacillus subtilis attenuation regulatory protein PyrR. Nucleic Acids Research 29:4851-4865.