Upload
others
View
24
Download
0
Embed Size (px)
Citation preview
UNIVERSIDAD CENTRAL DEL ECUADOR
FACULTAD DE CIENCIAS QUÍMICAS
CARRERA DE QUÍMICA FARMACÉUTICA
IDENTIFICACIÓN DE PROTEÍNAS DE DNA REPLICATION CHECKPOINT
EN TRIPANOSOMÁTIDOS, UTILIZANDO HERRAMIENTAS DE
BIOINFORMÁTICA Y MODELADO TRIDIMENSIONAL
TRABAJO DE TITULACIÓN, MODALIDAD PROYECTO DE
INVESTIGACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE QUÍMICO
FARMACÉUTICO
AUTOR: CARLOS ANDRÉS PARRA CRUZ
TUTORA: ANA POVEDA GABALDÓN Ph.D
QUITO
Agosto 2018
UNIVERSIDAD CENTRAL DEL ECUADOR
FACULTAD DE CIENCIAS QUÍMICAS
CARRERA DE QUÍMICA FARMACÉUTICA
INSTITUTO DE INVESTIGACIÓN EN SALUD PÚBLICA Y
ZOONOSIS CIZ
UNIVERSIDAD SAN FRANCISCO DE QUITO
INSTITUTO DE SIMULACIÓN COMPUTACIONAL
IDENTIFICACIÓN DE PROTEÍNAS DE DNA REPLICATION CHECKPOINT
EN TRIPANOSOMÁTIDOS, UTILIZANDO HERRAMIENTAS DE
BIOINFORMÁTICA Y MODELADO TRIDIMENSIONAL
TRABAJO DE TITULACIÓN, MODALIDAD PROYECTO DE
INVESTIGACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE QUÍMICO
FARMACÉUTICO
AUTOR: CARLOS PARRA CRUZ
TUTORA: ANA POVEDA GABALDÓN Ph.D
CO-TUTOR: MIGUEL ÁNGEL MÉNDEZ Ph.D
QUITO
Agosto 2018
iii
© DERECHOS DE AUTOR
Yo, Parra Cruz Carlos Andrés con C.I.: 060376931-6 en calidad de autor del trabajo de
investigación: “Identificación de proteínas de DNA Replication Checkpoint en
tripanosomátidos, utilizando herramientas de bioinformática y modelado tridimensional”,
autorizo a la Universidad Central del Ecuador, a hacer uso de todos los contenidos que
me pertenecen o parte de los que contiene esta obra, con fines estrictamente académicos
o de investigación.
Los derechos que como autor me corresponden, con excepción de la presente
autorización, seguirán vigentes a mi favor, de conformidad con lo establecido en los
artículos 5, 6, 8; 19 y demás pertinentes de la Ley de Propiedad Intelectual y su
Reglamento.
También, autorizo a la Universidad Central del Ecuador a realizar la digitalización y
publicación de este trabajo de investigación en el repositorio virtual, de conformidad a lo
dispuesto en el Art. 144 de la Ley Orgánica de Educación Superior.
En la ciudad de Quito, a los ___ del mes agosto de 2018.
_____________________
Carlos Parra Cruz
C.C. 060376931-6
iv
ACEPTACIÓN DEL TUTOR
Por la presente, dejo constancia que he leído la propuesta del trabajo de titulación,
presentada por el señor CARLOS ANDRÉS PARRA CRUZ cuyo tema es “Identificación
de proteínas de DNA Replication Checkpoint en tripanosomátidos, utilizando
herramientas de bioinformática y modelado tridimensional” y en tal virtud acepto
asesorar a la estudiante en calidad de Tutor durante la etapa del proyecto de investigación
e informe final del trabajo de investigación, hasta su correspondiente presentación y
evaluación.
Dado en la ciudad de Quito a los………………. del mes de…………………… de 2018.
--------------------------------------------------
Firma
Ana María Poveda Gabaldón Ph.D
C.I. 175066812-9
v
ACEPTACIÓN DEL CO-TUTOR
Por la presente, dejo constancia que he leído la propuesta del trabajo de titulación,
presentada por el señor CARLOS ANDRÉS PARRA CRUZ cuyo tema es “Identificación
de proteínas de DNA Replication Checkpoint en tripanosomátidos, utilizando
herramientas de bioinformática y modelado tridimensional” y en tal virtud acepto
asesorar a la estudiante en calidad de Co-tutor durante la etapa del proyecto de
investigación e informe final del trabajo de investigación, hasta su correspondiente
presentación y evaluación.
Dado en la ciudad de Quito a los………………. del mes de…………………… de 2018.
--------------------------------------------------
Firma
Miguel Angel Méndez Ph.D
C.I. 1708544596
vi
CONSTANCIA DE APROBACION DEL TRIBUNAL
El tribunal constituido por Msc. Eliana Lara, y Dr. Luis Castillo, luego de revisar el
trabajo de investigación titulado “Identificación de proteínas de DNA Replication
Checkpoint en tripanosomátidos, utilizando herramientas de bioinformática y modelado
tridimensional” previo a la obtención del título (o grado académico) de Químico
Farmacéutico presentado por el señor Carlos Andrés Parra Cruz, APRUEBA el trabajo
presentado.
Dado en la ciudad de Quito a los………………. del mes de…………………… de 2018.
Para constancia de lo actuado firman:
--------------------------------------------------
Firma
Eliana Lara Msc.
C.I. __________________
--------------------------------------------------
Firma
Dr. Luis Castillo
C.I. __________________
viii
AGRADECIMIENTOS
El autor expresa su ferviente agradecimiento a:
Ana Poveda, docente investigadora de la Universidad Central del Ecuador por su calidad
humana y alto intelecto demostrado como guía en el presente trabajo de investigación.
Miguel Ángel Méndez, docente de la Universidad San Francisco de Quito, por su
constante apoyo y motivación en las tareas desarrolladas, demostrando siempre su
brillantez e integridad moral.
A la Dra. Liliana Naranjo, directora de carrera de Química Farmacéutica de la UCE, por
su cálida tutela y gran contribución en la formación profesional de los jóvenes
investigadores del país.
ix
CONTENIDO
pág.
AGRADECIMIENTOS ................................................................................................. viii
CONTENIDO .................................................................................................................. ix
LISTA DE TABLAS ...................................................................................................... xii
LISTA DE FIGURAS ................................................................................................... xiii
LISTA DE ANEXOS ..................................................................................................... xv
LISTA DE ABREVIATURAS ...................................................................................... xvi
RESUMEN ................................................................................................................... xvii
ABSTRACT ................................................................................................................ xviii
INTRODUCCIÓN ............................................................................................................ 1
1. EL PROBLEMA........................................................................................................... 3
1.1 Planteamiento del Problema ................................................................................... 3
1.2 Formulación del problema ...................................................................................... 4
1.3 Justificación ............................................................................................................ 4
1.4 Preguntas de investigación ...................................................................................... 6
1.5 Objetivos ................................................................................................................. 7
1.5.1 Objetivo General .............................................................................................. 7
1.5.2 Objetivos Específicos ....................................................................................... 7
2. MARCO TEÓRICO ..................................................................................................... 8
2.1 Antecedentes ........................................................................................................... 8
2.2 Marco Referencial ................................................................................................... 9
2.2.1 Leishmaniasis ................................................................................................... 9
2.2.2 Ciclo celular ................................................................................................... 11
2.2.3 DNA Damage Checkpoint .............................................................................. 11
2.2.4 Similitud de secuencias .................................................................................. 14
2.2.5 Similitud a nivel de estructura ........................................................................ 15
2.2.6 Modelado de Proteínas ................................................................................... 15
x
2.2.7 Servidor para modelado de proteínas ............................................................. 15
2.2.8 Comparación de estructuras proteicas ............................................................ 16
2.2.9 Métricas de calidad......................................................................................... 17
2.3 Marco Legal .......................................................................................................... 18
2.4 Hipótesis ............................................................................................................... 19
2.5 Sistema de Variables ............................................................................................. 19
2.5.1 Variables caracterización ............................................................................... 19
2.5.2 Variables de interés ........................................................................................ 19
3. MARCO METODOLÓGICO .................................................................................... 20
3.1 Diseño de la investigación .................................................................................... 20
3.1.1 Paradigma de la investigación ........................................................................ 20
3.1.2 Nivel de la investigación ................................................................................ 20
3.1.3 Tipo de investigación ..................................................................................... 20
3.1.4 Procedimiento para alcance de objetivos ....................................................... 21
3.2 Materiales y Métodos ............................................................................................ 21
3.2.1 Materiales ....................................................................................................... 21
3.2.2 Servidores ....................................................................................................... 21
3.2.3 Métodos .......................................................................................................... 21
3.2.4 Matriz de operacionalización de variables ..................................................... 24
3.2.4 Técnicas e instrumentos de recolección de datos ........................................... 25
3.2.5 Técnicas de Procesamiento y Análisis de Datos ............................................ 25
4. MARCO ADMINISTRATIVO .................................................................................. 26
4.1 Recursos ................................................................................................................ 26
4.1.1 Talento humano .............................................................................................. 26
4.1.2 Recursos materiales ........................................................................................ 26
4.2 Presupuesto ........................................................................................................... 26
4.3 Cronograma........................................................................................................... 27
5. DISCUSIÓN DE RESULTADOS.............................................................................. 28
5.1 Definición de proteínas de DNA Replication Checkpoint ..................................... 28
5.2 Desarrollo del método de búsqueda ...................................................................... 29
5.3 Búsqueda de homólogos a spMrc1 en Leishmania mexicana .............................. 31
5.4 Homología estructural Mrc1/Claspin entre S. pombe, H. sapiens y L. mexicana 33
5.5 Validación de Estructuras ..................................................................................... 36
5.7 Homología Mrc1/Claspin en tripanosomátidos .................................................... 40
7. CONCLUSIONES Y RECOMENDACIONES ......................................................... 41
xi
7.1 Conclusiones ......................................................................................................... 41
7.2 Recomendaciones ................................................................................................. 42
CITAS BIBLIOGRÁFICAS........................................................................................... 43
ANEXOS ........................................................................................................................ 48
xii
LISTA DE TABLAS
pág.
Tabla 1. Operacionalización de variables .................................................................. 24
Tabla 2. Presupuesto requerido .................................................................................. 26
Tabla 3. Posibles genes homólogos a spMrc1 en H. sapiens ordenados en función de
su solapamiento. ......................................................................................................... 30
Tabla 4. Comparación por BLAST posibles homólogos a spMrc1 en H. sapiens .... 31
Tabla 5. Posibles genes homólogos a spMrc1 en L. mexicana ordenados en función de
su solapamiento. ......................................................................................................... 32
Tabla 6. Comparación por BLAST entre posibles homólogos a spMrc1 en L. mexicana
................................................................................................................................... 32
Tabla 7. Comparación entre proteínas de referencia y de L. mexicana. .................... 34
Tabla 8. Comparación entre estructuras de control. .................................................. 36
Tabla 9. Métricas de calidad de las proteínas modeladas. ......................................... 38
Tabla 10. Comparación entre familias de proteínas modeladas ................................ 39
Tabla 11. Resultados de BLAST entre LmxM.34.1090 (putative Mrc1) y a otros
tripanosomátidos ........................................................................................................ 40
xiii
LISTA DE FIGURAS
pág.
Figura 1. DNA Replication Checkpoint. ................................................................ 13
Figura 2. Protocolo I-TASSER para predicción de estructuras proteicas ............. 16
Figura 3. Gráfica de error Errat.. ........................................................................... 17
Figura 4. Red de interacción entre proteínas del mecanismo de DNA Replication
Checkpoint en Homo Sapiens................................................................................ 29
Figura 5. Red de interacción String entre proteínas del mecanismo de DNA
Replication Checkpoint en Saccharomyces cerevisiae. ........................................ 29
Figura 6. Estructura modelada por ITASSER de Claspin en H. sapiens. ............. 33
Figura 7. Estructura modelada por ITASSER de Mrc1 en S. pombe .................... 33
Figura 8. Estructura modelada por ITASSER de LmxM.33.0690 ......................... 35
Figura 9. Estructura modelada por ITASSER de LmxM.34.1090 ......................... 35
Figura 10. Superposición de estructuras modeladas.. ........................................... 34
Figura 11. Superposición de estructuras predichas. Dorado: hsClaspin, Naranja:
putative hsClaspin L. mexicana (LmxM.330690).. ............................................... 35
Figura 12. Superposición de estructuras modeladas. Azul: spMrc1, Violeta: putative
spMrc1 L. mexicana (LmxM.34.1090). ................................................................. 35
Figura 13. Superposición de estructuras scRad53. Dorado: S. cerevisiae, Celeste:
LmjF.17.0060. Control Positivo ............................................................................ 37
Figura 14. Superposición de estructuras Control Negativo. Azul: spMrc1, Rojo:
ACC....................................................................................................................... 37
Figura 15. Superposición de estructuras Control Negativo. Dorado: hsClaspin,
Rojo: ACC. Modeladas por I-TASSER. ............................................................... 37
xiv
Figura 16. Superposición de estructuras modeladas por I-TASEER para Claspin.
Dorado: H. sapiens, Verde: X. laevis .................................................................... 39
Figura 17 Superposición de estructuras predichas para putative Mrc1. Violeta: L.
mexicana, Blanco: L. major (LmjF.35.1090). ....................................................... 39
Figura 18. Superposición de estructuras predichas para Mrc1. Azul: S. pombe,
Amarillo: S. cerevisiae .......................................................................................... 39
xv
LISTA DE ANEXOS
pág.
Anexo A. Árbol de Problemas ............................................................................. 49
Anexo B. Categorización de variables ................................................................. 50
Anexo C. Instrumento de recolección de datos .................................................... 52
Anexo D. Diagrama de Flujo Metodología .......................................................... 53
Anexo E. Posibles genes homólogos a spMrc1 en Homo sapiens en KEGG ...... 54
Anexo F. Gráfica de distribución de Error Errat .................................................. 58
xvi
LISTA DE ABREVIATURAS
ADN: Ácido Desoxirribonucleico
ATM: Ataxia telangiectasia mutated
ATR: Ataxia telangiectasia and Rad3-related protein
CHK: Checkpoint
CLSPN: Claspin encode gene
KEGG: Kyoto Encyclopedia of Genes and Genomes
MRC: Mediator of Replication Checkpoint
NCBI: National Center for Biotechnology Information
PDB: Protein Data Bank
TIPIN: TIMELESS-interacting protein
GeneDB: Gene Data Base
xvii
Título: Identificación de proteínas de DNA Replication Checkpoint en tripanosomátidos,
utilizando herramientas de bioinformática y modelado tridimensional
Autor: Carlos Parra Cruz
Tutora: Ana Poveda
Co-tutor: Miguel Angel Méndez
RESUMEN
Leishmaniasis y tripanosomiasis americana son enfermedades tropicales causadas por
parásitos del orden de los tripanosomátidos. Estas enfermedades presentan tratamientos
con elevados efectos adversos. Actualmente, se investigan nuevas dianas terapéuticas
para el desarrollo de tratamientos alternativos, como por ejemplo los checkpoints. Estos
son mecanismos de verificación de la integridad del ADN, descritos e identificados en
diferentes organismos modelo. En tripanosomátidos, no se ha identificado varios
componentes proteicos que intervienen en el DNA Replication Checkpoint. En el presente
trabajo de investigación se identificaron posibles homólogos a hsClaspin/spMrc1 del
DNA Replication Checkpoint en tripanosomátidos. Se desarrolló un método que permite
realizar la búsqueda de genes con similitud de secuencia baja a esta proteína en
Leishmania mexicana. Las secuencias proteicas con mayor similitud atravesaron el
proceso de modelado de estructura terciaria. Además, se realizó comparaciones de
superposición estructural entre las proteínas de estudio y las de referencia. Se encontró
elevada similitud estructural entre spMrc1/hsClaspin y las proteínas codificadas por los
genes LmxM.34.1090 y LmxM.33.0690 respectivamente. Es posible la existencia de estos
dos homólogos en tripanosomátidos, sin embargo, se recomienda la investigación in vitro,
para confirmar esta teoría. Adicionalmente se encontró genes con alta similitud de
secuencia a LmxM.34.1090 en L. major, L. infantum, L. donovani, L. braziliensis y genes
con similitudes considerables en T. cruzi y T. brucei.
Palabras clave: CHECKPOINT, CLASPIN, MRC1, BIOINFORMÁTICA,
HOMÓLOGOS, Leishmania
xviii
Title: Identification of DNA Replication Checkpoint proteins in trypanosomatids, using
bioinformatics tools and structural modeling
Author: Carlos Parra Cruz
Tutor: Ana Poveda
Co-tutor: Miguel Angel Méndez
ABSTRACT
Leishmaniasis and American trypanosomiasis are tropical diseases caused by parasites of
the order trypanosomatids. These diseases present treatments with high adverse effects.
Currently, new therapeutic targets are being investigated for the development of
alternative treatments, such as checkpoints. These checkpoints are DNA verification
mechanisms, described and identified in different model organisms. In trypanosomatids,
several protein components that intervene in DNA Replication Checkpoint have not been
identified. In the present research, possible homologues to hsClaspin / spMrc1 in
trypanosomatids are identified. We develop a method that allows searches of genes with
low sequence similarity to this protein in Leishmania mexicana. The protein sequences
with greater similarity was modeled at its tertiary structure. In addition, comparisons of
structural overlap were made between the study and reference proteins. High structural
similarity was found between spMrc1 / hsClaspin and the proteins encoded by the genes
LmxM.34.1090 and LmxM.33.0690 respectively. The existence of these two homologous
genes in trypanosomatids is possible, however, in vitro research is recommended to
confirm this theory. Additionally, genes with high sequence similarity were found at
LmxM.34.1090 in L. major, L. infantum, L. donovani, L. braziliensis and genes with
considerable similarities in T. cruzi and T. brucei.
Keywords: CHECKPOINT, CLASPIN, MRC1, BIOINFORMATICS, HOMOLOGUES,
Leishmania
1
INTRODUCCIÓN
Leishmaniasis y tripanosomiasis americana, son enfermedades parasitarias
causadas por microorganismos del orden trypanosomatida que afectan al ser humano y
animales domésticos (OMS, 2018). En las últimas décadas se han realizado diversos
estudios orientados a la búsqueda de terapias alternativas a estas enfermedades
(Uzcanga et al., 2016), debido a que los tratamientos convencionales presentan elevados
efectos adversos (MSP, 2014). Para abordar esta problemática, se ha recurrido al estudio
de los mecanismos biológicos que rigen el ciclo celular en parásitos tripanosomátidos.
Durante el ciclo celular, la célula obtiene información del código genético, el cual
controla los procesos bioquímicos necesarios para su normal funcionamiento. Por tanto,
es de vital importancia que la integridad del ADN se conserve adecuadamente
(Beishline & Clifford, 2014). Para verificar esto, se utilizan checkpoints, los cuales
activan los mecanismos de reparación, en caso de existir daño en cualquiera de las fases
del ciclo celular: G0. G1, S y G2 (Abraham, 2001).
Existen diferentes tipos de checkpoints, dependiendo de la fase del ciclo celular
en la cual se realice el control. Por ejemplo, los checkpoints de mitosis, verifican el
correcto ensamblaje del uso mitótico. Los DNA Damage Checkpoint detectan daños en
el ADN. En la fase S, se realiza la verificación de la integridad del ADN a través de
unos de los checkpoints de daño denominado DNA Replication Checkpoint (Beishline
& Clifford, 2014).
Este checkpoint está conformado por grupos de proteínas que cumplen la función
verificadora. En Homo sapiens, se denominan proteínas sensoras (ATM/ATR),
transmisoras (Claspin/Tipin/Timeless) y efectoras (Chk1/Chk2). En Saccharomyces
cerevisiae son: proteínas sensoras (Tel1/Mec1), transmisoras (Mrc1/Csm3/Tof1) y
efectoras (Chk1/Rad53) (Beishline & Clifford, 2014). Es importante mencionar que no
se encuentran referencias documentadas del complejo transmisor
(Claspin/Tipin/Timeless) en tripanosomátidos (Uzcanga et al., 2016) (Genois, E., &
Laffitte, 2014).
2
A través de estudios preliminares se realizó la búsqueda de homólogos al complejo
Claspin/Tipin/Timeless en Leishmania sp., utilizando comparación de secuencias en
base a organismos de referencia (H. sapiens y S. cerevisiae) a través de la herramienta
bioinformática básica BLAST. En esta búsqueda elemental, no se encontraron
similitudes significativas (Genois, y otros, 2014).
En la actualidad, los mecanismos que rigen la integridad de ADN en
tripanosomátidos no se encuentran completamente caracterizados (Uzcanga, y otros,
2016). Sin embargo, en las últimas décadas, se han desarrollado herramientas
bioinformáticas más complejas que permiten realizar estudios comparativos del genoma
de tripanosomátidos frente a organismos de referencia, con la finalidad de inferir
información que permita caracterizar dichos mecanismos (Nunes, Damasceno, Freire,
& Tosi, 2011).
Este fue el caso de la identificación de Hus1, una proteína perteneciente al sistema
de checkpoint, realizada por Damasceno y colaboradores. Al realizar una búsqueda a
nivel de secuencia se presentó baja similitud entre la proteína de referencia spHus1 y el
proteoma de Leishmania major. Sin embargo, cuando se realizó la búsqueda a nivel de
estructura terciaria, fue posible encontrar homologías para esta proteína (Nunes,
Damasceno, Freire, & Tosi, 2011).
La caracterización acertada de los mecanismos de DNA Replication Checkpoint
en Leishmania y Trypanosoma, permite establecer nuevas dianas terapéuticas, con la
finalidad de desarrollar tratamientos alternativos frente a estos parásitos. En el presente
trabajo de investigación, se utilizaron herramientas bioinformáticas aplicadas, enfocadas
en la búsqueda e identificación de proteínas de DNA Replication Checkpoint en parásitos
tripanosomátidos, en función de la información descrita en organismos de referencia.
3
1. EL PROBLEMA
1.1 Planteamiento del Problema
Según la Organización Mundial de la Salud, cada año se producen entre 700 000
y un millón de nuevos casos de leishmaniasis y 30 000 defunciones (OMS, 2018).
Además, existen entre 6 y 7 millones de personas infectadas por Trypanosoma cruzi, el
parásito causante de la enfermedad de Chagas, la mayoría de ellas en América Latina
(OMS, 2018). En Ecuador, una zona geográfica tropical, se presentan las condiciones
apropiadas para el desarrollo de microorganismos parasitarios causantes de
enfermedades tropicales. De hecho, según el Ministerio de Salud Pública, se registraron
1.045 casos de leishmaniasis, en 22 de las 24 provincias (MSP, 2014), y se reportaron
cerca de 170 000 personas infectadas con tripanosomiasis americana (Larreátegui,
2011).
El tratamiento disponible en la actualidad frente a leishmaniasis, aprobado por el
Ministerio de Salud Pública del Ecuador, consiste en la administración múltiple de
inyecciones de antimoniato de meglumina, un fármaco con elevados efectos adversos,
entre los cuales se destacan: daños gastrointestinales, hepatotoxicidad y alteraciones
cardíacas (MSP, 2014). Otro medicamento utilizado es miltefosina, el cual presenta un
rango terapéutico muy estrecho, hecho que pone en riesgo la salud de los pacientes
tratados. (MSP, 2014). Miltefosina en la actualidad se considera como un medicamento
huérfano, pues bajo condiciones normales de mercado, la industria farmacéutica tiene
poco interés en desarrollar y comercializar este tipo de producto (Comisión de las
Comunidades Europeas, 2008).
En el caso de tripanosomiasis americana, el tratamiento farmacológico para las
etapas agudas corresponde a benznidazol y nifurtimox. Estos fármacos son usados bajo
vigilancia sanitaria, debido a sus efectos adversos que superan el 30% de los casos, a su
vez, las resistencias a la terapia son un problema notable. Se ha demostrado que, en
etapas crónicas de la enfermedad, los medicamentos descritos presentan menor eficacia
(Bern et al., 2007).
4
La cooperación establecida por la Universidad Central del Ecuador y el Instituto
de Simulación Computacional de la Universidad San Francisco de Quito, mediante la
modalidad de trabajo de titulación y el uso de software libre, permiten la ejecución del
presente trabajo de investigación que contribuye al desarrollo de enfoques terapéuticos
innovadores frente a leishmaniasis.
1.2 Formulación del problema
¿Existen homólogos de proteínas del complejo de Claspin/Tipin/Timeless de DNA
Replication Checkpoint en Leishmania mexicana?
1.3 Justificación
La leishmaniasis y tripanosomiasis son enfermedades que afectan
significativamente a los sectores más vulnerables del país (MSP, 2014). A través del
presente estudio, se pretende contribuir a la línea de investigación impulsada por el CIZ
“Development of innovative therapeutic approaches against leishmaniasis”, que tiene
como objetivo identificar fármacos y dianas terapéuticas para desarrollar tratamientos
alternativos frente a Leishmania sp., utilizando conocimientos que se encuentran a la
vanguardia en investigación científica a nivel mundial, dentro del campo de la
bioinformática, biología molecular e ingeniería genética.
Estudios previos han identificado la presencia de posibles dianas terapéuticas
relacionadas con la integridad del ADN en Leishmania sp. (Uzcanga, y otros, 2016). De
hecho, experimentalmente se ha comprobado la existencia de mecanismos de verificación
de la integridad del ADN en tripanosomátidos (Genois, E., & Laffitte, 2014) (Conway,
Proudfoot, Burton, & al., 2002). No obstante, la información disponible acerca de los
mecanismos moleculares relacionados con el DNA Replication Checkpoint en
tripanosomátidos, no se encuentra totalmente definida en Leishmania sp. Esto se debe a
que se observa la presencia de proteínas homólogas a ATM/ATR/Chk1/Chk2, sin
embargo, no se verifica la presencia del complejo Claspin/Tipin/Timeless en Leishmania
sp. (Uzcanga et al., 2016).
5
El uso del enfoque bioinformático aplicado a la búsqueda de proteínas del
complejo Claspin/Tipin/Timeless del sistema de DNA Replication Checkpoint en
Leishmania sp., permite un análisis eficiente de la información genética disponible
(Higgins & Taylor, 2000). De hecho, la bioinformática es una disciplina amplia que tiene
como objetivo la aplicación de tecnologías computacionales y estadísticas para la gestión
de datos biológicos (Luscombe, Greenbaum, & Gerstein, 2001). Entre las herramientas
que se utilizan se puede mencionar: búsqueda de homologías por secuencia, búsqueda de
homologías por estructura, modelado de proteínas, acomplamiento molecular o docking,
entre otras (Higgins & Taylor, 2000). Estudios preliminares realizados a través de
búsqueda de homologías por secuencia, sugieren la ausencia de homólogos al sistema
Claspin/Tipin/Timeless en L mexicana. Además, al realizar la búsqueda en la base de
datos UniProt, no se encuentra referencias a este sistema para Leishmania sp. en la
actualidad (The UniProt Consortium, 2017).
Otro enfoque bioinformático, consiste en la comparación de estructuras proteicas.
Es así, que se realizó la búsqueda de proteínas de DNA Replication checkpoint en el
Protein Data Bank, encontrándose los siguientes resultados. Existen alrededor de 62
entradas de estructuras cristalográficas de Leishmania mexicana en el Protein Data Bank,
lo cual representa una cantidad pequeña, en comparación con las 36.821 entradas
encontradas para Homo sapiens. Por tanto, se podría afirmar que el estudio de Leishmania
mexicana se podría beneficiar del uso de herramientas bioinformáticas dado que la
evidencia puramente experimental estructural aún es escasa (RCSB, 2018) (Berman et
al., 2000).
Al realizar la búsqueda de las estructuras cristalográficas del complejo
Claspin/Tipin/Timeless en la base de datos Protein Data Bank, se evidenció que no
existen en la actualidad entradas relacionadas con esta temática. Este hecho, dificulta el
estudio de los mecanismos de DNA Replication Checkpoint, en los cuales intervienen
estas proteínas (RCSB, 2018).
Disponer de una identificación bioinformática permite tener un punto de partida
valido para realizar experimentaciones in vitro, como podía ser introducción de
mutaciones genéticas y represión de genes. De esta manera, es posible optimizar los
recursos, ya que, al carecer de esta información previa que identifique genes, la
experimentación in vitro resultaría menos eficiente. Para el presente estudio, se ha tomado
6
en cuenta las cepas de Leishmania sp. almacenadas en el Laboratorio de replicación del
DNA e instabilidad del genoma del CIZ, y su relevancia clínica y epidemiológica.
Posterior a la identificación bioinformática y modelado tridimensional de
proteínas de Checkpoint de Leishmania sp., se puede continuar con la investigación
experimental que permita verificar los resultados obtenidos a través de las colecciones de
datos genéticos, ya que, en el laboratorio de replicación del ADN e inestabilidad del
genoma del CIZ, se dispone de la infraestructura y el personal requerido para continuar
con esta línea de investigación.
1.4 Preguntas de investigación
- ¿Qué proteínas se encuentran involucradas actualmente en el DNA Replication
Checkpoint en organismos de referencia?
- ¿Qué proteína del complejo Claspin/Tipin/Timeless de DNA Replication Checkpoint,
se estudiará en la presente investigación?
- ¿Cómo verificar la homología entre los organismos de referencia H. sapiens y S.
pombe, a través de técnicas bioinformáticas?
- ¿Qué estrategia bioinformática se puede aplicar para la identificación de homólogos
del complejo Claspin/Tipin/Timeless de DNA Replication Checkpoint en Leishmania
sp.?
- ¿Qué controles se puede establecer para validar los procedimientos descritos?
- ¿Qué homologías se pudiese interpolar a otros tripanosomátidos, como Trypanosoma
cruzi?
7
1.5 Objetivos
1.5.1 Objetivo General
Identificar homólogos a hClaspin/spMrc1 en Leishmania mexicana utilizando
herramientas bioinformáticas.
1.5.2 Objetivos Específicos
- Verificar el sistema de proteínas involucrado actualmente en DNA Replication
Checkpoint en organismos de referencia.
- Seleccionar la proteína de DNA Replication Checkpoint, que se estudiará en la
presente investigación.
- Verificar bioinformáticamente la homología documentada entre el sistema de DNA
Replication Checkpoint en organismos de referencia.
- Desarrollar una estrategia bioinformática que permita identificar homólogos del
complejo Claspin/Tipin/Timeless de DNA Replication Checkpoint en L. mexicana.
- Establecer las relaciones existentes entre Mrc1 y el genoma de L. mexicana.
- Realizar controles para validar los procedimientos descritos.
- Interpolar homologías frente a otros tripanosomátidos, como Trypanosoma cruzi.
8
2. MARCO TEÓRICO
2.1 Antecedentes
El Centro Internacional de Zoonosis CIZ, a través de Laboratorio de replicación del
DNA e instabilidad del genoma, impulsa la línea de investigación: “Development of
innovative therapeutic approaches against leishmaniasis”, en el cual se busca
identificar tratamientos alternativos a los expuestos frente a leishmaniasis. Es así, que
se ha estudiado los mecanismos de verificación de la integridad del ADN, con el fin de
identificar nuevas dianas potencialmente susceptibles a tratamientos alternativos, como
por ejemplo los mecanismos de checkpoint.
Uzcanga y col. han realizado una revisión bibliográfica en la que se describe las rutas
de control de la integridad del ADN en tripanosomátidos, como el Checkpoint de
Replicación de ADN (Uzcanga et al., 2016). Entre las proteínas homólogas identificadas
en este checkpoint se encuentran ATM, ATR, Chk1, y Chk2, sin embargo, Claspin,
Tipin y Timeless no han sido identificados debido a su baja similitud a nivel de secuencia
(Genois et al., 2014). El problema radica en que el método utilizado para realizar esta
identificación corresponde a una búsqueda bioinformática básica, por tanto, se podría
presentar el inconveniente de omitir ciertas proteínas con baja similitud de secuencia.
(Moore, Asselbergs, & Williams, 2010)
Esta omisión se ha evidenciado en diferentes estudios entre especies, como, por
ejemplo, el realizado por Sánchez y col. en el cual se identifica la proteína Sld3 tanto en
hongos como en animales utilizando herramientas de modelado de proteínas, a pesar de
que su similitud a nivel de secuencia es relativamente baja (Sanchez, Diffley, & Ponting,
2010). En otro estudio, Damasceno y col. identificaron la proteína Hus1, involucrada en
el DNA Damage Checkpoint, en Leishmania major, mediante la predicción de su
estructura secundaria, aunque la similitud a nivel primario entre la secuencia humana y
de Leishmania es relativamente baja. Por tanto, se puede afirmar que el reconocimiento
acertado de homólogos estructurales simplifica la búsqueda de proteínas similares
(Nunes, Damasceno, Freire, & Tosi, 2011).
9
2.2 Marco Referencial
2.2.1 Leishmaniasis
La leishmaniasis es una enfermedad causada por un protozoo parásito del género
Leishmania sp., transmitido por la picadura de flebótomos infectados. Es conocida como
rara o huérfana, pues los medicamentos utilizados para su tratamiento representan bajos
beneficios económicos para las industrias farmacéuticas productoras. La enfermedad,
que afecta a las poblaciones más pobres del planeta, está asociada a la malnutrición, los
desplazamientos de población, las malas condiciones de vivienda, la debilidad del
sistema inmunitario y la falta de recursos.
La leishmaniasis está vinculada a los cambios ambientales, como la deforestación, la
construcción de presas, los sistemas de riego y la urbanización. Se estima que cada año
se producen entre 700 000 y un millón de nuevos casos y entre 20 000 y 30 000
defunciones (OMS, 2018). La leishmaniasis que se encuentra en las Américas es muy
similar a la observada en la cuenca mediterránea. Se piensa que la costumbre de tener
perros y otros animales domésticos en el interior de las viviendas facilita la infección
humana (OMS, 2018).
2.2.1.1 Manifestaciones clínicas
Se distinguen tres tipos diferentes de manifestaciones clínicas, en función de la
especie de Leishmania involucrada, se puede presentar:
a. Leishmaniasis cutánea: Causada por L. braziliensis, L. major, L. mexicana
(IICAB, 2009). Se manifiesta con lesiones y úlceras que pueden cambiar de
tamaño y de apariencia con el tiempo. Inicialmente están cubiertas por una costra
que, al desprenderse, presenta una ulcera típica de fondo limpio, la cual puede
infectarse. Provoca deterioro del tejido, y lesiones permanentes y moderadas
(OMS, 2018).
b. Leishmaniasis mucocutánea: puede derivarse de la cutánea, afecta a las
mucosas, el sitio donde inicia la infección frecuentemente es el tabique nasal, y
puede progresar hasta perforarlo. El proceso puede extenderse al paladar y
10
faringe; la úvula se infiltra, se hipertrofia y luego se amputa. Cuando acomete a
la nariz se puede presentar obstrucción, sangrado, secreción nasal y la aparición
de costras y heridas. El compromiso de la laringe y la faringe puede ocasionar
dolor, ronquera, disfonía y disfagia (OMS, 2018).
c. Leishmaniasis visceral: Es causada generalmente por las cepas L. donovani, L.
infantum, L. trópica y L. amazoncensis (IICAB, 2009). Se considera como una
enfermedad crónica. Los síntomas más comunes son fiebre ondulante
prolongada, pérdida de peso, disminución del apetito, signos de anemia y
distensión abdominal con esplenomegalia y hepatomegalia. Puede comprometer
la vida del paciente (IICAB, 2009).
2.2.1.2 Tratamiento
La leishmaniasis es una enfermedad que se puede tratar y curar, pero para ello es
necesario un sistema inmunitario competente, dado que los medicamentos, por sí solos,
no son capaces de eliminar el parásito del organismo. De ahí el riesgo de recidiva en
caso de inmunodepresión. Todos los pacientes a quienes se haya diagnosticado
leishmaniasis visceral requieren la administración inmediata de un tratamiento
completo. En la actualidad, los tratamientos aprobados por el Ministerio de Salud
Pública del Ecuador, presenta diversas desventajas, entre las cuales constan, molestias
relacionadas a la administración, alto grado de toxicidad, resistencia parasitaria (MSP,
2014).
Por tanto, surge la necesidad de estudiar los mecanismos moleculares que rigen el
ciclo de vida del microorganismo, con la finalidad de desarrollar enfoques terapéuticos
innovadores, entre los que se incluye reposicionamiento de fármacos, como es el caso
de las fluoroquinolonas, y la identificación de nuevas dianas terapéuticas, como el caso
de los checkpoints (Uzcanga et al., 2016).
2.2.1.3 Ciclo de vida
Leishmaniasis es transmitida por la picadura de insectos flebótomos, los cuales
son vectores de Leishmania sp. Los promastigotes (forma extracelular del parásito) son
inoculados en el torrente sanguíneo de los infectados, luego son fagocitados por
11
macrófagos, donde se transforman en promastigotes (forma intracelular) (Sánchez &
Sáenz, 2004). En esta forma se reproducen a través de división celular, que incluye la
replicación de su material genético. Finalmente, un nuevo insecto ingiere la sangre del
hospedero infectado. Los amastigotes se diferencia en promastigotes en el intestino del
vector. (Romero, Machuca, & Padrón, 2007).
2.2.2 Ciclo celular
El ciclo celular es el conjunto de fases que atraviesa una célula y la conducen a su
crecimiento y división en dos células hijas. Durante estas fases (G1, S, G2 y mitosis,),
existen puntos de control denominados checkpoints, que aseguran la progresión del
ciclo, verificando su avance correcto (Abraham, 2001). Los checkpoints están
conformados por sistemas de proteínas que actúan a manera de sensores de daño celular,
los cuales desencadenan una cascada bioquímica que detiene el ciclo, para permitir que
los mecanismos de reparación desempeñen su función (Kastan, Zhan, & Deiry, 1992).
Existen diferentes checkpoints, en función de la fase del ciclo celular donde
actúan. Por ejemplo, el checkpoint de restricción, donde se decide si la célula atraviesa
de fase G1 a S, continuando con la síntesis de ADN, o de G1 a G0, permaneciendo en un
estado latente (Beishline, Kate, & Azizkhan, 2014). Este punto de control está mediado
por los inhibidores CDKs. Además, existen mecanismos de checkpoint, que se encargan
de detectar daños en el ADN (DNA Damage Checkpoint) y otros que verifican el
correcto ensamblaje del uso mitótico (Gorgoulis, 2005).
2.2.3 DNA Damage Checkpoint
El ADN es el código que almacena la información genética a copiarse, para la
generación de dos células hijas (Sutton & Walker, 2002). Este proceso puede sufrir
interferencias debido a daños en el ADN. Por tanto, existen los mecanismos de DNA
Damage Checkpoint, que detectan estos daños, tanto en la transición de G1/S, (DNA
Replication Checkpoint), y en la transición G2/M (G2/M Checkpoint), Cuando se
detectan anomalías en el ADN se recurre a la inactivación de los orígenes de replicación,
hasta que el daño genético se repare (Beishline & Clifford, 2014).
El inicio de la replicación del ADN está controlado por el encendido de los orígenes
de replicación. Un origen de replicación corresponde a un segmento específico del
12
cromosoma en el cual se inicia el proceso de replicación del ADN. Los orígenes de
replicación eucariota se desencadenan de forma secuencial, activando orígenes
adyacentes, que forman una maquinaria de replicación capaz de ser regulada a través
del tiempo. Este proceso especifico, se denomina timing de la replicación. Para llevar a
cabo el proceso de timing, los orígenes de replicación han de activarse en función del
tiempo (Beishline & Clifford, 2014).
Los orígenes de replicación que se activan al inicio de la replicación se denominan
tempranos, mientras que los que se activan luego de iniciado el proceso, se conocen
como tardíos. La activación de los orígenes de replicación en función de los checkpoints
del ciclo celular proporciona grandes ventajas a la replicación eucariota, pues las células
deben replicar grandes cantidades de datos con precisión en cortos lapsos de tiempo
(Musiałek & Rybaczek, 2015).
2.2.3.1 DNA Replication Checkpoint
El encendido adecuado de los orígenes de replicación en eucariotas está regulado por
diferentes mecanismos. Entre los primeros identificados se encuentra el DNA
Replication Checkpoint. Este checkpoint está mediado por los sensores ATM/ATR, los
transmisores Claspin/Tipin/Timeless y las quinasas efectoras Chk1 / Chk2, que regulan
a las proteínas que conforma el origen de replicación. Este mecanismo se encuentra
ampliamente conservado en levadura y células humanas (Musiałek & Rybaczek, 2015)
(Alcasabas, A. et al., 2001) (Bando, M. et al., 284) (Koundrioukoff, S. et al, 2013). Los
orígenes de replicación, tanto tempranos como tardíos, son regulados por la presencia
de factores limitantes esenciales para su activación secuencial (Mantiero, D.,
Mackenzie, A., Donaldson, A. & Zegerman, P., 2011). Esto se correlaciona con la
accesibilidad al origen, controlado por la estructura epigenética de la cromatina
(Yoshida, K. et al. , 2014).
Además, se ha relacionado el encendido de los orígenes con los niveles de
desoxirribonucleótidos trifosfatos (dNTPs) (Poli, J. et al. , 2012). La presencia de estos
mecanismos se ha verificado en animales y hongos, sin embargo, en tripanosomátidos
no se ha confirmado en su totalidad (Alcasabas, A. et al., 2001). (Bando, M. et al., 284).
(Alabert, Poveda, & Pasero, 2009). El daño provocado en el ADN genera un
desacoplamiento de la horquilla de replicación, dando lugar a largos tramos de ADN
13
monocatenario (single stranded DNA), que inmediatamente se recubre por las proteínas
RPA (figura 1). Esta estructura es detectada por las proteínas ATM/ATR (scMec1/Tel1),
quinasas de la familia PI3K. ATM/ATR activadas, fosforilan a las quinasas efectoras
Chk1/Chk2, (scChk1/scRad53), reguladores principales que desencadenan una oleada
de fosforilación a múltiples objetivos, que detienen el avance de la horquilla de
replicación, la estabilizan y previenen el ingreso de la célula a fase de mitosis.
Entre los detectores y efectores, existe un complejo heterotrimérico compuesto
por Claspin/Tipin/Timeless (scMrc1/ scTof1/ scCsm3) (figura 1). Las mutaciones o
defectos en estos componentes desencadenan hipersensibilidad frente a los genotóxicos,
incrementando la inestabilidad genómica y la presencia de daño del ADN (Beishline &
Clifford, 2014).
Figura 1. DNA Replication Checkpoint (Poveda, A. 2017). Se muestra el complejo
Clspn/Tipin/Tim (en color verde), como un nexo entre el complejo CMG y la DNA
Polimerasa. El desacoplamiento entre estos tres complejos forma tramos de ssDNA,
los cuales se recubren de proteínas RPA. Esta estructura es detectada por ATM/ATR,
desencadenando el sistema de checkpoint, y el detenimiento del avance de la horquilla
de replicación. (Beishline & Clifford, 2014).
En su revisión bibliográfica, Uzcanga y col. identifican la presencia de homólogos
de ATM/ATR, Chk1 y Chk2, en tripanosomátidos, lo que sugiere la presencia de este
mecanismo de protección del ADN. Sin embargo, es importante mencionar que no se
encontraron homólogos a nivel de secuencia del complejo intermediario
Claspin/Tipin/Timeless (Uzcanga et al., 2016). Por tanto, resulta interesante, realizar un
estudio se similitud de secuencias avanzado, para buscar los homólogos faltantes.
14
2.2.4 Similitud de Secuencias
La bioinformática puede responder a diversas interrogantes, basándose en
modelos de interacción generados por ordenador. El desarrollo incipiente de esta rama
del conocimiento ha traído consigo una innovadora forma de gestionar la genética
(Moore, Asselbergs, & Williams, 2010). Esta disciplina utiliza diferentes herramientas
computacionales para la administración de información de sistemas biológicos
(Luscombe, Greenbaum, & Gerstein, 2001). Entre las herramientas que surgen de la
gestión de genomas se puede describir el análisis de similitud de secuencias.
En el contexto genético, la similitud de secuencias de ADN entre diferentes
organismos hace referencia a que tan parecido es el orden en el que están dispuestas las
bases nitrogenadas que conforman las cadenas de nucleótidos (Higgins & Taylor, 2000).
Esta propiedad puede ser trasladada a la síntesis de proteínas. En este caso, los
aminoácidos que se comparten pueden ser idénticos, o formar parte de un mismo grupo
con propiedades fisicoquímicas similares que le confieren a la estructura un plegamiento
similar (Chothia & Lesk, 1986).
Esta similitud de secuencias es útil, pues permite reconocer homologías entre
distintos genes, y sus respectivas proteínas, además de identificar funciones
desconocidas por deducción a partir de genes ya descritos. Se dice que un gen es
homologo a otro, cuando ambos descienden de un ancestro común (Koonin, 2005).
La comparación se realiza mediante el alineamiento de las secuencias de
aminoácidos que conforman las proteínas que se pretenden analizar. Para cuantificar la
similitud se aplican diversas matrices que asignan un puntaje en función de la identidad
de las secuencias, o su equivalencia fisicoquímica (Hirosawa, Totoki, Hoshida, &
Ishikawa, 1995).
Para realizar la búsqueda de secuencias homólogas a un gen identificado, se debe
comparar la secuencia de referencia, frente a todo el genoma de la especie problema.
Por tanto, se han desarrollado sistemas informáticos, que permiten procesar grandes
volúmenes de información de forma eficiente (Stephens & Stephens, 1990). Entre estos
sistemas encontramos BLAST y KEGG SSDB.
a. BLAST: (Del inglés, Basic Local Alignment Search Tool), la herramienta de
búsqueda de alineación local básica BLAST encuentra regiones de similitud
15
local entre secuencias. El algoritmo compara las secuencias de nucleótidos o
proteínas con las bases de datos de secuencias y calcula la significancia
estadística de las coincidencias. BLAST puede usarse para inferir relaciones
funcionales y evolutivas entre secuencias, así como para ayudar a identificar
miembros de familias de genes (NCBI, 2014).
b. KEGG SSDB: (Del ingles, Sequence Similarity Data Base of Kyoto
Encyclopedia of Genes and Genomes). Es una biblioteca informática que
almacena genes homólogos obtenidos mediante el algoritmo de similitud creado
por Smith-Waterman, basado en programación dinámica (Pearson, 2013).
2.2.5 Similitud a nivel de Estructura
Se han identificado proteínas que, a pesar de presentar baja similitud a nivel de
secuencia, poseen una estructura terciaria muy similar. En este caso, es posible que
cumplan una función relacionada. Este hecho se ha comprobado mediante experimentos
realizados por Damasceno y colaboradores, además de los ensayos realizados por
Sanchez y colaboradores (Sanchez, Diffley, & Ponting, 2010) (Nunes, Damasceno,
Freire, & Tosi, 2011).
2.2.6 Modelado de Proteínas
El modelado de proteínas por homología es una técnica que permite predecir la
estructura tridimensional de proteínas a partir de su secuencia, utilizando como molde,
estructuras cristalográficas de proteínas similares almacenas en el Protein Data Bank
(Singh, M. K. & Dominy, B. N., 2010).
2.2.7 Servidor para modelado de proteínas
I-TASSER, (Del inglés, Iterative Threading Assembly Refinement) Algoritmo de
refinamiento para montaje vía iteración. Según la CASP, (Critical Assessment of
Techniques for Protein Structure Prediction), Evaluación Crítica de Técnicas Para la
Predicción de Estructura de Proteínas, el servidor I-TASSER se posiciona como el
número uno en cuanto a indicadores de precisión en el modelado de proteínas (Moult,
Fidelis, & Kryshtafovych, 2013). El protocolo del servidor incluye varias etapas. En
primer lugar, la secuencia de datos enviada se compara con las estructuras secundarias
plegadas que están almacenadas en el PDB Bank (Roy, Kucukural, & Zhang, 2010).
16
Los fragmentos análogos encontrados se reensamblan mediante simulaciones de Monte
Carlo. Estas simulaciones permiten realizar un análisis computacional acerca de la
probabilidad de éxito y el riesgo asociado a la toma de decisiones (McGreevy & Pusztai,
2007). Los estados de baja energía libre son agrupados por el algoritmo SPICKER, el
cual asocia las posibles estructuras predichas y las compara con los modelos reales del
PDB BANK (Zhang, Y. & Skolnick, J., 2004). En una tercera etapa, se reconstruye
nuevamente la estructura obtenida (figura 2). De esta manera se elimina el choque
estérico, y se refina la topología grupal de los centroides del grupo (Yang et al., 2015).
2.2.8 Comparación de estructuras proteicas
TM- Align es un algoritmo de comparación de estructuras proteicas, independiente
del orden de secuencia. Para dos estructuras de proteínas de equivalencia desconocida,
TM-Align genera un alineamiento optimizado residuo a residuo, basado en su similitud
estructural, utilizando circuitos de programación dinámica. Se emite una superposición
óptima de las estructuras, junto con un TM-Score que cuantifica la similitud estructural.
Este se encuentra en un rango de 0 a 1, donde 1 representa una alineación perfecta. De
acuerdo con estrictos parámetros estadísticos, valores menores a 0,2 indican un
alineamiento aleatorio, mientras que valores superiores a 0,5 suponen un alineamiento
similar. (Zhang & Skolnick, 2005).
Figura 2. Protocolo I-TASSER para predicción de estructuras y funciones proteicas (Yang et al., 2015).
(Zhang & Skolnick, 2005).
17
2.2.9 Métricas de Calidad
Son métodos encargados de evaluar la calidad de las estructuras de las proteínas,
en base a parámetros fisicoquímicos, como, por ejemplo, las fuerzas de Van der Waals
que intervienen en la interacción de los átomos de los aminoácidos con el medio (Kihara,
Chen, & Yang, 2009). Entre estos encontramos:
a. Errat: Es un servidor diseñado para determinar la calidad de estructuras
cristalográficas. El límite de confianza está graficado en función de número de
residuo. El cálculo de la función de error se basa en las estadísticas de las
interacciones átomo-átomo no enlazados, comparado con las estructuras de alta
resolución almacenadas en la biblioteca. Las proteínas con alto grado de
confianza no sobrepasan el 95% del límite (figura 3) (Mac, Laskowski, &
Thornton, 1994).
b. C-Score: Es un puntaje de confianza que estima la calidad de las proteínas
predichas por I-TASSER. Es calculado en base a la significancia de los
alineamientos de los modelos concatenados y los parámetros de convergencia de
las simulaciones de montaje de estructuras. Se encuentra típicamente en un
rango de 2 a -5, donde los valores más altos representan mayor significancia en
la predicción acertada y viceversa (Yang, Roy, & Zhang, 2013).
Figura 3. Gráfica de error Errat. Los residuos que se muestran en color rojo superan el 95% del
límite de confianza, incrementado su probabilidad de error. A. Muestra el modelo inicial, con
errores de estructura. B. Muestra un modelo procesado, con menores errores de estructura (Mac,
Laskowski, & Thornton, 1994).
A
B
18
2.3 Marco Legal
Ley Orgánica de Salud Ref. 2015
Capitulo III-A
De las enfermedades catastróficas y raras o huérfanas
Art. ...(1).- El Estado ecuatoriano reconocerá de interés nacional a las enfermedades
catastróficas y raras o huérfanas; y, a través de la autoridad sanitaria nacional,
implementará las acciones necesarias para la atención en salud de las y los enfermos que
las padezcan, con el fin de mejorar su calidad y expectativa de vida, bajo los principios
de disponibilidad, accesibilidad, calidad y calidez; y, estándares de calidad, en la
promoción, prevención, diagnóstico, tratamiento, rehabilitación, habilitación y curación.
Art. .. (2). - Son obligaciones de la autoridad sanitaria nacional:
a) Emitir protocolos para la atención de estas enfermedades, con la participación de las
sociedades científicas, las mismas que establecerán las directrices, criterios y
procedimientos de diagnóstico y tratamiento de las y los pacientes que padezcan
enfermedades raras o huérfanas;
b) Promover, coordinar y desarrollar, conjuntamente con organismos especializados
nacionales e internacionales públicos y privados, investigaciones para el estudio de las
enfermedades raras o huérfanas y catastróficas con la finalidad de favorecer diagnósticos
y tratamientos tempranos en pro de una mejor calidad y expectativa de vida;
2.4 Art. .. (4). - La autoridad sanitaria nacional promoverá acciones destinadas a la
capacitación, a nivel de pregrado, postgrado y la educación permanente, para todo el
personal y profesionales de la salud, a fin de divulgar el conocimiento científico de las
enfermedades raras o huérfanas.
19
2.4 Hipótesis
Hi: Herramientas bioinformáticas y modelado de proteínas permiten identificar
homólogos de spMrc1/hClaspin en Leishmania mexicana.
H0: Herramientas bioinformáticas y modelado de proteínas no permiten identificar
homólogos de spMrc1/hClaspin en Leishmania mexicana.
2.5 Sistema de Variables
2.5.1 Variables caracterización
Homólogos de spMrc1/hClaspin
2.5.2 Variables de interés
- Herramientas Bioinformáticas
- Modelo de estructuras de proteínas
- Proteomas de tripanosomátidos
- Proteomas de organismos modelo
20
3. MARCO METODOLÓGICO
3.1 Diseño de la investigación
3.1.1 Paradigma de la investigación
Se utilizó el paradigma cuantitativo ya que la investigación se realiza con técnicas de
análisis de información que permiten identificar de forma cuantitativa posibles
homólogos de Claspin/scMrc1 en tripanosomátidos.
3.1.2 Nivel de la investigación
Se realizó una investigación descriptiva ya que se identifica de forma cuantitativa posibles
homólogos de Claspin/scMrc1 en tripanosomátidos.
3.1.3 Tipo de investigación
a. Investigación experimental. - Se utilizó este tipo de investigación pues se basa
en el modelado de proteínas, donde se realizó la predicción de estructuras a partir
de secuencias de aminoácidos.
b. Investigación básica. - Se buscó complementar los conocimientos teóricos sobre
los mecanismos implicados en el DNA Replication Checkpoint en Leishmania
mexicana, además de determinar filogenéticamente una diana farmacológica, con
el objetivo de aplicar estos conocimientos obtenidos para el desarrollo de posibles
tratamientos innovadores.
c. Investigación documental. - Ya que se utilizó fuentes bibliográficas para obtener
información previa sobre la investigación. Además, se realizó la búsqueda de
metodologías desarrolladas para la identificación de homólogos a Claspin y Mrc1
en Leishmania mexicana.
d. Investigación cuantitativa. - Ya que se realizaron procesos cuantificados. El
principal método en el que se realiza una descripción cuantitativa es la búsqueda
de homologías las cuales se encuentran cuantificadas mediante los puntajes de
similitud de cada procedimiento.
e. Investigación cualitativa. – Por lo que se basa en describir de manera cualitativa
el posible gen identificado como análogo a Claspin/Mrc1.
21
3.1.4 Procedimiento para alcance de objetivos
Para la consecución de objetivos se utilizará un enfoque bibliográfico y experimental,
mediante la aplicación de protocolos de laboratorio bioinformático que permitirán
desarrollar el método. Se utilizan herramientas bioinformáticas como son el análisis
de genomas a través de algoritmos de comparación de secuencias, herramientas de
modelado y métricas de calidad de proteínas.
3.2 Materiales y Métodos
3.2.1 Materiales
- Computador
- Office 365
- Chimera 1.12
- Genoma y proteoma de organismos de estudio
- Genoma y proteoma de organismos de referencia
MHOM/GT/2001/U1103 (taxid:929439)
3.2.2 Servidores
- STRING
- KEGG SSDB
- NCBI BLAST
- PDB Bank
- Uniprot
- GeneDB
- I-TASSER
3.2.3 Métodos
3.2.3.1 Proteínas de DNA Replication Checkpoint
La metodología utilizada en el presente trabajo de investigación inició con el
estudio de las proteínas involucradas en el DNA Replication Chekpoint en organismos
de referencia como H. Sapiens y Saccharomyces, mediante el uso de la base de datos
STRING, la cual busca relaciones entre proteínas en las últimas publicaciones de modo
22
automatizado, abarcando los avances más recientes en la investigación. Para esto se
ingresó al servidor de STRING a través de la dirección: https://string-db.org/. Se
seleccionó el modo Search / Multiple proteins, y se escribió el nombre de algunas
proteínas del mecanismo de checkpoint en humanos: ATM/ATR, Claspin, Tipin,
Timeless, Chk1/Chk2. Se procedió a registrar la gráfica de relaciones de todas las
proteínas resultantes. Para el caso de Saccharomyces cerevisiae se procede de igual
manera a la anterior, colocando como entrada las proteínas: Tel1, Mec1, Mrc1, Csm3,
Tof1, Chk1, Rad53, análogas al sistema de DNA Replication Checkpoint en humanos.
Se registraron las gráficas de redes de interacción de proteínas obtenidas de STRING.
3.2.3.2 Homología Claspin/Mrc1
Se seleccionó una de las proteínas implicadas en el DNA Replication Checkpoint,
hsClaspin/spsMrc1 en humanos y Saccharomyces respectivamente, en base a su
importancia en la activación de la respuesta al daño del ADN, y la regulación de la
velocidad de avance de la horquilla de replicación (Beishline, Kate, & Azizkhan, 2014).
El siguiente paso consistió en caracterizar la relación existente entre hClaspin y
spMrc1, para corroborar bioinformáticamente su homología. Por tanto, se busca
homólogos de spMrc1 en Homo sapiens, utilizando la base de datos KEGG SSDB
(Secuence Similarity Database), con su código de tres letras "hsa". Se utilizó
Saccharomyces pombe, principalmente por dos razones, en primer lugar, debido a que
esta especie presenta el dominio Mrc1 más conservado que Saccharomyces cerevisiae
(Zech, Godfrey, Masai, Hartsuiker, & Dalgaard, 2015). Además, este estudio se
fundamenta en la metodología utilizada por Damasceno y colaboradores, donde se
utiliza S. pombe (Nunes, Damasceno, Freire, & Tosi, 2011).
Luego se ordenaron los genes encontrados en base a su solapamiento. Posterior a
ello, se realizó un BLAST proteína - proteína, entre dos secuencias, manteniendo como
secuencia de referencia a spMrc1, y comparándola frente a cada uno de los posibles
homólogos obtenidos anteriormente. Se ordenan los resultados de BLAST, en base al
valor E (E Value). Se comprobó analíticamente que el resultado con menor E value, se
corresponde exactamente con hsClaspin, proteína homóloga a spMrc1.
23
3.2.3.3 Predicción y validación de modelos de estructuras de referencia
Además, se identificó la similitud estructural entre dos proteínas homólogas,
spMrc1 y scMrc1 de Saccharomyces pombe y S. cerevisiae respectivamente, y entre
hsClaspin y xlClaspin de Homo sapiens y Xenopus laevis respectivamente, modeladas
a través del servidor I-TASSER. Se ingresó en la página:
https://zhanglab.ccmb.med.umich.edu/I-TASSER/, y se agregó la secuencia FASTA del
modelo de la proteína a predecir. Los resultados obtenidos son descargados, a la vez que
se registraron los C-Score de los modelos predichos. Estos se visualizan utilizando el
programa Chimera 1.12, y se superpusieron a través del algoritmo del servidor TM-
Align, obteniéndose su coeficiente de superposición.
3.2.3.4 Homología Claspin/Mrc1 en L. mexicana
Para realizar la identificación de proteínas homólogas a Claspin/Mrc1 en
Leishmania sp. se utilizó la metodología descrita anteriormente para Saccharomyces
pombe y Homo Sapiens. En este caso se comparó Saccharomyces pombe frente a
Leishmania mexicana. El código de tres letras de L. mexicana en KEGG, es "lmi". Las
proteínas candidatas a homólogo de Mrc1 en L. mexicana y sus similares en L. major
obtenidas por BLAST, se sometieron al proceso de modelado tridimensional descrito
anteriormente. Se comprueba si las proteínas identificadas presentan una función ya
definida en el GeneDB.
3.2.3.3 Métricas de calidad
Se utilizó los métodos Errat y C-Score para evaluar la calidad de las estructuras
estudiadas. En el primer caso se ingresó en la página web del servidor Errat en
http://services.mbi.ucla.edu/ERRAT/ y luego se cargó el archivo .pdb de la proteína que
se pretende evaluar, en el icono de subida de la página de Errat. Posterior a ello, se da
clic en la opción Run. Las gráficas de calidad y los coeficientes de confianza se
presentan en resultados. El C-Score se obtiene junto con los resultados de modelado de
proteínas en el servidor I-TASSER.
24
3.2.3.4 Controles
El control positivo utilizado corresponde a la proteína de DNA Replication
Checkpoint, Rad53, la cual presenta su homólogo en L. major. Se espera encontrar alta
similitud entre el modelo predicho para L. major, y su correspondiente homólogo
almacenado en el PDB.
El control negativo utilizado en el presente experimento corresponde a una de las
proteínas descartadas durante la búsqueda por BLAST debido a su baja homología. Este
control negativo corresponde a la proteína descrita como ACC (acetyl-CoA
carboxylase) en el GeneDB, LmxM.30.2970. Se esperaría que esta proteína presente una
estructura modelada muy diferente a la proteína homóloga que sí corresponde a
Mrc1/Claspin. La comparación se realiza mediante el servidor TM-Align.
3.2.3.5 Búsqueda de Mrc1/Claspin en otros tripanosomátidos
Con la secuencia de la proteína identificada como Mrc1/Claspin en Leishmania
mexicana, se procede a realizar un BLAST, frente a otras especies de tripanosomátidos
como son L. major, L. brazilienzis, T. brucei y T. cruzi. Se registró los posibles
homólogos en otras especies de Leishmania y Trypanosoma. Para esto, buscó la
secuencia del gen de estudio en la base de datos Uniprot. En su buscador se escribió el
código del gen, por ejemplo, LmxM_34_1090. En la opción secuencia FASTA, se copió
la secuencia a la plataforma de NCBI, y en la opción Organism se escogió
Trypanosomatidae. Se registraron los datos obtenidos para los diferentes genes
encontrados.
3.2.4 Matriz de operacionalización de variables
Tabla 1. Operacionalización de variables
Variables Dimensiones Indicadores
Herramientas de alineación
de secuencias
BLAST E value
KEGG SSDB % Solapamiento Relativo
Modelos de Proteínas I-TASSER C- Score
Métricas de Calidad: Errat
Homólogos a Mrc1/Claspin Gen Problema Identificado TM-Score, E-value
Elaborado por Parra C.
25
3.2.4 Técnicas e instrumentos de recolección de datos
La técnica utilizada para la recolección de datos fue la observación por medio del
instrumento guía de observación la cual se puede observar en el Anexo C. Los datos se
obtuvieron de bases de datos reconocidas oficialmente, como son NCBI, UniProt y
KEGG, actualizados hasta la fecha de registro del trabajo de titulación. Se utiliza la
observación ya que se realizará un registro informático de los resultados, con los
resultados obtenidos de los servidores en tiempo real. La guía de observación es un
instrumento de la observación que ayuda a dirigir la investigación, donde se lleva una
lista de datos obtenidos para posteriormente procesarlos y establecer enlaces sobre lo
estudiado que en este caso es la búsqueda e identificación de genes homólogos a
Mrc1/Claspin en Leishmania mexicana.
3.2.5 Técnicas de Procesamiento y Análisis de Datos
Para el procesamiento de los datos, se utiliza el programa Microsoft Excel, de la
Suite Office 365, licencia académica de la Universidad Central del Ecuador. El análisis
se realiza mediante graficas comparativas de las estructuras de las proteínas identificadas
y su superposición utilizando dos programas: Chimera 1,12 y el Algoritmo TM-Align de
Zhang Lab.
El análisis estadístico utilizado es propio de cada herramienta bioinformática,
entre las utilizadas encontramos NCBI a través de E value, donde se representa el número
de alineaciones diferentes con puntajes equivalentes o mejores hallados por casualidad,
cuanto menor es el puntaje de E, más significativo es el puntaje de alineación. (Fassler &
Cooper.P., 2011). Otro valor utilizado corresponde al TM-Score de Tm- Align, el cual
mide la similitud global del pliegue y es menos sensible a las variaciones estructurales
locales, similar al RMSD, (Desviación cuadrática media de las posiciones atómicas),
donde se mide la distancia promedio entre los átomos de cadenas de proteínas
superpuestas. (Zhang & Skolnick, 2005).
26
4. MARCO ADMINISTRATIVO
4.1 Recursos
4.1.1 Talento humano
- Tutor y cotutor
- Expertos
- Profesores
- Ayudantes de Investigación
- Estudiante
4.1.2 Recursos materiales
- Material de oficina
- Laboratorios de bioinformática
- Material bibliográfico
- Internet
- Servidores en internet
4.2 Presupuesto
Tabla 2. Presupuesto requerido
Concepto Costo USD
Material de oficina 10,00
Hora Uso de Laboratorio 15,00
Uso Hora de Servidores 2,00
Elaboración de documentos 20,00
Movilización 30,00
Defensa de Proyecto 40,00
Total 117,00
Elaborado por Parra C.
27
4.3 Cronograma
Actividades
Año 2018
Responsab
le
Enero Febrero Marzo Abril Mayo Junio Julio Agosto
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1. Revisión
Bibliográfica Estudiante
2. Elaboración del
Perfil Estudiante
3. Revisión de Perfil Tutores
4. Corrección de
Perfil Estudiante
5. Presentación a
Concejo de Carrera Estudiante
6. Ejecución de
ensayos piloto Estudiante
7. Ejecución de la
investigación Estudiante
8. Elaboración de
borrador de tesis Estudiante
9. Corrección del
escrito de tesis Tutores
10. Corrección de
errores del escrito Estudiante
11. Presentación de
Informe de tesis Tutora
12. Designación de
Tribunales
Consejo de
Carrera
13. Revisión del
Escrito Tribunales
14. Corrección del
Escrito Estudiante
15. Defensa oral Estudiante
Elaborado por Parra C.
28
5. DISCUSIÓN DE RESULTADOS
Filogenéticamente, se ha demostrado que las estructuras terciarias proteicas se
conservan más íntegramente que las secuencias de ácidos nucleicos. Esto se debe a que
las proteínas interactúan en sistemas biológicos dependientes de su conformación
tridimensional y su naturaleza fisicoquímica, la cual puede mantenerse entre grupos
químicos de aminoácidos con características en común. (Pellegrini, Marcotte, Thompson,
Eisenberg, & Yeates, 1999).
El presente estudio, tiene como objetivo principal, realizar la identificación de
proteínas de DNA Replication Checkpoint en tripanosomátidos, las cuales pueden
presentar una homología a nivel tridimensional frente a sus similares en organismos de
referencia. (Nunes, Damasceno, Freire, & Tosi, 2011).
5.1 Definición de proteínas de DNA Replication Checkpoint
Se ha utilizado la herramienta bioinformática STRING para verificar las rutas
bioquímicas que conforman los mecanismos de DNA Replication Checkpoint (Szklarczyk
et al., 2017). Los resultados obtenidos para la relación de proteínas en los sistemas H.
sapiens y S. cerevisiae se presentan en la figura 4 y figura 5 respectivamente.
En la figura 4 se puede observar la red de interacción de proteínas formada por
Claspin/Tipin/Timeless. Se muestra una relación directa entre las tres proteínas, con
relaciones de interacción de bases de datos curadas, en color azul, y determinadas
experimentalmente, en color violeta. Entre Claspin y Tipin no se han encontrado
interacciones determinadas experimentalmente. Sin embargo, existe relación de bases de
datos curados que confirman la interacción de estas proteínas. La búsqueda sistemática
realizada confirma analíticamente la interacción entre este sistema de proteínas. No
existen datos para estos mecanismos en Leishmania sp. o Trypanosoma sp. (Szklarczyk,
y otros, 2017).
29
5.2 Desarrollo del método de búsqueda
5.1 Desarrollo del método de búsqueda
Es conocida la homología existente entre las proteínas hsClaspin y spMrc1 a nivel
experimental (Masai, Yang, & Matsumoto, 2017). Por tanto, en el presente estudio se
desarrolla un método que permite identificar esta homología mediante técnicas
bioinformáticas, con la finalidad de identificar homólogos en organismos problema, como
por ejemplo Leishmania spp. (Sar et al., 2004).
Figura 5. Red de interacción String entre proteínas del
mecanismo de DNA Replication Checkpoint en
Saccharomyces cerevisiae.
Figura 4. Red de interacción entre proteínas del mecanismo
de DNA Replication Checkpoint en Homo Sapiens. Las
líneas de colores representan la interacción: Celeste: Base de
datos curada, Violeta, determinado experimentalmente,
Amarillo: extracción de textos. Negro: Co-expresado.
30
El método inicia con la búsqueda de homologías en la base de datos KEGG. En la
tabla 3, se muestran algunos de los posibles genes homólogos a spMrc1 obtenidos de
KEGG, los cuales, al ser ordenados en base a su solapamiento, muestran a hsClaspin en
sexto lugar. Este hecho demuestra la baja selectividad del algoritmo de búsqueda KEGG
SSDB, pues el resultado con mayor similitud de secuencia encontrado no se corresponde
precisamente con la homología descrita experimentalmente (hsClaspin/spMrc1) (Masai,
Yang, & Matsumoto, 2017). La tabla completa se despliega en el anexo E.
Tabla 3. Posibles genes homólogos a spMrc1 en H. sapiens
ordenados en función de su solapamiento.
N ° Gen Definition Solapamiento
1 MYH7 myosin heavy chain 7 1076
2 MYH6 myosin heavy chain 6 1070
3 CEP128 centrosomal protein 128 1066
4 BOD1L1 biorientation of chromosomes
in cell division 1 like 1 1058
5 CEP1 centriolin 1050
6 CLSPN Claspin 1043
7 ANKRD11 ankyrin repeat domain-
containing protein 11/12 1042
8 MYH8 myosin heavy chain 1034
9 CENPE centromere protein E 1029
10 KIF21A kinesin family member 21A 1015
… … … …
83 C18orf30 piezo type mechanosensitive
ion channel component 2 110
Por tanto, se toman todos los posibles genes homólogos a spMrc1 obtenidos por
KEGG SSDB, y se realiza la comparación uno a uno a través de BLAST. Estos resultados
se muestran en la Tabla 4.
Elaborado por Parra C. (KEGG, 2018).
31
Tabla 4. Comparación por BLAST entre posibles homólogos a spMrc1 en H.
sapiens
N ° Gen Code Definition Max Score E Value
1 CLSPN Claspin 39,7 1 x 10-6
2 PLEC Plectin 30,0 0,004
3 CNTLN Centlein 26,9 0,010
4 MAP3K19 mitogen-activated protein
kinase 26,2 0,017
5 C18orf30 piezo type mechanosensitive
ion channel 25,4 0,056
6 ANKRD11 ankyrin repeat domain 11 25,4 0,062
7 CGN Cingulin 23,9 0,076
8 IWS1 SUPT6H interacting protein 22,7 0,097
9 CGNL1 Cingulin like 1 22,7 0,170
10 KIF20B Kinesin family member 20B 23,1 0,200
… … … … …
83 GOLGA4 golgin subfamily A member 4 NA* NA
En la Tabla 4, se puede observar los resultados de posibles genes homólogos
obtenidos de KEGG SSDB, comparados a través de BLAST. Se puede apreciar que la
proteína hsClaspin, presenta el mayor resultado de Max Score y E value. Comprobándose
que es posible identificar la homología spMrc1/hsClaspin mediante herramientas
bioinformáticas de comparación de secuencias (Masai, Yang, & Matsumoto, 2017).
5.3 Búsqueda de homólogos a spMrc1 en Leishmania mexicana
Se aplicó el método desarrollado con anterioridad al genoma de Leishmania
mexicana. En la Tabla 5, se muestran los resultados de la búsqueda de genes homólogos
a spMrc1 frente a L. mexicana en KEGG SSDB.
* NA: No Aplica, no se encontraron similitudes estadísticas significativas.
Elaborado por Parra C. (NCBI, 2014).
32
* NA: No Aplica, no se encontraron similitudes estadísticas significativas.
Elaborado por Parra C. (NCBI, 2014).
Tabla 5. Posibles genes homólogos a spMrc1 en L. mexicana
ordenados en función de su solapamiento.
N ° Gen Definition Solapamiento
1 LmxM.16.1460c.1 hypothetical protein 1053
2 LmxM.16.1460 putative kinesin 1045
3 LmxM.22.1320 hypothetical protein,
unknown function 951
4 LmxM.14.1100 putative kinesin K39 934
5 LmxM.15.0440 tb-292 membrane associated
protein 913
6 LmxM.14.1120 putative kinesin K39 905
7 LmxM.33.0690 hypothetical protein 903
8 LmxM.34.1090 hypothetical protein 812
9 LmxM.14. 1120a.1 hypothetical protein 761
10 LmxM.16. 1460a.1 hypothetical protein 718
11 LmxM.26.2490 hypothetical protein 710
12 LmxM.30.2970 putative acetyl-CoA
carboxylase 136
En la Tabla 6 se muestran los posibles genes homólogos a spMrc1 en L. mexicana
obtenidos anteriormente (tabla 5), comparados a través de BLAST uno a uno. Las
proteínas que presentan la mayor puntuación de Max Score podrían ser consideradas
como posibles homologas a spMrc1/hsClaspin. Entre las proteínas mejor puntuadas se
encuentran las codificadas por los genes LmxM.34.1090 y LmxM.33.0690. Con estas
proteínas se realizó el modelado de estructura terciaria.
Tabla 6. Comparación por BLAST entre posibles homólogos a spMrc1 en L. mexicana
N ° Gen Code Definition Max Score E Value
1 LmxM.34.1090 hypothetical protein 22,3 0,17
2 LmxM.33.0690 hypothetical protein 20,8 1,2
3 LmxM.30.2970 putative acetyl-CoA
carboxylase 19,2 3,7
4 LmxM.26.2490 hypothetical protein 17,7 7,4
5 LmxM.16.1460c.1 hypothetical protein 17,7 9,1
6 LmxM.16.1460 putative kinesin NA NA
7 LmxM.22.1320 hypothetical protein,
unknown function NA NA
8 LmxM.14.1100 putative kinesin K39 NA NA
9 LmxM.15.0440 tb-292 membrane associated
protein NA NA
10 LmxM.14.1120 putative kinesin K39 NA NA
11 LmxM.14. 1120a.1 hypothetical protein NA NA
12 LmxM.16. 1460a.1 hypothetical protein NA NA
Elaborado por Parra C. (KEGG, 2018).
33
5.4 Homología estructural Mrc1/Claspin entre S. pombe, H. sapiens y L. mexicana
Los resultados presentados a continuación identifican la homología entre los
modelos predichos para hsClaspin (figura 6) y spMrc1 (figura 7) a nivel de estructura
tridimensional. En la figura 8, se muestra la superposición tridimensional entre spMrc1 y
hsClaspin. En la tabla 7, se cuantifica esta superposición, la cual es estadísticamente
significativa, con un TM-Score de 0,672, lo que verifica la homología existente (Zhang
& Skolnick, 2005), a pesar de que su porcentaje de identidad de secuencia es bajo: 5,8%.
Debe considerarse que esta comparación se realizó con el dominio terminal de la
proteína spMrc1 correspondiente a los aminoácidos del 790 al 1019, pues la estructura
completa presenta menor similitud. No obstante, la comparación aporta información
relevante debido a que las proteínas están conformadas por dominios, los cuales pueden
conservarse filogenéticamente de manera diferenciada (Hanks, Quinn, & Hunter, 1988).
De hecho, una comparación a través de dominios evolutivos es realizada por Adak y
Datta, donde el dominio proximal de la proteína peroxidasa APX, en L. major, es idéntico
en un 34 % a su homólogo en Glycine max (Adak & Datta, 2005). En la figura 6 y figura
7, se muestran las estructuras modeladas de hsClaspin y spMrc1 respectivamente.
Figura 6. Estructura modelada por ITASSER de
Claspin en H. sapiens (Yang, y otros, 2015).
Figura 7. Estructura
modelada por ITASSER de
Mrc1 en S. pombe (Yang, y
otros, 2015)
34
Tabla 7. Comparación entre proteínas de referencia y de L. mexicana.
TM-Score entre 0 y 1. Donde 1 indica un alineamiento idéntico.
Gen
Codificante
Análogo
Estructural % Seq_ID TM-Score
spMrc1 hsClaspin 5,8 0,672
LmxM.34.1090 spMrc1 7,4 0,828
LmxM.330690 hsClaspin 8,3 0,772
LmxM.34.1090 hsClaspin 7,0 0,288
LmxM.330690 spMrc1 8,3 0,291
Además, se establece la relación existente entre las proteínas de referencia
hsClaspin/spMrc1 y las proteínas LmxM.34.1090 (figura 9) y LmxM.33.0690 (figura 10)
identificadas por el método desarrollado en el presente estudio. Las superposiciones
(figura 11 y 12) fueron realizadas por el algoritmo TM-Align y se cuantifican en la tabla
7. Las proteínas codificadas por LmxM.34.1090 y LmxM.33.0690 presentaron alta
correspondencia con los modelos de referencia, spMrc1 y hsClaspin respectivamente. Los
valores de TM-Align indican elevada similitud estructural a pesar de que su identidad a
nivel de secuencia es baja: 5,8% y 6,8% respectivamente. Esta similitud entre las
estructuras modeladas en L. mexicana y las de los organismos de referencia spMrc1 y
hsClaspin, podría sugerir la presencia de sistemas múltiples de DNA Replication
Checkpoint en L. mexicana (Nunes, Damasceno, Freire, & Tosi, 2011) (Genois, y otros,
2014).
Figura 8. Superposición de estructuras
modeladas. Dorado: hsClaspin, Azul: spMrc1.
Realizado con Chimera 1.12
Elaborado por Parra C.
35
La proteína codificada por el gen LmxM.34.1090, (putative Mrc1), no se encuentra
identificada en el GeneDB. (Sanger Institute, 2018). Esto puede sugerir que la
identificación realizada es acertada, por tanto, se recomienda que se compruebe la
homología a través de experimentos de biología molecular. El segundo gen,
LmxM.33.0690, se encuentra descrito en el GenDB como FAZ1, relacionado con la zona
Figura 9. Estructura modelada
por ITASSER de LmxM.34.1090
(Yang, y otros, 2015)
Figura 10. Estructura modelada por
ITASSER de LmxM.33.0690 (Yang, y
otros, 2015)
Figura 11. Superposición de
estructuras modeladas. Azul:
spMrc1, Violeta: putative spMrc1
L. mexicana (LmxM.34.1090).
Realizado con Chimera 1.12
Figura 12. Superposición de estructuras predichas.
Dorado: hsClaspin, Naranja: putative hsClaspin L.
mexicana (LmxM.330690). Realizado con Chimera
1.12.
36
de anclaje del flagelo (Wheeler R. , Sunter, Gull, & K, 2016), sin embargo, en Uniprot no
está identificado, requiriéndose mayor evidencia científica para su etiquetado. (The
UniProt Consortium, 2017). Es posible que la similitud encontrada entre LmxM.33.0690
y hsClaspin tenga relación con la morfogénesis del flagelo y el ADN mitocondrial.
(Wheeler, Sunter, & Gull, 2016). La presencia de estos sistemas de reparación, tanto en
homólogos de hsClaspin y spMrc1 podría sugerir la conservación de dos sistemas de
reparación, tanto en ADN nuclear, como ADN mitocondrial. Por tanto, se debe considerar
estos mecanismos de checkpoint en L. mexicana.
5.5 Validación de estructuras proteicas modeladas
El sistema de modelado fue validado a través de tres vías. La primera consiste en
establecer controles. En la Tabla 8, se presentan los controles positivos y negativos. El
control positivo presenta un elevado valor de TM-Score, lo que supone una estructura
similar para las proteínas de Checkpoint Rad53 tanto en S. pombe como en Leishmania
major. Esto concuerda con la identificación documentada por Genois y colaboradores
(Genois et al., 2014). El control negativo presenta un TM-Score bajo, esto indica que a
pesar de que la proteína ACC, de L. mexicana, presenta similitud con hsClaspin/spMrc1,
su estructura no posee relación significativa con los modelos de las proteínas de
referencia. Se puede visualizar los alineamientos estructurales para los controles en la
Figura 13, Figura 14 y Figura 15.
Tabla 8. Comparación entre estructuras de control. TM-Score
entre 0 y 1. Donde 1 indica un alineamiento idéntico.
Control Estructura1 Estructura 2 TM-Score
Positivo Rad53 PDB
(4pdp)
LmjF.17.0060
modelado 0,827
Negativo
lmACC spMrc1
modelado 0,230
lmACC hsClaspin
modelado 0,242
Elaborado por Parra C.
37
La segunda forma de validación corresponde al control de calidad de las proteínas
modeladas a través de las métricas de calidad. Mediante el factor de calidad Q de Errat,
se puede observar que las proteínas cumplen con una calidad superior al 80% (Tabla 9).
Este factor resulta significativo, al compararlo con la proteína de referencia Chk1, la cual
presenta un coeficiente de calidad similar, de aproximadamente 86,2%. Es importante
mencionar que idealmente se preferiría trabajar con estructuras cristalográficas del PDB,
las cuales presentan una calidad ERRAT, cercana al 95%, sin embargo, al no encontrarse
las proteínas a estudiar en el PDB, se predice las estructuras del complejo, obteniéndose
modelos con una calidad aceptable para este ensayo. De hecho, proteínas con estructuras
Figura 13. Superposición de estructuras scRad53.
Dorado: S. cerevisiae, Celeste: LmjF.17.0060
modelado por I-TASSER. Control Positivo
Figura 15. Superposición de estructuras
Control Negativo. Azul: spMrc1, Rojo:
ACC. Modeladas por I-TASSER.
Figura 14. Superposición de estructuras
Control Negativo. Dorado: hsClaspin, Rojo:
ACC. Modeladas por I-TASSER.
38
cristalográficas disponibles en el PDB (referencias: hsChk1 y LmxM.30.2970), presentan
métricas de calidad similares a las obtenidas por modelado con I-TASSER. En el anexo
F, se muestra a manera de ejemplo, la gráfica de distribución del coeficiente de error Errat
en función del cada residuo proteico para hsClaspin
La segunda métrica de calidad utilizada corresponde al C-Score. En la Tabla 9, se
puede apreciar que el C-Score de las proteínas estudiadas varía entre -1,66 y 0,71. Estos
valores indican una distribución central aceptable del coeficiente, considerando que el
rango de confianza se expresa entre -5 y 2. Para esta prueba se utilizó como referencia
proteínas con estructuras cristalográficas como son hsChk1 y LmxM.30.2970 (RCSB,
2018). Sin embargo, se debe mencionar que la proteína modelada para el gen
LmxM.34.1090 presenta el menor C-Score (-3,28). Este hecho, pone en manifiesto la
necesidad de realizar una validación de la estructura adicional, utilizando otra especie de
Leishmania, en este caso se realizó la validación adicional utilizando la similitud
filogenética con L. major.
Tabla 9. Métricas de calidad de las proteínas modeladas.
C-Score: Entre 2 y -5, donde 2 corresponde a un modelo
de elevada confianza y viceversa.
Proteína Q Factor
% (Errat) C-Score
hsClaspin 83,76 0,13
xlClaspin 82,50 0,71
spMrc1 93,69 -1,27
scMrc1 85,75 -1,66
LmxM.34.1090 79,99 -3,28
LmjF.35.1090 91,98 -1,09
LmxM.33.0690 90,90 -0,42
Chk1 Control humano 86,21 -0.18
LmxM.30.2970 Control 85,03 0,26
La tercera forma de validación corresponde a la identificación de similitud
filogenética. Se esperaría que, en especies cercanas en términos evolutivos, la estructura
terciaria se conserve de mejor manera (Pellegrini, Marcotte, & Thompson, 1999). Por
tanto, en la tabla 10, se ha comparado las estructuras en diferentes especies relacionadas.
Para las estructuras modeladas en animales: H. sapiens y X. laevis, se muestra una
correspondencia de estructuras de 0,971. Entre S. pombe y S. cerevisiae el coeficiente de
Elaborado por Parra C.
39
alineamiento es de 0,933. Finalmente, para la familia de proteínas predichas entre L.
mexicana y L. major, el coeficiente de superposición es de 0.803. Por tanto, se puede
afirmar que existe alta correspondencia estructural entre especies filogenéticamente
cercanas (figuras 16, 17 y 18).
Tabla 10. Comparación entre familias de proteínas modeladas
Proteína Organismo 1 Organismo 2 TM-Score
Claspin H. sapiens X. laevis 0,971
Mrc1 S. pombe S. cerevisiae 0,933
Putative
Mrc1 L. mexicana L. major 0,803
Elaborado por Parra C.
Figura 16. Superposición de estructuras modeladas
por I-TASEER para Claspin. Dorado: H. sapiens,
Verde: X. laevis
Figura 17. Superposición de estructuras
predichas para Mrc1. Azul: S. pombe,
Amarillo: S. cerevisiae
Figura 18. Superposición de estructuras
predichas para putative Mrc1. Violeta: L.
mexicana, Blanco: L. major (LmjF.35.1090).
40
5.7 Homología Mrc1/Claspin en tripanosomátidos
Finalmente, se esperaría que un gen que codifica para una proteína de un rol tan
importante, como Claspin/Mrc1, se encuentre altamente conservada en el género
Leishmania sp. Al realizar una búsqueda por BLAST (Tabla 11), se aprecia una identidad
de secuencia superior al 90% en las especies L. major, L. infantum, L. donovani y superior
al 79% en L. braziliensis. Este hecho confirma la presencia de homólogos al gen
LmxM.34.1090 en el género Leishmania sp. En el caso del género Trypanosoma sp., se
observa similitud de identidad cercana al 40%. Esto pone en manifiesto, la alta
variabilidad del genoma en tripanosomátidos, sin embargo, no se descarta la presencia de
homólogos a nivel de estructura, para estas similitudes en Trypanosoma, las cuales son
relativamente altas.
Tabla 11. Resultados de BLAST entre LmxM.34.1090 (putative
Mrc1) y a otros tripanosomátidos
Gen Organismo Max
Score
E Value Ident
%
LmjF.35.1090 Leishmania
major 1591 0,0 91
LinJ.35.1100 Leishmania
infantum 1583 0,0 90
LdbPK.35.1100 Leishmania
donovani 1753 0,0 90
LbrM.27.0390 Leishmania
braziliensis 1422 0,0 79
TcCLB.503599.40 Trypanosoma
cruzi 460 3 x 10-144 37
Tb927.5.840 Trypanosoma
brucei 454 5 x 10-142 41
Elaborado por Parra C. (NCBI, 2014).
41
7. CONCLUSIONES Y RECOMENDACIONES
7.1 Conclusiones
- A través del presente estudio se han identificado proteínas homólogas a
hsClaspin/spMrc1 en Leishmania mexicana, utilizando herramientas
bioinformáticas como la comparación de secuencias de aminoácidos y la
comparación de estructuras modeladas.
- Entre los genes que codifican proteínas con similitud estructural a spMrc1 y
hsClaspin se encuentran LmxM.34.1090 y LmxM.33.0690 respectivamente.
- Es posible la existencia de posibles mecanismos de checkpoint mediados por
homólogos a hsClaspin y spMrc1 en Leishmania spp.
- La similitud estructural entre hsClaspin y el dominio terminal de spMrc1 en
proteínas modeladas es significativa, hecho que pone en manifiesto la relación
filogenética entre las especies comparadas.
- Se presentó elevada similitud estructural entre especies filogenéticamente
cercanas: H. sapiens y X. laevis, S. cerevisiae y S. pombe; L. mexicana y L.
major.
- Los controles de calidad para las proteínas generadas por ordenador presentan
valores de confianza aceptables para el presente estudio.
- Los controles positivo y negativo presentan resultados que validan la acertada
predicción de los modelos de proteínas y la especificidad del método, al verificar
la ausencia de falsos positivos.
- Se identifican posibles homólogos de spMrc1, en otras especies de Leishmania,
como L. major, L. infantum, L. donovani, L. braziliensis y genes con similitudes
considerables en T. cruzi y T. brucei.
42
7.2 Recomendaciones
- Se recomienda verificar la función de las proteínas identificadas en los
mecanismos de DNA Replication Checkpoint in silico, en experimentos in vitro
en L. mexicana.
- Se sugiere realizar experimentos de modelado tridimensional de proteínas con
los posibles homólogos a spMrc1 en Leishmania spp. y Trypanosoma spp.
descritos en este trabajo.
- Se sugiere realizar cortes de las proteínas en función de sus dominios en
proteínas de elevado tamaño. >1500 AA
- Se recomienda continuar con el estudio bioinformático de las proteínas que
conforman el complejo de DNA Replication Checkpoint Tipin/Timeless.
- Se sugiere optimizar el tiempo dedicado al modelado tridimensional de
proteínas, a través de la implementación del Servidor I-TASSER en una estación
de trabajo local.
- Se recomienda trabajar con múltiples cuentas institucionales de la universidad,
para optimizar el proceso de modelado de proteínas.
- Es altamente recomendable trabajar con un ordenador con interfaz de 64 bits,
pues varios programas requieren de esta característica.
- Se sugiere el trabajo en terminales de escritorio a través del control remoto de
estación en procesos que requieren alta capacidad de procesamiento.
- Se sugiere almacenar respaldos en la nube de los resultados obtenidos en las
diferentes etapas bioinformáticas, para evitar pérdida de información.
43
CITAS BIBLIOGRÁFICAS
Abraham, R. (2001). Cell cycle checkpoint signaling through the ATM and ATR kinases. Genes
& Development, 2177-2186.
Adak, S., & Datta, A. (2005). Leishmania major encodes an unusual peroxidase that is a close
homologue of plant ascorbate peroxidase: a novel role of the transmembrane domain.
Biochem Journal, 3-9.
Alabert, C., Poveda, A., & Pasero, P. (2009). Yeast as a Model for Human Disease. ed. Witt, S.
N, 199-222.
Alcasabas, A. et al. (2001). Mrc1 transduces signals of DNA replication stress to activate
Rad53. Nat. Cell Bio, 3, 65, 958.
Bando, M. et al. (284). Csm3 , Tof1 , and Mrc1 Form a Heterotrimeric Mediator Complex That
Associates with DNA Replication Forks. Journal of Biological Chemistry, 2009.
Beishline, K., & Clifford, J. (2014). Interplay Between the Cell Cycle and Double-Strand Break
Response in Mammalian Cells. Methods in molecular biology, 44-46.
Beishline, Kate, & Azizkhan, J. (2014). Interplay Between the Cell Cycle and Double-Strand
Break Response in Mammalian Cells. Methods in molecular biology, 50-51.
Berman, H., Westbrook, J., Feng, Z., Gilliland, G., Bhat, T., Weissig, H., . . . Bourne, P. (2000).
The Protein Data Bank. Nucleic Acids Research, 235-242.
Bern, C., Montgomery, S., Herdwalt, B., Maguire, J., Kirehoff, L., Gilman, R., & Moore, A.
(2007). Evaluation and Treatment of Chagas Disease in the United States. Clinician´s
Corner, 2176.
Bowie, J. L., & Eisenberg, D. (1991). A method to identify protein sequences that fold into a
known three-dimensional structure. Science, 164-166.
Chothia, C., & Lesk, A. (1986). The relation between the divergence of sequence and structure
in proteins. The Embo Journal, 1-2.
Comisión de las Comunidades Europeas. (2008). Desición de la comisión relativa a la
transferencia de la declaración del medicamento "Miltefosina" como medicamento
huérfano, con arreglo al Reglamento (CE) n° 141/2000 del Parlamento Europeo y del
Consejo. Brucelas: Agencia Europea de Medicamentos.
Conway, C., Proudfoot, C., Burton, P., & al., e. (2002). Two pathways of homologous
recombination in Trypanosoma brucei. Mol Microbiol, 700.
Fassler, J., & Cooper.P. (2011). BLAST Glosary. NCBI Help Manual, 53-55.
Genois, M., E., P., & Laffitte, M. (2014). DNA repair pathways in trypanosomatids: from DNA
repair to drug resistance. Microbiol Mol Biol, 40-73.
44
Genois, M., Paquet, E., Laffite, M., Maity, R., Rofrigue, A., Oullette, . . . Masson, J. (2014).
DNA Repair Pathways in Trypanosomatids: from DNA Repair to Drug Resistance.
Microbiol Mol Biol Rev, 70-43.
Gorgoulis, V. (2005). Activation of the DNA damage checkpoint and genomic instability in
human precancerous lesions. International Journal of Science, 907-911.
Hanks, S., Quinn, A., & Hunter, T. (1988). The protein kinase family: conserved features and
deduced phylogeny of the catalytic domains. Science, 42-52.
Higgins, D., & Taylor, W. (2000). Bioinformatics: sequence, structure, and databanks: a
practical approach. Oxford: Oxford University Press.
Hirosawa, M., Totoki, Y., Hoshida, M., & Ishikawa, M. (1995). Comprehensive study on
iterative algorithms of multiple sequence alignment. Bioinformatics, 11(1), 13-18.
IICAB. (2009). Leishmaniasis (cutánea y viceral). The Center for Food Security and Public
Health, 1-2.
Kastan, M., Zhan, Q., & Deiry, W. (1992). A mammalian cell cycle checkpoint pathway
utilizing p53 and GADD45 is defective in ataxia-telangiectasia. Cell, 587-590.
KEGG. (5 de Marzo de 2018). KEGG Pathway: Cell Cycle. Obtenido de Kyoto Encyclopedia of
Genes and Genomes: http://www.kegg.jp/kegg-
bin/highlight_pathway?scale=1.0&map=hsa04110&keyword=checkpoint
Khanra, S., Sarraf, N., Lahiry, S., & Roy, S. M. (2017). Leishmania genomics: a brief account.
The Nucleus, 227-228.
Kihara, D., Chen, H., & Yang, Y. (2009). Quality Assessment of Protein Structure Models.
Current Protein and Peptide Science, 216-219.
Koonin, E. (2005). Orthologs, Paralogs, and Evolutionary Genomics. Annual Review of
Genetics, 1.
Koundrioukoff, S. et al. (2013). Activation of the ATR Signaling Pathway upon Increasing
Replication Stress Impacts Fragile Site Integrity. PLos Genet, 9.
Larreátegui, D. (2011). Enfermededad de Chagas en el Ecuador: 100 años de historia. Post-
Grado. Medicina Interna. Universidad Internacional del Ecuador, 5,6. Obtenido de
https://es.scribd.com/doc/50321101/Revision-Chagas-100-anos-en-Ecuador
Luscombe, M., Greenbaum, D., & Gerstein, M. (2001). What is Bioinformatics? A Proposed
Definition and Overview of the Field. Schattauer GmbH, 346-347.
Mac, A., Laskowski, M., & Thornton, J. (1994). Knowledge-based validation of protein
structure coordinates derived by X-ray crystallography and NMR spectroscopy. El
Sevier, 731-733.
Mantiero, D., Mackenzie, A., Donaldson, A. & Zegerman, P. (2011). Limiting replication
initiation factors execute the temporal programme of origin firing in budding yeast. .
EMBO J., 30.
Martinez, M. (2009). Estructura y función del ADN y de los genes. Tipos de alteraciones de la
función del gen por mutaciones. El Sevier, 1-2.
45
Masai, H., Yang, C., & Matsumoto, S. (2017). Mrc1/Claspin: a new role for regulation of origin
firing. Current Genetics, 813-818.
McGreevy, R., & Pusztai, L. (2007). Reverse Monte Carlo Simulation: A New Technique for
the Determination of Disordered Structures. Molecular Simulation, 359-367.
Moore, J. H., Asselbergs, F. W., & Williams, S. M. (2010). Bioinformatics challenges for
genome-wide association studies. Bioinformatics, 445-446.
Moult, J., Fidelis, K., & Kryshtafovych, A. (2013). Critical assessment of methods of protein
structure prediction (CASP) — round x. Proteins, 1-2.
MSP. (2014). Cuadro Nacional de Medicamentos Básicos y Registro Terapéutico. Quito:
Publiasesores Cía. Ltda.
MSP. (4 de Diciembre de 2014). Gaceta Epidemiológica Semanal No. 47. Subsecretaria de
Vigilancia de la Salud Pública. Obtenido de Dirección Nacional de Vigilancia
Epidemiológica.
Musiałek, M. W., & Rybaczek, D. (2015). Behavior of replication origins in Eukaryota – spatio-
temporal dynamics of licensing and firing. . Cell Cycle, 00-00.
NCBI. (Febrero de 2014). BLAST. Obtenido de National Center for Biotechnology Information,
U.S. National Library of Medicine: https://blast.ncbi.nlm.nih.gov/Blast.cgi
Nunes, V., Damasceno, J., Freire, R., & Tosi, L. (2011). The Hus1 homologue of Leishmania
major encodes a nuclear protein that participates in DNA damage response. Molecular
& Biology Parasitology, 1-2.
OMS. (1 de Febrero de 2018). Centro de Prensa: La enfermedad de Chagas (tripanosomiasis
americana). Obtenido de Organización Mundial de la Salud:
http://www.who.int/es/news-room/fact-sheets/detail/chagas-disease-(american-
trypanosomiasis)
OMS. (14 de Marzo de 2018). Centro de Prensa: Leishmaniasis. Obtenido de Organización
Mundial de la Salud: http://www.who.int/es/news-room/fact-sheets/detail/leishmaniasis
Pearson, W. (2013). An Introduction to Sequence Similarity (“Homology”) Searching. Bulletin
of Mathematical Biology, 3.
Pellegrini, M., Marcotte, E., & Thompson, M. (1999). Assigning protein functions by
comparative genome analysis: Protein phylogenetic profiles. PNAS, 4285-4288.
Pellegrini, M., Marcotte, E., Thompson, M., Eisenberg, D., & Yeates, T. (1999). Assigning
protein functions by comparative genome analysis: Protein phylogenetic profiles.
Proceedings of the National Academy of Sciences, 4285.
Poli, J. et al. . (2012). dNTP pools determine fork progression and origin usage under
replication stress. . EMBO J., 31.
RCSB. (05 de 16 de 2018). Protein Data Bank. Obtenido de RCSB PDB : https://www.rcsb.org
Romero, A., Machuca, C., & Padrón, M. (2007). Valor pronóstico de los cambios fisiológicos
asociados a la quimio-resistencia en Leishmania. Researchgate, 2-4.
Roy, A., Kucukural, A., & Zhang, Y. (2010). I-TASSER: a unified platform for automated
protein structure and function prediction. Nature Protocols, 725-738.
46
Sánchez, L., & Sáenz, E. (2004). Leishmaniasis. Educación Médica Continua, 82-84.
Sanchez, L., Diffley, J., & Ponting, C. (2010). Homology explains the functional similarities of
Treslin/Ticrr amd SId3. Magazine R509, 1-2.
Sanger Institute. (16 de 05 de 2018). Kynetoplastid Protozoa. Obtenido de GenDB:
www.gendb.org
Sar, F., Lindsey Boltz, L., Subramanian, D., D., C., S., H., J., G., & A., S. (2004). Human
claspin is a ring-shaped DNA-binding protein with high affinity to branched DNA
structures. Journal of Biological Chemistry, 1-3.
Shankar, P., Borrman, T., Liu, V., Yang, S., Bechloefer, J., & Rhind, N. (2015). Replication
timing is regulated by the number of MCMs loaded at origins. Genome Research, 1-2.
Singh, M. K. & Dominy, B. N. (2010). Thermodynamic resolution: how do errors in modeled
protein structures affect binding affinity predictions? . Proteins, 78.
Stephens, T., & Stephens, R. (1990). Sequence logos: a new way to display consensus
sequences. Nucleic Acids Research, 1.
Sutton, M., & Walker, C. (2002). Managing DNA polymerases: Coordinating DNA replication,
DNA repair, and DNA Recombination. Pnas, 2-3.
Sverdlov, E. (1998). Perpetually mobile footprints of ancient infections in human genome.
FEBS Letters, 1-2.
Szklarczyk, D., Morris, J., Cook, H., Kuhn, M., Wyder, S. S., Doncheva, N., . . . Mering, C.
(2017). The STRING database in 2017: quality-controlled protein-protein association
networks, made broadly accessible. Nucleic Acids Research, 362-364.
The UniProt Consortium. (2017). UniProt: the universal protein knowledgebase. Nucleic Acids
Research, 1-5. Recuperado el 12 de 04 de 2018, de
http://www.uniprot.org/uniprot/?query=claspin&sort=score
Uzcanga, G., Lara, E., Gutiérrez, F., Beaty, D., Beske, T., Teran, R., . . . Poveda, A. (2016).
Nuclear DNA replication and repair in parasites of the genus Leishmania: Exploiting
differences to develop innovative therapeutic approaches. Critical Reviews in
Microbiology, 9-10.
Wheeler, R., Sunter, J., & Gull, K. (2016). Flagellar pocket restructuring through the
Leishmania life cycle involves a discrete flagellum attachment zone. Journal of Cell
Cience, 1.
Wheeler, R., Sunter, J., Gull, & K. (2016). Flagellar pocket restructuring through the
Leishmania life cycle involves a discrete flagellum attachment zone. J Cell Sci, 854-
857.
Yang, J., Roy, A., & Zhang, Y. (2013). Proteinm ligand binding site recognition using
complementary. Bioinformatics, 29.
Yang, J., Yan, R., Roy, A., Xu, D., Poisson, J., & Zhang, Y. (2015). The I-TASSER Suite:
Protein structure and function prediction. Nature Methods, 12, 7-8.
Yoshida, K. et al. . (2014). The histone deacetylases sir2 and rpd3 act on ribosomal DNA to
control the replication program in budding yeast. Cell, 7.
47
Zech, J., Godfrey, E., Masai, H., Hartsuiker, E., & Dalgaard, Z. (2015). The DNA Binding
Domain of S.pombe Mrc1 (Claspin) Acts to Enhance Stalling at Replication Barriers.
PLOS One, 1-3.
Zhang, Y. & Skolnick, J. (2004). SPICKER: a clustering approach to identify near-native
protein folds. Journal of Computational Chemistry, 1-2.
Zhang, Y., & Skolnick, J. (2005). TM-align: A protein structure alignment algorithm based on
TM-score. Nucleic Acids Research, 2302-2309.
Zhao, H., Tanaka, K., Eishi, N., Nogochi, C., & Russell, P. (2003). Replication Checkpoint
Protein Mrc1 Is Regulated by Rad3 and Tel1 in Fission Yeast. Molecular And Cellular
Biology, 8395-8400.
49
Anexo A. Árbol de Problemas
Desconocimiento acerca de la presencia de homólogos de Mrc1/Claspin en
Leishmania mexicana, durante el periodo 2018-2018?
.
Mecanismo de acción
de los fármacos no
elucidado
Alta variabilidad
genética
Baja inversión en I&D en
parasitosis tropicales
Métodos moleculares de
localización de proteínas
poco desarrollados
Dianas farmacológicas
muy recientes en L.
mexicana
Desarrollo acelerado de
bases de datos genéticas
Atribución incorrecta
de la diana
farmacológica
Desconocimiento sobre
posibles resistencias
ocasionadas por
mutaciones
Desarrollo de la terapia
limitado
Teorías moleculares
complejas
Potencial uso clínico no
valorado
Falta de insumos de
laboratorio (costosos)
Recursos económicos
limitados para investigación
Mayores efectos
adversos con otros
fármacos
Baja calidad de vida de
enfermos de
Leishmaniasis
50
Anexo B. Categorización de variables
- Leishmania mexicana
- DNA Replication Checkpoint
Parásitos tropicales
CaracterísticasManifestaciones
clínicasTratamiento
Leishmaniasis
Leishmania mexicana
Replicación de ADN
ATM/ATR, Chk1/Chk2
Claspin/Tipin/
Timeless
Orígenes de Replicación
DNA Replication Checkpoint
51
- Similitud de Secuencias
Estudio Filogenético
Similitud a nivel de estructura
Modelado de Proteinas
Métricas de Calidad
Genes Homólogos
Similitud de Secuencias
52
Anexo C. Instrumento de recolección de datos
Aspecto Valor
Nombre del Gen
Código GenDB
Solapamiento
Max Score
E value NCBI
Estructura predicha
54
Anexo E. Posibles genes homólogos a spMrc1 en Homo sapiens en KEGG
Entry SW_score bits identity overlap
hsa:10525 102 29.0 0.300 130
hsa:1062 248 62.3 0.202 1029
hsa:1063 236 59.6 0.205 830
hsa:10763 172 45.0 0.251 398
hsa:11064 221 56.2 0.210 1050
hsa:11113 201 51.6 0.227 603
hsa:127254 203 52.1 0.188 936
hsa:129446 208 53.2 0.200 1001
hsa:145508 248 62.3 0.210 1066
hsa:151246 244 61.4 0.201 877
hsa:1538 208 53.2 0.202 563
hsa:1832 225 57.1 0.190 701
hsa:1834 283 70.3 0.183 737
hsa:22852 217 55.3 0.203 695
hsa:22989 225 57.1 0.221 869
hsa:23013 215 54.8 0.195 912
hsa:23085 228 57.8 0.207 884
hsa:23091 243 61.2 0.193 791
hsa:23253 216 55.0 0.186 862
hsa:23285 205 52.5 0.193 803
hsa:25836 221 56.2 0.198 885
hsa:259282 266 66.4 0.193 1058
hsa:27445 200 51.4 0.219 722
55
Entry SW_score bits identity overlap
hsa:2803 226 57.3 0.186 962
hsa:2804 233 58.9 0.206 866
hsa:284992 201 51.6 0.211 570
hsa:287 225 57.1 0.206 980
hsa:29123 246 61.9 0.200 1043
hsa:339965 212 54.1 0.210 749
hsa:343099 203 52.1 0.190 977
hsa:375248 262 65.5 0.199 961
hsa:387680 201 51.6 0.216 941
hsa:3895 212 54.1 0.196 1003
hsa:399687 244 61.4 0.197 952
hsa:4131 201 51.6 0.192 689
hsa:440193 210 53.7 0.196 982
hsa:4619 237 59.8 0.197 897
hsa:4620 237 59.8 0.195 902
hsa:4621 229 58.0 0.211 883
hsa:4622 238 60.0 0.192 1007
hsa:4624 264 66.0 0.209 1070
hsa:4625 273 68.0 0.207 1076
hsa:4626 232 58.7 0.196 1034
hsa:4627 211 53.9 0.203 665
hsa:4628 279 69.4 0.212 958
hsa:4629 238 60.0 0.202 960
hsa:4744 203 52.1 0.196 881
hsa:51742 211 53.9 0.207 1000
56
Entry SW_score bits identity overlap
hsa:5339 219 55.7 0.200 858
hsa:546 225 57.1 0.203 809
hsa:54875 219 55.7 0.188 884
hsa:5493 205 52.5 0.205 844
hsa:55088 239 60.3 0.199 860
hsa:55605 210 53.7 0.181 1015
hsa:55677 216 55.0 0.197 694
hsa:55704 262 65.5 0.194 954
hsa:55835 201 51.6 0.214 823
hsa:57530 210 53.7 0.212 735
hsa:5930 234 59.1 0.195 718
hsa:6093 210 53.7 0.199 599
hsa:6249 262 65.5 0.200 824
hsa:63895 101 28.8 0.327 110
hsa:63967 225 57.1 0.217 1042
hsa:643677 202 51.8 0.199 845
hsa:7175 240 60.5 0.204 825
hsa:7798 221 56.2 0.224 697
hsa:79741 235 59.4 0.205 874
hsa:7994 227 57.5 0.226 807
hsa:800 219 55.7 0.195 652
hsa:80122 103 29.3 0.312 112
hsa:80184 222 56.4 0.208 849
hsa:8411 287 71.2 0.201 971
hsa:84952 220 55.9 0.213 844
57
Entry MF_score bits identity overlap
hsa:8735 262 65.5 0.225 867
hsa:9321 245 61.6 0.213 957
hsa:9360 204 52.3 0.190 638
hsa:9416 118 32.7 0.311 135
hsa:9475 234 59.1 0.197 751
hsa:9585 218 55.5 0.214 695
hsa:9648 220 55.9 0.213 927
hsa:9669 212 54.1 0.218 593
hsa:9696 206 52.8 0.206 817
hsa:9857 231 58.5 0.210 946
58
Anexo F. Gráfica de distribución de Error Errat
Anexo F. Gráfica de error Errat para la proteína hsClaspin. La línea inferior muestra los residuos que
sobrepasan el 95% de coeficiente de confianza de color amarillo. Los residuos que sobrepasan la
segunda línea se muestran con rojo, y superan el 99% de error de modelado. Se aprecia que más del
80% de la proteína modelada presenta una confianza aceptable (en color verde). Elaborada con Errat