Laboratório Nacional de Computação Científica
Curso de Pós Graduação em Modelagem Computacional
Técnicas de Bioinformática e Modelagem Computacional
Aplicadas ao Estudo do Genoma de Trypanosoma cruzi e de
Enzimas Consideradas de Interesse no Tratamento da Doença de
Chagas: Estudo Particular das Cruzipaínas 1 e 2
Por
Priscila Vanessa Zabala Capriles Goliatt
PETRÓPOLIS, RJ - BRASIL
MARÇO DE 2007
TÉCNICAS DE BIOINFORMÁTICA E MODELAGEM COMPUTACIONAL
APLICADAS AO ESTUDO DO GENOMA DE TRYPANOSOMA CRUZI E DE
ENZIMAS CONSIDERADAS DE INTERESSE NO TRATAMENTO DA
DOENÇA DE CHAGAS: ESTUDO PARTICULAR DAS CRUZIPAÍNAS 1 E 2
Priscila Vanessa Zabala Capriles Goliatt
DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO LABORATÓRIO NA-
CIONAL DE COMPUTAÇÃO CIENTÍFICA COMO PARTE DOS REQUISITOS NE-
CESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM MODELAGEM
COMPUTACIONAL
Aprovada por:
Laurent Emmanuel Dardenne, D.Sc.
(Presidente)
Wim Maurits Sylvain Degrave, Ph.D.
Claudia B. M. Vitorello, Ph.D.
Helio J. C. Barbosa, D.Sc.
Ana Paula C. de A. Lima, Ph.D.
Ernesto Raul Caffarena, Ph.D.
PETRÓPOLIS, RJ - BRASILMARÇO DE 2007
Goliatt, Priscila Vanessa Zabala Capriles
C253t Técnicas de bioinformática e modelagem computacional aplicadas ao estudo
do genoma de Trypanosoma cruzi e de enzimas consideradas de interesse no tra-
tamento da doença de chagas: estudo particular das cruzipaínas 1 e 2 / Priscila
Vanessa Zabala Capriles Goliatt. Petropólis, RJ. : Laboratório Nacional de Compu-
tação Científica, 2007.
xxii, 153 p. : il.; 29 cm
Orientadore(s): Laurent Emmanuel Dardenne e Wim Maurits Sylvain Degrave
Dissertação (M.Sc.) – Laboratório Nacional de Computação Científica, 2007.
1. Doença de Chagas. 2. Trypanosoma cruzi. 3. Alvos Moleculares. 4.
Modelagem Comparativa. I. Dardenne, Laurent Emmanuel. II. LNCC/MCT. III.
Título.
CDD 616.936 3
“Pensar é uma forma de represar poemas
Até que saiam pelas turbinas
em estado de força.
Tenho muita admiração por hidrelétricas.”
Viviane Mosé
iv
Ao homem que
calou-me as palavras duras,
abriu meu sorriso e
fez-me entender o que é o
AMOR.
“Ao meu marido Leonardo”.
v
Agradecimentos
“A construção de todo um pensamento e uma postura científica leva anos e é
cercada por várias pessoas que nos apresentam suas vivências, idéias, barreiras e solu-
ções”. É por consideração e respeito, que não agradecerei nominalmente à cada uma
destas pessoas que contribuíram até o último ponto final desta tese (o que faz-me crer
cada vez mais que estes textos de gratidão deveriam vir ao final dos trabalhos), mesmo
por que uma parte delas não tem conhecimento de minha existência, das que me co-
nhecem a maioria não tem noção da importância que teve neste processo, as que sabem
que desempenharam um papel significativo em minha vida, possivelmente, nunca lerão
estas palavras e, as que por ventura venham a ter acesso à estas, podem sentir-se supra
ou supervalorizados pelas expressões de agradecimento.
Desta forma, aterei-me a agradecer usando o termo mais comum à todas estas pes-
soas que foram minhas “orientadoras”. Agradeço àqueles que orientaram minha imper-
suasiva decisão de ser biomédica, biomédica/geneticista e, por fim, biomédica/geneticis-
ta/modeladora-computacional. Aos meus orientadores familiares, pessoais, emocionais,
profissionais, intelectuais e, por quê não citar, os que me orientaram filosófica e espiri-
tualmente, afinal, como um grande amigo meu diz “Não importa se um pesquisador tem
ou não religião, o que ele não pode negar é que pesquisar é um processo de fé”.
À todos que orientaram minha vida até este ponto, um muito obrigada e, como
sempre, saibam que continuarei empenhada em honrar minha palavra de seguir em
frente na fé que tenho em poder transformar meu trabalho no que ele exatamente se
destina, em produto de utilidade pública.
vi
Este trabalho está integrado ao Projeto Temático: Desenvolvimento de Métodos
de Docking Acoplado a Computação de Alto Desempenho Visando o Desenho Racional
de Compostos Bioativos (Nº E26/171.401/01 - FAPERJ), sob coordenação do Ph.D.
Luiz Bevilacqua - LNCC; e ao projeto coordenado pelo D.Sc. Lauren E. Dardenne -
LNCC, sob o número E26/170.648/2004 - FAPERJ. Mais recentemente este trabalho
também foi integrado ao projeto Instituto do Milênio - Inovação e Desenvolvimento de
Fármacos e Medicamentos (IM-INOFAR/CNPq 420.015/2005-1).
Conta também com as seguintes colaborações:
• Laboratório de Genômica Funcional e Bioinformática - DBBM/FIOCRUZ:
* Ph.D. Antônio Basílio
* D.Sc. Thomas D. Otto
* M.Sc. Ana Carolina Guimarães
* M.Sc. Marcos Catanho
• Instituto de Biofísica Carlos Chagas Filho - UFRJ:
* Ph.D. Shaila C. S. Rössle
vii
Resumo da Dissertação apresentada ao LNCC/MCT como parte dos requisitos neces-
sários para a obtenção do grau de Mestre em Ciências (M.Sc.)
TÉCNICAS DE BIOINFORMÁTICA E MODELAGEM COMPUTACIONAL
APLICADAS AO ESTUDO DO GENOMA DE TRYPANOSOMA CRUZI E DE
ENZIMAS CONSIDERADAS DE INTERESSE NO TRATAMENTO DA
DOENÇA DE CHAGAS: ESTUDO PARTICULAR DAS CRUZIPAÍNAS 1 E 2
Priscila Vanessa Zabala Capriles Goliatt
Março, 2007
Orientador: Laurent Emmanuel Dardenne, D.Sc.
Co-orientador: Wim Maurits Sylvain Degrave, Ph.D.
Quase 100 anos após a descoberta do Trypanosoma cruzi, agente etiológico da
doença de Chagas, não existem tratamentos efetivos para esta doença tanto em sua fase
aguda quanto crônica. Neste trabalho é apresentado um estudo em grande escala das
proteínas preditas a partir de seqüências genômicas de T. cruzi, através de técnicas de
bioinformática e modelagem comparativa, visando investigar e discutir os seguintes as-
pectos: (i) quais seqüências podem ter suas estruturas tridimensionais (3D) geradas e
qualificadas por técnicas de modelagem comparativa, usando o workflow MHOLline;
(ii) associar a estes modelos protéicos uma classificação enzimática (EC), através da
ferramenta ECNGet (desenvolvida neste trabalho); (iii) através desta associação enzi-
mática aos modelos, usá-los para inferir possíveis funções biológicas às suas seqüências
alvos originalmente anotadas como hipotéticas, e/ou sugerir uma possível reanotação
de seqüências; (iv) investigar dentre as enzimas com estruturas 3D geradas quais pos-
suem similaridades (ortologias) com enzimas humanas (genoma de Homo sapiens); (v)
determinar quais das enzimas identificadas fazem parte de alguma via metabólica repre-
sentativa depositada em bancos de dados específicos.
Dentre as enzimas de T. cruzi consideradas como alvos moleculares para o trata-
viii
mento da doença de Chagas, as cisteíno proteases têm sido extensivamente estudadas
experimentalmente. Neste presente estudo, as isoformas 1 e 2 da cruzipaína foram in-
vestigadas por simulações de dinâmica molecular (DM), nas temperaturas de 25◦C e
37◦C , tendo como controle a papaína, enzima representativa da família C1 de cisteíno
proteases.
Analisando 20.679 seqüências protéicas preditas a partir de CDS (Seqüência Co-
dificante) não redundantes do genoma de T. cruzi (cepa CL Brener), 4.719 seqüências
foram associadas a proteínas de membrana e foram gerados 2.786 modelos estruturais
protéicos. Destes modelos, 1.888 foram associados a um EC, dos quais aproximada-
mente 79,5% foram classificados como tendo uma qualidade suficientemente boa para
serem usados em estudos de desenho racional de fármacos baseado em estrutura, através
de métodos de modelagem molecular. Dos 1.876 modelos enzimáticos com, pelo menos,
uma sub-subclasse enzimática, foram identificadas 99 seqüências possivelmente análo-
gas a enzimas humanas, 1.776 como similares e 1 bifuncional como análoga/similar.
Também foi possível detectar um subgrupo de 10 modelos considerados como prová-
veis enzimas específicas de T. cruzi em relação a H. sapiens, não descartando possíveis
relações destas seqüências com outros organismos. Nos estudos de DM realizados,
o principal resultado obtido indica que a presença de resíduos ácidos na posição 158
(numeração da papaína) no sítio catalítico, pode induzir uma reorganização estrutural,
suscetível a variações de temperatura, dos resíduos catalíticos em cisteíno proteases da
família da papaína. Esta reorganização estrutural gera uma conformação semelhante à
apresentada pela tríade catalítica (ASP/HIS/SER) em serino proteases.
ix
Abstract of Dissertation presented to LNCC/MCT as a partial fulfillment of the
requirements for the degree of Master of Sciences (M.Sc.)
BIOINFORMATICS AND COMPUTATIONAL MODELLING TECHNIQUES
APPLIED TO THE TRYPANOSOMA CRUZI GENOME STUDY AND ENZYMES
CONSIDERED AS POTENTIAL MOLECULAR TARGETS FOR CHAGAS’
DISEASE TREATMENT: PARTICULAR STUDY OF CRUZIPAINS 1 AND 2
Priscila Vanessa Zabala Capriles Goliatt
March, 2007
Advisor: Laurent Emmanuel Dardenne, D.Sc.
Co-advisor: Wim Maurits Sylvain Degrave, Ph.D.
Nearly 100 years after the discovery of Trypanosoma cruzi, the parasitic agent
of Chagas’ disease, there are no appropriate therapies that lead to cure the acute or the
chronic phases of this disease. In this work, it is presented a high-throughput compa-
rative modelling study of the predicted proteins from genomic sequences of T. cruzi,
aiming to investigate and discuss the following topics: (i) which sequences could gene-
rate structural models of different qualities, by MHOLline workflow; (ii) the association
of the modelled proteins with a different enzymatic classification (EC), using the ECN-
Get tool (developed in this work); (iii) the use of the structural models with EC to infer
a possible biological function to hypothetical protein sequences and/or to infer a dis-
tinct function to already annotated ones; (iv) to investigate amongst enzymes, with 3D
structures generated, which have similarities (orthologies) with human enzymes (Homo
sapiens genome); (v) to determine which of the identified enzymes have a representative
metabolic pathway in specific databanks.
Amongst enzymes of T. cruzi already considered as molecular target for Chagas’
disease treatment, the cysteine proteases had been extensively studied by experimen-
tal approaches. In present work, the isoforms 1 and 2 of cruzipains were investigated
x
by molecular dynamics simulations (MD) at 25◦C and 37◦C temperatures, having as
control the papain, the representative enzyme of cysteine proteases family C1.
Analysing the 20,679 predicted protein sequences from non redundant CDS (Co-
ding Sequence) of T. cruzi genome (CL Brener strain), 4,719 sequences were associated
to membrane proteins and 2,786 structural protein models were generated. From these
ones, 1,888 models were associated to an EC, of which approximately 79.5% were clas-
sified as having a enough good quality for rational drug design studies, by molecular
modelling methods. From 1,876 enzyme models with at least sub-subclass classifi-
cation, 99 sequences were identified as possible analogs to human enzymes, 1,776 as
similar and 1 bifunctional as analog/similar. It was also possible to identify a subset of
10 models considered as probably specific enzymes of T. cruzi in relation to H. sapiens,
which does not exclude relations with other organisms. In the MD studies, the main
result showed that the presence of an acidic residue in position 158 (papain numbering)
of the catalytic site, can induce a structural reorganisation, susceptible to temperature
variations, of the catalytic amino acids in cysteine proteases from papain family. This
structural reorganisation generates a similar conformation to that presented by the ca-
talytic triad (ASP/HIS/SER) in serine proteases.
xi
Sumário
1 Introdução 1
1.1 O Trypanosoma cruzi e seu Impacto Médico e Social . . . . . . . . . . 2
1.1.1 O Genoma de Trypanosoma cruzi . . . . . . . . . . . . . . . . 4
1.1.2 O Ciclo de Vida do Trypanosoma cruzi . . . . . . . . . . . . . 5
1.1.3 A Doença de Chagas . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.4 Tratamentos da Doença de Chagas . . . . . . . . . . . . . . . . 8
1.2 Alvos Moleculares de Trypanosoma cruzi em Estudo . . . . . . . . . . 11
1.2.1 Enzimas Proteolíticas . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.2 Cisteíno Proteases de Trypanosoma cruzi: Cruzipaínas 1 e 2 . . 24
1.3 Desenho Racional de Fármacos Baseado em Estrutura . . . . . . . . . . 29
1.4 Geração de Modelo Protéico via Modelagem Comparativa . . . . . . . 30
1.5 Simulação por Dinâmica Molecular . . . . . . . . . . . . . . . . . . . 39
2 Objetivos 50
2.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.2 Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3 Metodologia 51
3.1 Alinhamento de Seqüências . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2 Construção de Modelos Protéicos Tridimensionais via MHOLline . . . 56
3.2.1 Refinamento na Busca da Estrutura Molde . . . . . . . . . . . . 58
xii
3.3 Classificação Enzimática de Modelos Protéicos Tridimensionais de Try-
panosoma cruzi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.4 Determinação de Enzimas Análogas entre Trypanosoma cruzi e Homo
sapiens via AnEnπ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.5 Dinâmicas Moleculares da Papaína, Cruzipaína 1 e Cruzipaína 2 . . . . 72
3.5.1 Método de Simulação de Dinâmica Molecular . . . . . . . . . . 72
4 Resultados e Discussão 80
4.1 Modelos Protéicos Tridimensionais e Classificação Enzimática . . . . . 80
4.2 Enzimas Análogas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.3 Dinâmicas Moleculares . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5 Conclusões e Perspectivas 117
Referências Bibliográficas 124
Apêndice
A Arquivo.mdp usado em dinâmica molecular com temperatura a 37◦C 145
B Alinhamento entre as sequências de cruzipaína 1 e cruzipaína 2 148
Glossário 150
xiii
Lista de Figuras
Figura
1.1 Trypanosoma cruzi e seu vetor invertebrado. . . . . . . . . . . . . . . . . . . . 3
1.2 Incidência da doença de Chagas pela América do Sul, América Central e EUA. . . . 4
1.3 Ciclo de vida do Trypanosoma cruzi. . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Doença de Chagas: Fase Crônica. . . . . . . . . . . . . . . . . . . . . . . . 7
1.5 Porcentagem dos alvos farmacológicos de interesse comercial em 2002. . . . . . . . 11
1.6 Conformação estrutural dos resíduos que compõem a tríade catalítica das famílias S1
e S2 em serino proteases. . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7 Diagrama esquemático apresentando a classe das cisteíno proteases, suas principais
famílias e clans. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.8 Representação esquemática da estrutura primária da cruzipaína. . . . . . . . . . . 25
1.9 Representação esquemática do domínio catalítico da cruzipaína e seu sítio de catálise. 26
1.10 Representação esquemática do mecanismo catalítico de cisteíno protease. . . . . . . 28
1.11 Possíveis aplicações de modelos tridimensionais de acordo com os valores de RMSD. 33
1.12 Exemplo de gráfico de Ramachandran apresentando correlações entre os ângulos φ e
ψ de uma cadeia polipeptídica. . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.13 Esquema geral das etapas de construção de um modelo protéico tridimensional por
técnica de modelagem comparativa. . . . . . . . . . . . . . . . . . . . . . . . 38
1.14 Representação esquemática bidimensional de condições periódicas de contorno para a
simulação de um sistema pseudo-infinito. . . . . . . . . . . . . . . . . . . . . 48
1.15 Representação do potencial de Coulomb com e sem a aplicação do Campo de Reação. 49
3.1 Esquema apresentando parte da matriz BLOSUM62. . . . . . . . . . . . . . . . 53
xiv
3.2 Parte de um arquivo de saída apresentando o resultado de um BLASTP. . . . . . . . 55
3.3 Página de navegação on-line do BioParser. . . . . . . . . . . . . . . . . . . . . 56
3.4 Exemplo de uma seqüência protéica no formato FASTA. . . . . . . . . . . . . . 57
3.5 Exemplo de análise do Procheck classificando um modelo 3D como de boa qualidade. 59
3.6 Esquema representando o fluxo de dados em todas as etapas de funcionamento do
workflow MHOLline. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7 Classificação enzimática da cruzipaína apresentando sua numeração EC de acordo com
o NC-IUBMB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.8 Esquema apresentando o resumo das metodologias aplicadas na elaboração de uma
primeira lista de possíveis alvos moleculares para o tratamento da doença de Chagas. . 71
4.1 Modelo estrutural de cruzipaína obtido de seqüência genômica de T. cruzi anotada
como proteína hipotética. . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.2 Alinhamento entre as seqüências de cisteíno proteases de T. cruzi e H. sapiens classi-
ficadas pelo AnEnπ como similares. . . . . . . . . . . . . . . . . . . . . . . 87
4.3 Esquema apresentando o resumo dos resultados obtidos na elaboração de uma primeira
lista de possíveis alvos moleculares para o tratamento da doença de Chagas. . . . . . 90
4.4 Média da energia total por átomo do sistema (Kcal/mol/átomo), ao longo de 10 ns
de simulação de dinâmica molecular da papaína (9PAP) e cruzipaínas 1 (1ME4) e 2
(1ME4m). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.5 Estrutura secundária da papaína (9pap), ao longo de 10 ns de simulação de dinâmica
molecular, considerando CYS25 com carga total igual a -1,0. . . . . . . . . . . . 95
4.6 Estrutura secundária da cruzipaína 1 (1ME4), ao longo de 10 ns de simulação de dinâ-
mica molecular, considerando CYS25 com carga total igual a -1,0. . . . . . . . . . 96
4.7 Estrutura secundária da cruzipaína 2 (1ME4m), ao longo de 10 ns de simulação de
dinâmica molecular, considerando CYS25 com carga total igual a -1,0. . . . . . . . 97
4.8 RMSF (em nanômetros) dos carbonos-α da papaína (9PAP) e cruzipaínas 1 (1ME4)
e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, em relação a
estrutura original apresentada no cristal/modelo. . . . . . . . . . . . . . . . . . 99
xv
4.9 Grupo de conformações representativas de papaína (9PAP) usando como ponto de
corte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular. . . . . 106
4.10 Grupo de conformações representativas de cruzipaína 1 (1ME4) usando como ponto
de corte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular. . . 107
4.11 Grupo de conformações representativas de cruzipaína 2 (1ME4m) usando como ponto
de corte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular. . . 108
4.12 Conformações assumidas pelos resíduos da papaína (9PAP) e das cruzipaínas 1 (1ME4)
e 2 (1ME4m), em relação aos seus cristais e modelo, ao longo de 10 ns de simulação
de dinâmica molecular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.13 Distâncias entre os resíduos dos sítios catalíticos da papaína (9PAP) e das cruzipaínas
1 (1ME4) e 2 (1ME4m), no 10◦ ns de simulação de dinâmica molecular. . . . . . . 116
5.1 Conformação estrutural dos resíduos que compõem a tríade catalítica de serino prote-
ase mutada (SER221CSO) e de cruzipaína 1 (1ME4) após simulação de DM a 37◦C. . 123
B.1 Alinhamento múltiplo entre cruzipaínas 1 e 2. . . . . . . . . . . . . . . . . . . 149
xvi
Lista de Tabelas
Tabela
1.1 Principais enzimas de Trypanosoma cruzi considerados alvos moleculares para o de-
senvolvimento racional de fármacos contra a doença de Chagas . . . . . . . . . . 14
1.2 Exemplos de classes de proteases com alguns de seus clans e famílias. . . . . . . . 22
3.1 Classificação dos tipos de alinhamentos entre seqüências. . . . . . . . . . . . . . 52
3.2 Exemplo de resultado de BLAST filtrado pelo BATS e depositado no banco de dados
MHOLdb. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3 Exemplo de valores de LVI e GRSI calculados pelo BATS e depositados no banco de
dados MHOLdb. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.4 Exemplo de pontuação final calculada pelo BATS para os tipos de alinhamentos entre
seqüências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.5 Exemplo de classificação do BATS para os tipos de alinhamentos entre seqüências. . . 63
3.6 Classificação dos modelos construídos via MHOLline, de acordo com os valores de
identidade e cobertura† apresentados no alinhamento entre as seqüências alvo e molde. 66
3.7 Exemplo de resultado do AnEnπ mostrando seqüências de T. cruzi similares, possíveis
análogas e possíveis específicas a este organismo, em relação a enzimas humanas. . . 70
3.8 Cargas dos resíduos ácidos e básicos e resíduos de histidina e cisteína da papaína
(9PAP), cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m). . . . . . . . . . . . . . . 75
3.9 Resíduos de cisteína que participam de ligações dissulfídicas (S-S) na papaína (9PAP),
cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m). . . . . . . . . . . . . . . . . . . 75
3.10 Triptofanos e resíduos que compõem o sítio e os subsítios catalíticos da papaína (9PAP),
cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m). . . . . . . . . . . . . . . . . . . 79
xvii
4.1 Número de modelos protéicos de T. cruzi com e sem classificação enzimática, clas-
sificados de acordo com a qualidade de suas estruturas tridimensionais geradas pelo
MHOLline. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2 Número e porcentagem de modelos protéicos de T. cruzi de acordo com a classe enzi-
mática pertencente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.3 Categorias dos modelos protéicos de T. cruzi de acordo com comparação entre sua
classificação enzimática e a anotação genômica de sua seqüência alvo. . . . . . . . 83
4.4 Modelos protéicos de T. cruzi: categoria de anotação, analogia a H. sapiens via AnEnπ,
classificação enzimática e qualidade do modelo via MHOLline. . . . . . . . . . . 85
4.5 Exemplos de grupos enzimáticos classificados pelo AnEnπ, de acordo com a relação
entre o número de enzimas presentes em H. sapiens e T. cruzi, e pela presença de alvos
moleculares de T. cruzi já em estudo. . . . . . . . . . . . . . . . . . . . . . . 89
4.6 Porcentagem de estruturas secundárias em papaína (9PAP) e cruzipaínas 1 (1ME4) e
2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular. . . . . . . . . 94
4.7 RMSD médio (em A) do esqueleto peptídico da papaína (9PAP) e cruzipaínas 1 (1ME4)
e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, em relação a
estrutura original apresentada no cristal/modelo. . . . . . . . . . . . . . . . . . 98
4.8 RMSD médio (em A) do esqueleto peptídico dos subsítios e tríade catalítica da papaína
(9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m), ao longo de 10 ns de simulação de
dinâmica molecular, em relação a estrutura original apresentada no cristal/modelo. . . 98
4.9 Superfície acessível ao solvente (área em A2) dos triptofanos da papaína (9PAP) e
cruzipaínas 1 (1ME4) e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica
molecular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.10 Superfície acessível ao solvente (área em A2) dos triptofanos da papaína (9PAP) e
cruzipaínas 1 (1ME4) e 2 (1ME4m), no 10◦ ns de simulação de dinâmica molecular. . 101
4.11 Superfície acessível ao solvente (área em A2) dos subsítios e tríade catalítica da pa-
paína (9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m), ao longo de 10 ns de simulação
de dinâmica molecular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
xviii
4.12 Superfície acessível ao solvente (área em A2) dos subsítios e tríade catalítica da pa-
paína (9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m), no 10◦ ns de simulação de dinâ-
mica molecular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.13 Número de grupos de conformações representativas da papaína (9PAP) e cruzipaínas 1
(1ME4) e 2 (1ME4m), usando diferentes pontos de corte de RMSD (em A), ao longo
de 10 ns de simulação de dinâmica molecular. . . . . . . . . . . . . . . . . . . 105
xix
Lista de Siglas e Abreviaturas
• 1ME4: Cristal da cruzipaína 1, obtido do PDB
• 1ME4m: Modelo da cruzipaína 2, gerado por modelagem comparativa
• 24-SMT: 24-metiltransferase
• 3D: Tridimensional
• 9PAP: Cristal da papaína, obtido do PDB
• A: Angströms
• AK: Arginina cinase
• ALA: Alanina
• ARG: Arginina
• ASN: Asparagina
• ASP: Ácido aspártico
• BATS: BLAST Automatic Targeting for Structures
• BISTIC: Biomedical Information Science and Technology Initiative Consortium
• BLAST: Basic Local Alignment Search Tool
• Cα: Carbono-α
• CDS: Sequência codificante
• Cl−: Íon Cloro
• CSO: S-Hidroxicisteína
• CYP51: Citocromo-P450 em T. cruzi
• CYS: Cisteína
• DM: Dinâmica Molecular
• DNA (ou ADN): Ácido Desoxirribonucléico
xx
• EC: Enzyme Comission
• ED50: Dose Média Efetiva
• FTase: Farnesiltransferase
• GLN: Glutamina
• GLU: Ácido glutâmico
• gp = GP: Glicoproteína
• GPI: Glicosilfosfatidilinositol
• GPCR: G-protein-coupled receptor
• GR: glutationa redutase
• GRSI: Gap Relative Strengh Index
• GUS: Genomics Unified Schema
• H. sapiens = h = HSA: Homo sapiens
• HIS: Histidina
• IC50: Concentração Média Inibitória
• ID50: Dose Média Inibitória
• Ki: Constante de dissociação
• KEGG: Kyoto Encyclopedia of Genes and Genomes
• LC50: Concentração Média Letal
• LEU: Leucina
• LIT: Liver Infusion Tryptose
• LVI: Lenght Variation Index
• LYS: Lisina
• MET: Metionina
• MIC: Concentração Mínima Inibitória
• Na+: Íon Sódio
• NADH: estado reduzido da Nicotinamida Adenina Dinucleotídeo (NAD)
• NC-IUBMB: Nomenclature Committee of the International Union of Biochemistry and Mole-
cular Biology
xxi
• NIH: National Institutes of Health
• OMS: Organização Mundial da Saúde
• PDB: Protein Data Bank
• PDF: Função Densidade de Probabilidade
• PHE: Fenilalanina
• PRO: Prolina
• RMN: Ressonância Magnética Nuclear
• RMSD: Desvio Médio Quadrático
• Rx: Raios-X
• SAS: Superfície Acessível ao Solvente
• SER: Serina
• SQS: Esqualeno sintase
• S-S: Ligação dissulfídica
• T. cruzi = Tc = TCR: Trypanosoma cruzi
• TR: Tripanotiona redutase
• TRP: Triptofano
• TYR: Tirosina
• TS: Trans-sialidase
• T[SH]2: Tripanotiona (N1,N8-bis(glutationil)spermidina) redutase
• UNG: Uracil-DNA glicosilase
• VAL: Valina
xxii
Capítulo 1
Introdução
Pesquisas nas áreas de bioinformática e biologia computacional iniciaram-se na
década de 60, combinando algoritmos e dados experimentais da biologia celular e mole-
cular, para a resolução computacional de problemas biológicos, como análises de estru-
turas, funções e evoluções de moléculas. Desde então, as tecnologias computacionais
sofreram grandes avanços que, juntamente com a rede mundial de computadores, foi
possível aumentar a capacidade de processamento e transmissão de dados, permitindo
que sistemas biológicos cada vez mais complexos pudessem ser estudados. Estes avan-
ços ocorreram tão rapidamente que atualmente existe um grande esforço para a unifi-
cação e integração de bases de dados e ferramentas de análises existentes (Ouzounis e
Valencia, 2003).
Contudo, somente em junho de 2000 o National Institutes of Health (NIH) orga-
nizou, através do Biomedical Information Science and Technology Initiative Consortium
(BISTIC), um comitê para definir os termos bioinformática e biologia computacional.
De acordo com o relatório publicado (Huerta et al, 2000), estas abordagens interdisci-
plinares são descritas como:
• Bioinformática: pesquisa, desenvolvimento ou aplicação de ferramentas e abor-
dagens computacionais para ampliar o uso de dados de origem biológica, mé-
dica, comportamental ou de saúde, incluindo adquirir, armazenar, organizar,
arquivar, analisar ou visualizar tais dados.
• Biologia Computacional: desenvolvimento e aplicação de métodos analíticos e
1
teóricos de dados e técnicas de modelagem matemática e simulação computa-
cional para o estudo de sistemas biológicos, comportamentais e sociais.
Desta forma, estas abordagens tornaram-se parte integral no desenvolvimento de
pesquisas na área das ciências biomédicas, desempenhando um papel essencial na ge-
ração e análise de dados provenientes da genômica, transcriptômica e proteômica, pro-
duzidos em grande escala por diferentes grupos de pesquisa e consórcios (Guimarães,
2006). Dentre estes, pode-se citar os projetos de seqüenciamento dos genomas hu-
mano (U.S. Department of Energy Office of Science, 2003) e de Trypanosoma cruzi (El-
Sayed et al, 2005).
Neste trabalho, serão apresentadas técnicas de bioinformática e modelagem com-
parativa aplicadas ao estudo em grande escala das proteínas preditas a partir de seqüên-
cias genômicas de T. cruzi. O principal objetivo é investigar e discutir diferentes as-
pectos biológicos deste parasita, bem como a aplicação dos resultados obtidos para a
identificação de possíveis alvos moleculares para o tratamento da doença de Chagas.
1.1 O Trypanosoma cruzi e seu Impacto Médico e Social
O Trypanosoma cruzi foi descoberto em fins de 1907 por Carlos Justiniano Ri-
beiro Chagas, em triatomíneos alojados nas paredes de casas de “pau-a-pique", em
Lassance (Minas Gerais/ Brasil) (Fig. 1.1). Carlos Chagas verificou a patogenicidade
deste novo parasita em animais de laboratório e sua presença em animais domésticos.
Tendo detectado na população local alterações patológicas de fundo desconhecido, Car-
los Chagas iniciou um trabalho de correlação entre o T. cruzi e a condição mórbida dos
pacientes. Em 23 de abril de 1909, Carlos Chagas descobriu pela primeira vez o pa-
rasita no sangue de um ser humano (durante a fase aguda da doença), uma menina de
três anos chamada Berenice, cujo nome batizou esta primeira cepa ou linhagem (fonte:
http://www.fiocruz.br/coc/fioch1.html).
A doença de Chagas, também conhecida como Tripanossomíase Americana, é
uma doença endêmica em países da América do Sul e América Central e no México
(Fig. 1.2) (Kirchhoff et al, 2006). Segundo a Organização Mundial da Saúde (OMS),
2
cerca de 18 milhões de pessoas estão infectadas por T. cruzi, pelo menos outras 100
milhões encontram-se em risco de infecção e aproximadamente 660.000 novos casos
e 21.000 mortes são relatados anualmente (WHO et al, 2002). Alguns casos foram
descritos no Canadá, Estados Unidos da América (EUA) (Leiby et al, 2002; Beard et
al, 2003) e regiões da Europa (Reesink, 2005), tendo como possível causa a imigração
de pessoas infectadas para estas regiões, representando um potencial reservatório para a
transmissão do T. cruzi via transfusão sanguínea (Leiby et al, 2002).
Figura 1.1: Trypanosoma cruzi e seu vetor invertebrado.
(a) Trypanosoma cruzi. (b) Barbeiro em repasto sanguíneo.Fonte: http://www.ioc.fiocruz.br/pages/ Fonte: www.fiocruz.br/ccs/estetica/informerede/corpo/noticia/2006/ chagas1.jpg.fevereiro/23_02_06_02.htm.
O parasita possui um ciclo de vida dependente de um vetor invertebrado e de
um hospedeiro vertebrado (preferencialmente mamíferos), circulando entre os meios
silvestres e domésticos. As principais formas de transmissão do T. cruzi aos humanos
são (Yoshida, 2006): (i) durante o repasto de triatomíneos infectados, seguido de defe-
cação contaminada; (ii) por transfusão de sangue; (iii) por via placentária ou durante a
amamentação; (iv) via oral por alimento contaminado com vetores infectados ou com as
fezes e urina de triatomíneos e mamíferos parasitados, bem como pela ingestão de carne
mal cozida de mamíferos infectados (Dias, 2006). Uma vez alcançando o sistema san-
guíneo, o parasita se dispersa instalando-se em diferentes tecidos, dando continuidade
ao seu ciclo de vida.
3
Figura 1.2: Incidência da doença de Chagas pela América do Sul, América Central e EUA.
Valores de incidência anual/1000 pessoas.Fonte: http://www.dbbm.fiocruz.br/tropical/chagas/incidenc.html.
1.1.1 O Genoma de Trypanosoma cruzi
O Trypanosoma cruzi é uma espécie composta por uma população heterogênea
denominada de cepas, estoques ou isolados. O consórcio de seqüenciamento do ge-
noma de T. cruzi escolheu a cepa CL Brener, isolada do vetor invertebrado Triatoma
infestans, para o projeto genoma de Trypanosoma cruzi (Zingales et al, 1997). Os da-
dos do seqüenciamento indicam que trata-se de um organismo diplóide, cujo tamanho
do genoma consiste entre 50− 100× 106 pares de base (pb), contendo cerca de 12.000
genes.
Os dados genômicos de T. cruzi podem ser encontrados no banco de dados pú-
blico TcruziDB (http://TcruziDB.org) (Luchtan et al, 2004), que abriga a montagem do
genoma recém publicado por El-Sayed et al (2005) e a anotação fornecida pelo consór-
cio, em uma base de dados relacional, suportada pela arquitetura do Genomics Unified
Schema (GUS) (Guimarães, 2006).
4
1.1.2 O Ciclo de Vida do Trypanosoma cruzi
O Trypanosoma cruzi é um protozoário hemoflagelado pertencente à Ordem Ki-
netoplastida e à Família Trypanosomatidae, que possui formas morfológicas distintas
correspondentes aos diferentes estágios do seu ciclo de vida. O T. cruzi possui ciclo
heteroxeno, caracterizado por uma alternância entre o hospedeiro invertebrado e ver-
tebrado (Fig. 1.3). No Brasil, os principais vetores invertebrados são o Triatoma
infestans e o Panstrogylus megistus, comumente conhecidos como barbeiro, nos quais
observam-se as formas epimastigotas (forma replicativa) e tripomastigotas metacíclicas
(forma infectiva). Os hospedeiros vertebrados (humanos e animais domésticos e sil-
vestres) contém as formas tripomastigotas sanguíneas e amastigotas tissulares (Garcia e
Azambuja, 2000).
Um pequeno número de tripomastigotas sanguíneos se encontra no sangue cir-
culante dos hospedeiros vertebrados na fase crônica. Caso aconteça a ingestão destas
formas pelo vetor durante a alimentação, este pode se infectar. No estômago do vetor
ocorre a primeira diferenciação do parasita ingerido, com a transformação das formas
tripomastigotas em epimastigotas e esferomastigotas.
A segunda diferenciação do parasita ocorre no final do tubo digestivo do vetor,
quando os epimastigotas e esferomastigotas se transformam em tripomastigotas metací-
clicos. Durante novo repasto, estas formas migram para a ampola retal do vetor sendo
liberadas nas fezes e urina de forma que, através de uma lesão com solução de continui-
dade da pele ou mucosa, infectam os hospedeiros vertebrados.
Os parasitas alcançam o interior de diversas células do hospedeiro vertebrado
diferenciando-se em amastigotas e reproduzindo-se por divisão binária. A primeira di-
ferenciação ocorre ainda no sítio primário de infecção quando os tripomastigotas meta-
cíclicos invadem diferentes células do sistema imunológico. Posteriormente, os amas-
tigotas se diferenciam em tripomastigotas, são liberados para o sangue após ruptura
da membrana celular, disseminam-se para outras regiões do hospedeiro e, assim, dá-se
início a mais um ciclo biológico do parasita (Garcia e Azambuja, 2000).
5
Figura 1.3: Ciclo de vida do Trypanosoma cruzi.
Durante repasto sanguíneo em mamíferos infectados, insetos triatomíneos ingerem formas tripomastigo-tas de T. cruzi que, no estômago deste vetor, se diferenciam em epimastigotas e, no fim do tubo digestivo,em tripomastigotas metacíclicos. Durante novo repasto sanguíneo, o vetor libera saliva, fezes e urina con-taminadas que penetram a pele ou mucosa, alcançando as células do hospedeiro onde se diferenciam emamastigotas, depois em tripomastigotas e, por ruptura celular, alcançam a corrente sanguínea, iniciandoum novo ciclo.Fonte: Adaptado de http://www.who.int/tdr/diseases/chagas/lifecycle.htm.
1.1.3 A Doença de Chagas
O impacto médico e social da doença de Chagas é alto. Somente no Brasil, cuja
doença é endêmica em aproximadamente 44, 5% do território nacional, estima-se que
aproximadamente 75.000 pessoas abandonem seus empregos pelo agravamento dos sin-
tomas ou por morte prematura, tendo como principais acometimentos os cardíacos e
neurológicos (Devera, 2002).
A doença de Chagas apresenta-se sob diferentes manifestações clínicas: a fase
aguda que pode ser assintomática ou caracterizada por febre e miocardite aguda e a fase
crônica que resulta em insuficiência cardíaca progressiva e constitui a causa mais impor-
tante de morte por cardiopatia em vários países latino-americanos. A doença de Chagas
crônica constitui, também, casos de megaesôfago e megacólon (Fig. 1.4-a) (Taranto,
1991).
Na fase aguda ocorre uma parasitemia patente (presença do parasita no sangue
periférico) com aumento na concentração de IgM (imunoglobulina-M). Nesta fase, a
6
Figura 1.4: Doença de Chagas: Fase Crônica.
(a) Caso cirúrgico de megacólon chagásico. (b) Exame de Rx apresentando cardiomegaliaFonte: http://www.itg.be/itg/Distance causada por doença de Chagas.Learning/LectureNotesVandenEndenE/ Fonte: Bonet et al (2003).imagehtml/ppages/CD_1056_012c.htm.
detecção do parasita é feita por exame direto (análise de sangue fresco ao microscó-
pio, esfregaço corado de sangue ou métodos de concentração) (Luquetti e Rassi, 2000).
Clinicamente, caracteriza-se por febre, astenia, poliadenite, hepato e esplenomegalia,
sendo o dano resultante da invasão direta das células pelos parasitas e das subseqüentes
alterações inflamatórias (Rey, 1991).
A fase crônica apresenta aumento na concentração de IgG (imunoglobulina-G)
e parasitemia escassa dificultando o encontro do parasita pelos testes parasitológicos
diretos (Rey, 1991). Os exames que podem ser usados nesta fase são: xenodiagnóstico,
hemocultura, ELISA e Reação em Cadeia da Polimerase (PCR) seguida de hibridação
com sondas de DNA sítio específicas (Luquetti e Rassi, 2000).
A doença crônica manifesta-se principalmente na forma de um início progressivo
de insuficiência cardíaca. Nesse estágio tardio, a parasitemia continua escassa e os or-
ganismos dentro dos tecidos também costumam diminuir de número sendo difícil de os
encontrar em cortes histológicos. Apesar disto, existe infiltração inflamatória do miocár-
dio (Fig. 1.4-b) e, às vezes, dos músculos esqueléticos que se encontram completamente
fora de proporção com relação ao baixo número de parasitas demonstráveis (Taranto,
1991).
7
1.1.4 Tratamentos da Doença de Chagas
Os métodos profiláticos ainda são os principais meios para a diminuição dos ca-
sos de doença de Chagas. Através do controle dos vetores, com o uso de inseticidas
e a melhora nas condições habitacionais das regiões de risco, bem como precauções
em transfusão de sangue e transplantes, pode-se conseguir uma diminuição significa-
tiva na incidência de novos casos. Em pessoas já infectadas, o tratamento precoce dos
casos agudos e congênitos diminuem significativamente o estado de morbidade destes
pacientes. Os tratamentos sintomáticos mais indicados são:
• Cardiopatias: cardiotônicos, diuréticos, antiarrítmicos, vasodilatadores, dentre
outros. Por vezes, é necessária a colocação de marcapasso.
• Formas digestivas: dietas, laxativos, lavagens e, em casos mais graves, inter-
venções cirúrgicas.
Quanto aos métodos farmacoterápicos, durante os últimos quase 100 anos, dife-
rentes abordagens foram testadas (Dias, 1999; Coura e de Castro, 2002):
• De 1911 à 1940: os arsenicais, antimoniais, derivados do quinino, aminas,
sulfas e antibióticos, que se mostravam ativos em outras infecções e doenças
tropicais como sífilis, malária, doença do sono, leishmanioses, tuberculose e
amebíase, mostravam-se inócuos contra o T. cruzi.
• Década de 40: o quinoleínico Bayer 7.602 apresentava discreta atividade para-
siticida e era ineficaz para a fase crônica, além de ser muito tóxico ao paciente.
• Década de 50: o arsenical Spirotrypan reduzia efetivamente o número de para-
sitas circulantes na fase aguda, mas era praticamente ineficaz na fase crônica.
Adicionalmente, a violeta genciana passou a ser usada na esterilização de san-
gue contaminado com T. cruzi.
• Década de 60: houve o surgimento de fármacos mais ativos como os nitrofura-
nos. Dentre estes, o mais efetivo era o nifurtimox (Lampitr), que de fato levava
8
à cura vários casos agudos e mesmo alguns crônicos, trazendo esperanças aos
doentes e à comunidade científica.
• Década de 80: surgia um derivado imidazólico denominado benznidazol (Ro-
chaganr), sendo um pouco mais efetivo que os seus antecessores.
• Década de 90: o Lampitr deixa de ser produzido e novos medicamentos como
o Alopurinol e anti-fúngicos começam a ser investigados, obtendo-se resulta-
dos, em alguns casos, mais eficazes que o benznidazol.
• Atualmente: alguns derivados de Nitrofuranos e Nitroimidazóis (e.g. alopuri-
nol, cetoconazol, fluconazol e itraconazol) têm mostrado maior eficiência em
casos agudos e crônicos.
Além destes, diferentes compostos vêm sendo testados in vitro e em modelos
animais, dentre estes, substâncias isoladas de produtos naturais:
• Metilpluviatolido das folhas do arbusto “mamica de cadela” (Zanthoxylum na-
ranjillo) (desenvolvido pela Faculdade de Farmácia da UNIFRAN).
• Naftoquinonas de “ipês” (Tabebuia sp.) (de Moura et al, 2001).
• Catequinas do “chá verde” (Camellia sinensis) (Paveto et al, 2004).
O Trypanosoma cruzi possui diversas linhagens com características e morfolo-
gias distintas para cada uma das fases de seu ciclo de vida. Durante cada uma destas
fases, o parasita expressa diferentes proteínas em diferentes concentrações, o que di-
ficulta bastante o desenvolvimento de fármacos parasita/específico (Atwood III et al,
2005). Além disso, o T. cruzi possivelmente mimetiza uma ou mais moléculas de teci-
dos humanos, podendo levar seu hospedeiro a desenvolver doenças auto-imunes (Rose,
2001; Gironès et al, 2001), agravando a debilidade de certos tecidos já comprometidos,
principalmente os cardíacos (Engman e Leon, 2002).
Quase 100 anos após a descoberta do T. cruzi, as terapias disponíveis contra a
doença de Chagas não são capazes de levar à cura mais de 50% dos infectados tanto na
9
fase aguda quanto crônica (Liñares et al, 2006). A crescente incidência, as altas taxas
de morte, a toxicidade dos fármacos mais aplicados bem como a capacidade do parasita
de desenvolver resistência a estes fármacos, reforçam a importância do desenvolvimento
de novas quimioterapias contra esta enfermidade (Bond et al, 1999; Gelb e Hol, 2002).
Uma nova abordagem denominada pesquisa racional de fármacos, tem contri-
buído na busca por novos tratamentos. Neste método, fármacos sítio-direcionados são
elaborados através de análise de vias metabólicas do parasita que sejam mais vulneráveis
a uma ação farmacológica (e.g. síntese de esteróis e metabolismo oxidativo), de forma a
minimizar os riscos ao hospedeiro. Um exemplo de fármaco racional para o tratamento
da doença de Chagas é a fenotiazina, que tem como alvo a enzima tripanotiona redutase,
responsável por manter os níveis intracelulares de radicais livres em T. cruzi (Chan et al,
1998). Apesar de seu uso clínico em tratamentos psiquiátricos, ações anti-histamínicas
e efeitos antitumorais, a aplicação da fenotiazina e seus derivados para o tratamento
da doença de Chagas ainda encontram-se em fase de testes laboratoriais tanto in vitro
quanto in vivo (Rivarola e Paglini-Oliva, 2002; Lo Presti et al, 2004).
No contexto de desenho racional de fármacos é importante ressaltar que, em sis-
temas biológicos existem basicamente quatro tipos de macromoléculas com as quais
agentes terapêuticos podem interagir: proteínas, polissacarídeos, lipídios e ácidos nu-
cléicos. No entanto, as dificuldades em se trabalhar com estes três últimos incentivam
cada vez mais as pesquisas sobre inibidores protéicos, mais precisamente enzimas, que
compreendem cerca de 47% do total de alvos farmacologicamente abordados, como
apresentado na Fig. 1.5 (Hopkins e Groom, 2002).
10
Figura 1.5: Porcentagem dos alvos farmacológicos de interesse comercial em 2002.
GPCR: G-protein-coupled receptor.Fonte: Adaptado de Hopkins e Groom (2002).
1.2 Alvos Moleculares de Trypanosoma cruzi em Estudo
Até o presente momento, o combate à doença de Chagas conta oficialmente com
quimioterapias baseadas em apenas dois fármacos, nifurtimox e benznidazol, capazes de
curar apenas 50% das infecções recentes. As principais desvantagens da administração
destes fármacos consiste em serem (i) ineficazes em pacientes na fase crônica da do-
ença; (ii) na fase aguda são sensíveis as diferentes cepas do parasita; (iii) causadores de
diversos efeitos colaterais (e.g. vômito, anorexia, neuropatias periféricas e dermopatias
alérgicas); (iv) tratamentos de longo-termo, levando a toxicidade e/ou descontinuidade
de seu uso por parte dos pacientes (Liñares et al, 2006).
Por estes motivos, o estudo e desenvolvimento de novos fármacos mais efetivos e
menos tóxicos ao paciente fazem-se necessários. Pesquisas baseadas nas propriedades
fisiológicas e bioquímicas particulares ao T. cruzi têm apresentado algumas enzimas
como potenciais alvos moleculares para o desenvolvimento de novos fármacos.
Para ser considerada um alvo molecular, a enzima precisa de estar ligada com
a sobrevivência do parasita. Outro aspecto importante a se observar é se tais enzimas
possuem diferentes isoformas gênicas e/ou possíveis vias metabólicas compensatórias,
11
o que poderia torná-las farmacologicamente desinteressantes (Joachimiak et al, 2001).
A quimioterapia racional aborda as principais diferenças metabólicas entre o mi-
croorganismo patogênico e o seu hospedeiro, desta forma, pode-se antecipar quais são
as vias metabólicas de fundamental importância para a sobrevivência do patógeno, ana-
lisar quais poderiam ser consideradas alvos de uma inibição seletiva e, por conseguinte,
apresentar baixo risco de toxicidade ao paciente. No desenvolvimento de fármacos sítio-
direcionados a um alvo molecular, métodos que visem o estudo estrutural da enzima po-
dem contribuir significativamente, bem como a análise de sítios ativos que sirvam como
alvos para o acoplamento de inibidores (Galperin e Koonin, 1999; Hopkins e Groom,
2002)
Dentre os alvos moleculares em estudo, encontram-se as enzimas pertencentes as
biossínteses de esteróis e de tripanotiona, produção de energia, mecanismos de evasão
ao sistema imunológico do hospedeiro e reparo do DNA, bem como outras considera-
das fundamentais para a sobrevivência do T. cruzi. As proteínas cinases estão presente
em grande número (≈171 proteínas) em T. cruzi e desempenham diferentes funções vi-
tais como regulação do ciclo celular, diferenciação e resposta a estresses, tornando-as
atrativos alvos moleculares (Naula et al, 2005).
Proteínas de superfície de T. cruzi, associadas por âncoras GPI (glicosilfosfatidi-
linositol) à membrana celular, têm sido consideradas relevantes por estarem implicadas
em mecanismos de evasão ao sistema imune (Garg et al, 1997) e pelo mecanismo de
invasão celular como no caso das mucinas (Acosta-Serrano et al, 2001) e Tcgp63 (ho-
móloga a leishmanolisina) (Cuevas et al, 2003). As mucinas são aceptoras de ácido
siálico, um monossacarídeo que desempenha um papel importante na interação celular
parasita-hospedeiro, bem como na adesão e invasão celular (Buschiazzo et al, 2000).
Os tripanosomatídeos não são capazes de sintetizar o ácido siálico que precisa de
ser obtido da célula hospedeira (Buschiazzo et al, 2000). Para isto, o parasita possui
as sialidases, enzimas de superfície ancoradas via GPI. A trans-sialidase (TcTS) é capaz
de transferir ácido siálico de glicoconjugados do hospedeiro para a β-galactose presente
nas mucinas do parasita (Paris et al, 2005). Por esta propriedade, a TcTS tem sido
12
estudada como alvo para o desenvolvimento de vacinas (Nyame et al, 2004) e, além
disto, recentemente MacRae et al (2006) mostraram que a supressão de glicoproteínas
de superfície, através da redução do metabolismo de galactose, é capaz de alterar a
superfície molecular e a morfologia celular de T. cruzi.
Uma das preocupações dos pesquisadores consiste no fato das diferentes cepas
de T. cruzi apresentarem variados graus de suscetibilidade em relação ao benznidazol,
nifurtimox e seus derivados. Desta forma, tem-se buscado o desenvolvimento de fárma-
cos capazes de curar a doença de Chagas mesmo em cepas resistentes aos tratamentos
usuais. Molina et al (2000) apresentam em seu trabalho o desempenho promissor de
um derivado de azol, o SCH 56592 (posaconazol), contra cepas caracterizadas como
suscetíveis (cepa CL), parcialmente resistentes (cepa Y) e altamente resistentes (cepas
Colombiana, SC-28 e VL-10) ao nifurtimox, benznidazol e a outros derivados azóicos
testados in vivo, como o anti-fúngico cetoconazol.
Em recentes trabalhos publicados, Liñares et al (2006) e Maya et al (2006)
fazem uma revisão dos principais fármacos, naturais e sintéticos, usados em enzimas
consideradas alvos moleculares em protozoários responsáveis por doenças tropicais. Na
Tab. 1.1 estão descritos alguns destes fármacos usados em testes anti-tripanossomíase e
uma revisão não exaustiva de inibidores usados em alvos moleculares de T. cruzi.
13
Tabe
la1.
1:Pr
inci
pais
enzi
mas
deTr
ypan
osom
acr
uzic
onsi
dera
dos
alvo
sm
olec
ular
espa
rao
dese
nvol
vim
ento
raci
onal
defá
rmac
osco
ntra
ado
ença
deC
haga
s
Bio
ssín
tese
deE
ster
óis:
tem
porp
rodu
tofin
alo
ergo
ster
olao
invé
sdo
cole
ster
ol,p
rinc
ipal
este
role
ncon
trad
oem
mam
ífer
os.
ALV
OM
OL
EC
UL
AR
FÁR
MA
CO
/IN
IBID
OR
CO
NSI
DE
RA
ÇÕ
ES
Esq
uale
noE
poxi
dase
,con
-ve
rte
esqu
alen
oem
2,3-
oxid
oesq
uale
no
Der
ivad
osde
2-pr
open
o-1-
amin
aTe
stad
osem
form
asep
imas
tigot
as(c
epa
Y)c
ultiv
adas
emm
eio
LIT
,apr
esen
ta-
ram
,em
anál
ise
crom
atog
ráfic
a,um
adi
min
uiçã
ono
sní
veis
deer
gost
erol
(de
63µ
g/m
Lpa
ra52µ
g/m
L)
eau
men
tona
conc
entr
ação
dees
qual
eno
(de
18µ
g/m
Lpa
ra76µ
g/m
L)(
Oliv
eira
etal
,200
5).
Oxi
does
qual
eno
Ci-
clas
e,co
nver
tea
2,3-
oxid
oesq
uale
noem
lano
ster
ol.
N-(
4E,8
E)-
5,9,
13-t
rim
ethy
l-4,
8,12
-te
trad
ecat
rien
-1-y
lpyr
idin
ium
e27
com
post
osco
rrel
atos
Test
adas
cont
raT.
cruz
ina
fase
dein
fecç
ãoao
hosp
edei
rom
amíf
ero.
12co
m-
post
osin
ibir
amo
cres
cim
ento
celu
lare
m50
%co
mco
ncen
traç
ões
abai
xode
25nM
.Oco
mpo
sto
base
prod
uziu
acúm
ulo
deox
idos
qual
eno
ede
crés
cim
ona
pro-
duçã
ode
lano
ster
ole
ergo
ster
ol,c
arac
terí
stic
asco
ndiz
ente
sco
ma
inib
ição
daox
idoe
squa
leno
cicl
ase
(Buc
kner
etal
,200
1).
Esq
uale
nosi
ntas
e(S
QS,
EC
:2.5
.1.2
1)3-
(bip
heny
l-4-
yl)-
3-hy
drox
yqui
nucl
idin
e(B
PQ-O
H)
Pode
roso
inib
idor
não
com
petit
ivo
deSQ
Sem
T.cr
uzie
Leis
hman
iam
exic
ana,
com
Ki
12-6
2nM
.Ind
uziu
are
duçã
odo
se-d
epen
dent
eda
prol
ifer
ação
extr
ace-
lula
rde
stes
para
sita
s,co
mM
ICde
10-3
0m
M.A
inib
ição
docr
esci
men
toe
alis
ece
lula
rest
ãoas
soci
adas
com
ade
pleç
ãoco
mpl
eta
dees
qual
eno
endó
geno
ees
teró
is,c
onsi
sten
teco
mum
bloq
ueio
dasí
ntes
ede
novo
dees
teró
isna
fase
deat
uaçã
oda
SQS.
Éca
paz
deer
radi
carf
orm
asam
astig
otas
deT.
cruz
iem
cultu
rade
célu
las
Ver
oco
mM
ICde
30nM
,se
mpr
oduz
iref
eito
sde
leté
rios
acé
lula
hosp
edei
ra(U
rbin
aet
al,2
002)
.
Der
ivad
osde
bife
nilq
uinu
clid
inos
(BPQ
-OH
)In
ibiu
ocr
esci
men
tode
form
asam
astig
otas
(ED
50
0,36
µM
),po
ssiv
elm
ente
,de
vido
inib
ição
daSQ
S(L
oren
teet
al,2
005a
).
4-ph
enox
yphe
noxy
ethy
lth
iocy
anat
e(W
C-9
)In
duzi
uum
ain
ibiç
ãodo
se-d
epen
dent
eno
cres
cim
ento
defo
rmas
epim
astig
otas
dace
paE
Pdo
para
sita
,cul
tivad
asem
mei
oL
IT,c
omM
ICde
1,0µ
M.E
stes
efei
-to
ses
tão
asso
ciad
osco
ma
depl
eção
com
plet
ade
esqu
alen
oen
dóge
noe
este
róis
,co
nsis
tent
eco
mum
bloq
ueio
dasí
ntes
ede
novo
dees
teró
isna
fase
deat
uaçã
oda
SQS
(Urb
ina
etal
,200
3).
EC
:E
nzym
eC
omm
issi
on.
Cla
ssifi
caçã
onu
mér
ica
deac
ordo
com
NC
-IU
BM
B(N
omen
clat
ure
Com
mitt
eeof
the
Inte
rnat
iona
lU
nion
ofB
ioch
emis
try
and
Mol
ecul
arB
iolo
gy-
disp
onív
elem
http
://w
ww
.che
m.q
mul
.ac.
uk/iu
bmb/
enzy
me/
).K
i:co
nsta
nte
dedi
ssoc
iaçã
o.M
IC(M
inim
alIn
hibi
tory
Con
cent
ratio
ns):
conc
entr
ação
mín
ima
capa
zde
inib
iro
cres
cim
ento
deum
aor
gani
smo.
ED
50
(Med
ian
Effe
ctiv
eD
ose)
:dos
ede
uma
subs
tânc
iaca
paz
depr
ovoc
aref
eito
não
leta
lem
50%
dapo
pula
ção
expe
rim
enta
l.
14
Bio
ssín
tese
deE
ster
óis(
cont
inua
ção)
ALV
OM
OL
EC
UL
AR
FÁR
MA
CO
/IN
IBID
OR
CO
NSI
DE
RA
ÇÕ
ES
24-m
etilt
rans
fera
se(2
4-SM
T,E
C:2
.1.1
.41)
Aza
ster
óis
base
ados
em(2
0R,2
2ξ)-
5α-p
regn
an-2
0-(p
iper
idin
-2-y
l)-
3β,2
0-di
ol
Todo
sos
com
post
osap
rese
ntar
amef
eito
anti-
prol
ifer
ativ
opa
raa
form
aep
imas
-tig
ota
(IC
50
0,6-
1,2µ
M)
e4
dos
com
post
oste
stad
osin
ibir
amo
cres
cim
ento
defo
rmas
amas
tigot
as(I
C50
6,1-
18µ
M)(
Mag
arac
iet
al,2
003)
.E
mL
oren
teet
al(2
005b
),te
stes
emfo
rmas
amas
tigot
asm
ostr
aram
ativ
idad
ean
ti-pa
rasi
tári
am
as,s
emap
rese
ntar
inib
ição
daen
zim
a24
-SM
T.C
itocr
omo-
P450
Est
erol
14-d
emet
ilase
(CY
P51,
EC
:1.1
4.13
.70)
UR
-982
5,de
rivad
odo
antif
úngi
coTr
iazo
lTe
stad
oem
cultu
rade
epim
astig
otas
com
MIC
de30
nM.
Ain
ibiç
ãodo
cres
cim
ento
coin
cidi
uco
ma
depl
eção
de4,
14-d
esm
etil
este
róis
endó
geno
s(e
rgos
tero
l,24-
ethy
lcho
lest
a-5,
7,22
-tri
en-3
b-ol
,epr
ecur
sore
s),s
ubst
ituíd
ospo
res
teró
ism
etila
dos
(lan
oste
rol,
24-m
ethy
lene
dihy
drol
anos
tero
leob
tusi
folio
l),o
que
indi
caa
inib
ição
da14
-dem
etila
se(U
rbin
aet
al,2
000)
.
Der
ivad
osde
FTI-
2220
Os
com
post
os4
e5
mos
trar
am-s
epo
tent
esin
ibid
ores
tant
oem
test
esin
vitr
o,co
m23
%e
16%
dein
ibiç
ãoda
enzi
ma
com
50nM
dos
resp
ectiv
osco
mpo
stos
,co
mo
emm
odel
osan
imai
s(B
AL
B/c
),ap
rese
ntan
dodi
min
uiçã
oda
para
site
mia
e10
0%de
sobr
eviv
ênci
ado
san
imai
s(B
uckn
eret
al,2
003)
.
Tipi
farn
ib(R
1157
77),
fárm
aco
usad
ono
trat
amen
toan
ti-câ
ncer
Inib
idor
dafa
rnes
iltra
nsfe
rase
(PFT
)em
H.s
apie
ns,
mos
trou
-se,
tam
bém
,um
pote
nte
inib
idor
daTc
CY
P51.
Est
udos
dem
odel
agem
porh
omol
ogia
edo
ckin
gm
ostr
aram
que
asdi
fere
nças
nafo
rma
delig
ação
doco
mpo
sto
com
esta
sen
zi-
mas
,m
ais
asu
aba
ixa
oune
nhum
aafi
nida
depo
rci
tocr
omo-
P450
hepá
tica
dem
amíf
eros
,pod
emse
ra
base
para
ode
senh
ode
novo
sfá
rmac
os,d
eriv
ados
doTi
pifa
rnib
,con
tra
ado
ença
deC
haga
s(H
ucke
etal
,200
5).
EC
:E
nzym
eC
omm
issi
on.
Cla
ssifi
caçã
onu
mér
ica
deac
ordo
com
NC
-IU
BM
B(N
omen
clat
ure
Com
mitt
eeof
the
Inte
rnat
iona
lU
nion
ofB
ioch
emis
try
and
Mol
ecul
arB
iolo
gy-
disp
onív
elem
http
://w
ww
.che
m.q
mul
.ac.
uk/iu
bmb/
enzy
me/
).IC
50
(Med
ian
Inhi
bito
ryC
once
ntra
tion)
:con
cent
raçã
oda
subs
tânc
iane
cess
ária
para
prod
uzir
inte
raçã
o(i
nibi
tóri
a)co
m50
%de
seus
rece
ptor
es.
15
Bio
ssín
tese
deFo
sfat
idilc
olin
aA
LVO
MO
LE
CU
LA
RFÁ
RM
AC
O/I
NIB
IDO
RC
ON
SID
ER
AÇ
ÕE
SPE
-PC
-N-m
etil-
tran
sfer
ase
ET-
18-O
CH
3,
milt
efos
ine
eilm
ofo-
sine
,an
álog
osde
lisof
osfo
lipíd
ios
(LPA
s)
Test
adas
emcu
ltura
sde
célu
las
Ver
o,le
vara
ma
erra
dica
ção
defo
rmas
amas
-tig
otas
emco
ncen
traç
ões
de0,
1,0,
1e
1,0µ
M,r
espe
ctiv
amen
te.
Obs
ervo
u-se
alte
raçã
ona
razã
oPC
/PE
de1,
5(n
ascé
lula
sco
ntro
le)
para
0,67
(nas
célu
las
trat
adas
)e,
sine
rgis
mo
antip
rolif
erat
ivo
emep
imas
tigot
astr
atad
asco
mE
T-18
-O
CH
3co
mbi
nado
com
ceto
cona
zol(
inib
idor
dabi
ossí
ntes
ede
este
róis
)(L
ira
etal
,200
1).
Tran
sduç
ãode
Sina
lInt
race
lula
rA
LVO
MO
LE
CU
LA
RFÁ
RM
AC
O/I
NIB
IDO
RC
ON
SID
ER
AÇ
ÕE
SFa
rnes
iltra
nsfe
rase
(FTa
se,
EC
:2.
5.1.
58e
2.5.
1.21
),pr
omov
em
odifi
caçã
opó
s-tr
ansd
ucio
nal
Der
ivad
osde
2-am
ino-
5-ni
trob
en-
zofe
nona
Nos
test
esin
vitr
o,os
com
post
os4a
e2f
inib
iram
form
astr
ipom
astig
otas
com
LC
50
1nM
e10
mM
,res
pect
ivam
ente
e,in
vivo
(em
BA
LB
/c),
houv
eau
men
tona
sobr
evid
ade
anim
ais
trat
ados
com
6,4
e7
mg/
kg/d
ia,r
espe
ctiv
amen
te.A
tra-
vés
dem
odel
agem
por
hom
olog
iada
TcFT
ase
ede
estu
dode
dock
ing,
pôde
-se
cara
cter
izar
are
gião
dosí
tioat
ivo
daen
zim
a,au
xilia
ndo
futu
ros
estu
dos
dede
-se
nho
raci
onal
defá
rmac
os(E
stev
aet
al,2
006)
.B
ioss
ínte
sede
Isop
renó
ides
ALV
OM
OL
EC
UL
AR
FÁR
MA
CO
/IN
IBID
OR
CO
NSI
DE
RA
ÇÕ
ES
Farn
esil
piro
fosf
ato
sint
ase
(EC
:2.5
.1.1
0)R
ised
rona
tobi
sfos
fona
do(R
is),
usad
ono
trat
amen
tode
deso
rden
sde
reab
sorç
ãoós
sea
Apr
esen
tou
sele
tiva
ativ
idad
ean
ti-tr
ipan
osso
mat
ídic
a,co
min
ibiç
ãodo
se-
depe
nden
tedo
cres
cim
ento
defo
rma
amas
tigot
a,at
ingi
ndo
alis
ece
lula
ra
150
µM
.Est
ain
ibiç
ãoes
táas
soci
ada
ade
pleç
ãode
este
róis
endó
geno
se,
ape
rda
davi
abili
dade
celu
lar
está
asso
ciad
aao
desa
pare
cim
ento
depo
li-is
opre
nóid
eses
-se
ncia
is(G
arzo
niet
al,2
004)
.A
trav
ésde
técn
icas
dem
odel
agem
por
hom
olog
iae
dinâ
mic
am
olec
ular
pôde
-se
estu
dar
afo
rma
delig
ação
doR
isao
sítio
ativ
ode
sta
enzi
ma,
bem
com
oa
elab
oraç
ãoe
estu
dos
dein
tera
ção
dede
rivad
osdo
Ris
(Sig
man
etal
,200
6).
EC
:E
nzym
eC
omm
issi
on.
Cla
ssifi
caçã
onu
mér
ica
deac
ordo
com
NC
-IU
BM
B(N
omen
clat
ure
Com
mitt
eeof
the
Inte
rnat
iona
lU
nion
ofB
ioch
emis
try
and
Mol
ecul
arB
iolo
gy-
disp
onív
elem
http
://w
ww
.che
m.q
mul
.ac.
uk/iu
bmb/
enzy
me/
).L
C50
(Med
ian
Leth
alC
once
ntra
tion)
:con
cent
raçã
oda
subs
tânc
ia(e
mág
ua)c
apaz
dele
vara
mor
te50
%da
popu
laçã
ote
ste.
16
Prod
ução
deE
nerg
iaA
LVO
MO
LE
CU
LA
RFÁ
RM
AC
O/I
NIB
IDO
RC
ON
SID
ER
AÇ
ÕE
SN
AD
H-f
umar
ato
redu
tase
,pr
esen
teem
dive
rsos
mem
-br
osdo
gêne
roTr
ypan
o-so
ma
mas
,aus
ente
emm
a-m
ífer
os
Der
ivad
osde
imid
azol
usad
osco
mo
anti-
helm
íntic
os(n
itro
ebe
nzim
ida-
zóis
)
Test
ados
emcu
ltura
deep
imas
tigot
as(c
epa
Y),
todo
sos
com
post
osin
ibir
ama
fum
arat
ore
duta
seem
uma
ampl
aes
cala
deco
ncen
traç
ão(I
C50
1,27
-420
µM
).E
stud
osde
corr
elaç
ãosu
gere
mqu
ea
inib
ição
docr
esci
men
toce
lula
res
teja
re-
laci
onad
aco
ma
inib
ição
dafu
mar
ato
redu
tase
(Tur
rens
etal
,199
6).
2-m
erca
ptop
irid
ina-
N-o
xido
(MPN
O)
Inib
iuo
cres
cim
ento
deep
imas
tigot
as(c
epa
Y)(
ID50
0,08µ
M)e
deam
astig
otas
(cul
tura
dem
iobl
asto
sL6E
9)e
mco
ncen
traç
ãode
2,4µ
Mde
MPN
O,b
emco
mo
aca
paci
dade
infe
ctiv
ade
trip
omas
tigot
as(I
D50
20µ
M)a
mio
blas
tos.
Est
esef
eito
ses
tão
asso
ciad
osco
ma
inib
ição
doac
úmul
ode
succ
inat
o,pr
odut
oda
fum
arat
ore
duta
se(T
urre
nset
al,1
999)
.A
rgin
ina
cina
se(A
K,
EC
:2.
7.3.
3)C
ateq
uina
sdo
chá
verd
e(C
amel
liasi
-ne
nsis
)D
asca
tequ
ina
test
adas
,ape
nasa
Cg
eG
Cg,
emco
ncen
traç
õesd
e1
nM,a
pres
en-
tara
min
ibiç
ãode
apro
xim
adam
ente
50%
dafu
nção
enzi
mát
ica
deA
K(P
avet
oet
al,2
004)
.M
ecan
ism
osde
Rep
aro
doD
NA
ALV
OM
OL
EC
UL
AR
FÁR
MA
CO
/IN
IBID
OR
CO
NSI
DE
RA
ÇÕ
ES
Ura
cil-
DN
Agl
icos
ilase
(UN
G,
EC
:3.
2.2.
3),
res-
pons
ável
pela
exci
são
deur
acil
doD
NA
(i)
Ura
cil
ean
álog
osde
urac
il(6
-clo
rour
acil,
6-am
inou
raci
le
5-flu
orou
raci
l);(
ii)sí
tios-
AP;
(iii)
inib
i-do
rpro
téic
oPB
S2(U
gi)
(i)
ATc
UN
Gfo
iini
bida
pela
urac
ilco
mIC
50
0,3
mM
,bem
com
ope
los
3an
á-lo
gos
test
ados
com
IC50
0,1
mM
,2m
Me
5mM
,res
pect
ivam
ente
.(ii)
Aen
zim
afo
iini
bida
emm
ais
de50
%na
pres
ença
de8µ
Mde
olig
onuc
leot
ídeo
dupl
afit
aco
nten
dosí
tios-
AP,
aum
enta
ndo
para
80%
dein
ibiç
ãoa
16µ
M.(
iii)
Foii
nibi
dair
reve
rsiv
elm
ente
porU
gico
mIC
50
3,1
fmol
.A
prin
cipa
ldif
eren
çaen
tre
aU
NG
deT.
cruz
iede
H.s
apie
nsco
nsis
tena
pro-
prie
dade
func
iona
ldos
dom
ínio
sre
gula
tóri
osdo
N-t
erm
inal
dapr
oteí
na.
Est
esre
sulta
dos
pode
mau
xilia
rem
estu
dos
dede
senh
ora
cion
alde
fárm
aco
espe
cífic
opa
raes
teal
vo(P
eña-
Dia
zet
al,2
004)
.
EC
:E
nzym
eC
omm
issi
on.
Cla
ssifi
caçã
onu
mér
ica
deac
ordo
com
NC
-IU
BM
B(N
omen
clat
ure
Com
mitt
eeof
the
Inte
rnat
iona
lU
nion
ofB
ioch
emis
try
and
Mol
ecul
arB
iolo
gy-
disp
onív
elem
http
://w
ww
.che
m.q
mul
.ac.
uk/iu
bmb/
enzy
me/
).IC
50
(Med
ian
Inhi
bito
ryC
once
ntra
tion)
:con
cent
raçã
oda
subs
tânc
iane
cess
ária
para
prod
uzir
inte
raçã
o(i
nibi
tóri
a)co
m50
%de
seus
rece
ptor
es.
ID50
(Med
ian
Inhi
bito
ryD
ose)
:dos
ede
uma
subs
tânc
iaca
paz
dein
ibir
ocr
esci
men
tode
50%
dapo
pula
ção
expe
rim
enta
l.
17
Met
abol
ism
oO
xida
tivo
ALV
OM
OL
EC
UL
AR
FÁR
MA
CO
/IN
IBID
OR
CO
NSI
DE
RA
ÇÕ
ES
Trip
anot
iona
(N1,N
8-(
bis
glut
atio
nil)
sper
mid
ina)
redu
tase
(T[S
H] 2
,E
C:
1.8.
1.12
),ex
clus
ivo
apr
o-to
zoár
ios
Kin
etop
last
idas
Aná
logo
sam
ídic
osde
glut
atio
na(L
-γ
-Glu
-L-L
eu-G
ly-N
HR
),on
deR
são
grup
osal
quil
linea
res
Todo
sos1
6co
mpo
stos
test
ados
inib
iram
apr
olif
eraç
ãode
form
asep
imas
tigot
as,
com
conc
entr
açõe
sa
part
irde
20µ
g/m
l(R
avas
chin
oet
al,2
003)
.
Fosfi
nope
ptíd
eos
estr
utur
alm
ente
re-
laci
onad
osà
glut
atio
naTo
dos
os7
com
post
osde
senv
olvi
dos
ete
stad
osin
ibir
am(I
C50>
50µ
M)o
cres
-ci
men
tode
form
asep
imas
tigot
ase
amas
tigot
asem
cultu
rade
mio
blas
tos,
send
oos
com
post
os53
e54
cons
ider
ados
osm
ais
pote
ntes
cont
raas
form
asam
astig
o-ta
s,co
mIC
50
9,8µ
Me
14,2µ
M,r
espe
ctiv
amen
te(R
avas
chin
oet
al,2
006)
.Tr
ipan
otio
nare
duta
se(T
R,
EC
:1.
8.1.
12),
form
aox
i-da
dada
T[S
H] 2
,pr
esen
teem
trip
anos
omat
ídeo
sno
luga
rda
glut
atio
nare
du-
tase
(GR
)em
hum
anos
Mep
acri
na,
acri
dina
ede
rivad
osde
acri
dina
Ens
aios
enzi
mát
icos
mos
trar
amqu
ea
mep
acri
naé
capa
zde
inib
ira
TcT
Rco
mK
i25
µM
.Ade
term
inaç
ãoda
estr
utur
acr
ista
logr
áfica
dam
epac
rina
ligad
aao
sítio
ativ
oda
TcT
Rse
rve
deba
sepa
rao
dese
nho
raci
onal
deno
vos
inib
ido-
res
(Jac
oby
etal
,199
6).
Clo
rpro
maz
ina
(ant
idep
ress
ivo
tric
í-cl
ico)
ede
rivad
osPo
ren
saio
enzi
mát
ico
mos
trou
-se
que
acl
orpr
omaz
ina
éum
inib
idor
com
peti-
tivo
daTc
TR
com
Ki
10µ
Mem
rela
ção
ahG
R(K
i76
2µ
M).
Dos
3de
rivad
oste
stad
os,a
pena
sos
com
post
os2
e3
apre
sent
aram
capa
cida
dein
ibitó
ria
com
Ki
65µ
Me
17µ
M,r
espe
ctiv
amen
te(F
aerm
anet
al,1
996)
.
Der
ivad
osde
Feno
tiazi
naA
trav
ésde
dese
nho
raci
onal
defá
rmac
osba
sead
ona
estr
utur
ada
TcT
R,
mos
trou
-se
que
osco
mpo
stos
test
ados
inib
emre
vers
ivel
men
tees
taen
zim
a,co
mdi
fere
ntes
form
asde
ligaç
ãoa
regi
ãodo
sítio
ativ
o(C
han
etal
,199
8).
Est
udos
post
erio
res
mos
trar
amqu
eo
deriv
ado
tiori
dazi
naé
capa
zde
inib
irir
reve
rsiv
el-
men
tea
TR
(Riv
arol
ae
Pagl
ini-
Oliv
a,20
02;L
oPr
esti
etal
,200
4).
Com
plex
os(2
,2’:
6’,2
”-Te
rpir
idin
e)pl
atin
um(I
I)D
os10
com
plex
oste
stad
osap
enas
2(1
ae
2e)i
nibi
ram
irre
vers
ivel
men
tea
TcT
Rna
pres
ença
deN
AD
PH(I
C50
108
nMe
100
nM,r
espe
ctiv
amen
te),
não
prom
o-ve
ndo
efei
toin
ibitó
rio
nahG
R(B
onse
etal
,200
0).
Naf
toqu
inon
asde
rivad
asde
men
adi-
ona,
plum
bagi
nae
jugl
ona
As
séri
es19
-20
(3,3
’-[p
olia
min
obis
(car
boni
lalq
uil)
]bis
(1,4
-NQ
))in
ibir
amir
re-
vers
ivel
men
tea
TcT
Rco
mIC
50>
10µ
M(S
alm
on-C
hem
inet
al,2
001)
.E
C:
Enz
yme
Com
mis
sion
.C
lass
ifica
ção
num
éric
ade
acor
doco
mN
C-I
UB
MB
(Nom
encl
atur
eC
omm
ittee
ofth
eIn
tern
atio
nal
Uni
onof
Bio
chem
istr
yan
dM
olec
ular
Bio
logy
-di
spon
ível
emht
tp://
ww
w.c
hem
.qm
ul.a
c.uk
/iubm
b/en
zym
e/).
Ki:
cons
tant
ede
diss
ocia
ção.
IC50
(Med
ian
Inhi
bito
ryC
once
ntra
tion)
:con
cent
raçã
oda
subs
tânc
iane
cess
ária
para
prod
uzir
inte
raçã
o(i
nibi
tóri
a)co
m50
%de
seus
rece
ptor
es.
18
Mec
anis
mo
deD
ifere
ncia
ção
eIn
vasã
oC
elul
arA
LVO
MO
LE
CU
LA
RFÁ
RM
AC
O/I
NIB
IDO
RC
ON
SID
ER
AÇ
ÕE
SC
ruzi
paín
a,cr
uzaí
naou
GP5
7/51
(EC
:3.
4.22
.51)
,pa
rtic
ipa
dopr
oces
sode
di-
fere
ncia
ção
celu
lar
deT.
cruz
iede
inva
são
decé
lu-
las
dem
amíf
eros
Z-P
he-A
la-fl
uoro
met
ilce
tona
(Z-
Phe-
Ala
-FM
K)
Test
ado
emcu
ltura
dem
acró
fago
sU
774,
foic
apaz
dein
ibir
form
astr
ipom
asti-
gota
sem
conc
entr
ação
de25
µM
.Ade
term
inaç
ãocr
ista
logr
áfica
,por
raio
s-X
,do
inib
idor
ligad
oao
sítio
ativ
oda
cruz
ipaí
na,
serv
ede
mod
elo
inic
ial
para
ode
senh
ora
cion
alde
fárm
acos
base
ado
emes
trut
ura
(McG
rath
etal
,199
5).
Mu-
F-hF
-VSP
hw
Mu-
F-hF
-FM
KIn
ibir
amem
60%
ocr
esci
men
tode
form
asep
imas
tigot
as(c
epa
Y)a
5µ
M,c
omin
ibiç
ãoto
talaleq1
0µ
M(E
ngel
etal
,199
9).
Der
ivad
osde
uréi
aE
stud
ode
dock
ing
por
busc
aem
banc
ode
dado
sdo
prog
ram
aD
OC
K4.
0.1
ras-
treo
u9
mol
écul
asca
paze
sde
inib
ira
cruz
ipaí
naco
mIC
50>
10µ
M.D
eriv
ados
deur
éia
etio
uréi
afo
ram
sint
etiz
ados
ete
stad
os,s
endo
oco
mpo
sto
D16
(5’(
1-m
ethy
l-3-
trifl
uoro
met
hylp
yraz
ol-5
-yl)
-thi
ophe
ne3’
-tri
fluor
omet
hylp
heny
lure
a)o
que
apre
sent
oum
elho
res
resu
ltado
sem
cultu
rade
célu
las
dem
amíf
ero,
com
sobr
eviv
ênci
a3,
7ve
zes
mai
orqu
eem
célu
las
não
trat
adas
ein
ibiç
ãodo
cres
ci-
men
tode
form
asam
astig
otas
(cep
aY
)a3,
1µ
M(D
uet
al,2
000)
.
Cha
gasi
na,
prot
eína
deT.
cruz
ire
s-po
nsáv
elpe
lare
gula
ção
endó
gena
deci
steí
nopr
otea
ses
Test
esen
zim
átic
osfo
ram
feito
sno
intu
itode
dem
onst
rara
inte
raçã
oen
tre
chag
a-si
nae
cruz
ipaí
na(S
anto
set
al,2
005)
ese
uef
eito
regu
lató
rio
sobr
ees
taci
steí
nopr
otea
se(K
i0,
095±
0,00
76nM
)(S
alm
onet
al,2
006)
.A
dete
rmin
ação
estr
u-tu
rald
ach
agas
ina,
por
RM
N,e
oes
tudo
dese
uco
mpo
rtam
ento
dinâ
mic
o,be
mco
mo
om
apea
men
tode
seus
sítio
sde
ligaç
ão,s
ãoas
etap
asin
icia
ispa
rao
estu
dora
cion
alde
inib
idor
estip
o-ch
agas
ina
(Sal
mon
etal
,200
6).
EC
:E
nzym
eC
omm
issi
on.
Cla
ssifi
caçã
onu
mér
ica
deac
ordo
com
NC
-IU
BM
B(N
omen
clat
ure
Com
mitt
eeof
the
Inte
rnat
iona
lU
nion
ofB
ioch
emis
try
and
Mol
ecul
arB
iolo
gy-
disp
onív
elem
http
://w
ww
.che
m.q
mul
.ac.
uk/iu
bmb/
enzy
me/
).IC
50
(Med
ian
Inhi
bito
ryC
once
ntra
tion)
:con
cent
raçã
oda
subs
tânc
iane
cess
ária
para
prod
uzir
inte
raçã
o(i
nibi
tóri
a)co
m50
%de
seus
rece
ptor
es.
Ki:
cons
tant
ede
diss
ocia
ção.
19
1.2.1 Enzimas Proteolíticas
Proteases, ou enzimas proteolíticas, hidrolisam1 ligações peptídicas de proteí-
nas e peptídeos, podendo ser classificadas em (i) endopeptidases, ou proteinases, que
catalisam a clivagem de ligações peptídicas localizadas no interior de uma cadeia poli-
peptídica; (ii) exopeptidases, que catalisam a clivagem de um a três aminoácidos a partir
das extremidades amino-terminal (aminopeptidases) ou carboxi-terminal (carboxipepti-
dases).
Através do alinhamento entre as seqüências de aminoácidos de proteínas classifi-
cadas como proteases e o estudo de seus sítios catalíticos, foi possível propor uma pri-
meira organização de famílias de peptidades (Rawlings e Barret, 1993), de acordo com o
grupamento químico responsável pela catálise: serino (S), cisteíno (C), aspartil (A), me-
talo (M) e desconhecido (U). Atualmente, o banco de dados MEROPS (http://merops.
sanger.ac.uk/index.htm), distingue 7 diferentes famílias de peptidases (aspartil, cisteíno,
glutâmico, metalo, serino, treonino e desconhecido) (Rawlings et al, 2006).
Em cada classe, o termo família é usado para descrever um grupo de enzimas que
apresentam relação evolutiva entre si, determinada pela similaridade ao longo de toda a
seqüência de aminoácidos ou pelo menos na região do sítio catalítico. Já o termo clan
compreende um grupo de famílias que possuem indicação de relação evolutiva, apesar
de apresentar estatisticamente uma similaridade pouco significativa entre as seqüências.
No alinhamento entre duas seqüências de aminoácidos pertencentes a um mesmo
clan, por vezes, a ordem de alguns resíduos, principalmente os que compõem o sítio ca-
talítico, podem aparecer invertidas. Desta forma, a pontuação de similaridade entre estes
resíduos será baixa e, durante a análise estatística deste alinhamento, estas seqüências
serão apontadas como evolutivamente distantes. Um exemplo deste tipo de troca de po-
sição entre resíduos do sítio catalítico pode ser observada na Tab. 1.2, onde os resíduos
HIS e ASP da região catalítica do clan SA, aparecem com posições trocadas entre as
famílias S1 e S2, dentro da classe das serino proteases. Na Fig. 1.6 é apresentada a con-
formação estrutural das enzimas quimotripsina (PDB: 1CA0) e subtilisina (PDB: 1S01),
1 Hidrólise é a clivagem de uma ligação química com o envolvimento de molécula de água na forma-ção do produto da reação catalítica.
20
Figura 1.6: Conformação estrutural dos resíduos que compõem a tríade catalítica das famílias S1 e S2em serino proteases.
Família S1: Quimotripsina† Família S2: Subtilisina‡
As distâncias apresentadas foram medidas em Angströms (A).†PDB 1CA0 (Scheidig et al, 1997). A tríade catalítica da família S1 é composta por HIS57, ASP102 eSER195.‡PDB 1S01 (Pantoliano et al, 1989). A tríade catalítica da família S2 é composta por ASP32, HIS64 eSER221.
serino proteases das famílias S1 e S2, respectivamente, nas quais pode-se notar que ape-
sar de haver uma inversão na posição dos resíduos HIS e ASP em suas seqüências de
aminoácidos, o posicionamento destes na estrutura terciária é equivalente, mantendo-se
a conformação necessária para a ação catalítica característica de uma serino protease.
A nomenclatura das famílias é dada pela letra do grupamento catalítico seguida
de um número definido arbitrariamente e, de forma similar, a nomenclatura dos clans
é definida pela letra do tipo catalítico seguida de uma letra maiúscula arbitrariamente
selecionada (Rawlings et al, 2006). Na Tab. 1.2 é apresentado um resumo das classes
de proteases, suas famílias e principais clans e representantes.
A classe das cisteíno proteases possui diversos representantes em diferentes orga-
nismos desde vírus até vertebrados, como mostrado na Fig. 1.7, que têm sido alvos de
estudos no combate à organismos patogênicos. Em 1879, o primeiro representante desta
classe foi purificado e caracterizado a partir do “mamão papaia” (Carica papaya) e, por
isso, denominado papaína (Sajid e McKerrow, 2002).
A papaína foi, também, a primeira cisteíno protease a ter sua estrutura tridimen-
sional (3D) resolvida, em 1968, por cristalografia de raios-X (Drenth et al, 1968). Pos-
teriormente, tornou-se o protótipo de uma família (C1) e desde então proteases que
21
Tabela 1.2: Exemplos de classes de proteases com alguns de seus clans e famílias.
CLASSE CLAN FAMÍLIA SÍTIO ATIVO EXEMPLOS
SerinoProtease
(EC: 3.4.21)
SA S1:Quimo-tripsina
HIS, ASP, SERQuimotripsina, Tripsina,Trombina, Catepsina G,Fatores de CoagulaçãoVII, IX, X, XI e XII.
SA
S2:Subti-lisina
ASP, HIS, SERSubtilisina, Cerevisina,Kexina, Furina, Endo-peptidases K, R e T.
CisteínoProtease
(EC: 3.4.22)
CA C1:Papaína GLN, CYS,HIS, ASN
Papaína, Quimopapaína,Caricaína, Cruzipaína,Catepsinas L, S, H e B.
AspartilProtease
(EC: 3.4.23)
AA A1:Pepsina ASP, ASPPepsina, Gastricsina,Quimosina, Renina,Catepsinas D e E.
MetaloProtease
(EC: 3.4.24)
MA M4:Termo-lisina
MotivoHEXXH
zinc-binding
Termolisina, Pseudoli-sina, Vibriolisina, Baci-lolisina, Coccolisina.
MAM8:Leishma-
nolisina
MotivoHEXXH
zinc-binding
Leishmanolisina.
EC: Enzyme Commission. Classificação numérica de acordo com NC-IUBMB (NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).Fonte: Rawlings e Barret (1993).
apresentem, através de suas seqüências de aminoácidos, uma relação evolutiva com a
papaína, são classificadas como proteases tipo-papaína tornando-se membros da família
C1. Dentre estas, encontram-se enzimas em estudo contra doenças parasitárias como a
cisteíno protease majoritária de T. cruzi, a cruzipaína.
22
Figura 1.7: Diagrama esquemático apresentando a classe das cisteíno proteases, suas principais famíliase clans.
Fonte: Diagrama baseado em Sajid e McKerrow (2002).
23
1.2.2 Cisteíno Proteases de Trypanosoma cruzi: Cruzipaínas 1 e 2
A cruzipaína, cruzaína ou GP57/51, constitui-se na principal cisteíno protease de
T. cruzi. É uma enzima lisossomal que pode ser encontrada, também, na superfície ce-
lular de formas epimastigotas e amastigotas, e é expressa em todos os estágios do ciclo
de vida do T. cruzi exercendo diferentes funções. As mais comuns são a participação
no processo de diferenciação celular do parasita e da invasão deste à células de mamí-
feros (Klemba e Goldberg, 2002), funções de grande relevância para a sobrevivência do
T. cruzi, o que caracteriza esta enzima como um alvo molecular importante no combate
à doença de Chagas, conforme apresentado na Tab. 1.1.
Como em todas as proteases do clan CA da família C1, a cruzipaína é sintetizada
sob a forma de pré-pró-enzima, como apresentado na Fig. 1.8. O domínio pré é cons-
tituído de ≈20 aminoácidos e é responsável pelo endereçamento da cisteíno protease
ao retículo endoplasmático, onde será removido por proteólise pela enzima peptidase
sinal. A região pró é formada de ≈130 aminoácidos e suas principais funções estão
na participação do correto enovelamento da proteína, a manutenção da estabilidade da
enzima em pHs neutros e alcalinos, o direcionamento para compartimentos endosso-
mais/lisossomais e a manutenção da enzima inibida, impedindo a atividade proteolítica
indesejável fora dos compartimentos lisossomais (dos Reis, 2005).
A cruzipaína madura é formada após a remoção da região pró e é composta por
345 aminoácidos sendo 215 do domínio central (domínio catalítico), onde se encon-
tram os resíduos conservados característicos do Clan CA: glutamina (GLN19), cisteína
(CYS25), histidina (HIS162) e asparagina (ASN182) , sendo os três últimos os formado-
res da tríade catalítica. Os últimos 130 resíduos constituem a porção C-terminal, que é
uma região exclusiva das proteases de tripanosomatídeos, não apresentando importância
na ação enzimática da proteína (Cazzulo et al, 2001; dos Reis, 2005). No entanto, al-
guns estudos mostram que esta porção está intrinsecamente envolvida na resposta imune
do hospedeiro a cruzipaína (Cazzulo et al, 2001; dos Reis, 2005). A seqüência de ami-
noácidos do domínio central possui cerca de 35% de identidade com a papaína e, a partir
da resolução de sua estrutura 3D por cristalografia de raios-X, verificou-se que ambas
24
possuem o mesmo tipo de enovelamento (McGrath et al, 1995).
Figura 1.8: Representação esquemática da estrutura primária da cruzipaína.
A região PRE é o peptídeo sinal com ≈20 aminoácidos, a região PRO, com cerca de 130 aminoácidos,confere estabilidade a proteína e é removida após a ativação da enzima. O Domínio Central (215 resíduos)confere atividade catalítica a enzima e o C-terminal (130 aminoácidos) possui função desconhecida. Osresíduos limítrofes de cada domínio estão indicados na porção superior do esquema, onde as setas apon-tam o local de separação entre eles.Fonte: Esquema baseado em dos Reis (2005)
O domínio catalítico da cruzipaína é formado por 5 subsítios (S3, S2, S1, S1′
e S2′), conforme apresentado na Fig. 1.9, onde encontra-se a tríade catalítica CYS25,
HIS162 e ASN182. Estudos bioquímicos e a determinação experimental de estruturas
tridimensionais complexadas a diferentes inibidores, mostram que o subsítio S2 é a re-
gião que confere especificidade de substrato a cruzipaína (Serveau et al, 1996; Judice et
al, 2001). Os subsítios S1 e S1′ auxiliam nesta especificidade e, os demais subsítios,
aparentemente não contribuem muito neste aspecto (McGrath, 1999).
A análise das propriedades eletrostáticas no sítio catalítico da cruzipaína (Dar-
denne, 2000) mostrou que a atividade catalítica desta enzima está particularmente li-
gada a formação e estabilização do par iônico CYS25− · · ·HIS162+, como apresentado
pela papaína (Dardenne et al, 2003). Resíduos situados a uma distância de até 5 A
em relação a porção sulfidrila (SG) da CYS25 e da porção imidazol (ND1) da HIS162,
são responsáveis pela formação de um campo elétrico intenso e alinhado na direção
SG−ND1, exluindo-se a contribuição dos resíduos CYS25 e HIS162 (Dardenne et al,
2003). Estes estudos também mostram a participação em particular da GLN19 no favo-
recimento desta formação, quando encontra-se na sua configuração usual estando o seu
nitrogênio NE2 voltado para o nitrogênio N da CYS25 (Dardenne, 2000). A participa-
ção destes três resíduos (GLN19, CYS25 e HIS162) no processo catalítico da cruzipaína
pode ser observada na Fig. 1.10.
25
Figura 1.9: Representação esquemática do domínio catalítico da cruzipaína e seu sítio de catálise.
Representação da interação de um substrato com a região catalítica da cruzipaína. Os resíduos do substratosão denotados por P e os subsítios de interação da enzima são descritos por S. O grupo tiol da CYS25é representado por S− e a seta aponta para a ligação peptídica do substrato a ser hidrolisada. A porçãocarboxil (prime side) do substrato e da protease são denominadas P1′ e P2′ e S1′ e S2′, respectivamente.A porção amino do substrato e os subsítios enzimáticos correspondentes (non-prime side) são designadospor P1, P2 e P3 e S1, S2 e S3, respectivamente.Fonte: Esquema baseado em Sajid e McKerrow (2002)
A cruzipaína possui diferentes isoformas sendo a cruzipaína 1 caraterizada como
a isoforma majoritária de T. cruzi. Estas diferentes isoformas são obtidas de diferentes
cepas e em diferentes estágios de desenvolvimento do parasita, sendo a cruzipaína 2
uma delas (dos Reis, 2005).
A cruzipaína 2 foi clonada e seqüenciada (Lima et al, 1994), apresentando 86%
de identidade entre a sua seqüência de amiácidos e a da cruzipaína 1, estando as prin-
cipais diferenças nos subsítios catalíticos. Estudos bioquímicos mostram que estas
duas isoformas possuem diferentes preferências a substratos, bem como suscetibili-
dade a inibidores (del Nery et al, 1997; Lima et al, 2001). Além disso, apontam
que a substituição do ASP161 no subsítio S1′, comum entre as isoformas de cruzipaína,
por SER161 no mesmo subsítio da cruzipaína 2, seria responsável pela caracterização
desta isoforma (dos Reis et al, 2006). Estudos computacionais simulando a mutação
SER161ASP na cruzipaína 2, mostraram que a introdução de um resíduo ácido à esta
isoforma favorece mais a formação do par iônico CIS25− · · ·HIS162+, em relação a sua
conformação original com a presença do resíduo neutro SER161 (Dardenne, 2000). A
substituição ASP161→SER161 somada a possibilidade da GLN19 assumir uma confor-
26
mação não usual, poderiam justificar a baixa eficiência enzimática da cruzipaína 2, em
relação a cruzipaína 1, para os substratos mais usuais em cisteíno proteases, conforme
apresentado em dos Reis (1999).
Tem sido proposto que a atividade enzimática das isoformas da cruzipaína pode-
ria ser modulada por alterações conformacionais na região do sítio ativo bem como pela
presença de um possível sítio alostérico (dos Reis, 2005). A regulação deste possível
sítio alostérico estaria condicionada a temperatura de forma que, a atividade enzimática
seria inibida por excesso de substrato a 25◦C (temperatura encontrada no vetor inver-
tebrado), desaparecendo a 37◦C (temperatura no hospedeiro vertebrado) (Lima et al,
1992). Além disto, a temperatura também exerceria um importante papel na manuten-
ção da estrutura secundária da enzima que sofreria uma diminuição do seu conteúdo
a 37◦C (dos Reis, 2005). Estas análises do perfil enzimático da cruzipaína em rela-
ção a diferentes inibidores e temperaturas, bem como sua caracterização estrutural, em
particular para os subsítios catalíticos, podem auxiliar significativamente no desenvol-
vimento de novos fármacos.
27
Figu
ra1.
10:R
epre
sent
ação
esqu
emát
ica
dom
ecan
ism
oca
talít
ico
deci
steí
nopr
otea
se.
RR'
-
Cys25
His159
Gln19 C
O
NH
H
NH
H
CC
NC
NH
+
CH2S_
CO
NH2
Asn175
CO
NH
Cys25
His159
CO-
R'
R
Gln19 C
O
NH
H
H
CC
NC
NH
+
CH2S_
CO
NH2
Asn175
Gln19 C
O
NH
H
NH
CH2S_
Cys25
His159
CO
NH2
Asn175
CO
H
CC
NC
N
HR'
R
Gln19 C
O
NH
H CH2S_
Cys25
His159
CO
NH2
Asn175
CO
H
CC
NC
N
NHH
H2O
R'
R
Cys25
His159
OH
CO
-
R
Gln19 C
O
NH
H
H
CC
NC
NH
+
CH2S_
CO
NH2
Asn175
OH
Cys25
His159
CO-
R
Gln19 C
O
NH
H
H
CC
NC
NH
+
CH2S_
CO
NH2
Asn175
(A)
(B)
(C)
(D)
(E)
(F)
(N-T
er d
o su
bstr
ato)
(C-T
er d
o su
bstr
ato)
(Sub
stra
to p
eptíd
ico)
(i)
Eta
pade
acila
ção:
(A)↔
(B)↔
(C)↔
(D).
(A)
Form
ação
dopa
riô
nico
CY
S25−
···H
IS15
9+.
(B)
Form
ação
doIn
term
ediá
rio
tetr
aédr
ico
(est
ado
detr
ansi
ção)
.(C
)Rom
pim
ento
dopa
riôn
ico
eac
opla
men
todo
subs
trat
o.(D
)For
maç
ãodo
com
plex
oac
il-en
zim
a.(i
i)E
tapa
dede
saci
laçã
o:(D
)↔(E
)↔(F
).(E
)In
term
ediá
rio
tetr
aédr
ico
(est
ado
detr
ansi
ção)
.(F)
Lib
eraç
ãodo
prod
uto
cata
lític
oe
rest
abel
ecim
ento
dopa
riôn
ico.
Obs
erva
ção:
Os
amin
oáci
dos
repr
esen
tado
ses
tão
desc
rito
sde
acor
doco
ma
num
eraç
ãoda
papa
ína.
Font
e:R
epre
sent
ação
adap
tada
deD
arde
nne
(200
0).
28
1.3 Desenho Racional de Fármacos Baseado em Estrutura
A metodologia tradicional, usualmente chamada de triagem cega (blind scree-
ning), é responsável pela descoberta da maioria dos protótipos de fármacos disponíveis
hoje no mercado, e consiste no teste direto de compostos sintéticos ou produtos natu-
rais em ensaios in vitro e em células ou modelos animais. Os esforços em purificar,
caracterizar e sintetizar princípios ativos, além da necessidade de se ter uma grande
diversidade de material biológico para testes, tornam o processo inteiro bastante traba-
lhoso, ineficiente e cujo custo envolve investimentos, por parte de grandes companhias
farmacêuticas, que em 2001 chegavam a, aproximadamente, US$800 milhões (Rockey
e Elcock, 2002) e que hoje podem chegar a bilhões de dólares (Kola e Landis, 2004).
No entanto, mesmo quando um composto eficaz é descoberto, seu mecanismo de ação
quase sempre permanece desconhecido.
Atualmente, uma abordagem mais racional, denominada desenho racional de fár-
macos baseado em estrutura, visa a identificação e uma maior compreensão das intera-
ções moleculares entre receptor e ligante, envolvendo o uso de métodos computacionais
baseados nas estruturas tridimensionais das moléculas interagentes. No final do século
XX, Ohlstein et al (2000) chamaram a atenção para a importância de que mais pesqui-
sadores e indústrias farmacêuticas usufruíssem dos métodos computacionais aplicados
à descoberta de novos fármacos. O uso de estratégias que combinem ferramentas de
bioinformática e biologia computacional para a análise da seqüência de aminoácidos e
da estrutura protéica, pode desempenhar um importante papel na identificação de poten-
ciais alvos moleculares e na investigação das propriedades físico-químicas e caracterís-
ticas associadas às regiões de sítio ativo dos mesmos.
As ferramentas de bioinformática, visualização molecular, modelagem compa-
rativa, mecânica/dinâmica molecular e metodologias de docking receptor-ligante, são
algumas das possíveis ferramentas usadas no planejamento e descoberta de compostos
protótipos em estudos de grande escala (Goldsmith-Fischman e Honig, 2003). Estes
métodos vêm sendo aplicados em projetos de desenho racional de fármacos baseado em
estrutura de outros parasitas de alto impacto médico social como o Plasmodium falcipa-
29
rum e o Mycobacterium tuberculosis, agentes etiológicos da Malária e da Tuberculose,
respectivamente (Joachimiak et al, 2001; Goulding et al, 2003).
A publicação das informações do genoma de T. cruzi (El-Sayed et al, 2005),
abriu um caminho bastante promissor para o desenvolvimento de novos fármacos contra
a doença de Chagas que sejam mais efetivos e menos tóxicos ao hospedeiro. O estudo
correlato entre proteínas de T. cruzi e de humanos (Homo sapiens) (U.S. Department
of Energy Office of Science, 2003) constitui uma etapa crucial para o planejamento de
fármacos terapeuticamente úteis. Isto ocorre através do estudo teórico e computacional
das bases moleculares envolvidas no processo de reconhecimento e acoplamento entre
a região do sítio ativo das enzimas similares entre os dois organismos e seus potenciais
ligantes.
Seqüências e funções similares dentro de uma família gênica, geralmente, indicam
um tipo de conservação na arquitetura do sítio de ligação entre proteínas provenientes de
membros desta família. Isto pode sugerir que se uma proteína sintetizada a partir de um
destes membros é capaz de ligar-se à um fármaco, proteínas oriundas de outros mem-
bros desta mesma família, também, podem ser capazes de ligar-se à este composto com
propriedades físico-químicas parecidas (Galperin e Koonin, 1999; Hopkins e Groom,
2002). Através desta triagem inicial, seria possível identificar quais são as enzimas pos-
sivelmente similares entre T. cruzi e H. sapiens, de forma a se evitar a proposição de
alvos moleculares que desencadeiem prováveis reações cruzadas nos dois organismos,
evitando-se, assim, o agravamento da debilidade física dos pacientes.
1.4 Geração de Modelo Protéico via Modelagem Comparativa
Com o crescente número de projetos de seqüenciamento de genomas de orga-
nismos patogênicos, a predição experimental de estruturas protéicas tornou-se limitada
fazendo-se cada vez mais necessário métodos teóricos e preditivos capazes de analisar
estes dados em grande escala. Com a genômica estrutural tornou-se possível a deter-
minação teórica em grande escala da estrutura 3D de macromoléculas e sua análise
biológica (Goldsmith-Fischman e Honig, 2003).
30
As estratégias teóricas comumente aplicadas são (Rössle, 2004):
• Métodos Físicos: baseiam-se nas interações entre átomos e incluem métodos de
modelagem molecular, como a dinâmica molecular e a minimização de energia
(métodos ab initio).
• Métodos Empíricos: dependem de estruturas de proteínas que já foram determi-
nadas experimentalmente e depositadas em um banco de dados (Protein Data
Bank (PDB) - Westbrook et al (2002)).
A predição da estrutura 3D de uma proteína e seu padrão de enovelamento forne-
cem informações relevantes sobre sua provável função biológica e, conseqüentemente,
na identificação desta como um potencial alvo farmacológico. Já é bem estabelecido
que a evolução tende a conservar funções que dependem mais diretamente das estrutu-
ras tridimensionais que das similaridades entre as seqüências de aminoácidos das pro-
teínas (Sánchez et al, 2000; Cherkasov et al, 2004). O enovelamento protéico permite
que aminoácidos seqüencialmente distantes interajam em uma mesma região espacial
da proteína, formando distintos padrões conformacionais, dependendo das condições
físico-químicas do ambiente. Portanto, um alinhamento estrutural entre proteínas con-
sideradas de uma mesma família, mesmo que envolvendo apenas uma região associada
ao sítio ativo, pode ser um importante método para se inferir a função da seqüência em
estudo (Laskowski et al, 2003; Marsden et al, 2006).
A técnica de modelagem comparativa, também chamada de modelagem por ho-
mologia, é um método empírico que se baseia no alinhamento construído entre a seqüên-
cia que se deseja modelar e uma ou mais seqüências de proteínas evolutivamente relaci-
onadas que possuam uma estrutura tridimensionalmente resolvida (determinada experi-
mentalmente por técnicas de raios-X ou Ressonância Magnética Nuclear) e depositada
no PDB (Goldsmith-Fischman e Honig, 2003).
Os modelos 3D gerados pela técnica de modelagem comparativa podem ser apli-
cados não somente em predição funcional e em desenho racional de fármacos baseado
em estrutura mas, também, no desenho de experimentos de mutagênese sítio-dirigida
31
fornecendo possíveis mutações para testar hipóteses funcionais, modelar a especifici-
dade de um substrato, fazer a predição de epítopos antigênicos, possibilitar simulações
de interações entre proteínas por técnicas de modelagem/dinâmica molecular, auxiliar
no refinamento de estruturas resolvidas por cristalografia de raios-X e por experimentos
de ressonância magnética nuclear (RMN), dentre outras (Rössle, 2004).
A aplicabilidade do modelo está diretamente relacionada com a precisão com que
este foi gerado (Fig. 1.11), que é dada pelo grau de similaridade entre as estruturas 3D
da proteína predita e da proteína molde. Este grau de similaridade é determinado pelo
desvio médio quadrático (RMSD), que mede as distâncias interatômicas, em Angströms
(A), entre o modelo gerado e a estrutura molde, de acordo com a seguinte função:
RMSD =
√√√√ 1
N
N∑i=1
‖rAi − rB
i ‖2 (1.1)
ondeN é o número total de átomos pareados entre as duas estruturas, ri é o vetor posição
do átomo i, A é a estrutura modelo e B é a estrutura molde.
A modelagem comparativa consiste basicamente de quatro etapas descritas a se-
guir (Goldsmith-Fischman e Honig, 2003; Rössle, 2004) e resumidas na Fig. 1.13:
(1) Identificação de referências: tem por objetivo identificar seqüências de aminoá-
cidos que possuam similaridade com a proteína em estudo (seqüência alvo). A
determinação da seqüência de referência pode ser feita através de algoritmos
como o BLAST (Basic Local Alignment Search Tool) (Altschul et al, 1990)
que realiza o alinhamento entre a seqüência alvo e seqüências depositadas em
bancos de dados estruturais (e.g. Protein Data Bank - PDB), sendo selecionadas
as que possuírem similaridade suficiente para se inferir homologia entre elas.
Quando as seqüências de aminoácidos possuem pouca similaridade, aplica-se
o método de Threading (Miller et al, 1996) que realiza a comparação entre
a seqüência alvo e estruturas 3D de proteínas depositadas em banco de dados,
objetivando-se identificar proteínas remotamente relacionadas que possuam um
mesmo tipo de enovelamento.
32
Figura 1.11: Possíveis aplicações de modelos tridimensionais de acordo com os valores de RMSD.
Fonte: Esquema baseado em Baker e Sali (2001).
33
(2) Alinhamento entre seqüências: como a fase de identificação de referências tem
como objetivo encontrar relações evolutivas entre seqüências, os alinhamentos
construídos são apenas locais 2 e não globais 3 o que, por muitas vezes, faz
com que a referência escolhida não seja a melhor seqüência para a construção
do modelo. Nesta etapa, é realizado o alinhamento global entre a seqüência alvo
e a de referência no intuito de se verificar a cobertura do alinhamento. Desta
forma, um alinhamento global com mais de 40% de identidade é o suficiente
para gerar um modelo confiável, mesmo por métodos automatizados.
(3) Construção do modelo: baseia-se na informação contida no alinhamento entre
as seqüências alvo e molde. As técnicas mais aplicadas são a de construção
usando corpos rígidos e por satisfação de restrições espaciais, que é conceitu-
almente similar ao usado na determinação de estruturas por RMN.
• Construção usando corpos rígidos: constrói um modelo por partes basean-
do-se no fato de que proteínas homólogas possuem regiões estrutural-
mente conservadas como α-hélices e folhas β. As regiões estruturalmente
conservadas da seqüência em estudo são definidas através de uma predi-
ção de estruturas secundárias. Estas serão alinhadas considerando-se a
média das posições dos Cα das seqüências de aminoácidos das regiões
estruturalmente conservadas nas seqüências de referência. As regiões que
não satisfazem as exigências são chamadas de regiões variáveis e compre-
endem, geralmente, regiões de voltas que conectam as regiões conserva-
das. A cadeia principal destas regiões pode ser obtida em bancos de dados
de estruturas protéicas, que apresentam conjuntos de voltas determinados
através do número de aminoácidos e do tipo de estruturas secundárias que
conectam. Após a inserção das regiões de volta, um modelo inicial do
esqueleto peptídico estará pronto restando, apenas, a inserção das cadeias
2 Alinhamento Local: alinhamento entre regiões de seqüências com maior densidade de resíduosidênticos ou similares
3 Alinhamento Global: alinhamento entre seqüências em toda a sua extensão, de forma a coincidir omaior número de resíduos idênticos ou similares
34
laterais dos aminoácidos que o compõe, através de busca em bibliotecas
de rotâmeros (Lovell et al, 2000). Alguns programas como o SWISS-
MODEL (Guex e Peitsch, 1997) baseiam-se neste tipo de metodologia
para a construção de modelos protéicos.
• Construção por satisfação de restrições espaciais: inicia-se pelo alinha-
mento entre a seqüência em estudo e a de referência, extraindo-se deste
molde suas restrições espaciais (distâncias e ângulos) e transferindo-as
para o modelo. O tamanho das ligações bem como seus ângulos pre-
ferenciais são obtidos de campos de força (e.g. CHARMM) enquanto
que o dos átomos não ligados, são obtidos por análise estatística de um
grupo representativo de estruturas conhecidas (Sali e Overington, 1994).
Desta forma, é possível limitar o número de possíveis conformações que
o modelo pode assumir. A principal característica deste método é a obten-
ção empírica das restrições espaciais, expressas por funções densidade de
probabilidade (PDF’s), a partir de banco de dados contendo informações
sobre alinhamentos entre estruturas protéicas de alta resolução. As res-
trições espaciais e os termos de energia são combinados em uma função
objetivo, sendo submetida a métodos de otimização por gradiente conju-
gado e recozimento simulado, visando a minimização das violações das
restrições espaciais (Sánchez e Sali, 1997). Este método é o mesmo em-
pregado em programas como o Modeller (Sánchez e Sali, 1997).
(4) Validação do modelo: após a construção do modelo é necessário identificar
possíveis erros relacionados aos métodos empregados, à escolha das referên-
cias e ao alinhamento entre a seqüência alvo e a seqüência de referência. Caso
o modelo seja caracterizado de má qualidade, todo o protocolo anterior deve
ser revisto no intuito de se melhorar o alinhamento inicial ou decidir-se por
outros métodos. A qualidade de um modelo é determinada pelas ligações en-
tre os átomos, ângulos formados, ligações peptídicas, planaridade dos anéis e
ângulos de torção nas cadeias principal e laterais. Por ser baseado em uma
35
estrutura tridimensionalmente resolvida, o valor de RMSD obtido pela sobre-
posição do modelo gerado e da estrutura molde deve estar entre 1A e 2A, para
ser considerado de boa qualidade. Além disto, através da análise do gráfico
de Ramachandran (Ramakrishnan, 2001) é possível identificar, através da cor-
relação entre os ângulos φ e ψ, quais resíduos encontram-se fora das regiões
favoráveis, possibilitando uma melhora no modelo (Fig. 1.12).
Por ser dependente de uma estrutura protéica tridimensionalmente resolvida, a
técnica de modelagem comparativa possui certas limitações: (i) nem sempre se conse-
gue uma estrutura que sirva como molde para a seqüência que se deseja estudar; (ii) por
vezes, as seqüências que podem servir como molde possuem resolução acima de 3, 0A,
sendo consideradas estruturas de resolução não muito boa para a construção de um mo-
delo preciso; (iii) o grau de similaridade entre a seqüência de estudo e as seqüências das
estruturas molde pode ser pequeno (< 30% de identidade), mesmo em regiões do sítio
ativo. Nestes casos, informações como a identificação de regiões transmembranares,
predição de estruturas secundárias, reconhecimento do tipo de enovelamento e dados
experimentais podem ser fatores importantes no auxílio tanto na predição de modelos
tridimensionais como na análise funcional de seqüências (Chance et al, 2002; Rössle,
2004).
Quanto à qualidade do modelo, métodos de simulação de dinâmica molecular
têm sido empregados na melhora de modelos gerados tanto por técnicas baseadas em
homologia quanto por ab initio. Simulações em solvente explícito ajudam a acomodar
a estrutura 3D do modelo melhorando, principalmente, os ângulos φ e ψ de resíduos em
regiões desfavoráveis no gráfico de Ramachandran (Fan e Mark, 2004). Além disto, os
métodos de dinâmica molecular aplicados aos modelos, são empregados na pesquisa de
diferentes conformações protéicas para estudos de docking receptor-ligante bem como
em estudos envolvendo a interação de um ligante na região de sítio ativo da enzima em
estudo (Xiao et al, 2006).
36
Figura 1.12: Exemplo de gráfico de Ramachandran apresentando correlações entre os ângulos φ e ψ deuma cadeia polipeptídica.
(a) Determinação dos ângulos φ e ψ de uma cadeia polipeptídica.Fonte: http://employees.csbsju.edu/hjakubowski/classes/ch331/protstructure/olunderstandconfo.html.
B
A
L
b
a
l
p
~p
~b
~a
~l
b
~b
b~b
~b
-180 -135 -90 -45 0 45 90 135 180
-135
-90
-45
0
45
90
135
180
Ramachandran Plot1me4m
Phi (degrees)
Psi (
degr
ees)
CYS 101
THR 185
(b) Gráfico de Ramachandran gerado pelo programa Procheck (Laskowski et al, 1993), apre-sentando as regiões favoráveis do modelo estrutural da cruzipaína 2.
No gráfico de Ramachandran os resíduos de aminoácidos são representados por quadrados, sendo asglicinas representadas por triângulos.As áreas em vermelho compreendem as regiões muito favoráveis, em amarelo as favoráveis, em bege aspouco favoráveis e em branco as regiões desfavoráveis. Esta última região é desfavorável para todos osaminoácidos, com exceção a glicina.
37
Figura 1.13: Esquema geral das etapas de construção de um modelo protéico tridimensional por técnicade modelagem comparativa.
Fonte: Esquema baseado em Marti-Renom et al (2002).
38
1.5 Simulação por Dinâmica Molecular
A dinâmica molecular (DM) estuda os movimentos em um sistema de partícu-
las por simulação, através da evolução temporal das configurações dos constituintes do
sistema. A partir das seqüências de posições geradas, é possível determinar as pro-
priedades do sistema (Borin, 1999). Este método pode ser empregado tanto em siste-
mas de elétrons, átomos ou moléculas, como em sistemas biológicos mais complexos
(e.g. transporte de membrana), baseando-se no conhecimento do potencial de intera-
ção entre as partículas e nas equações de movimento que governam a dinâmica dessas
partículas (Pascutti, 2004), no intuito de se observar as propriedades termodinâmicas,
estruturais, espectroscópicas, de transporte, estruturas de solvatação e agregações inter-
moleculares (Borin, 1999).
Simulações de dinâmica molecular são amplamente usadas para se obter informa-
ções sobre as propriedades de proteínas em equilíbrio numa solução. Cada vez mais,
simulações são usadas no estudo de fenômenos tempo- e ambiente-dependentes como,
por exemplo, otimização estrutural de modelos 3D gerados por métodos ab initio ou por
homologia, no processo de enovelamento e desenovelamento de proteínas, as diferen-
tes conformações estruturais de uma proteína ao longo do tempo, a interação entre uma
proteína e um ligante, dentre outros (Walser et al, 2000).
Nos métodos de DM, partículas interagentes, inicialmente dispostas em uma de-
terminada configuração, movimentam-se sob a influência de potenciais intermolecula-
res (Borin, 1999). A representação física do sistema é dada por uma função poten-
cial empírica, usualmente chamada de Campo de Força Molecular Clássico, que de-
pende das coordenadas cartesianas dos átomos do sistema. Os campos de força mais
comumente empregados em simulações de DM são o GROMOS (van Gunsteren e Be-
rendsen, 1987), AMBER (Weiner et al, 1984; Cornell et al, 1995), CHARMM (Bro-
oks et al, 1983) e MMFF94 (Halgren, 1996a,b,c,d,e). A função energia potencial
V ({ri}) = V (r1, r2, . . . , rN) de um sistema molecular constituído de N átomos com
vetores posição ri, pode assumir a seguinte forma:
39
V ({ri}) =12
Nb∑n=1
Kbn(bn − b0n)2︸ ︷︷ ︸I
+12
Nθ∑n=1
Kθn(θn − θ0n)2︸ ︷︷ ︸II
+12
Nξ∑n=1
Kξn(ξn − ξ0n)2︸ ︷︷ ︸III
+
+Nφ∑n=1
Kφn[1 + cos(nnφn − δn)]︸ ︷︷ ︸IV
+Nátomos∑
i≤k
−(Aij
rij
)6
+(Bij
rij
)12
︸ ︷︷ ︸V
+Nátomos∑
i≤k
qiqj4πε0εrrij︸ ︷︷ ︸V I
(1.2)
Analisando em detalhes a Eq. (1.2), seus termos são descritos da seguinte forma:
O termo I representa o potencial harmônico linear que descreve as Nb ligações
químicas e seus movimentos vibracionais, sendo Kb a constante de Hooke, b o compri-
mento instantâneo de ligação e b0 o comprimento de equilíbrio.
O segundo termo, denotado por II , representa o potencial harmônico angular que
descreve osNθ ângulos formados por três átomos ligados consecutivamente na molécula
sendo Kθ a constante de Hooke, θ o ângulo entre as ligações e θ0 o ângulo de equilíbrio.
O termo denotado por III consiste no potencial diedral impróprio que descreve os
Nξ ângulos entre planos formados por quatro átomos, sendo Kξ a constante de Hooke,
ξ o ângulo entre os planos e ξ0 o ângulo de equilíbrio.
O quarto termo (IV ) se refere ao potencial diedral próprio que descreve as Nφ
rotações em torno das ligações químicas formadas, sendo Kφ uma constante que define
a altura da barreira de rotação, n é o número de mínimos da função, φ é a variação
angular e δ o ângulo de diferença de fase (0o ou 180o).
O termo V considera o tipo e a distância entre os átomos e é descrito pelo po-
tencial de Lennard-Jones, caracterizado por um termo atrativo(
Aij
rij
)6
(interação de van
der Waals) e um repulsivo(
Bij
rij
)12
, onde Aij e Bij dependem dos tipos de átomos i e j
interagentes, e sendo rij a distância entre os átomos i e j.
Finalmente, V I considera as cargas dos átomos e é descrito pelo potencial de
Coulomb, sendo qi a carga do átomo i, qj a carga do átomo j, ε0 a permissividade
elétrica do vácuo, εr a constante dielétrica do meio e rij a distância entre os átomos i e
j.
O protocolo associado a uma simulação de DM pode ser resumido, basicamente,
40
nas seguintes etapas (van der Spoel et al, 2004):
(1) Condições Iniciais do Sistema: as coordenadas espaciais iniciais obtidas de
uma estrutura experimentalmente resolvida ou de um modelo 3D gerado, bem
como as velocidades iniciais de cada átomo que constituem a molécula, servem
como parâmetros de entrada para o início de qualquer simulação de DM. Se as
velocidades iniciais de cada átomo não forem conhecidas, valores podem ser
atribuidos segundo a distribuição de Maxwell-Boltzmann:
p(vi,n) =
√mi
2πkBTexp
(−miv
2i,n
2kBT
), i = 1, . . . , N ; n = 1, 2, 3
(1.3)
onde vi,n é a n-ésima componente do vetor velocidade do átomo i,mi é a massa
de cada átomo i, kB é a constante de Boltzmann, T é a temperatura absoluta do
sistema dada em Kelvin e N é o número de átomos do sistema.
A partir do vetor posição ri de cada átomo i é possível calcular a função energia
potencial V ({ri}), apresentada na Eq. (1.2), que descreve a interação entre os
N átomos do sistema: (i) entre pares de átomos i e j não ligados (potencial
de Lennard-Jones e potencial de Coulomb); (ii) entre átomos ligados (poten-
cial harmônico linear e angular e potencial diedral próprio e impróprio); (iii)
possíveis forças externas e restrições ao sistema.
(2) Cálculo das Forças que Regem o Sistema: Inicialmente calcula-se o vetor força
Fi atuante em cada átomo i do sistema, de acordo com o negativo do gradiente
da função energia potencial V ({ri}):
Fi = −∇V ({ri}), i = 1, . . . , N (1.4)
Em seguida, a energia total do sistema é calculada com base na função energia
potencial V ({ri}) e energia cinética Ec, definida por
41
Ec =1
2
N∑i
miv2i , (1.5)
onde mi e v2i = (v2
x + v2y + v2
z) são, respectivamente, a massa e a velocidade
escalar de cada átomo i do sistema.
(3) Otimização do Sistema: ao calcular-se as forças iniciais atuantes em um sis-
tema contendo um modelo 3D ou mesmo uma estrutura obtida experimental-
mente, os valores obtidos podem ser demasiadamente altos, levando a grandes
acelerações durante os passos de integração da DM. Isto causaria ruídos cada
vez maiores e, assim, invalidaria a simulação. Desta forma, a etapa de mini-
mização do sistema é fundamental para que se possa corrigir a configuração
inicial do sistema e, com isso, eliminar as tensões locais ajustando distâncias
de ligações, espaços não preenchidos na solvatação do sistema, sobreposição
de átomos, dentre outros (Gomes, 2006).
Existem diferentes algoritmos empregados em simulações de DM para a mi-
nimização do sistema (e.g. Máximo Declive ou Steepest Descent, Gradien-
tes Conjugados e Newton-Raphson), sendo o algoritmo de Steepest Descent,
o mais comumente usado. Apesar deste não ser um dos métodos mais efici-
entes, é bastante robusto e de fácil implementação. É um método de primeira
derivada e converge vagarosamente nas proximidades do mínimo, porém, é po-
deroso para configurações distantes de um mínimo em energia (Pascutti, 2004).
Dado um deslocamento inicial h0 (e.g. ≈ 0.1A), o incremento nas coordenadas
de um átomo i, é dado na direção e sentido da força resultante sobre este átomo:
ri,n+1 = ri,n +Fi,n
‖Fn‖∞hn, i = 1, . . . , N (1.6)
onde Fi,n é o vetor força resultante no átomo i, na iteração n, e é obtida de
acordo com a Eq. (1.4), o escalar ‖Fn‖∞ = max(|F1,n|, . . . , |FN,n|), N é o
42
número de átomos do sistema e hn é um parâmetro escalar que é ajustado para
acelerar a minimização.
Os valores de hn são ajustados de acordo com as forças e energias recomputa-
das para as novas posições ri,n+1:
hn+1 =
1, 2hn, se Vn+1 < Vn
0, 2hn, caso contrário(1.7)
Neste método, a condição de parada geralmente é determinada pelo número de
passos mas, pode-se usar como critério de convergência um valor próximo de
zero para a norma do gradiente do potencial.
(4) Atualização da configuração: determinadas as condições iniciais, o próximo
passo consiste em se determinar as posições e velocidades a cada passo da
dinâmica. Se a energia total do sistema for constante e o passo de tempo for su-
ficientemente pequeno para se considerar que as posições variem suavemente,
dados os vetores posição ri e velocidade vi é possível se obter as trajetórias dos
átomos que constituem o sistema através da resolução numérica das equações
de movimento de Newton e na integração das mesmas passo-a-passo no tempo:
mid2ri
dt2= Fi, i = 1, . . . , N (1.8)
onde i representa os N átomos do sistema, mi é a massa de cada átomo i, ri é
o vetor posição de cada átomo i, t é o tempo e Fi o vetor força atuante em cada
átomo i.
Para a etapa de integração, diferentes algoritmos podem ser aplicados (e.g.
Verlet, Meio-Passo ou Leap-Frog, Velocity-Verlet e Beeman). O algoritmo de
Leap-Frog é uma modificação do algoritmo de Verlet e, atualmente, é o mais
usado por ser menos suscetível a erros numéricos e ser capaz de tornar o sis-
tema acoplável a um banho térmico através de correções nas velocidades (Bo-
rin, 1999). No método de Verlet (Verlett, 1967) os ri vetores posições dos i
43
átomos em um passo de tempo ∆t são dadas por uma expansão de Taylor em
torno de ri(t):
ri(t+ ∆t) = ri(t) + ri(t)∆t+1
2!ri(t)∆t
2 +1
3!
...ri(t)∆t
3 + . . . (1.9)
ri(t−∆t) = ri(t)− ri(t)∆t+1
2!ri(t)∆t
2 − 1
3!
...ri(t)∆t
3 + . . . (1.10)
Somando-se as Eqs. (1.9) e (1.10), e considerando a aceleração ri(t) obtida da
Eq. (1.8), obtém-se o algoritmo de Verlet para a propagação das posições:
ri(t+ ∆t) u 2ri(t)− ri(t−∆t) +Fi(t)
mi
∆t2 (1.11)
onde as novas posições ri(t+∆t) possuem um erro de ordem (∆t)4, apesar do
erro global do algoritmo ser da ordem de (∆t)2 (Schlick, 2000).
Uma das desvantagens do algoritmo de Verlet é que as novas posições são obti-
das pela adição de um termo pequeno (∆t2) à diferença entre dois termos muito
maiores, (2ri(t)) e (ri(t−∆t)), levando a perda de precisão do algoritmo (Le-
ach, 2001). Outra desvantagem dá-se pelo fato de as velocidades não aparecem
na Eq. (1.11), não desempenhando papel algum na determinação das trajetórias
neste algoritmo. No entanto, o cálculo das velocidades se faz necessário para a
determinação da energia cinética e, somada à energia potencial, para o cálculo
da energia total do sistema. Uma estimativa da velocidade das partículas pode
ser obtida se subtrairmos a Eq. (1.10) da Eq. (1.9) obtendo:
vi(t) = ri(t) u1
2∆t[ri(t+ ∆t)− ri(t−∆t)] (1.12)
onde as novas velocidades ri(t) possuem um erro de ordem (∆t)2.
44
No algoritmo de Leap-Frog (Hockney, 1970) a velocidade é incluída explicita-
mente na determinação das novas posições e possui uma maior precisão numé-
rica sendo as velocidades calculadas em(t± ∆t
2
)e as posições em (t ± ∆t).
As velocidades nos meio-passos podem ser definidas a partir da Eq. (1.12):
ri
(t+
∆t
2
)u
1
∆t[ri(t+ ∆t)− ri(t)] (1.13)
ri
(t− ∆t
2
)u
1
∆t[ri(t)− ri(t−∆t)] (1.14)
sendo ri(t+ ∆t) obtido por
ri(t+ ∆t) = ri(t) + vi
(t+
∆t
2
)∆t (1.15)
Subtraindo a Eq. (1.14) da Eq. (1.13) obtém-se a expressão geral para a deter-
minação da velocidade de cada átomo em t+ ∆t2
:
ri
(t+
∆t
2
)u ri
(t− ∆t
2
)+ ri(t)∆t (1.16)
considerando a aceleração ri(t) obtida da Eq. (1.8), obtém-se o algoritmo de
Leap-Frog para a propagação das velocidades:
vi
(t+
∆t
2
)= ri
(t+
∆t
2
)u ri
(t− ∆t
2
)+Fi(t)
mi
∆t (1.17)
(5) Dinâmica de Equilibração do Sistema: a dinâmica é continuada por um tempo
suficientemente grande (dependendo do tamanho do sistema em questão) para
se alcançar o equilíbrio do sistema, baseando-se nas médias temporais de, por
exemplo, temperatura, energia e pressão (van der Spoel et al, 2004). Usual-
mente, esta dinâmica é feita em duas etapas, sendo que na primeira aplica-se
45
restrições às posições dos átomos da macromolécula em estudo, deixando-se
os átomos do solvente livres para a acomodação dos mesmos em camadas de
solvatação em torno da molécula em questão. Desta forma, a energia potencial
considerando-se restrições nas posições atômicas é dada pela adição do termo
Vpr(ri) =1
2kpr‖ri −Ri‖2 i = 1 . . . N (1.18)
onde kpr é a constante de penalização associada as posições espaciais, ri é o
vetor posição calculado para o átomo i e Ri é o vetor posição original do átomo
i.
Na segunda etapa, nenhuma restrição é aplicada e todo o sistema pode acomodar-
se às condições físicas aplicadas ao sistema, como temperatura, volume e pres-
são.
(6) Análise dos Resultados: após a etapa de equilibração, são feitas simulações de
DM para a geração de arquivos de saída contendo as trajetórias do sistema em
função do tempo, informando as posições, velocidades e acelerações de cada
átomo. Dependendo do objetivo da simulação de DM, a partir destes arquivos
de saída pode-se analisar o comportamento da temperatura, energias e pressão
total do sistema bem como informações mais específicas como deformações
ocorridas em uma proteína, o monitoramento do número de ligações de hidro-
gênio estabelecidas, o grau de exposição dos resíduos da molécula ao solvente,
dentre outros.
Em geral os parâmetros são ajustados objetivando reproduzir algumas das propri-
edades que, geralmente, são a entalpia de vaporização e a densidade. Portanto, durante a
simulação, alguns parâmetros macroscópicos podem ser conjuntamente mantidos cons-
tantes como o número de partículas do sistema (N), a pressão (P), o volume (V) e a
temperatura (T). Cada um desses conjuntos de parâmetros caracterizam ensembles 4 di-4 Ensemble é um grande conjunto de réplicas de um sistema de interesse, em que cada réplica ocupa
uma região do espaço de fases. Assim, equações de movimento diferentes geram sucessões de estados deacordo com ensembles diferentes. (Borin, 1999).
46
ferentes, que definem diferentes equações de estado para o sistema, de modo a permitir
que diferentes funções termodinâmicas possam ser mais convenientemente calculadas
em um ou outro ensemble. Como exemplos de ensembles pode-se citar o canônico, em
que os estados de equilíbrio são caracterizados por serem mínimos na função energia
livre de Helmholtz (NVT constantes), e o ensemble isobárico-isotérmico no qual os es-
tados de equilíbrio são caracterizados por serem mínimos na função energia livre de
Gibbs (NPT constantes).
No método de simulação por dinâmica molecular, os átomos estão imersos em um
sistema finito sujeito a problemas em relação aos efeitos de fronteira, cuja minimização
pode ser resolvida através da aplicação de condições periódicas de contorno. Neste
método, os átomos do sistema são confinados em uma caixa tridimensional (célula de
simulação) circundada por réplicas transladadas, produzindo um sistema que tenda ao
limite termodinâmico (sistema pseudo-infinito), onde as partículas se movimentam de
maneira idêntica à movimentação na célula principal (Fig. 1.14).
Esse procedimento deve ser acompanhado por uma descrição de como as intera-
ções entre as imagens das partículas pertencentes a diferentes réplicas periódicas devem
ser manipuladas, desta forma, a natureza pseudo-infinita do sistema implica na necessi-
dade de algumas aproximações para o tratamento das interações intermoleculares. Para
as forças de curto alcance pode ser aplicada a aproximação da imagem mínima conjun-
tamente com as convenções do raio de corte esférico (Rc), dado por
Rc ≤1
2min(a, b, c) (1.19)
onde a, b e c são os comprimentos das arestas da caixa nas direções x, y e z.
Na aproximação da imagem mínima supõe-se que somente uma imagem (a mais
próxima) de cada partícula seja considerada nos termos de interações de curto alcance
para átomos não ligados. Isto implica que o raio de corte Rc, usado para truncar as inte-
rações não ligadas, esteja restrito a um valor menor ou igual que a metade da dimensão
da célula de simulação, evitando-se que um átomo interaja com sua própria imagem.
Para o cálculo das interações de longo alcance, o uso do raio de corte visando a
47
Figura 1.14: Representação esquemática bidimensional de condições periódicas de contorno para asimulação de um sistema pseudo-infinito.
A célula de simulação central é circundada por réplicas transladadas com comportamento idêntico. Nacélula central, as forças eletrostáticas são computadas através de aproximação da imagem mínima com ouso de raio de corte (Rc) para o truncamento de interações não ligadas.
diminuição do custo computacional, pode gerar ruídos ao sistema, através da introdução
de uma descontinuidade nas funções energia potencial e força, próximas ao valor Rc es-
colhido. Para o tratamento desta descontinuidade, são aplicadas funções como a switch
e shift. Se Rc for pequeno (< 10, 0 Å), a contribuição de um grande número de átomos
pode ser desconsiderada o que afetaria significativamente os cálculos da simulação de
dinâmica molecular (Leach, 2001). No potencial de Lennard-Jones o uso de raio de
corte provoca efeitos pequenos na energia embora provoque grandes efeitos na pressão.
Já no potencial de Coulomb, estes efeitos são mais significativos necessitando o uso de
Rc maiores e de métodos específicos para o tratamento das interações eletrostáticas (van
der Spoel et al, 1998).
Quando as forças de interação entre as partículas decaem vagarosamente com a
distância, pode-se substituir a força de interação simples entre duas partículas na célula
de simulação por uma força efetiva, obtida somando-se as interações entre todas as
imagens periódicas dessas partículas através do método da soma infinita (e.g. Soma de
Ewald, Particle-Mesh Ewald (PME) e Particle-Particle Particle-Mesh (PPPM)).
48
No método de Campo de Reação, o potencial de Coulomb, dado pelo termo V I da
Eq. (1.2), pode ser modificado para um sistema homogêneo, assumindo uma constante
dielétrica (εrf ) que simula o efeito da blindagem eletrostática causada pelo solvente,
além do uso de um raio de corte Rc que, dependente do valor, faz com que o potencial
tenda a zero (van der Spoel et al, 1998), como mostrado na Fig. 1.15. Desta forma, o
potencial de Coulomb com Campo de Reação entre dois átomos i e j é descrito por
Vcrf =qiqj
4πε0rij
[1 +
εrf − 1
2εrf + 1
r3ij
R3c
]− qiqj
4πε0Rc
3εrf
2εrf + 1(1.20)
onde qi é a carga do átomo i, qj a carga do átomo j, ε0 a permissividade elétrica do vácuo,
εrf a constante dielétrica para o Campo de Reação, rij a distância entre os átomos i e j
e Rc o raio de corte.
Figura 1.15: Representação do potencial de Coulomb com e sem a aplicação do Campo de Reação.
Para esta representação foram considerados átomos de mesma carga, constante dielétrica εrf igual a 54 eraio de corte Rc de 16, 0 Å.
49
Capítulo 2
Objetivos
2.1 Objetivo Geral
Aplicar técnicas de bioinformática, modelagem computacional e abordagens enzi-
máticas/evolutivas às proteínas preditas a partir da seqüência genômica de Trypanosoma
cruzi (cepa CL Brener),visando a construção de modelos protéicos estruturais para iden-
tificação de possíveis alvos moleculares para o tratamento da doença de Chagas, bem
como o estudo do comportamento dinâmico de alguns destes alvos, no caso, as cisteíno
proteases cruzipaína 1 e cruzipaína 2.
2.2 Objetivos Específicos
• Construir e qualificar modelos tridimensionais de proteínas de T. cruzi a partir
de técnicas de modelagem comparativa.
• Identificar quais destes modelos possuem perfil enzimático e propor uma pri-
meira lista de possíveis alvos moleculares para o tratamento da doença de Cha-
gas, dentro do contexto de desenho racional de fármacos baseado em estrutura.
• Investigar dentre as enzimas com estruturas tridimensionais geradas, quais pos-
suem similaridades (ortologias) com enzimas humanas.
• Analisar por técnicas de simulação de dinâmica molecular em solvente explí-
cito e nas temperaturas de 25◦C e 37◦C, as isoformas 1 e 2 da cruzipaína (alvos
moleculares de T. cruzi), tendo como controle a enzima papaína extraída da
Carica papaia.
50
Capítulo 3
Metodologia
3.1 Alinhamento de Seqüências
O alinhamento local de seqüências é uma das ferramentas importantes para pro-
cessos de busca em bancos de dados de nucleotídeos e aminoácidos. Ao comparar-se
seqüências, visa-se estabelecer parâmetros de semelhança entre elas respeitando-se cri-
térios específicos (Lesk, 2002). Portanto, no alinhamento de seqüências deseja-se iden-
tificar a correspondência resíduo a resíduo existente entre duas seqüências, tendo por
objetivos medir a similaridade entre elas, observar formas de conservação e variabili-
dade, e inferir relações evolutivas (Lesk, 2002).
Nas medidas de similaridade, tenta-se medir o grau de semelhança entre seqüên-
cias usando um sistema de pontuação, no qual quanto maior for a pontuação obtida
maior será a similaridade entre estas seqüências. As relações de como pontuar e como
penalizar podem variar de acordo com a aplicação do problema e do tipo de alinhamento
obtido, como apresentado na Tab. 3.1.
Uma das ferramentas comumente usada para a rápida comparação entre sequên-
cias é o BLAST (Basic Local Alignment Search Tool) (Altschul et al, 1990), um
grupo de programas elaborado para executar buscas por similaridade entre uma ou mais
seqüências alvos e seqüências depositadas nos diversos bancos de dados disponíveis
(nucleotídicos e protéicos). O BLAST tem por objetivo otimizar a medida de similari-
dade local e aumentar a velocidade de busca em bancos de dados de grandes proporções.
51
Tabela 3.1: Classificação dos tipos de alinhamentos entre seqüências.
Não informativo − − − − G C TA C T A C − −
Informativo sem Gaps† A C T G CA C C G C
Informativo com Gaps† A C T G − CA C − G T C
†Gaps são deslocamentos feitos em uma ou nas duas seqüências, de forma a se obter um melhor alinha-mento entre elas.
O BLAST usa um algoritmo desenvolvido pelo NCBI (National Center for Bio-
technology Information) que realiza alinhamentos locais usando matrizes de pontuação
próprias (Altschul et al, 1990). O padrão do BLAST é a matriz BLOSUM62 (Fig. 3.1),
uma matriz simétrica 20×20 apresentando todas as possíveis identidades e substituições
existentes entre os 20 aminoácidos mais comumente encontrados na natureza (Pertsem-
lidis e Fondon III, 2002; Eddy, 2004). A pontuação desta matriz é baseada nas freqüên-
cias observadas para a ocorrência de cada resíduo em alinhamentos, múltiplos e sem
gaps5 , entre seqüências de famílias de proteínas com até 62% de identidade, sendo que
(i) as identidades definem pontuações positivas de maiores índices, (ii) as substituições
freqüentemente observadas são dadas por pontuações positivas de menores índices e (iii)
as substituições menos freqüentes são pontuadas negativamente.
Uma busca em um banco de dados pode gerar de poucos a milhares de ali-
nhamentos, desta forma, é necessário conhecer quais alinhamentos representam uma
similaridade significativa. No BLAST, dadas duas seqüências A = {a1, . . . , am} e
B = {b1, . . . , bn} contendo m e n números de resíduos, a análise de significância do
alinhamento entre elas é feita por um conjunto de parâmetros exemplificados na Fig. 3.2
e descritos a seguir (Karlin e Altschul, 1990; Altschul et al, 1997; Korf et al, 2003):
5 Gaps são deslocamentos feitos em uma ou nas duas seqüências, de forma a se obter um melhoralinhamento entre elas.
52
Figura 3.1: Esquema apresentando parte da matriz BLOSUM62.
É uma matriz simétrica 20 × 20 contendo todas as possíveis identidades e substituições existentes entreos 20 aminoácidos mais comumente encontrados na natureza, observadas em alinhamentos múltiplos deseqüências de famílias protéicas com até 62% de identidade. A diagonal principal da matriz consiste nasidentidades residuais e possuem pontuações positivas de maiores índices, as substituições freqüentementeobservadas são dadas por pontuações positivas de menores índices e as substituições menos freqüentessão pontuadas negativamente.Fonte: http://folding.stanford.edu/education/s.html.
(1) Raw Score (S): é o somatório de cada pontuação sij obtida a partir do alinha-
mento entre os resíduos ai e bj . Este não é considerado o melhor índice de
comparação, uma vez que as matrizes de pontuação de cada alinhamento po-
dem apresentar grandezas diferentes. O raw score é calculado pela seguinte
equação:
S =∑ij
sij = logqijpipj
(3.1)
onde qij é a freqüência do pareamento entre o resíduo ai da seqüência de busca
A e o resíduo bj da seqüência B depositada no banco de dados, pi = p(ai) é a
probabilidade do resíduo ai e pj = p(bj) a probabilidade do resíduo bj .
(2) Bit Score (S ′): é a normalização do raw score S. Este índice pode ser compará-
vel uma vez que as pontuações são convertidas para uma mesma base, através
da equação
53
S ′ =λS − lnK
ln2(3.2)
onde λ e K são parâmetros calculados de acordo com o algoritmo proposto
por Karlin e Altschul (1990), considerando as probabilidades dos valores de
pontuação dependentes de sij .
(3) Esperança (E-value): é a chance de que uma pontuação tão boa quanto a do
alinhamento entre a seqüência alvo e uma seqüência do banco de dados, seja
encontrada ao acaso no alinhamento entre seqüências aleatórias. O E-value (E)
é dado por
E = mn2−S′(3.3)
onde m é o número de resíduos da seqüência de busca A e n o número de re-
síduos da seqüência B depositada no banco de dados. No caso do alinhamento
de uma seqüência de busca contra todas as seqüências depositadas no banco de
dados, n correponde ao número total de resíduos no banco de dados.
No entanto, mesmo considerando-se os alinhamentos de maior significância, os
resultados provenientes de buscas em bancos de dados grandes são consideravelmente
extensos, tornando-se impraticável a sua rápida inspeção manual. Como solução a este
inconveniente, foi desenvolvido pelo Laboratório de Genômica Funcional e Bioinfor-
mática (FIOCRUZ), o BioParser (Catanho et al, 2006), um programa em linguagem
de programação Perl, que usa o conjunto de ferramentas BioPerl (Stajich et al, 2002)
para analisar os resultados do BLAST, filtrá-los de acordo com atributos desejados e
armazená-los em arquivos de saída de fácil manuseio (Fig. 3.3).
Para a construção de uma primeira lista de possíveis alvos moleculares para o
tratamento da doença de Chagas, foram aplicadas ferramentas computacionais às pro-
teínas preditas a partir da seqüência genômica de Trypanosoma cruzi (cepa CL Brener),
54
Figura 3.2: Parte de um arquivo de saída apresentando o resultado de um BLASTP.---------------------------------------------------------------------------------------
BLASTP 2.2.10 [Oct-19-2004]
Query= 1ME4M ||cruzipain II by comparative modelling with 1ME4(214 letters)
Database: tcxtc_filter_i95_nonredundant.fasta20,679 sequences; 9,201,748 total letters
>8091.m00003 ||Tc00.1047053509401.30|cysteineproteinase|t_cruzi|chr_0|1047053509401|809Length = 500
Score = 366 bits (939), Expect = e-102Identities = 176/214 (82%), Positives = 188/214 (87%)
Query: 1 APAAKDWREEGAVTAVKNQGICGSCWAFAAIGNIEGQWFLAGNPLTRLSEQMLVSCDNTN 60APAAKDWREEGAVTAVKNQG+CGSCWAFAAIGNIE QWFLAGNPLTRLSEQMLVSCDNTN
Sbjct: 156 APAAKDWREEGAVTAVKNQGMCGSCWAFAAIGNIECQWFLAGNPLTRLSEQMLVSCDNTN 215
Query: 61 SGCGGGLSSKAFEWIVQENNGAVYTEDSYPYHSCIGIKLPCKDSDRTVGATITGHVELPQ 120SGCGGG AF+WIV NNG VYTE+SYPYHSCIGI PC S TVGATITG+V +P+
Sbjct: 216 SGCGGGWPLVAFKWIVDRNNGTVYTEESYPYHSCIGISPPCTTSGHTVGATITGYVTIPR 275
Query: 121 DEAQIAASGAVKGPLSVAVDASSWPPYTGGVLTNCVSKRLSHAVLLVGYNDSAAVPYWII 180DE IAA AV GP++V VDASSW YTGGV+T+CVSK+LSHAVLLVGYNDSA VP+WII
Sbjct: 276 DENGIAAWLAVNGPVAVVVDASSWIFYTGGVMTSCVSKQLSHAVLLVGYNDSATVPHWII 335
Query: 181 KNSWTTHWGEGGYIRIAKGSNQCLVKEEVSSAVV 214KNSWTTHWGE GYIRIAKGSNQCLVKE VSSAVV
Sbjct: 336 KNSWTTHWGEDGYIRIAKGSNQCLVKEGVSSAVV 369---------------------------------------------------------------------------------------
BLASTP é um programa que usa o algoritmo BLAST para comparar seqüências protéicas.O BLAST (Basic Local Alignment Search Tool) (Altschul et al, 1990), é um grupo de programas elabo-rado para executar buscas por similaridade entre uma ou mais seqüências alvos e seqüências depositadasem bancos de dados nucleotídicos e protéicos. A análise de significância é feita pelos seguintes parâme-tros apresentados nesta figura: Score que é o valor do Raw Score de acordo com a Eq. (3.1), bits queé o Bit Score dado pela Eq. (3.2) e Expect que é o E-value dado pela Eq. (3.3). O termo Identitiesequivale ao número de resíduos idênticos ao longo do alinhamento e Positives ao número de resíduosidênticos mais o número de resíduos similares ao longo do alinhamento.
visando determinar quais seqüências podem ter suas estruturas tridimensionais modela-
das por técnicas de modelagem comparativa, e destas quais apresentam características
enzimáticas.
Por tratar-se de um organismo diplóide, primeiramente, verificou-se possíveis re-
dundâncias de anotação através do programa BLASTP (usa o algoritmo BLAST para
comparar seqüências protéicas) (versão 2.2.10), alinhando-se todas contra todas as CDS
(Seqüência Codificante) de T. cruzi, obtidas do banco de dados público TcruziDB (http://
TcruziDB.org - versão TCA1.pep) (Luchtan et al, 2004). Foi usada a matriz de pon-
tuação padrão (BLOSUM62) e como corte de significância de alinhamento um E-value
55
Figura 3.3: Página de navegação on-line do BioParser.
Interface web do BioParser apresentando suas opções de filtro, dados de saída e campo para inserção debusca em formato SQL (Structured Query Language).Imagem retirada do endereço web http://www.dbbm.fiocruz.br/BioParser.html.
≤ 10e−5. O resultado deste alinhamento foi submetido ao BioParser (versão 1.2.3) que
filtrou os dados segundo os valores de identidade entre as seqüências (≤ 95%).
3.2 Construção de Modelos Protéicos Tridimensionais via MHOLline
Para a construção dos modelos estruturais de proteínas de T. cruzi, usou-se o
MHOLline (Rössle, 2004), um workflow6 científico desenvolvido em linguagem de
programação Perl, para automatizar os processos de predição de estruturas protéicas e
anotação funcional. Este programa é capaz de extrair informações sobre a estrutura de
uma proteína a partir da análise de sua seqüência, mesmo em projetos de anotações de
genomas em grande escala (Cavalcanti et al, 2005).
O MHOLline é composto por um conjunto de programas científicos de domínio
6 Workflow: de acordo com a WFMC (The Workflow Management Coalition), trata-se da automati-zação de parte ou de todo um processo computacional, no qual documentos, informações ou tarefas sãopassados de um participante do processo a outro, por meio de uma ação interligante que segue regraspré-estipuladas.
56
público, usados nas diferentes etapas de construção de modelos de estruturas protéi-
cas por modelagem comparativa, bem como em estudos de biologia computacional.
Parte destes programas estão organizados seqüencialmente de forma que a saída de um
programa serve como dado de entrada para o próximo, e assim sucessivamente, até a
obtenção do modelo final com sua análise de qualidade. É importante lembrar que o
processo pode ser interrompido em cada uma das etapas em função do tipo de análise
que se deseja realizar. A outra parte dos programas funciona independentemente de
forma a adicionar informações ao conjunto de dados em estudo, como a predição de
regiões transmembranares e de estruturas secundárias (Rössle, 2004).
Como descrito na subseção 1.4, o método de modelagem comparativa consiste
basicamente de quatro etapas: (i) identificação de referências, (ii) alinhamento entre
seqüências, (iii) construção do modelo e (iv) validação do modelo. No MHOLline estas
etapas estão integradas de forma automatizada, sendo executadas da seguinte maneira:
• No processo de identificação de estruturas de referência para a construção de
modelos, o MHOLline usa o algoritmo BLAST (versão 2.2.10) que efetua o
alinhamento local entre as seqüências alvos e seqüências protéicas resolvi-
das experimentalmente e depositadas no banco de dados PDB (Protein Data
Bank) (Berman et al, 2000; Westbrook et al, 2002). Como entrada para o
programa, usa-se um arquivo no formato FASTA (Fig. 3.4) que é composto por
uma linha contendo o identificador de uma nova seqüência, representado pelo
sinal “>”, seguido do nome da seqüência, e por demais linhas apresentando a
seqüência propriamente dita.
Figura 3.4: Exemplo de uma seqüência protéica no formato FASTA.
---------------------------------------------------------------------->1ME4M ||cruzipain II by comparative modelling with 1ME4APAAKDWREEGAVTAVKNQGICGSCWAFAAIGNIEGQWFLAGNPLTRLSEQMLVSCDNTNSGCGGGLSSKAFEWIVQENNGAVYTEDSYPYHSCIGIKLPCKDSDRTVGATITGHVELPQDEAQIAASGAVKGPLSVAVDASSWPPYTGGVLTNCVSKRLSHAVLLVGYNDSAAVPYWIIKNSWTTHWGEGGYIRIAKGSNQCLVKEEVSSAVV----------------------------------------------------------------------
A primeira linha é caracterizada como linha de identificação de seqüência sendo composta por um iden-tificador (o sinal “>”) e o nome da seqüência. As demais linhas representam a seqüência em questão.
57
• A construção dos alinhamentos globais e dos modelos 3D são feitos de forma
automatizada via programa Modeller (versão 8.0) (Sánchez e Sali, 1997). Este
programa constrói os modelos protéicos por modelagem comparativa, usando
o método de modelagem por satisfação de restrições espaciais. O Modeller
é executado em diferentes tarefas começando pelo alinhamento entre seqüên-
cias, geração de um modelo primário que terá sua geometria conformacional
otimizada segundo sua energia potencial, gerando, por fim, o modelo 3D final.
• A qualidade de cada modelo gerado é avaliada de acordo com o empacotamento
global da proteína, usando o programa Procheck (versão 3.4) (Laskowski et al,
1993). Ele gera gráficos de Ramachandran (Ramakrishnan, 2001) que possibi-
litam a análise dos ângulos φ e ψ de todos os resíduos, verificando quais deles
encontram-se fora das regiões energeticamente favoráveis. Além disto, é capaz
de identificar possíveis erros estereoquímicos locais, de acordo com a análise
do esqueleto peptídico e das cadeias laterais dos resíduos.
Conforme apresentado na Fig. 1.12, um gráfico de Ramachandran é divido em
regiões energeticamente muito favoráveis, favoráveis, pouco favoráveis e des-
favoráveis. Para que um modelo seja considerado de boa qualidade deve apre-
sentar mais de 85% de seus resíduos (excluindo as glicinas, prolinas e resíduos
de porções terminais) em regiões muito favoráveis, e a soma destes com os
das regiões favoráveis deve ser > 95%. A Fig. 3.5 exemplifica um resultado
fornecido pelo Procheck de um modelo considerado de boa qualidade estere-
oquímica.
3.2.1 Refinamento na Busca da Estrutura Molde
A busca da estrutura molde é considerada uma etapa chave para a construção de
um modelo protéico, desta forma, foi desenvolvido no MHOLline um programa cha-
mado BATS (BLAST Automatic Targeting for Structures) (Rössle, 2004). O BATS é
capaz de identificar seqüências às quais as técnicas de modelagem comparativa podem
ser aplicadas, escolhendo dentre estas qual é a melhor estrutura a ser usada como molde
58
Figura 3.5: Exemplo de análise do Procheck classificando um modelo 3D como de boa qualidade.
----------------------------------------------------------------------R A M A C H A N D R A N P L O T S T A T I S T I C S
Residues in most favoured regions [A,B,L] 155 86.6%Residues in additional allowed regions [a,b,l,p] 22 12.3%Residues in generously allowed regions [~a,~b,~l,~p] 0 0.0%Residues in disallowed regions [XX] 2 1.1%
--- ------Number of non-glycine and non-proline residues 179 100.0%
Number of end-residues (excl. Gly and Pro) 4
Number of glycine residues 23Number of proline residues 7
---Total number of residues 213
----------------------------------------------------------------------
A primeira linha descreve os resíduos em regiões muito favoráveis, a segunda linha os favoráveis, aterceira os pouco favoráveis e a quarta os resíduos em regiões desfavoráveis.
para a construção de um modelo. Esta escolha é feita através da análise de suas pon-
tuações, E-values e identidades e similaridades entre seqüências, obtidas dos resultados
fornecidos pelo BLAST. Além disto, o BATS constrói os arquivos de entrada para a
construção automática dos alinhamentos globais e dos modelos, via Modeller.
Como primeira etapa, o BATS filtra os resultados provenientes do BLAST e
deposita-os em um banco de dados próprio, o MHOLdb, conforme apresentado na
Tab. 3.2. As informações a serem armazenadas em cada coluna C são: (C1) o nome
da seqüência alvo, (C2) o número de aminoácidos desta seqüência, (C3) o código PDB
da seqüência similar, (C4) o número de resíduos da seqüência similar, (C5) número de
gaps produzidos pelo alinhamento, (C6) a porcentagem de identidade calculada pelo
BLAST, (C 7) a porcentagem de similaridade calculada pelo BLAST, (C8) o número de
aminoácidos alinhados e (C9) o E-value calculado pelo BLAST.
Após esta filtragem, o BATS inicia a etapa de pontuação das seqüências, que ser-
virá para determinar a melhor estrutura molde para a geração do modelo 3D. Esta pontu-
ação final é determinada pelos valores filtrados do BLAST para número de aminoácidos
alinhados, identidade e similaridade, e por mais dois índices calculados pelo BATS, o
LVI (Lenght Variation Index) e o GRSI (Gap Relative Strengh Index), exemplificados
na Tab. 3.3.
59
Tabela 3.2: Exemplo de resultado de BLAST filtrado pelo BATS e depositado no banco de dadosMHOLdb.
1a Etapa do BATSC1 C2 C3 C4 C5 C6 C7 C8 C9
ALVO NAaM PDB NAs
O GAPS %IDENT %SIMIL NAalnN E-VALUE
2194 1045 1S0J 648 43 33 49 617 1e-752194 1045 1MS5 648 43 33 48 617 4e-752194 1045 2AH2 648 43 33 48 617 5e-752194 1045 1N1Y 641 43 32 48 613 2e-742194 1045 1WCS 641 43 32 48 613 3e-742194 1045 1MZ6 638 43 32 47 613 2e-73
C# corresponde a uma coluna do banco de dados MHOLdbMNAa: Número de aminoácidos da seqüência alvoONAs: Número de aminoácidos da seqüência similar encontrada no PDBNNAaln: Número de aminoácidos alinhados entre as seqüências
O LVI, depositado na coluna 10 (C10) do MHOLdb, é usado para identificar
dentre as seqüências similares, a que possui um número de aminoácidos mais parecido
com o número de aminoácidos que constitui a seqüência alvo. O valor de LVI para o
alinhamento de duas seqüências a e s é dado por
LV I =NAa −NAs
NAa
(3.4)
sendo NAa o número de aminoácidos da seqüência alvo e NAs o número de aminoáci-
dos da seqüência similar encontrada no PDB.
O GRSI de cada alinhamento é depositado em (C11) no MHOLdb, e serve para
identificar dentre as seqüências similares, as que possuem o menor número de gaps
posicionados de forma pouco dispersa ao longo do alinhamento com a seqüência alvo.
O seu valor é dado por
GRSI =NGa +NGg
NAa
(3.5)
onde NGa é o número de gaps em que os vizinhos sejam aminoácidos e NGg o número
de gaps em que os vizinhos também sejam gaps.
Após os cálculos de LVI e GRSI para cada seqüência depositada no MHOLdb, o
BATS classifica cada seqüência similar, de acordo com a qualidade de seus valores. Os
60
Tabela 3.3: Exemplo de valores de LVI e GRSI calculados pelo BATS e depositados no banco de dadosMHOLdb.
2a Etapa do BATSC1 C3 C10 C11
ALVO PDB LVI† GRSI‡
2194 1S0J 0,3799 0,07752194 1MS5 0,3799 0,07752194 2AH2 0,3799 0,07752194 1N1Y 0,3866 0,06992194 1WCS 0,3866 0,06992194 1MZ6 0,3895 0,0699
C# corresponde a uma coluna do banco de dados MHOLdb†LVI: Lenght Variation Index dado pela Eq. (3.4)‡GRSI: Gap Relative Strengh Index dado pela Eq. (3.5)
valores de identidade, similaridade e número de aminoácidos alinhados são classifica-
dos de forma decrescente, sendo os maiores valores melhor classificados. Os valores de
LVI e GRSI são classificados em ordem crescente, recebendo melhor classificação os
menores valores calculados. Os 5 primeiros colocados de cada valor, assumindo empa-
tes, recebem uma pontuação decrescente P , de forma que o(s) primeiro(s) colocado(s)
receba(m) 5 pontos e o(s) quinto(s) colocado(s) apenas 1 ponto. Os demais colocados, a
partir da quinta posição, recebem 0 ponto. Cada um desses pontos será multiplicado por
um peso W de acordo com o tipo de valor associado. A pontuação final Sf é armaze-
nada na coluna 12 (C12) do MHOLdb, conforme apresentado na Tab. 3.4, e é calculada
pela seguinte expressão
Sf = WiPi +WsPs +WnPn +WlPl +WgPg (3.6)
ondeWi, Ws, Wn, Wl eWg são, respectivamente, os pesos de identidade, similaridade,
número de aminoácidos alinhados, LVI e GRSI, e Pi, Ps, Pn, Pl e Pg correspondem a
pontuação atribuída a identidade, similaridade, número de aminoácidos alinhados, LVI
e GRSI, respectivamente.
A terceira e última etapa, consiste em agrupar as seqüências similares em três
grupos e armazená-las em (C13) no MHOLdb, como apresentado na Tab. 3.5:
• G1: todas as seqüências alvos que não encontrarem seqüências similares no
61
Tabe
la3.
4:E
xem
plo
depo
ntua
ção
final
calc
ulad
ape
loB
AT
Spa
raos
tipos
deal
inha
men
tos
entr
ese
qüên
cias
.
2aE
tapa
doBA
TS
(con
tinua
ção)
C1
C3
C6
C7
C8
C10
C11
C12
ALV
OPD
B%
IDE
NT
Wi
Pi
%SI
MIL
Ws
Ps
NA
aln
NW
nP
nLV
I†W
lP
lG
RSI
‡W
gP
gS f
H
2194
1S0J
331,
05
491,
15
617
1,0
50,
3799
2,0
50,
0775
1,0
429
,521
941M
S533
1,0
548
1,1
461
71,
05
0,37
992,
05
0,07
751,
04
28,4
2194
2AH
233
1,0
548
1,1
461
71,
05
0,37
992,
05
0,07
751,
04
28,4
2194
1N1Y
321,
04
481,
14
613
1,0
40,
3866
2,0
40,
0699
1,0
525
,421
941W
CS
321,
04
481,
14
613
1,0
40,
3866
2,0
40,
0699
1,0
525
,421
941M
Z6
321,
04
471,
13
613
1,0
40,
3895
2,0
30,
0699
1,0
522
,3C
#co
rres
pond
ea
uma
colu
nado
banc
ode
dado
sM
HO
Ldb
NN
Aaln
:Núm
ero
deam
inoá
cido
sal
inha
dos
entr
eas
seqü
ênci
as† L
VI:
Leng
htVa
riat
ion
Inde
xda
dope
laE
q.(3
.4)
‡ GR
SI:G
apR
elat
ive
Stre
ngh
Inde
xda
dope
laE
q.(3
.5)
HS f
:Pon
tuaç
ãofin
alca
lcul
ada
pelo
BA
TS
deac
ordo
com
aE
q.(3
.6)
Weq
uiva
leao
peso
deca
dapo
ntua
çãoP
62
PDB. Estas seqüências não continuam no processamento do workflow.
• G2: seqüências alvos que apresentam similaridade > 25% e podem ter seus
modelos tridimensionais construídos via Modeller, continuando o processa-
mento seqüencial do workflow.
• G3: seqüências com baixa similaridade (< 25 − 30%) seguirão pelo proces-
samento idenpendente de forma a se obter informações sobre o seu tipo de
enovelamento e possíveis características funcionais.
Tabela 3.5: Exemplo de classificação do BATS para os tipos de alinhamentos entre seqüências.
3a Etapa do BATSC1 C3 C7 C13
ALVO PDB %SIMIL GRUPO2194 1S0J 49 G22194 1MS5 48 G22194 2AH2 48 G22194 1N1Y 48 G22194 1WCS 48 G22194 1MZ6 47 G2
C# corresponde a uma coluna do banco de dados MHOLdb
Ao final destas etapas, o BATS irá selecionar apenas um molde para a construção
do modelo de cada alvo, no caso o que tiver sido classificado como pertencente a G2
e que apresentar a melhor pontuação final Sf . Tomando-se como exemplo as Tabs. 3.4
e 3.5, a seqüência 1S0J seria selecionada como molde para a construção do modelo da
seqüência alvo 2194, uma vez que dentre as seqüência do grupo G2 é a que apresenta
maior pontuação final Sf = 29, 5. O melhor molde de cada seqüência e a seqüência a ser
modelada, são conjuntamente armazenados em um arquivo em formato FASTA, e então
submetido ao Modeller para a geração do modelo e subseqüentemente ao PROCHECK
para a avaliação da qualidade do modelo gerado.
Mesmo escolhendo-se apenas um molde para a construção do modelo de cada
alvo, o MHOLline fornece o alinhamento múltiplo entre as seqüências de todos os pos-
síveis moldes através do programa T-Coffee (versão 2.0) (Notredame et al, 2000). Em
63
alguns casos, o alinhamento múltiplo pode ser muito útil, principalmente, quando a agre-
gação das informações de vários moldes é usada para a construção de um modelo final
mais refinado, da mesma forma que é feita em análises funcionais de famílias protéicas.
No MHOLline, o processo de predição de estruturas secundárias é feito através
do programa PsiPred (versão 2.0) (McGuffin et al, 2000). enquanto a designação de
regiões transmembranares é feita através do programa HMMTOP (Hidden Markov Mo-
del for Topology Prediction) (versão 2.0) (Tusnady e Simon, 2001). Para as seqüências
em G3 que não possuam regiões transmembranares, é aplicado o programa THREA-
DER (versão 3.0) (Miller et al, 1996), que usa o banco de dados SCOP (versão 1.71),
para fazer a busca por tipos de enovelamentos que estas seqüências possam assumir,
objetivando inferir-lhes características funcionais.
Em resumo, para cada seqüência alvo submetida ao MHOLline, este consegue
gerar e agregar informações estruturais a partir de alinhamentos entre seqüências, ge-
rar um modelo tridimensional com suas coordenadas espaciais, fornecer o gráfico de
Ramachandran apontando a qualidade estereoquímica do modelo, gerar o alinhamento
múltiplo entre todos os candidatos a molde para um possível refinamento na estrutura do
modelo gerado, predizer sua estrutura secundária, além de detectar regiões transmem-
branares e inferir seus tipos de enovelamento. A Fig. 3.6 resume cada uma das etapas
do MHOLline de acordo com a participação de cada programa.
Desta forma, as seqüências não redundantes de T. cruzi foram submetidas ao
MHOLline, sendo alinhadas, via BLASTP, contra todas as seqüências protéicas depo-
sitadas no PDB até janeiro de 2006, usando como parâmetro de exclusão seqüências
com E-value ≤ 10e−5. Os alinhamentos foram analisados via BATS, calculando-se as
pontuações finais e determinando-se os grupos G1, G2 e G3 da seguinte forma:
• G1: seqüências com identidade < 15% e E-value > 10e−4.
• G2: seqüências cujos alinhamentos apresentaram identidade ≥ 25%, E-value
≤ 10e−5 e LVI ≥ 70%.
• G3: seqüências com identidade ≥ 15% e < 30% e E-value > 10e−4.
64
Figura 3.6: Esquema representando o fluxo de dados em todas as etapas de funcionamento do workflowMHOLline.
Dado um arquivo de entrada contendo as enzimas a serem modeladas (no formato FASTA),o MHOLline aciona diferentes programas para cada etapa de análise. Em quadrados azuisestão destacados o banco de dados SCOP e os programas de domínio público: BLAST, HMM-TOP, PsiPred, Modeller, Prochek, T-Coffee e Threader. O programa BATS, implementado noMHOLline, está representado em amarelo. Os losangos verdes representam os grupos definidospelo MHOLline, determinando os conjuntos enzimáticos que serão submetidos a cada etapa doworkflow‡. Os resultados de cada programa encontram-se em elipses laranjas.‡Workflow: de acordo com a WFMC (The Workflow Management Coalition), trata-se da auto-matização de parte ou de todo um processo computacional, no qual documentos, informaçõesou tarefas são passados de um participante do processo a outro, por meio de uma ação interli-gante que segue regras pré-estipuladas.Fonte: Fluxograma baseado em Rössle (2004).
65
O resultado do BATS foi submetido ao Modeller, para a geração dos modelos tri-
dimensionais, os quais foram agrupados de acordo com os critérios de qualidade apre-
sentados na tabela a seguir:
Tabela 3.6: Classificação dos modelos construídos via MHOLline, de acordo com os valores de identi-dade e cobertura† apresentados no alinhamento entre as seqüências alvo e molde.
Classificação (Qualidade) Identidade Cobertura†1. Muito Alta Qualidade ≥ 75% ≥ 90%2. Alta Qualidade ≥ 50% e < 75% ≥ 90%3. Boa Qualidade ≥ 50% ≥ 70% e < 90%4. Média a Boa Qualidade ≥ 35% e < 50% ≥ 70%5. Média a Baixa Qualidade ≥ 25% e < 35% ≥ 70%6. Baixa Qualidade ≥ 25% ≥ 50% e < 70%
†Cobertura: neste trabalho, foi usado o valor de LVI como definição de cobertura
3.3 Classificação Enzimática de Modelos Protéicos Tridimensionais de Trypa-
nosoma cruzi
Os 2.786 modelos construídos foram submetidos ao programa ECNGet, desenvol-
vido nesta dissertação, em linguagem de programação C. O ECNGet foi implementado
para detectar de forma automática o número que determina a classificação enzimática
(EC) de uma seqüência protéica, de acordo com o NC-IUBMB (Nomenclature Commit-
tee of the International Union of Biochemistry and Molecular Biology - disponível em
http://www.chem.qmul.ac.uk/iubmb/enzyme/).
Para isto, o programa usa o código PDB do molde como parâmetro de busca e as-
sociação a um número EC. Através do banco de dados pdb2sp.txt (ftp://beta.rcsb.org/pub/
pdb/uniformity/derived_data/ de fevereiro de 2006), o ECNGet correlaciona cada nú-
mero PDB com o respectivo código Swiss-Prot (Bairoch et al, 2004). Em seguida, asso-
cia o código Swiss-Prot ao respectivo número EC obtido do banco de dados enzyme.dat
(ftp://br.expasy.org/databases/enzyme/release_with_updates/ de fevereiro de 2006). O
ECNGet foi implementado de forma a detectar todo e qualquer EC associado a um có-
digo PDB, identificando inclusive enzimas multi-EC classificadas como sinônimas ou
como bi ou multifuncionais.
Um número EC é determinado por quatro dígitos da forma A.B.C.D, sendo os três
66
primeiros os que definem o tipo de reação catalítica: A é o número da classe enzimática
e refere-se a química da enzima, B e C são, respectivamente, os números da subclasse
e subsubclasse, e especificam os grupos químicos envolvidos na reação como doadores
e aceptores. O quarto dígito representado por D é o número de série que determina a
atividade catalítica em relação ao substrato.
As classes enzimáticas são definidas por seis categorias:
• Oxidorredutases (1. -. -.-): são enzimas que catalisam reações de oxidação-
redução, tendo como representantes as dehidrogenases e redutases.
• Transferases (2. -. -.-): são enzimas do tipo cinases, aminotransferases e tiola-
ses, que catalisam a transferência de grupos funcionais.
• Hidrolases (3. -. -.-): enzimas que catalisam reações de hidrólise, como as
peptidases, glicosidases, lipases e fosfatases.
• Liases (4. -. -.-): catalizam a eliminação ou adição de grupos funcionais com
o objetivo de formar ou quebrar duplas ligações, tendo como representantes
enzimas do tipo sintase, decarboxilase e dehidratase.
• Isomerases (5. -. -.-): são enzimas isomerases ou mutases, que catalisam re-
ações capazes de alterar uma estrutura, sem modificar sua composição ótica,
geométrica ou isomérica.
• Ligases (6. -. -.-): são enzimas que catalisam o acoplamento de dois compostos
com a hidrólise de uma ligação fosfoanidrido. Os principais representates são
enzimas do tipo sintetase, carboxilase e polimerase.
Na figura 3.7 é apresentada a classificação enzimática da cruzipaína, exemplifi-
cando uma numeração EC de acordo com o NC-IUBMB.
67
Figura 3.7: Classificação enzimática da cruzipaína apresentando sua numeração EC de acordo com oNC-IUBMB.---------------------------------------------------------------------------------------
3. -. -.- Hydrolases.3. 4. -.- Acting on peptide bonds (peptide hydrolases).3. 4.22.- Cysteine endopeptidases.ID 3.4.22.51DE Cruzipain.AN Congopain.AN Cruzain.AN Evansain.AN Trypanopain.CA Broad endopeptidase specificity similar to that of cathepsin L.CC -!- Is located in the digestive vacuoles of the parasitic trypanosomeCC and contributes to the nutrition of the organism by digestion ofCC host proteins.CC -!- Belongs to peptidase family C1.PR PROSITE; PDOC00126;DR P25779, CYSP_TRYCR ;
---------------------------------------------------------------------------------------
EC: Enzyme Commission.NC-IUBMB: Nomenclature Committee of the International Union of Biochemistry and Molecular Bio-logy - disponível em http://www.chem.qmul.ac.uk/iubmb/enzyme/.A primeira linha da figura apresenta a numeração da classe enzimática, a segunda se refere a subclassee a terceira a subsubclasse. A quarta linha apresenta a numeração completa composta de quatro dígi-tos, seguida por demais linhas informando a(s) enzima(s) que compõem este EC e o tipo de atividadeenzimática.
3.4 Determinação de Enzimas Análogas entre Trypanosoma cruzi e Homo sapi-
ens via AnEnπ
Como descrito na seção 1.3, o estudo de correlações entre as vias bioquímicas
codificadas no genoma de T. cruzi e no genoma humano é uma importante etapa no
planejamento de fármacos terapeuticamente úteis. Desta forma, os modelos estruturais
de T. cruzi que apresentaram uma classificação enzimática foram investigados quanto a
possíveis similaridades à enzimas de Homo sapiens (U.S. Department of Energy Office
of Science, 2003), visando se evitar a proposição de alvos moleculares que sofreriam
interferência quando tratados com inibidores, nos dois organismos.
Para esta análise, foi usado o AnEnπ (Analoguous Enzyme Pipeline) (Otto et
al, 2006), um programa desenvolvido pelo Laboratório de Genômica Funcional e Bi-
oinformática (FIOCRUZ), que usa o banco de dados KEGG (Kyoto Encyclopedia of
Genes and Genomes - disponível em ftp://ftp.genome.ad.jp/pub/kegg/) (Kanehisa et al,
2006) para a identificação de enzimas análogas entre dois organismos. Enzimas análo-
gas são proteínas capazes de catalisar uma mesma reação enzimática, porém, sem serem
68
ortólogos, nem parálogos. Apresentam estrutura primária sem similaridade, bem como
diferenças em suas estruturas terciárias (Otto et al, 2006). Estas enzimas são resultantes
de eventos evolutivos independentes, em vez de descenderem de uma enzima ancestral
comum (Galperin et al, 1998).
Inicialmente, o AnEnπ constrói um banco de dados de seqüências protéicas obti-
das a partir do banco de dados KEGG e, que tenham um número EC associado a alguma
das 2.314 diferentes classificações enzimáticas com representantes em diversos organis-
mos. Neste trabalho, foram usadas 224.707 seqüências com classificação enzimática,
depositadas no KEGG até fevereiro de 2006. Além disso, para este trabalho, foram
incorporadas ao banco do AnEnπ todas as seqüências protéicas de T. cruzi com mode-
los 3D gerados e associadas a um EC de pelo menos três dígitos (classificação até a
subsubclasse).
A seguir, o AnEnπ agrupa todas as enzimas pertencentes a um EC específico,
de acordo com o método de Galperin et al (1998), excluindo-se do banco todas as
seqüências com menos de 100 aminoácidos, por serem tipicamente fragmentos. Para
cada grupo de atividade enzimática é feito um alinhamento, via BLASTP, de todas con-
tra todas as seqüências integrantes. O resultado deste alinhamento é transformado em
um grafo onde cada enzima representa um nó, e a conexão entre dois nós é feita por
uma aresta não ponderada se as duas enzimas pertencerem a uma mesma classe enzimá-
tica e apresentarem pontuação ≥ 120. Todas as enzimas que estiverem conectadas são
consideradas como pertencentes a um mesmo grupo enzimático e, portanto, homólogas.
Seqüências não conectadas são consideradas como análogas.
Classificações enzimáticas com mais de 15 grupos, o que representa, conseqüen-
temente, 15 possíveis eventos de origem independente, foram consideradas como repre-
sentantes de enzimas multiméricas. Desta forma, as análises de analogia intragenômica
foram feitas excluindo-se tais seqüências (Guimarães, 2006).
Portanto, os modelos protéicos de Trypanosoma cruzi foram classificados da se-
guinte forma: (i) proteínas de T. cruzi e H. sapiens pertencentes a um mesmo grupo den-
tro de uma mesma subsubclasse enzimática, foram classificadas como enzimaticamente
69
similares; (ii) proteínas de T. cruzi e H. sapiens pertencentes a grupos diferentes dentro
de uma mesma subsubclasse enzimática, foram classificadas como possíveis análogas;
(iii) proteínas de T. cruzi integrantes de um ou mais grupos pertencentes a um mesmo
EC, no qual não foi encontrado nenhum representante de H. sapiens, foram classificadas
como possíveis específicas de T. cruzi em relação a humanos, o que não exclui sua simi-
laridade ou analogia com enzimas de outros organismos. Exemplos destas classificações
fornecidas pelo AnEnπ são apresentados na Tab. 3.7.
Tabela 3.7: Exemplo de resultado do AnEnπ mostrando seqüências de T. cruzi similares, possíveisanálogas e possíveis específicas a este organismo, em relação a enzimas humanas.
Homo sapiens Trypanosoma cruziNúmero Número Número Número Número Seqüência de
EC‡ do Grupo de Enzimas do Grupo de Enzimas T. cruzi1.11.1 1a 7 1a 4 TCR:7366.m00001
TCR:6148.m00006TCR:4808.m00011TCR:4808.m00013
2 6 - -3 1 - -- - 6b 1 TCR:8655.m00004- - 7b 2 TCR:4731.m00003
TCR:6846.m000068 4 - -
1.13.12 Not found in HSA 1c 3 TCR:4646.m00005TCR:4947.m00002TCR:7108.m00010
‡EC: Enzyme Commission. Classificação de acordo com NC-IUBMB (Nomencla-ture Committee International Union of Biochemistry and Molecular - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).aSimilares: proteínas de T. cruzi e H. sapiens pertencentes a um mesmo grupo (grupo 1) dentrode uma mesma subsubclasse enzimática (EC: 1.11.1).bPossíveis Análogas: enzimas de T. cruzi pertencentes a um grupo (grupos 6 e 7) sem repre-sentantes de H. sapiens, porém, com enzimas humanas pertencentes a outros grupos dentro deum mesmo EC (EC: 1.11.1).cPossíveis Específicas: enzimas de T. cruzi integrantes de um ou mais grupos (grupo 1) dentrode uma mesma classificação enzimática (EC: 1.13.12) que não possua qualquer representanteenzimático de H. sapiens.
Um resumo das metodologias aplicadas no estudo do genoma de T. cruzi para
a construção de seus modelos estruturais protéicos, caracterização dos modelos com
perfil enzimático e estudos evolutivos para a detecção de enzimas similares e análogas
em relação as enzimas humanas, está descrito na Fig. 3.8.
70
Figu
ra3.
8:E
sque
ma
apre
sent
ando
ore
sum
oda
sm
etod
olog
ias
aplic
adas
nael
abor
ação
deum
apr
imei
ralis
tade
poss
ívei
sal
vos
mol
ecul
ares
para
otr
atam
ento
dado
ença
deC
haga
s.
Fer
ram
enta
s de
Bio
info
rmát
ica
BL
AST
, Bio
Par
ser
Fer
ram
enta
s de
Mod
elag
em
Com
put
acio
nal
MH
OL
Lin
e
EC
NG
et
2. G
eraç
ão d
e M
odel
os 3
D:
• Seq
uênc
ias
não
redu
ndan
tes
de T
. cr
uzi s
ubm
etid
as a
o M
HO
LL
ine
e al
inha
das
cont
ra to
das
as s
equê
ncia
s pr
otéi
cas
do P
DB
(E
-val
ue 1
0e-5)
para
ge
raçã
o e
clas
sifi
caçã
o qu
alit
ativ
a de
m
odel
os.
3. C
lass
ific
ação
Enz
imát
ica:
• Mod
elos
ger
ados
sub
met
idos
ao
EC
NG
et p
ara
a as
soci
ação
aut
omát
ica
de u
ma
clas
sifi
caçã
o en
zim
átic
a (E
C):
ob
tenç
ão d
e m
odel
os p
roté
icos
com
ca
ract
erís
tica
s en
zim
átic
as
AnE
nπ
4. C
arac
teri
zaçã
o de
Enz
imas
Aná
loga
s a
part
ir d
e E
vent
os E
volu
tivo
s:
• Mod
elos
enz
imát
icos
de
T. c
ruzi
su
bmet
idos
ao
AnE
nπ p
ara
a de
tecç
ão d
e po
ssív
eis
enzi
mas
sim
ilar
es o
u an
álog
as e
m
rela
ção
a en
zim
as h
uman
as (
Hom
o sa
pien
s).
Abo
rdag
ens
Enz
imát
icas
/Evo
luti
vas
1. T
rata
men
to d
e R
edun
dânc
ias:
• BL
AS
TP
de to
das
cont
ra to
das
as
CD
S
(cod
ing
sequ
ence
) de
Try
pano
som
a cr
uzi
(E-v
alue
10e
-5).
• Res
ulta
do f
iltr
ado
pelo
Bio
Par
ser:
id
enti
dade
≤ 9
5% e
E-v
alue
= 1
0e-5.
71
Um dos objetivos deste trabalho é o estudo das isoformas 1 e 2 da cruzipaína
através da técnica de dinâmica molecular. Tratam-se de enzimas com perfil enzimático
bastante investigado experimentalmente, porém, vários aspectos (e.g. comportamentos
enzimáticos a diferentes temperaturas e estabilidade variada do sítio ativo e subsítios)
necessitam de maiores estudos em nível molecular, com o objetivo de auxiliar a eluci-
dação de resultados de complexa ou difícil interpretação.
3.5 Dinâmicas Moleculares da Papaína, Cruzipaína 1 e Cruzipaína 2
A cruzipaína é a cisteíno protease majoritária de T. cruzi, pertencente a família
da papaína. A estrutura cristalográfica da cruzipaína 1 foi resolvida experimental pela
primeira vez por McGrath et al (1995), ao contrário da cruzipaína 2 que ainda não teve
sua estrutura 3D resolvida. Neste trabalho, os estudos de simulação de dinâmica mo-
lecular (DM) da cruzipaína 2 serão feitos a partir do seu modelo tridimensional gerado
por modelagem comparativa, via Modeller (Sánchez e Sali, 1997).
Como controle para as análises do sítio catalítico, optou-se por realizar, também, o
estudo dinâmico da papaína estando sujeita ao mesmo protocolo aplicado às cruzipaínas
1 e 2.
3.5.1 Método de Simulação de Dinâmica Molecular
3.5.1.1 Escolha das Estruturas
As estruturas da papaína e da cruzipaína 1 foram obtidas do banco de dados
PDB (Berman et al, 2000; Westbrook et al, 2002), tomando-se como critérios a re-
solução da estrutura cristalográfica e a conformação usual da GLN19 (i.e conformação
da cadeia lateral necessária para polarizar o grupamento carbonila da ligação peptídica
a ser clivada) (Fig 1.10). Desta forma, foram escolhidas as estruturas 9PAP da papaína
(resolução de 1,65A) (Kamphuis et al, 1984), e 1ME4 da cruzipaína 1 (resolução de
1,20A) (Huang et al, 2003), desconsiderando-se as estruturas de seus ligantes.
O modelo da cruzipaína 2 (1ME4m) foi gerado a partir da seqüência alvo M90067
(Lima et al, 1994), depositada no GenBank (disponível em http://www.ncbi.nlm.nih.gov),
72
e como molde a estrutura 1ME4 da cruzipaína 1, considerando-se apenas a estrutura
protéica. No alinhamento entre as seqüências da M90067 e de diferentes estruturas da
cruzipaína 1 depositadas no PDB, verificou-se que a cruzipaína 2 e a 1ME4 possuem
86% de identidade. A alta similaridade entre estas seqüências associada a alta resolu-
ção da estrutura cristalográfica da 1ME4, permitiu a construção do modelo estrutural da
cruzipaína 2 baseando-se apenas na 1ME4 como molde.
3.5.1.2 Escolha dos Parâmetros
As simulações de dinâmica molecular foram realizadas usando-se o programa
GROMACS (versão 3.2) (van der Spoel et al, 2004) em dupla precisão, e assumindo
o campo de força GROMACS (van Gunsteren e Berendsen, 1987; van der Spoel et al,
2004). Considerando-se os estudos enzimáticos experimentais realizados com a cru-
zipaína, os quais mostram diferenças em sua eficiência enzimática de acordo com as
temperaturas encontradas em seu vetor invertebrado (25◦C = 298K) e em seu hospe-
deiro vertebrado (37◦C = 310K), optou-se por realizar as simulações de DM, para cada
uma das três enzimas, nestas duas temperaturas e com pressão de 1 atm.
O sistema foi simulado em uma caixa cúbica (com arestas de pelo menos 75A),
construída considerando-se uma camada de solvatação de no mínimo 10A em cada di-
mensão da macromolécula, usando-se o modelo de água SPC (Simple Point Charge) (Be-
rendsen et al, 1987). Deste modo, tem-se para a papaína um sistema (proteína + solvente
+ íons) composto por 47.590 átomos e para as cruzipaínas 1 e 2 sistemas com 61.029 e
40.463 átomos, respectivamente. As temperaturas e a pressão do sistema foram manti-
das constantes, aplicando-se o algoritmo de Berendsen (Berendsen et al, 1984). Usou-se
um passo de integração de 2 fs em conjunto com a imposição de restrições de distância
para todas as ligações químicas da macromolécula, via algoritmo LINCS (Hess et al,
1997). Para o tratamento das moléculas de água usou-se o método SETTLE (Miyamoto
e Kollman, 1992) de forma a considerar como fixas as distâncias e os ângulos intramo-
leculares. Maiores detalhes sobre os parâmetros usados nas simulações de DM podem
ser vistos no Apêndice A.
73
Para o tratamento do potencial de Coulomb, aplicou-se o método de Campo de
Reação usando raio de corte Rc = 16A e constante dielétrica εrf = 54, valores esco-
lhidos em função da temperatura e do modelo de água usados, de acordo com estudo
realizado por Smith e van Gunsteren (1994). Já para o potencial de Lennard-Jones, as
interações de van der Waals foram submetidas ao raio de corte Rc = 14A.
Por tratarem-se de enzimas atuantes em ambientes de pH ácido, os resíduos ácidos
(ASP e GLU) e básicos (ARG e LYS), bem como as histidinas, tiveram suas cargas tra-
tadas de forma a simular o ambiente biológico destas enzimas. Além disto, a cisteína do
sítio catalítico (CYS25) também sofreu tratamento de sua carga total, assumindo valor
de -1,0 (CB = -0,2 e SG = -0,8), simulando as condições de favorecimento da formação
do par iônico. As demais cisteínas não participantes de uma ligação dissulfídica foram
consideradas como tendo carga zero. Para neutralizar a carga total dos sistemas, foram
adicionados ao solvente íons cloro (Cl−) ou sódio (Na+), conforme a carga líquida apre-
sentada pela enzima em estudo. Os resíduos com tratamento de carga em cada enzima
são apresentados na Tab. 3.8 e as cisteínas que participam de ligações dissulfídicas estão
descritas na Tab. 3.9.
Em resumo, foram realizadas no total seis diferentes simulações de dinâmica mo-
lecular:
• Papaína (9PAP):
CYS25: carga total de -1,0 nas temperaturas
25◦C
37◦C
• Cruzipaína 1 (1ME4):
CYS25: carga total de -1,0 nas temperaturas
25◦C
37◦C
• Cruzipaína 2 (1ME4m):
CYS25: carga total de -1,0 nas temperaturas
25◦C
37◦C
74
Tabela 3.8: Cargas dos resíduos ácidos e básicos e resíduos de histidina e cisteína da papaína (9PAP),cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m).
Resíduos Carga 9PAP 1ME4 1ME4mÁcidos -1 ASP: 6, 55, 57, 108,
140 e 158GLU: 3, 35, 50, 52,89, 99 e 183
ASP: 6, 18, 57, 60,87, 121, 140, 161 e171GLU: 35, 50, 73, 78,86, 95, 117, 122, 158,190, 191, 207 e 208
ASP: 6, 57, 87, 103,105, 121, 140 e 171GLU: 9, 10, 35, 50,73, 78, 86, 117, 122,190, 207 e 208
Básicos +1 ARG: 8, 41, 58, 59,83, 93, 96, 98, 111,145, 188 e 191LYS: 10, 17, 39, 100,106, 139, 156, 174,190 e 211
ARG: 8, 10 e 195
LYS: 17, 58, 181,198 e 206
ARG: 8, 47, 106, 159e 195
LYS: 5, 17, 70,98, 102, 132, 158,181, 198 e 206
Histidinas +1 HIS: 81 e 159 HIS: 43, 106, 115 e162
HIS: 92, 115, 162 e187
Cisteínas 0 CYS: - CYS: 36 CYS: 94Carga Líquida +11 -10 -1Total com CYS25 -1 +10 -11 -2Íons adicionados +10 Cl− +11 Na+ +2 Na+
Tabela 3.9: Resíduos de cisteína que participam de ligações dissulfídicas (S-S) na papaína (9PAP),cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m).
Enzimas Resíduos de Cisteína (S-S)9PAP 22-63, 56-95, 153-2001ME4 22-63, 56-101, 155-2031ME4m 22-63, 56-101, 155-203
75
3.5.1.3 Otimização do Sistema
A minimização da energia potencial do sistema foi realizada aplicando-se o algo-
ritmo de Steepest Descent, em duas etapas:
(1) Tratamento do Solvente: para a acomodação das águas, realizou-se uma mini-
mização do solvente mantendo-se a proteína restrita.
(2) Tratamento do Sistema: nenhuma restrição foi aplicada, sendo todo o sistema
(proteína e solvente) submetido ao método de otimização.
3.5.1.4 Equilibração do Sistema
Para a equilibração do sistema foram executadas duas simulações de dinâmica
molecular:
(1) Equilibração do Solvente: restringiu-se a movimentação da proteína mantendo-
se as moléculas de água livres para a acomodação em camadas de solvatação
em torno da proteína. Esta dinâmica transcorreu por 0,5 ns.
(2) Equilibração do Sistema: nenhuma restrição foi aplicada ao sistema, permitindo-
se a acomodação de todos os átomos às condições físicas aplicadas ao sistema.
Esta simulação foi efetuada durante 1,0 ns.
3.5.1.5 Simulações de DM para análises
Após a otimização e equilibração dos sistemas, iniciaram-se as simulações de
dinâmica molecular usadas para as análises estruturais da papaína (9PAP), cruzipaína 1
(1ME4) e cruzipaína 2 (1ME4m). Cada uma das seis simulações de DM para análises,
transcorreram por 10 ns. Os tipos de análises e métodos empregados estão descritos a
seguir:
• Verificação da Estabilidade do Sistema: para o monitoramento da estabilidade
do sistema, acompanhou-se a variação média da energia total por átomo do
sistema (Kcal/mol/átomo), usando-se o comando g_energy_d do GROMACS.
76
• Análise de Alterações na Estrutura Secundária: a análise de possíveis perdas ou
ganhos de estruturas secundárias (hélices, folhas e voltas) foi realizada através
do monitoramento das porcentagens de cada um dos três tipos de estrutura ao
longo da DM. Para isto, usou-se o programa RIBBONS (versão 3.3) (Carson e
Bugg, 1986).
• Análise de Variações na Estrutura Protéica: para verificar possíveis alterações
conformacionais nas proteínas ao longo do tempo, foi calculado o desvio médio
quadrático (RMSD), de acordo com a Eq. (1.1), do esqueleto peptídico em re-
lação ao cristal/modelo, ao longo do tempo, usando-se o comando g_rms_d do
GROMACS. Além disso, foram analisadas possíveis flutuações de cada resíduo
da proteína, calculando-se a flutuação média quadrática (RMSF, i.e. desvio pa-
drão) dos Cα ao longo do tempo, através do comando g_rmsf_d do GROMACS.
• Análise da Superfície Acessível ao Solvente (SAS): para verificar possíveis
alterações na interface dielétrica proteína/solvente, foi feita a análise da super-
fície dos resíduos proteícos acessíveis a água ao longo da simulação de DM. A
SAS é definida como sendo a superfície traçada pelo centro de uma sonda es-
férica imaginária, representando uma molécula do solvente, ao ser rolada sobre
a parte exterior da superfície formada pela união das esferas de van der Waals
dos átomos da proteína (Lee e Richards, 1971).
Para o cálculo da superfície acessível ao solvente foi usado o algoritmo de
Connolly (Connolly, 1983) implementado no programa MDS (Molecular Dot
Surface) (Connolly, 1986). Dado um arquivo de entrada contendo as coorde-
nadas espaciais dos átomos que constituem a molécula de estudo, os raios de
van der Waals associados a estes átomos, o raio da sonda esférica e a densidade
desejada de pontos por A2 da SAS, o MDS gera um conjunto de pontos rela-
tivos à SAS e para cada ponto são geradas as coordenadas espaciais (x, y, z),
as coordenadas do vetor normal externo à superfície (nx, ny, nz) e uma área
aproximada da superfície associada a este ponto.
77
Neste trabalho foi desenvolvido o programa SASCalc, escrito em linguagem C,
que usa o MDS como rotina principal e como parâmetros de entrada um arquivo
no formato PDB (com hidrogênios polares já inclusos) e, os valores do raio da
sonda (Rs = 1,4 A) e da densidade de pontos desejados. Os raios de van der
Waals são associados aos respectivos átomos de forma automática, assumido-
se os valores calculados por Bondi (1964). Como o GROMACS considera
os hidrogênios apolares como átomos unidos, os valores dos raio de van der
Waals para estes casos foram obtidos de (Li e Nussinov, 1998) e tratados em
uma tabela diferenciada.
Para o estudo de possíveis alterações na conformação terciária das enzimas
papaína (9PAP), cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m), foram moni-
toradas as médias e desvios padrões da SAS de seus triptofanos (TRP). Estes
resíduos são usados em estudos por fluorescência, para a análise de alterações
na conformação estrutural de proteínas, verificando-se o aumento ou a dimi-
nuição de sua exposição ao solvente. Para a análise da região catalítica, foram
monitoradas as médias e os desvios padrões da SAS dos resíduos que com-
põem o sítio e os subsítios catalíticos. Todos os resíduos analisados quanto a
sua superfície acessível ao solvente estão descritos na Tab. 3.10.
Para a visualização e comparação de possíveis alterações estruturais na re-
gião catalítica das enzimas, nas duas temperaturas testadas, foram determi-
nadas as conformações preferencias de cada enzima, obtidas pelo comando
g_cluster_d do GROMACS, usando-se o método gromos (algoritmo desenvol-
vido de acordo com o descrito em Daura et al (1999)) e diferentes valores de
RMSD (1,0-2,0A) como critério de decisão de agrupamento.
• Estabilidade do Par Iônico: para a análise da manutenção do par iônico res-
ponsável pela atividade catalítica das enzimas, foram monitorados os posici-
onamentos das cadeias laterais dos seguintes resíduos: (i) papaína: CYS25,
ASP158, HIS159 e ASN175; (ii) cruzipaína 1: CYS25, ASP161, HIS162 e
ASN182; (iii) cruzipaína 2: CYS25, SER161, HIS162 e ASN182.
78
Tabela 3.10: Triptofanos e resíduos que compõem o sítio e os subsítios catalíticos da papaína (9PAP),cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m).
Resíduos 9PAP 1ME4 1ME4mTriptofanos TRP: 7, 26, 69, 177‡ e
181TRP: 7, 26, 38, 74, 128,144, 178, 184‡ e 188
TRP: 7, 26, 38, 74, 144,178, 184‡ e 188
Subsítio S2′ GLN19 e CYS22 GLN19 e CYS22 GLN19 e CYS22
Subsítio S1′ ALA136, ALA137,GLN142, ASP158 eTRP177
ALA141, SER142,MET145, ASP161 eTRP184
ALA141, SER142,PHE145, SER161 eTRP184
Subsítio S1 GLY23, SER24, ASN64,GLY65 e GLY66
GLY23, SER24, SER64,GLY65 e GLY66
GLY23, SER24, GLY64,GLY65 e GLY66
Subsítio S2 TYR67, PRO68,VAL133, VAL157,ALA160 e SER205
LEU67, MET68,ALA138, LEU160,GLY163 e GLU207
LEU67, SER68,ALA138, LEU160,ALA163 e GLU207
Subsítio S3 SER60 e TYR61 ASP60 e SER61 ASN60 e SER61
Sítio Catalítico CYS25, HIS159 eASN175
CYS25, HIS162 eASN182
CYS25, HIS162 eANS182
‡Triptofano constituinte do subsítio S1′.
79
Capítulo 4
Resultados e Discussão
Sendo o Trypanosoma cruzi um organismo diplóide, verificou-se possíveis redun-
dâncias de anotação através do programa BLASTP (usa o algoritmo BLAST para com-
parar seqüências protéicas), alinhando-se todas contra todas as 25.041 CDS (Seqüência
Codificante) de T. cruzi, obtidas do banco de dados público TcruziDB (http://TcruziDB.
org - versão TCA1.pep) (Luchtan et al, 2004). O resultado deste alinhamento foi sub-
metido ao BioParser que filtrou os dados segundo os valores de identidade (≤ 95%),
obtendo-se 20.679 seqüências não redundantes.
4.1 Modelos Protéicos Tridimensionais e Classificação Enzimática
Partindo de 20.679 CDS de T. cruzi não redundantes, o MHOLline produziu 2.786
modelos protéicos (aproximadamente 13,5% do total de seqüências analisadas), e iden-
tificou 4.719 seqüências com regiões transmembranares (próximo de 23% do total de
seqüências analisadas), o que indica que estas podem estar associadas a proteínas de
membrana. Este resultado apresenta-se condizente com valores encontrados em geno-
mas microbianos, nos quais as proteínas de membrana representam de 20-30% do total
protéico (Wallin e von Heijne, 1998). Informações sobre regiões transmembranares são
relevantes na inferência de características funcionais a seqüências.
Em seguida, o MHOLline classificou os 2.786 modelos gerados de acordo com
os critérios de qualidade apresentados na Tab. 3.6, obtendo os resultados apresentados
na Tab. 4.1. Os 2.786 modelos protéicos de T. cruzi foram submetidos ao ECNGet, que
80
associou um número correspondente a uma classificação enzimática a 1.888 seqüências,
obtendo-se 39 diferentes classificações (EC). As demais 898 seqüências não apresenta-
ram funções conhecidas ou foram associadas a funções não enzimáticas (e.g. fatores de
regulação celular). De acordo com a Tab. 4.1, do conjunto de modelos com classificação
enzimática (coluna 3), aproximadamente 20,5% foram classificados como de baixa qua-
lidade, 70% como de média qualidade e 9,5% como boa, alta ou muito alta qualidade. A
qualificação destes modelos é um indicativo de quais poderão ser submetidos a estudos
de desenho racional de fármacos baseado em estrutura e de docking receptor-ligante,
bem como outros tipos de estudos que envolvam modelos de menor qualidade.
Tabela 4.1: Número de modelos protéicos de T. cruzi com e sem classificação enzimática, classificadosde acordo com a qualidade de suas estruturas tridimensionais geradas pelo MHOLline.
Número de Modelos Número de Modelos TotalQualidade (sem EC‡) (com EC‡)Muito Alta 14 29 43Alta 63 97 160Boa 44 49 93Média a Boa 299 652 951Média a Baixa 258 674 932Baixa 220 387 607TOTAL 898 1.888 2.786
‡EC: Enzyme Commission. Classificação numérica de acordo com NC-IUBMB (NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).
Na Tab. 4.2 é apresentado o número de modelos protéicos de T. cruzi de acordo
com sua classe enzimática determinada pelo ECNGet, bem como as respectivas porcen-
tagens em relação ao número total de modelos construídos que apresentaram caracterís-
ticas enzimáticas. As classes enzimáticas mais representativas foram as das Hidrolases e
Transferases, compreendendo cerca de 84% do total de modelos de enzimas construídos.
Dos 1.888 modelos associados a algum EC, 25 seqüências apresentaram mais de
uma classificação enzimática: (i) 5 seqüências foram classificadas como bifuncionais
(e.g. GAL10 com EC: 5.1.3.2 e EC: 5.2.3.3) e 10 como sinônimas 8 (e.g. metileno-
tetrahidrofolato dehidrogenase (NADP+) com EC: 1.5.1.5 e considerada sinônima da
meteniltetrahidrofolato ciclohidrolase (EC: 3.5.4.9) e da formato-tetrahidrofolato ligase8 Enzimas sinônimas: enzimas que possuem EC diferentes mas descritas pelo NC-IUBMB (Nomen-
clature Committee of the International Union of Biochemistry and Molecular Biology) como númerossinônimos referentes a uma mesma função, ou apenas enzimas classificadas inicialmente com um EC eposteriormente reclassificadas com um novo número.
81
Tabela 4.2: Número e porcentagem de modelos protéicos de T. cruzi de acordo com a classe enzimáticapertencente.
Classe Enzimática Número de Modelos Porcentagem de Modelos(com EC‡) (com EC‡)
Oxidorredutase 144 7,63Transferase 462 24,47Hidrolase 1124 59,53Liase 41 2,17Isomerase 54 2,86Ligase 63 3,34TOTAL 1.888 100,00
‡EC: Enzyme Commission. Classificação numérica de acordo com NC-IUBMB (NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).
(EC: 6.3.4.3)); (ii) 5 apresentaram classificações enzimáticas pertencentes a uma mesma
classe funcional (e.g. fosfoproteína fosfatase (EC: 3.1.3.16) com função correlacionada
a da fosfotirosina fosfatase (EC: 3.1.3.48)); (iii) 5 foram indicadas como pertencentes
a diferentes classes, porém, com funções correlacionadas (e.g. 3-hidroxiacil-CoA dehi-
drogenase (EC: 1.1.1.35) com função correlacionada a da D-3-hidroxiacil-CoA dehidra-
tase (EC: 4.2.1.107)).
Os modelos associado a uma função enzimática foram agrupados na Tab. 4.3, de
acordo com as principais observações feitas em sua anotação genômica original:
(1) Anotação Coincidente: classificação enzimática do modelo coincide com a
anotação original da CDS.
(2) Proteína de Superfície: classificação enzimática do modelo gerado coincide
com a da CDS alvo, originalmente anotada como proteína de superfície ou
como gp63 (glicoproteína 63).
(3) Hipotética: modelo cuja seqüência alvo foi originalmente anotada como hipo-
tética.
(4) Anotação Discordante: modelo com classificação enzimática diferente da ano-
tação original da seqüência alvo.
Através dos resultados apresentados na Tab. 4.3, pode-se observar que 238 seqüên-
cias originalmente anotadas como proteínas hipotéticas, puderam através da metodolo-
82
gia empregada neste trabalho, ter suas estruturas tridimensionais modeladas e suas fun-
ções atribuídas através de uma classificação enzimática associada a um número EC. Na
Fig. 4.1 é apresentado um exemplo de seqüência genômica de T. cruzi anotada como
proteína hipotética, cujo modelo estrutural foi gerado pelo MHOLline usando como
molde a estrutura PDB 1U9Q. Este modelo foi considerado de Muito Alta qualidade e
teve sua classificação enzimática (EC: 3.4.22.51) determinada pelo ECNGet.
Tabela 4.3: Categorias dos modelos protéicos de T. cruzi de acordo com comparação entre sua classifi-cação enzimática e a anotação genômica de sua seqüência alvo.
Categorias TotalAnotação Coincidentea 695Hipotética 238Proteína de Superfície
- gp63 143- Sialidase 227- Transialidase 327
Anotação Discordanteb 258TOTAL 1.888
aModelos com classificação enzimática coincidente com a anotação genômicada seqüência alvo.bModelos cuja classificação enzimática não coincide com a anotação genômicada seqüência alvo.
Outro resultado importante a ressaltar é o fato de 258 modelos (aproximadamente
13, 67% do total de modelos de enzimas gerados) assumirem uma classificação enzimá-
tica discordante da anotação original apresentada pela CDS alvo correspondente. Duas
hipóteses podem ser levantadas, uma delas seria a possibilidade do BATS ter escolhido
como melhor molde para a construção do modelo final uma seqüência que, apesar de
apresentar uma melhor pontuação final, não seja a que melhor representa a função da-
quela enzima. Desta forma, seria necessário retornar ao MHOLline e revisar todas as
possíveis referências apontadas pelo programa para a geração do respectivo modelo, se
necessário analisar o alinhamento múltiplo destas e, então, verificar se há alguma que
melhor represente a seqüência alvo de acordo com a função proposta em sua anotação.
Outra hipótese seria de realmente ter havido algum erro na anotação da seqüência genô-
mica, podendo o MHOLline ser uma boa ferramenta para se propor uma reanotação
funcional.
83
Figura 4.1: Modelo estrutural de cruzipaína obtido de seqüência genômica de T. cruzi anotada comoproteína hipotética.
(a) Modelo de cruzipaína cuja seqüênciafoi originalmente anotada como hipoté-tica.
(b) Estrutura cristalográfica de cruzi-paína obtida do Protein Data Bank (PDB1U9Q).
4.2 Enzimas Análogas
Dos 1.888 modelos com classificação enzimática, foram excluídos 12 modelos
que apresentaram apenas o número da classe enzimática. As demais 1.876 seqüências
capazes de gerar um modelo com classificação enzimática, contendo pelo menos a nu-
meração referente a subsubclasse, foram submetidas ao AnEnπ (Otto et al, 2006) para
avaliar similaridades entre as seqüências de Trypanosoma cruzi e Homo sapiens.
O AnEnπ classificou 99 seqüências como possíveis análogas a enzimas humanas,
1.776 como similares (sendo 24 seqüências com mais de uma classificação enzimática)
e 1 bifuncional (modelo de GAL10 classificado como similar ao EC: 5.1.3 e análogo
ao EC: 3.4.24). Além disto, foi possível identificar 10 seqüências consideradas como
possivelmente específicas de T. cruzi em relação a humanos.
Na Tab. 4.4 é apresentado um resumo contendo a classificação geral das seqüên-
cias de acordo com a categoria de anotação genômica, analogia a seqüências de H.
sapiens detectada via AnEnπ, classificação enzimática obtida via ECNGet e qualidade
do modelo estrutural gerado via MHOLline.
Neste trabalho, foi possível identificar um total de 39 classificações enzimáti-
cas, sendo 26 (abrangendo 1185 modelos) associadas a uma via metabólica descrita no
KEGG. Das 13 demais classificações (compreendendo 691 modelos estruturais de T.
84
Tabe
la4.
4:M
odel
ospr
otéi
cos
deT.
cruz
i:ca
tego
ria
dean
otaç
ão,a
nalo
gia
aH
.sap
iens
via
AnE
nπ,c
lass
ifica
ção
enzi
mát
ica
equ
alid
ade
dom
odel
ovi
aM
HO
Llin
e.C
ateg
oria
sC
lass
eE
nzim
átic
aQ
ualid
ade
doM
odel
oTo
tal
12
34
56
Ano
taçã
oC
oinc
iden
tea
1.Si
mila
r†O
xido
rred
utas
e9
166
3615
789
(e.g
.deh
idro
gena
ses,
trip
anot
iona
-dis
ulfid
ere
duta
se)
Tran
sfer
ase
924
1288
8335
251
(e.g
.pro
teín
asci
nase
s,po
limer
ases
)H
idro
lase
212
975
5921
178
(e.g
.fos
fopr
oteí
na-f
osfa
tase
s,en
dope
ptid
ases
)L
iase
111
17
53
28(e
.g.h
idra
tase
s,en
donu
clea
ses)
Isom
eras
e-
75
246
446
(e.g
.pep
tidilp
rolil
isom
eras
e,ep
imer
ases
)L
igas
e-
72
336
856
(e.g
.glu
tatio
nasi
ntas
e,ub
iqui
tinas
,tR
NA
ligas
es)
2.Po
ssív
elA
nálo
ga‡
Oxi
dorr
edut
ase
--
-2
42
8(e
.g.d
ehid
roge
nase
s)Tr
ansf
eras
e-
--
4-
-4
(e.g
.ser
ino
acet
iltra
nsfe
rase
,cis
teín
osi
ntas
e)H
idro
lase
1-
114
75
28(e
.g.l
ipas
e,fa
ctor
deal
onga
men
toT
U)
Lia
se-
2-
-4
-6
(e.g
.UD
P-gl
ucur
onat
ode
carb
oxila
se1)
Prot
eína
deSu
perf
ície
b
1.Si
mila
r†
-gp6
3H
idro
lase
--
-60
3251
143
(e.g
.lei
shm
anol
isin
a)-S
ialid
ase
Hid
rola
se-
--
6792
6822
7-T
rans
ialid
ase
Hid
rola
se6
-4
8917
553
327
Hip
otét
icac
1.Si
mila
r†O
xido
rred
utas
e-
11
1-
-3
(e.g
.deh
idro
gena
ses)
Tran
sfer
ase
-3
-11
2012
46(e
.g.p
rote
ínas
cina
ses)
Hid
rola
se1
11
3644
7015
3(e
.g.c
ruzi
paín
a,pr
oteí
nas
desu
perf
ície
)L
iase
-1
-1
-1
3(e
.g.c
iste
íno
desu
lfur
ase,
dehi
drat
ase)
Isom
eras
e-
--
3-
-3
(e.g
.cic
lofil
ina)
Lig
ase
--
12
1-
4(e
.g.g
luta
min
a-tR
NA
ligas
e,ub
iqui
tinas
)
2.Po
ssív
elA
nálo
ga‡
Oxi
dorr
edut
ase
-1
-3
23
9(e
.g.d
ehid
roge
nase
s)Tr
ansf
eras
e-
--
15
17
(e.g
.pro
teín
asci
nase
s)H
idro
lase
--
-2
61
9(e
.g.f
osfa
tase
s)
Ano
taçã
oD
isco
rdan
ted
1.Si
mila
r†O
xido
rred
utas
e-
21
612
324
(e.g
.deh
idro
gena
ses,
redu
tase
s)Tr
ansf
eras
e-
43
5068
1614
1(e
.g.p
rote
ínas
cina
ses,
acet
iltra
nsfe
rase
hist
ônic
a)H
idro
lase
-2
116
1511
45(e
.g.d
eace
tilas
eN
AD
-dep
ende
nte,
fosf
opro
teín
afo
sfat
ase)
Lia
se-
1-
-1
13
(e.g
.cis
teín
ode
sulf
uras
e)Is
omer
ase
--
-3
-1
4(e
.g.p
eptid
ilpro
lilis
omer
ase)
Lig
ase
--
--
2-
2(e
.g.g
luta
tiona
sint
ase)
2.Po
ssív
elA
nálo
ga‡
Oxi
dorr
edut
ase
-1
-7
1-
9(e
.g.p
erox
idas
es)
Tran
sfer
ase
--
13
11
6(e
.g.a
cetil
em
etil
tran
sfer
ases
)H
idro
lase
-1
-4
15
11(e
.g.f
osfo
dies
tera
se)
Lia
se-
--
-1
-1
(e.g
.tR
NA
pseu
dour
idin
asi
ntas
eD
)L
igas
e-
--
1-
-1
(e.g
.Glu
tam
il-tR
NA
(Gln
)am
idot
rans
fera
se-s
ubun
idad
eD
)TO
TAL
2997
4964
966
838
31.
875
aM
odel
oco
mcl
assi
ficaç
ãoen
zim
átic
aco
inci
dent
eco
ma
anot
ação
genô
mic
ada
seqü
ênci
aal
vo.
bM
odel
oem
que
aan
otaç
ãoge
nôm
ica
dase
qüên
cia
alvo
ade
scre
veco
mo
prot
eína
desu
perf
ície
ouco
mo
gp63
.cM
odel
ocu
jase
qüên
cia
alvo
foia
nota
daco
mo
hipo
tétic
a.
dM
odel
ocu
jacl
assi
ficaç
ãoen
zim
átic
anã
oco
inci
deco
ma
anot
ação
genô
mic
ada
seqü
ênci
aal
vo.
† Seq
üênc
iacl
assi
ficad
aco
mo
sim
ilara
uma
enzi
ma
enco
ntra
daem
Hom
osa
pien
s.‡ S
eqüê
ncia
clas
sific
ada
com
opo
ssív
elan
álog
aa
algu
ma
enzi
ma
enco
ntra
daem
Hom
osa
pien
s.
85
cruzi), foi possível detectar 4 das 14 enzimas descritas na Tab. 1.1 como alvos molecu-
lares de interesse no combate à doença de Chagas. Como exemplo deste último caso,
pode-se citar a cruzipaína (EC: 3.4.22.51), cujo grupo determinado pelo AnEnπ apresen-
tou 11 seqüências de H. sapiens como similares. O alinhamento entre estas seqüências
é apresentado na Fig. 4.2.
Na Tab. 4.5 são listados alguns dos grupos enzimáticos, determinados pelo AnEnπ,
cuja relevância é apresentada de acordo com a relação entre o número de enzimas pre-
sentes em H. sapiens e T. cruzi, e pela presença de potenciais alvos moleculares de T.
cruzi descritos na Seção 1.2 e de alvos já em estudo, conforme apresentados na Tab. 1.1.
É importante notar que dos 14 alvos moleculares citados neste trabalho, foi possível
gerar o modelo estrutural de 8 destas enzimas, compreendendo no total 31 modelos.
Destes, pode-se destacar os 3 modelos gerados do alvo molecular NADH-fumarato re-
dutase que foram classificados pelo AnEnπ como possivelmente análogos a enzimas
humanas.
Das demais 6 enzimas de T. cruzi consideradas como alvos moleculares, ape-
nas 3 (esqualeno ciclase - EC: 2.5.1.21, farnesil pirofosfato sintase - EC: 2.5.1.10 e
Uracil-DNA glicosilase - EC: 3.2.2.3) possuem estrutura tridimensionalmente resolvida
e depositada no PDB. Para a investigação destas enzimas no genoma de T. cruzi foi re-
alizado um BLASTP entre as 20.679 CDS de T. cruzi não redundantes e as seguintes
estruturas 3D depositadas no PDB: 1EZF (EC: 2.5.1.21) e 1AKZ, 1UGH e 2HXM (EC:
3.2.2.3), enzimas de H. sapiens; 1YHK e 1YHM (EC: 2.5.1.10), enzimas de T. cruzi. O
BLAST não foi capaz de identificar nenhuma seqüência similar à estas enzimas dentro
do genoma de T. cruzi, nem mesmo das estruturas da farnesil pirofosfato sintase isoladas
deste parasita, sugerindo uma possível anotação incompleta deste genoma.
Um resumo dos resultados obtidos no estudo do genoma de T. cruzi para a cons-
trução de seus modelos estruturais protéicos, caracterização dos modelos com perfil
enzimático e estudos evolutivos para a detecção de enzimas similares e análogas em
relação as enzimas humanas, é apresentado na Fig. 4.3.
86
Figu
ra4.
2:A
linha
men
toen
tre
asse
qüên
cias
deci
steí
nopr
otea
ses
deT.
cruz
ieH
.sap
iens
clas
sific
adas
pelo
AnE
nπco
mo
sim
ilare
s.
6986.m00055 ---------------------------------------------------AATASLHAEETLASQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120
8294.m00001 ---------------------------------------------------AATASLHAEETLASQFAEFKQKHGRVYESAAEEAFRLSVFRANLFLARLHA---AANP-HATFGVTPFS 120
7376.m00001 ---------------------------------------------------AATASLHAEETLTSQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120
7376.m00002 ---------------------------------------------------AATASLHAEETLTSQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120
7400.m00026 ---------------------------------------------------AATASLHAEETLTSQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120
7400.m00027 ---------------------------------------------------AATASLHAEETLTSQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120
8096.m00032 ---------------------------------------------------AATASLHAEETLASQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120
8091.m00002 ------------------------------------------------------------------------------------------------------------------------
8091.m00003 ---------------------------------------------------AATASLHAEETLASQFAEFKQKHGRVYGSAAEEAFRLSVFRANLFLARLHA---AANP-HATFGVTPFS 120
7289.m00001 ------------------------------------------------------------------------------------------------------------------------
hsa_8722 RKDCGPVDTKVPGAGEPKSAFTQGSAMISSLSQNHPDNRNETFSSVISLLNEDPLSQDLPVKMASIFKNFVITYNRTYESKEEARWRLSVFVNNMVRAQKIQ---ALDRGTAQYGVTKFS 237
hsa_1521 ---------------------------------------------------------PQPLELKEAFKLFQIQFNRSYLSPEEHAHRLDIFAHNLAQAQRLQ---EEDLGTAEFGVTPFS 92
hsa_1514 ------------------------------------------------------ATLTFDHSLEAQWTKWKAMHNRLYG-MNEEGWRRAVWEKNMKMIELHNQEYREGKHSFTMAMNAFG 81
hsa_441561 ------------------------------------------------------AALTRDHSLDAQWTKWKAKHKRLYD-MNGEGWRRAVXEKDVKMIEQHNQEYSQGKHSFTMAMNAFG 81
hsa_1515 ------------------------------------------------------AVPKFDQNLDTKWYQWKATHRRLYG-ANEEGWRRAVWEKNMKMIELHNGEYSQGKHGFTMAMNAFG 81
hsa_1520 ------------------------------------------------------AQLHKDPTLDHHWHLWKKTYGKQYKEKNEEAVRRLIWEKNLKFVMLHNLEHSMGMHSYDLGMNHLG 81
hsa_1513 ------------------------------------------------------FALYPEEILDTHWELWKKTHRKQYNNKVDEISRRLIWEKNLKYISIHNLEASLGVHTYELAMNHLG 79
hsa_1512 ------------------------------------------------------AELCVNSLEKFHFKSWMSKHRKTYS-TEEYHHRLQTFASNWRKINAHN----NGNHTFKMALNQFS 83
8422.m00010 ----------------------------------------------------------MRVYFSLSIALFLFLLYATAGHSFHAEDAPILTDEFLEHVNRLNG--GKWTAGRTSRTKHLT 60
8799.m00010 ----------------------------------------------------------MRAYFSLSIALFLFLLYATAGHSFHAEDAPILTDEFLELVNRLNG--GKWTAGRTSRTKHLT 60
hsa_1508 ----------------------------------------------------------MWQLWA-SLCCLLVLANARSRPSFHP-----LSDELVNYVNKRN---TTWQAGHNFYNVDMS 53
7624.m00011 ---------------------------------------------------AMTVTSDEDYLAQYTFEKYIADFGKRYADPEEHRKRAAIFKENLAKVRAFN---GALGRSYRLGINKFS 89
hsa_1519 ---------------------------------------------------------WLLWLLCRGGGDADSRAPFTPTWPRSREREAAAFRESLNRHRYLNSLFPSENSTAFYGINQFS 73
hsa_1522 -----------------------------------------------------------------------------------MARRGPGWRPLLLLVLLAG-----------AAQGGLY 26
6986.m00055 DLTREEFRSRYHNGAAHFAAAQERARVPVDVEVVGAPAAKDWR--KEGAVTAVKN----QGLCGSCWAFAAIGNVESQWFLAG---HPLTRLSEQMLVSCDDTN------FGCGGGWPLG 225
8294.m00001 DLTREEFRSRYRNGAAHFAAAQERARVPVDVEVVGAPAAKDWR--KEGAVTAVKN----QGLCGSCWAFAAIGNVESQWFLAG---NPLTRLSEQMLVSCDDTN------FGCGGGSSLK 225
7376.m00001 DLTREEFRSRYHNGAAHFAAAQERARVPVKVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------FGCSGGLMNN 225
7376.m00002 DLTREEFRSRYHNGAAHFAAAQERARVPVKVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------SGCSGGLMNN 225
7400.m00026 DLTREEFRSRYHNGAVHFAAAQERARVPVKVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------SGCSGGLMNN 225
7400.m00027 DLTREEFRSRYHNGAAHFAAAQERARVPVKVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------FGCSGGLMNN 225
8096.m00032 DLTREEFRSRYHNGAAHFAAAQERARVPVNVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------SGCGGGLMNN 225
8091.m00002 -------------------------------------------------------------MCGSCWAFAAIGNIEGQWFLAG---NPLTRLSEQMLVSCDNTN------SGCGGGSSLK 50
8091.m00003 DLTREEFRSRYHNGAAHFAAAQERARVPVDVEFVGAPAAKDWR--EEGAVTAVKN----QGMCGSCWAFAAIGNIECQWFLAG---NPLTRLSEQMLVSCDNTN------SGCGGGWPLV 225
7289.m00001 -----------------------------------------------------------------------------------------------MLVSCDKTD------SGCGGGLMNN 19
hsa_8722 DLTEEEFRTIYLNTLLRKEPGNKMKQAKSVG--DLAPPEWDWR--SKGAVTKVKD----QGMCGSCWAFSVTGNVEGQWFLNQ---GTLLSLSEQELLDCDKMD------KACMGGLPSN 340
hsa_1521 DLTEEEFGQLYGYRRAAGGVPSMGREIRSEEPEESVPFSCDWRK-VAGAISPIKD----QKNCNCCWAMAAAGNIETLWRISF---WDFVDVSVQELLDCGRCG------DGCHGGFVWD 198
hsa_1514 DMTSEEFRQVMNGFQNRKPRKG---KVFQEPLFYEAPRSVDWRE-KG-YVTPVKN----QGQCGSCWAFSATGALEGQMFRKT---GRLISLSEQNLVDCSGPQ-GN---EGCNGGLMDY 185
hsa_441561 DMTNEEFRQVMNGFQHQKHRKG---KQFQERLLLEIPTSVDWRE-KG-YMTPMKD----QGQCGSCWAFSATGALEGQMFWKT---GKLISLNEQNLVDCSGPQ-GN---EGCNGGFMDN 185
hsa_1515 DMTNEEFRQMMGCFRNQKFRKG---KVFREPLFLDLPKSVDWRK-KG-YVTPVKN----QKQCGSCWAFSATGALEGQMFRKT---GKLVSLSEQNLVDCSRPQ-GN---QGCNGGFMAR 185
hsa_1520 DMTSEEVMSLMSSLRVPSQWQR--NITYKSNPNRILPDSVDWRE-KG-CVTEVKY----QGSCGACWAFSAVGALEAQLKLKT---GKLVSLSAQNLVDCSTEKYGN---KGCNGGFMTT 187
hsa_1513 DMTSEEVVQKMTGLKVPLSHSRSNDTLYIPEWEGRAPDSVDYRK-KG-YVTPVKN----QGQCGSCWAFSSVGALEGQLKKKT---GKLLNLSPQNLVDCVSE---N---DGCGGGYMTN 184
hsa_1512 DMSFAEIKHKYLWSEPQNCSAT---KSNYLRGTGPYPPSVDWRK-KGNFVSPVKN----QGACGSCWTFSTTGALESAIAIAT---GKMLSLAEQQLVDCAQDF-NN---HGCQGGLPSQ 188
8422.m00010 RRGASRMLGTFLRNTSILPPRQFSEEELRVPLQDRFDAGEAWP--ECPTVTEIRD----QSSCGSCWAVAAASAISDRYCTLG--GVRDLRISAGDLMSCC-DVCG----FGCNGGYPEV 167
8799.m00010 RRGASRLLGTFLRNTSILPPRQFSEEELREPLQDRFDAGEAWP--KCPTITEIRD----QSSCGSCWAVAAASAISDRYCTLG--GVRDLRISAGDLMSCC-DVCG----YGCNGGYPEV 167
hsa_1508 Y--LKRLCGTFLGGP-KPPQRVMFTEDLKLPAS--FDAREQWP--QCPTIKEIRD----QGSCGSCWAFGAVEAISDRICIHTN-AHVSVEVSAEDLLTCCGSMCG----DGCNGGYPAE 157
7624.m00011 DMTKEEFNAKFNGRVAAPQSTQSPQRAPYKRTKATFPEALNWQEAKNPVLTPVKD----QGSCGSCWAHAATESVESMYAISS---GKLLTLSTQQITSCVNNTRKCGGSGGCGGGTAQL 202
hsa_1519 YLFPEEFKAIYLRSKPSKFPRYS-AEVHMSIPNVSLPLRFDWRD--KQVVTQVRN----QQMCGGCWAFSVVGAVESAYAIKG---KPLEDLSVQQVIDCSYNN------YGCNGGSTLN 177
hsa_1522 FRRGQTCYRPLRGDGLAPLGRSTYPRPHEYLSPADLPKSWDWRNVDGVNYASITRNQHIPQYCGSCWAHASTSAMADRINIKRKGAWPSTLLSVQNVIDCGNAG-------SCEGGNDLS 139
* *oo> < < ooxx
>SÍTIO CATALÍTICO
*S2'
#S1'
oS1
xS2
<S3
Seqü
ênci
as#
.m#
:CD
S(S
eqüê
ncia
Cod
ifica
nte)
deTr
ypan
osom
acr
uzi.
Seqü
ênci
ashs
a_#
:CD
S(S
eqüê
ncia
Cod
ifica
nte)
deH
omo
sapi
ens.
87
6986.m00055 AFKWIVDRNNGTVY---------TEESYPYHSCIVIKLPCKDSDRTVGATVQDTVSSPQ----------------------DEAQIVAWLAVNGPHFAVIDIIGWMFYTR----GVFT-- 308
8294.m00001 AFKWIVDRNNGAVY---------TEESYPYHSCIGIKLPCKDSDRTVGATVQDTVSSPQ----------------------DEAQIVAWLAVNGPHFAVIDIIGWMFYTR----GVFT-- 308
7376.m00001 AFEWIVQENNGAVY---------TEDSYPYASGEGISPPCTTSGHTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVAVDASSWMTYTG----GVMTSC 310
7376.m00002 AFEWIVQENNGAVY---------TEDSYPYASGEGISPPCTTSGHTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVAVDASSWMTYTG----GVMTSC 310
7400.m00026 AFEWIVQENNGAVY---------TEDSYPYASGEGISPPCTTSGHTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVAVDASSWMTYTG----GVMTSC 310
7400.m00027 AFEWIVQENNGAVY---------TEDSYPYASGEGISPPCTTSGHTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVAVDASSWMTYTG----GVMTSC 310
8096.m00032 AFEWIVQENNGAVY---------TEDSYPYASGEGISPPCTTSGHTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVAVDASSWMTYTG----GVMTSC 310
8091.m00002 AFKWIVDRNNGAVY---------TEESYPYHSCIGIKLPCTTSGHTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVVVDASSWIFYTG----GVLTNC 135
8091.m00003 AFKWIVDRNNGTVY---------TEESYPYHSCIGISPPCTTSGHTVGATITGYVTIPR----------------------DENGIAAWLAVNGPVAVVVDASSWIFYTG----GVMTSC 310
7289.m00001 AFEWIVQENNGAVY---------TEDSYPYASGEGISPPCTTSGRTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVAVDASSWMTYTG----GVMTSC 104
hsa_8722 AYSAIKN--LGGLE---------TEDDYSYQG-HMQS--CNFSAEKAKVYINDSVELSQ----------------------NEQKLAAWLAKRGPISVAINAFGMQFYRHGISRPLRPLC 424
hsa_1521 AFITVLN--NSGLA---------SEKDYPFQG-KVRAHRCHPKKYQKVAWIQDFIMLQN----------------------NEHRIAQYLATYGPITVTINMKPLQLYRKGVIKATPTTC 284
hsa_1514 AFQYVQD--NGGLD---------SEESYPYEA---TEESCKYNPKYSVANDTGF-VDIPK---------------------QEKALMKAVATVGPISVAIDAGHESFLFYKEGIYFEPDC 269
hsa_441561 PFRYVQE--NGGLD---------SEASYPYEG---KVKTCRYNPKYSAANDTGF-VDIPS---------------------REKDLAKAVATVGPISVAVGASHVSFQFYKKGIYFEPRC 269
hsa_1515 AFQYVKE--NGGLD---------SEESYPYVA---VDEICKYRPENSVANDTGFTVVAPG---------------------KEKALMKAVATVGPISVAMDAGHSSFQFYKSGIYFEPDC 270
hsa_1520 AFQYIID--NKGID---------SDASYPYKA---MDQKCQYDSKYRAATCSKYTELPYG---------------------REDVLKEAVANKGPVSVGVDARHPSFFLYRSGVYYEPSC 272
hsa_1513 AFQYVQK--NRGID---------SEDAYPYVG---QEESCMYNPTGKAAKCRGYREIPEG---------------------NEKALKRAVARVGPVSVAIDASLTSFQFYSKGVYYDESC 269
hsa_1512 AFEYILY--NKGIM---------GEDTYPYQG---KDGYCKFQPGKAIGFVKDVANITIY---------------------DEEAMVEAVALYNPVSFAFEVTQD-FMMYRTGIYSSTSC 272
8422.m00010 AWEYYAVHGIVS----------EYCQPYPFPSCAHHVNSSDLSPCSGEYDTPTCNSTCTDKKIPLIK---YRGNTSYVLS-GEEPFKRELILNGPFEVSFSVYADFVAYTG---GVYKHV 270
8799.m00010 AWEYYAVHGIVS----------EYCQPYPFPSCAHHVNSSDLSPCSGEYDTPTCNSTCTDKKVPLIK---YRGNTSYLLS-GEESFKRELLLNGPFEVSFSVYADFLAYTG---GVYKHV 270
hsa_1508 AWNFWTRKGLVSGGLY---ESHVGCRPYSIPPCEHHVNGS-RPPCTGEGDTPKCSKICEPGYSPTYKQDKHYGYNSYSVSNSEKDIMAEIYKNGPVEGAFSVYSDFLLYKS---GVYQHV 270
7624.m00011 AWEYIMNTGGITLD---------AEYPYVSGETSVTGRCVLNRSMPRVVNVYGYASLPHN---------------------DYEAVIEALVQKGPLAVSVAASDWMFYTGGVFDGCGKDG 292
hsa_1519 ALNWLNKMQVKLVK----------DSEYPFKAQNGLCHYFSGSHSGFSIKGYSAYDFSD----------------------QEDEMAKALLTFGPLVVIVDAVSWQDYLGG---IIQHHC 262
hsa_1522 VWDYAHQHGIPDETCNNYQAKDQECDKFNQCGTCNEFKECHAIRNYTLWRVGDYGSLS-----------------------GREKMMAEIYANGPISCGIMATERLANYTG---GIYAEY 233
x ## #
6986.m00055 --------------VYFCMCV--------------------FSLWTFK------------------------------------------------------------------------
8294.m00001 --------------VYFRMCV--------------------FSLWTFK------------------------------------------------------------------------
7376.m00001 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTTQWGEDGYIRIAKGS-NQCLVKEEASSAVVGGPG---THSRANHHDN-HKCPRTVPIVLCADVLH--- 400
7376.m00002 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTTQWGEEGYIRIAKGL-NQCLVKEEASSAAKHGFFRIFSIVVVLVLVF-CVCGVFFCFFFFFDVFYFLL 406
7400.m00026 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTTQWGEEGYIRIAKGS-NQCLVKEEASSAVVGGPGPTPEPTTTTTTSAPGPSPSYFVQMSCTDAACIVG 407
7400.m00027 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTTQWGEEGYIRIAKGS-NQCLVKEEASSAVVGGPGPTPEPTTTTTTSAPGPSPSYFVQMSCTDAACIVG 407
8096.m00032 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTAQWGEDGYIRIAKGS-NQCLVKEEASSAVVGGPGPTPEPTTTTTTSAPGPSPSYFVQMSCTDAACIVG 407
8091.m00002 VS--KKLDHAVLLVGYNDSAT--------------------APYWIIKNSWTTQWGEDGYIRIAKGS-NQCLVKEEASSAVVGGPGATPEPTTTTTTSAPGPSPSCFVQMSCTDAACIVG 232
8091.m00003 VS--KQLSHAVLLVGYNDSAT--------------------VPHWIIKNSWTTHWGEDGYIRIAKGS-NQCLVKEGVSSAVVGGPGATPEPTTTTTTSAPGPSPSYFVQMSCTDDACIVG 407
7289.m00001 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTAQWGEDGYIRIAKGS-NQCLVKEEASSAAQQGLLLFFVFRFVVFLVLVFCVCGIVFLVFFTFSWVFFL 201
hsa_8722 SP--WLIDHAVLLVGYGNRSD--------------------VPFWAIKNSWGTDWGEKGYYYLHRGS-GACGVNTMASSAVVD------------------------------------- 484
hsa_1521 DP--QLVDHSVLLVGFGSVKSEEGIWAETVSSQSQPQPPHPTPYWILKNSWGAQWGEKGYFRLHRGS-NTCGITKFPLTARVQKPDMKPRVSCPP------------------------- 376
hsa_1514 SS--EDMDHGVLVVGYGFESTES----------------DNNKYWLVKNSWGEEWGMGGYVKMAKDRRNHCGIASAASYPTV-------------------------------------- 333
hsa_441561 DP--EGLDHAMLVVGYSYEGADS----------------DNNKYWLVKNSWGKNWGMDGYIKMAKDRRNSCGIATAASYPTV-------------------------------------- 333
hsa_1515 SS--KNLDHGVLVVGYGFEGANS----------------NNSKYWLVKNSWGPEWGSNGYVKIAKDKNNHCGIATAASYPNV-------------------------------------- 334
hsa_1520 T---QNVNHGVLVVGYGDL--------------------NGKEYWLVKNSWGHNFGEEGYIRMARNKGNHCGIASFPSYPEI-------------------------------------- 331
hsa_1513 NS--DNLNHAVLAVGYGIQ--------------------KGNKHWIIKNSWGENWGNKGYILMARNKNNACGIANLASFPKM-------------------------------------- 329
hsa_1512 HKTPDKVNHAVLAVGYGEK--------------------NGIPYWIVKNSWGPQWGMNGYFLIERGK-NMCGLAACASYPIPLV------------------------------------ 335
8422.m00010 AG-IFLGGHAVRIVGWGELNG--------------------EPYWKIANSWNREWGMNGYFLIARGV-DECGIEGSGVAGTPRIP----------------------------------- 333
8799.m00010 AG-TFLGGHAVRIVGWGELNG--------------------EPYWKIANSWNREWGMNGYFLIARGV-DECGIEGSGVAGTPRIP----------------------------------- 333
hsa_1508 TG-EMMGGHAIRILGWGVENG--------------------TPYWLVANSWNTDWGDNGFFKILRGQ-DHCGIESEVVAGIPRTDQYWEKI----------------------------- 339
7624.m00011 EN--ITISHAVQLVGYGTDNKTN------------------QDYWVVRNSWGEGWGENGFIRLLRKKHNELCVFNNAWNTAGGGCADDPNITIVACGMCGILYDVAYPVVTKPPGRGRFL 392
hsa_1519 SS--GEANHAVLITGFDKTGS--------------------TPYWIVRNSWGSSWGVDGYAHVKMGS-NVCGIADSVSSIFV-------------------------------------- 321
hsa_1522 QD-TTYINHVVSVAGWGISDG--------------------TEYWIVRNSWGEPWGERGWLRIVTSTYKDGKGARYNLAIEEHCTFGDPIV----------------------------- 303
x#>x
> # x
>SÍTIO CATALÍTICO
*S2'
#S1'
oS1
xS2
<S3
Seqü
ênci
as#
.m#
:CD
S(S
eqüê
ncia
Cod
ifica
nte)
deTr
ypan
osom
acr
uzi.
Seqü
ênci
ashs
a_#
:CD
S(S
eqüê
ncia
Cod
ifica
nte)
deH
omo
sapi
ens.
88
Tabela 4.5: Exemplos de grupos enzimáticos classificados pelo AnEnπ, de acordo com a relação entreo número de enzimas presentes em H. sapiens e T. cruzi, e pela presença de alvos moleculares de T. cruzijá em estudo.
I. Enzimas associadas a uma via metabólica não descrita no KEGG‡
ECa Grupo Seqüências Seqüências Exemplode HSAb de TCRc
1.8.1 1 4 6 Tripanotiona redutase ≈ T[SH]21.14.13 2 11 2 Citocromo P450 = Lanosterol 14α-demetilase2.5.1 23 3 4 Farnesiltransferase2.7.1 1 412 266 Proteínas cinases3.1.2 2 37 5 Ubiquitina hidrolase
6 35 2 Proteína tirosina fofatase3.4.21 6 15 3 Prolil oligopeptidase3.4.22 5 11 13 Cisteíno proteases (e.g. cruzipaína)3.4.24 5 1 150 Leishmanolisina
II. Enzimas associadas a uma via metabólica descrita no KEGG‡
ECa Grupo Seqüências Seqüências Exemplode HSAb de TCRc
1.1.1 3 52 27 Dehidrogenases1.2.1 1 14 6 Aldeído dehidrogenase
3 3 10 Gliceraldeído-3-fosfo dehidrogenase1.3.99 2 - 3 NADH-fumarato redutase1.6.2 1 2 6 Citocromo-B5 redutase1.15.1 2 1 9 Superóxido dismutase2.1.1 2 25 11 Transferases
19 7 1 Transferases2.3.1 5 14 4 Acetiltransferase2.4.1 2 52 3 UDP-Transferase2.5.1 3 17 6 Glutationa transferase2.6.1 2 9 14 Transaminases2.7.2 2 2 6 3-fosfoglicerato cinase3.1.3 1 13 50 Fosfoproteína fosfatase2.7.3 2 4 1 Arginina cinase3.1.4 3 20 7 Nucleotídeo fosfodiesterase
13 9 1 Fosfoinositídeo fosfolipase C3.2.1 1 16 679 Sialidases3.5.1 1 1 6 Aminoacilases3.6.3 4 31 6 ATPases4.2.1 12 1 8 Cistationina β-sintase
30 14 1 Anidrase carbônica4.6.1 2 19 2 Adenilato ciclase5.4.99 13 1 2 Oxidoesqualeno–lanosterol ciclase6.2.1 1 11 4 Acetil CoA
Em bege estão destacadas as enzimas de T. cruzi consideradas alvos moleculares no combate à doençade Chagas, conforme listadas na Tab. 1.1.Em amarelo estão destacadas as enzimas de T. cruzi de grande importância biológica para o parasita,e consideradas como potenciais alvos moleculares para o tratamento da doença de Chagas, conformedescrito na Seção 1.2.‡ KEGG: Kyoto Encyclopedia of Genes and Genomes - disponível em ftp://ftp.genome.ad.jp/pub/kegg/aEC: Enzyme Commission. Classificação numérica de acordo com NC-IUBMB (NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).bHSA: Homo sapiens.cTCR: Trypanosoma cruzi.
89
Figu
ra4.
3:E
sque
ma
apre
sent
ando
ore
sum
odo
sre
sulta
dos
obtid
osna
elab
oraç
ãode
uma
prim
eira
lista
depo
ssív
eis
alvo
sm
olec
ular
espa
rao
trat
amen
toda
doen
çade
Cha
gas.
Fer
ram
enta
s de
Bio
info
rmát
ica
BL
AST
, Bio
Par
ser
Fer
ram
enta
s de
Mod
elag
em
Com
put
acio
nal
MH
OL
Lin
e
EC
NG
et
1. T
rata
men
to d
e R
edun
dânc
ias:
• 25.
041
CD
S de
Try
pano
som
a cr
uzi.
• Fil
trag
em d
o B
LA
ST c
ruzi
X c
ruzi
=
20.6
79 C
DS
.
2. G
eraç
ão d
e M
odel
os 3
D:
• 2.7
86 m
odel
os p
roté
icos
de
T. c
ruzi
, ge
rado
s a
part
ir d
e cr
ista
is d
o P
DB
, co
m d
ifer
ente
s qu
alid
ades
.• 4
.719
seq
uênc
ias
asso
ciad
as a
pr
oteí
nas
de m
embr
ana.
3. C
lass
ific
ação
Enz
imát
ica:
• 1.8
88 m
odel
os p
roté
icos
de
T. c
ruzi
co
m c
arac
terí
stic
a en
zim
átic
a: O
xido
rred
utas
es (
144)
Tra
nsfe
rase
s (4
62)
Hid
rola
ses(
1124
) L
iase
s (4
1) I
som
eras
es (
54)
Lig
ases
(63
)
AnE
nπ
4. C
arac
teri
zaçã
o de
Enz
imas
Aná
loga
s a
part
ir d
e E
vent
os E
volu
tivo
s:
• 1.8
76 m
odel
os 3
D d
e T.
cru
zi a
ssoc
iado
s a
pelo
men
os u
ma
sub-
subc
lass
e en
zim
átic
a: 1
.776
mod
elos
cla
ssif
icad
os c
omo
sim
ilar
es a
alg
uma
enzi
ma
de H
omo
sapi
ens
99
com
o po
ssív
eis
anál
ogas
a H
. sap
iens
1 c
lass
ific
ada
com
o bi
func
iona
l
Abo
rdag
ens
Enz
imát
icas
/Evo
luti
vas
90
4.3 Dinâmicas Moleculares
A cruzipaína, cisteíno protease majoritária de T. cruzi e pertencente a família da
papaína, é uma das enzimas de T. cruzi com mecanismo de ação bastante investigado
experimentalmente (Lima et al, 1992; del Nery et al, 1997; Judice et al, 2001; Lima et
al, 2001; dos Reis et al, 2006). No entanto, vários aspectos de seu perfil enzimático
como, por exemplo, seu comportamento enzimático a diferentes temperaturas e a efici-
ência catalítica diferenciada entre as isoformas, necessitam de maiores estudos em nível
molecular, visando auxiliar na interpretação de resultados experimentais.
Neste trabalho foram investigadas as estruturas das enzimas cruzipaína 1 e cru-
zipaína 2, tendo-se como controle a enzima papaína (extraída da Carica papaia), que
representa a família C1 (família papaína) das cisteíno proteases. Foram escolhidas para
este trabalho, as estruturas cristalográficas da papaína (PDB: 9PAP) (Kamphuis et al,
1984) e da cruzipaína 1 (PDB: 1ME4) (Huang et al, 2003) provenientes do banco de
dados PDB (Berman et al, 2000; Westbrook et al, 2002). Foram tomados como crité-
rios de seleção a resolução cristalográfica das estruturas (9PAP: 1,65A e 1ME4: 1,20A)
e a conformação usual da GLN19 (i.e conformação da cadeia lateral necessária para
polarizar o grupamento carbonila da ligação peptídica a ser clivada) (Fig 1.10).
Para a construção do modelo estrutural da cruzipaína 2 (1ME4m), aplicou-se o
método de modelagem comparativa (via programa Modeller (Sánchez e Sali, 1997)),
usando-se a seqüência alvo M90067 (Lima et al, 1994), depositada no GenBank (dis-
ponível em http://www.ncbi.nlm.nih.gov). Como molde, foi selecionado o cristal 1ME4
da cruzipaína 1, não somente por apresentar uma boa resolução cristalográfica mas, tam-
bém, por apresentar alta similaridade com a seqüência da cruzipaína 2 (86% de identi-
dade) (ver alinhamento das seqüências no Apêndice B). A qualidade estereoquímica do
modelo gerado foi verificada com o programa Procheck (Laskowski et al, 1993), apre-
sentando como resultado mais de 95% dos resíduos em regiões favoráveis. O gráfico de
Ramachandran gerado e a análise feita pelo Procheck foram apresentadas nas Fig. 1.12
e Fig. 3.5, respectivamente.
As dinâmicas moleculares destinadas às análises das estruturas das enzimas pa-
91
paína (9PAP), cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m) foram realizadas por 10
ns, simulando-se as temperaturas encontradas no vetor invertebrado (25◦C = 298K) e
no hospedeiro vertebrado (37◦C = 310K) de T. cruzi.
Durante os 10 ns de dinâmica molecular, a energia total por átomo do sistema
manteve-se estável e sem alterações observáveis entre as duas temperaturas testadas,
como observado na Fig. 4.4. Os valores das médias e desvios padrões, em Kcal/mol/
átomo, ao longo de toda a simulação foram: (i) papaína: −2, 6837 ± 0, 0022 (25◦C) e
−2, 6052 ± 0, 0022 (37◦C); (ii) cruzipaína 1: −2, 6967 ± 0, 0020 (25◦C) e −2, 6177 ±
0, 0020 (37◦C); (iii) cruzipaína 2: −2, 6705 ± 0, 0024 (25◦C) e −2, 5917 ± 0, 0024
(37◦C).
De acordo com resultados experimentais realizados com a cruzipaína 1 nas tem-
peraturas de 25◦C e 37◦C (Lima et al, 1992; dos Reis, 2005), esta enzima tenderia
a diminuir sua porcentagem de estruturas secundárias quando incubada a 37◦C. Foi
proposto, também, que a atividade enzimática das isoformas da cruzipaína poderia ser
modulada por alterações conformacionais na região do sítio ativo bem como pela pre-
sença de um possível sítio alostérico (dos Reis, 2005). A regulação deste possível sítio
alostérico estaria condicionada a temperatura de forma que, a atividade enzimática seria
inibida pelo excesso de substrato a 25◦C (temperatura encontrada no vetor invertebrado),
desaparecendo a 37◦C (temperatura no hospedeiro vertebrado) (Lima et al, 1992).
De acordo com os resultados apresentados na Tab. 4.6, pode-se observar que não
houveram alterações significativas, em função da temperatura, nas porcentagens de es-
truturas secundárias das três enzimas estudadas. No entanto, pode-se notar no 10◦ ns
de simulação que há uma tendência de diminuição da porcentagem de hélices em cruzi-
paína 1, quando simulada a 37◦C, enquanto há uma tendência de aumento, tanto da por-
centagem de hélices quanto de folhas, em cruzipaína 2 simulada a 37◦C. As estruturas
secundárias médias de cada nanosegundo de simulação de DM, estão esquematicamente
representadas na Fig. 4.5 para a papaína, na Fig. 4.6 para a cruzipaína 1 e na Fig. 4.7
para a cruzipaína 2.
92
Figura 4.4: Média da energia total por átomo do sistema (Kcal/mol/átomo), ao longo de 10 ns desimulação de dinâmica molecular da papaína (9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m).
Número de átomos que constituem os sistemas: 9PAP = 47.592, 1ME4 = 61.027 e 1ME4m = 40.462.
93
Tabela 4.6: Porcentagem de estruturas secundárias em papaína (9PAP) e cruzipaínas 1 (1ME4) e 2(1ME4m), ao longo de 10 ns de simulação de dinâmica molecular.
Estruturas 9PAP 1ME4 1ME4m25◦C 37◦C 25◦C 37◦C 25◦C 37◦C
Hélices 1ns 23, 58 24, 53 25, 58 22, 33 21, 03 18, 222ns 23, 11 23, 59 21, 86 23, 26 21, 49 21, 033ns 26, 41 23, 59 23, 26 20, 93 19, 63 21, 964ns 23, 11 24, 06 25, 58 20, 47 20, 09 22, 905ns 27, 83 23, 11 24, 19 21, 39 21, 96 22, 436ns 22, 17 25, 47 25, 12 18, 60 21, 96 24, 307ns 25, 00 26, 42 26, 98 21, 86 19, 63 20, 098ns 22, 64 20, 76 22, 79 25, 12 19, 63 18, 699ns 24, 05 22, 17 23, 72 23, 72 20, 09 21, 9610ns 25, 00 25, 00 24, 19 21, 86 18, 22 22, 43
Folhas 1ns 13, 68 13, 21 21, 86 21, 39 19, 63 19, 632ns 14, 62 15, 09 21, 40 22, 32 19, 63 20, 093ns 16, 04 15, 09 20, 00 19, 53 19, 62 19, 634ns 14, 62 16, 04 17, 68 20, 93 18, 23 22, 435ns 15, 57 15, 57 19, 07 23, 26 16, 82 19, 166ns 14, 15 14, 15 20, 46 21, 86 17, 76 18, 697ns 15, 09 17, 92 20, 00 21, 86 16, 82 21, 968ns 16, 04 17, 92 22, 33 23, 72 19, 16 21, 509ns 15, 10 16, 04 18, 61 20, 93 18, 23 19, 1610ns 16, 04 17, 92 20, 00 20, 93 17, 76 20, 56
Voltas 1ns 62, 74 62, 26 52, 56 56, 28 59, 34 62, 152ns 62, 27 61, 32 56, 74 54, 42 58, 88 58, 883ns 57, 55 61, 32 56, 74 59, 54 60, 75 58, 414ns 62, 27 59, 90 56, 74 58, 60 61, 68 54, 675ns 56, 60 61, 32 56, 74 55, 35 61, 22 58, 416ns 63, 68 60, 38 54, 42 59, 54 60, 28 57, 017ns 59, 91 55, 66 53, 02 56, 28 63, 55 57, 958ns 61, 32 61, 32 54, 88 51, 16 61, 21 59, 819ns 60, 85 61, 79 57, 67 55, 35 61, 68 58, 8810ns 58, 96 57, 08 55, 81 57, 21 64, 02 57, 01
94
Figu
ra4.
5:E
stru
tura
secu
ndár
iada
papa
ína
(9pa
p),a
olo
ngo
de10
nsde
sim
ulaç
ãode
dinâ
mic
am
olec
ular
,con
side
rand
oC
YS2
5co
mca
rga
tota
ligu
ala
-1,0
.
25◦ C
37◦ C
As
estr
utur
asse
cund
ária
ses
tão
repr
esen
tada
sda
segu
inte
form
a:H
élic
es-a
mar
elo,
Folh
as-v
erm
elho
eVo
ltas
-bra
nco
95
Figu
ra4.
6:E
stru
tura
secu
ndár
iada
cruz
ipaí
na1
(1M
E4)
,ao
long
ode
10ns
desi
mul
ação
dedi
nâm
ica
mol
ecul
ar,c
onsi
dera
ndo
CY
S25
com
carg
ato
tali
gual
a-1
,0.
25◦ C
37◦ C
As
estr
utur
asse
cund
ária
ses
tão
repr
esen
tada
sda
segu
inte
form
a:H
élic
es-a
mar
elo,
Folh
as-v
erm
elho
eVo
ltas
-bra
nco
96
Figu
ra4.
7:E
stru
tura
secu
ndár
iada
cruz
ipaí
na2
(1M
E4m
),ao
long
ode
10ns
desi
mul
ação
dedi
nâm
ica
mol
ecul
ar,c
onsi
dera
ndo
CY
S25
com
carg
ato
tali
gual
a-1
,0.
25◦ C
37◦ C
As
estr
utur
asse
cund
ária
ses
tão
repr
esen
tada
sda
segu
inte
form
a:H
élic
es-a
mar
elo,
Folh
as-v
erm
elho
eVo
ltas
-bra
nco
97
Para verificar possíveis alterações conformacionais no esqueleto peptídico das en-
zimas ao longo do tempo, foram calculados os desvios médios quadráticos (RMSD), de
acordo com a Eq. (1.1), do esqueleto peptídico da papaína (9PAP), cruzipaína 1 (1ME4)
e cruzipaína 2 (1ME4m), em relação a conformação originalmente apresentada no cris-
tal/modelo. Desvios de 2,0-3,0 A no esqueleto peptídico, em relação a estrutura inicial,
são considerados normais (Smith et al, 2005). Desta forma, os resultados apresentados
na Tab. 4.7 e na Tab. 4.8 mostram que não houve alteração significativa na estrutura
global de nenhuma das três proteínas estudadas, em particular para os resíduos que
constituem os subsítios e o sítio catalítico (resíduos descritos na Tab. 3.10).
Tabela 4.7: RMSD médio (em A) do esqueleto peptídico da papaína (9PAP) e cruzipaínas 1 (1ME4)e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, em relação a estrutura originalapresentada no cristal/modelo.
Proteína 25◦C 37◦C9PAP 1, 21± 0, 12 1, 36± 0, 241ME4 1, 21± 0, 36 1, 14± 0, 291ME4m 1, 16± 0, 12 1, 52± 0, 29
Tabela 4.8: RMSD médio (em A) do esqueleto peptídico dos subsítios e tríade catalítica da papaína(9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, emrelação a estrutura original apresentada no cristal/modelo.
Sítios 9PAP 1ME4 1ME4m25◦C 37◦C 25◦C 37◦C 25◦C 37◦C
S2′ 0, 88± 0, 37 1, 40± 0, 42 0, 85± 0, 18 0, 53± 0, 21 0, 55± 0, 15 0, 91± 0, 16S1′ 1, 39± 0, 37 2, 28± 0, 75 1, 18± 0, 41 1, 42± 0, 40 1, 09± 0, 36 2, 19± 0, 60S1 1, 25± 0, 51 1, 07± 0, 29 1, 16± 0, 58 0, 72± 0, 28 0, 96± 0, 22 1, 14± 0, 23S2 1, 20± 0, 29 1, 07± 0, 39 1, 29± 0, 53 1, 57± 0, 52 1, 48± 0, 38 1, 13± 0, 19S3 1, 03± 0, 30 1, 35± 0, 38 1, 23± 0, 46 0, 75± 0, 26 1, 21± 0, 36 0, 96± 0, 59Catalítico 0, 55± 0, 09 0, 53± 0, 18 0, 89± 0, 21 0, 82± 0, 34 0, 55± 0, 10 0, 77± 0, 29
As flutuações, em torno da média (RMSF), dos Cα da papaína e cruzipaína 2,
permaneceram dentro dos valores considerados normais (até 2,0-3,0 A), não havendo
variações significativas entre as duas temperaturas simuladas. No entanto, para a cruzi-
paína 1 observou-se uma flutuação significativa nos resíduos 58 a 61, para a temperatura
de 25◦C. Os resíduos 60 e 61 constituem o subsítio catalítico S3, o qual apesar de apre-
sentar ao longo da DM uma conformação peptídica média bem próxima da descrita pela
estrutura cristalográfica, seus carbonos-α apresentaram altas flutuações ao longo de 10
ns de simulação a 25◦C.
98
Figura 4.8: RMSF (em nanômetros) dos carbonos-α da papaína (9PAP) e cruzipaínas 1 (1ME4) e2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, em relação a estrutura originalapresentada no cristal/modelo.
(a) RMSF dos Cα da papaína (9PAP): diferença entre as temperaturas de 37◦C e 25◦C
(b) RMSF dos Cα da cruzipaína 1 (1ME4): diferença entre as temperaturas de 37◦C e 25◦C
(c) RMSF dos Cα da cruzipaína 2 (1ME4m): diferença entre as temperaturas de 37◦C e 25◦C
99
Para a análise de possíveis alterações na interface dielétrica proteína/solvente, foi
realizado o estudo da superfície acessível ao solvente (SAS) dos resíduos protéicos das
enzimas papaína e cruzipaínas 1 e 2. Considerando-se como raio da sonda o valor de 1,4
A, variações na SAS são consideradas significativas quando são observadas flutuações
de 24 A2, área referente a superfície de contato de van der Waals de uma molécula de
água (Lu et al, 2007).
De acordo com estudos experimentais, a cruzipaína 1 tende a diminuir sua in-
tensidade de fluorescência quando incubada a 37◦C, sugerindo alterações na sua con-
formação terciária, o que levaria a uma menor exposição ao solvente de seus resíduos
aromáticos (dos Reis, 2005). Para a verificação de possíveis alterações na conformação
terciária das enzimas em estudo, foram monitoradas as médias e desvios padrões da SAS
de todos os seus resíduos de triptofano (TRP), apresentados na Tab. 4.9 e na Tab. 4.10.
Na papaína, apesar da tendência de diminuição na exposição dos resíduos de TRP
ao solvente, estas alterações não foram consideradas significativas, exceto pelo resíduo
TRP181 que tende a diminuir sua exposição ao solente a 37◦C. Este comportamento
persistiu no último nanossegundo de simulação.
Na cruzipaína 1, observou-se uma diminuição na exposição dos resíduos de TRP
ao solvente, com destaque para o TRP74 ao longo da simulação a 37◦C. A diminuição
da SAS dos triptofanos é bem expressiva nas duas temperaturas quando comparadas a
SAS apresentada pela estrutura cristalográfica desta enzima. É importante notar que
apesar da estrutura cristalográfica 1ME4 apresentar-se acomplada ao inibidor T10, as
simulações feitas neste trabalho desconsideraram a presença do inibidor.
Na cruzipaína 2, apesar do valor da SAS total dos resíduos de TRP não apresentar
uma diminuição significativa a 37◦C, pôde-se verificar uma diminuição expressiva na
SAS do TRP144, que é compensada pelo aumento significativo da SAS do TRP184,
resíduo pertencente ao subsítio catalítico S1′. Estas alterações são mais relevantes no
10◦ ns de DM, apesar do valor da SAS total passar a apresentar um aumento não signifi-
cativo a 37◦C. Observou-se, também, um aumento significativo na SAS total em ambas
as temperaturas simuladas, em relação ao valor apresentado pelo modelo.
100
Tabe
la4.
9:Su
perf
ície
aces
síve
lao
solv
ente
(áre
aem
A2)
dos
trip
tofa
nos
dapa
paín
a(9
PAP)
ecr
uzip
aína
s1
(1M
E4)
e2
(1M
E4m
),ao
long
ode
10ns
desi
mul
ação
dedi
nâm
ica
mol
ecul
ar.
9PA
P1M
E4
1ME
4mT
RP
Cri
stal
25◦ C
37◦ C
TR
PC
rist
al25
◦ C37
◦ CT
RP
Mod
elo
25◦ C
37◦ C
734
6,88
336,
02±
0,31
333,
81±
0,37
734
1,50
326,
93±
0,47
327,
49±
0,40
734
7,97
338,
42±
0,77
338,
51±
0,31
2610
7,72
113,
72±
0,78
114,
83±
0,67
2693,0
587,0
7±
0,89
80,7
4±
1,13
2610
1,37
95,7
3±
0,66
89,9
2±
0,93
-−
−−
3835
3,37
341,
21±
0,34
341,
87±
0,34
3834
2,30
339,
99±
0,51
339,
77±
0,34
6921
0,03
221,
72±
0,69
214,
71±
0,76
7432
1,47
317,
93±
1,70
301,
43±
1,41
7432
5,97
307,
33±
0,69
311,
30±
0,51
-−
−−
128
346,
3832
2,84±
2,18
322,
59±
2,48
-−
−-
−−
−14
415
7,01
139,
30±
0,49
142,
62±
0,49
144
137,
1819
9,69±
1,66
170,
13±
1,07
-−
−−
178
358,
9833
9,01±
0,61
340,
54±
0,46
178
350,
5433
8,28±
0,59
331,
85±
0,89
177‡
106,
3880,2
3±
1,30
83,6
6±
3,03
184‡
109,
9510
0,49±
1,97
99,2
1±
1,65
184‡
96,7
286,2
6±
1,07
121,
90±
3,58
181
203,
5821
9,82±
1,21
207,
26±
1,21
188
199,
7219
1,86±
1,62
201,
69±
1,38
188
193,
3418
6,89±
0,94
190,
45±
0,94
Tota
l97
4,59
971,
51±
18,3
195
4,26±
25,4
4To
tal
2281,4
321
66,6
5±
35,0
521
58,1
8±
28,1
6To
tal
1895,3
919
68,0
6±
32,2
219
59,2
4±
38,2
6‡ T
ript
ofan
oco
nstit
uint
edo
subs
ítioS
1′
Alte
raçõ
esna
SAS
são
cons
ider
adas
sign
ifica
tivas
quan
dooc
orre
mflu
tuaç
ões
de24A
2,á
rea
refe
rent
ea
supe
rfíc
iede
cont
ato
deva
nde
rWaa
lsde
uma
mol
écul
ade
água
(Lu
etal
,20
07).
Tabe
la4.
10:S
uper
fíci
eac
essí
vela
oso
lven
te(á
rea
emA
2)d
ostr
ipto
fano
sda
papa
ína
(9PA
P)e
cruz
ipaí
nas
1(1
ME
4)e
2(1
ME
4m),
no10
◦ns
desi
mul
ação
dedi
nâm
ica
mol
ecul
ar.
9PA
P1M
E4
1ME
4mT
RP
Cri
stal
25◦ C
37◦ C
TR
PC
rist
al25
◦ C37
◦ CT
RP
Mod
elo
25◦ C
37◦ C
734
6,88
337,
44±
1,09
332,
55±
0,93
734
1,50
327,
76±
1,14
327,
13±
1,80
734
7,97
340,
54±
1,06
339,
26±
1,10
2610
7,72
112,
44±
1,30
115,
51±
1,42
2693,0
586,2
1±
1,38
78,5
5±
1,07
2610
1,37
96,8
3±
1,34
87,9
4±
1,43
-−
−−
3835
3,37
342,
64±
0,98
342,
32±
0,93
3834
2,30
341,
37±
0,56
339,
16±
0,68
6921
0,03
224,
63±
1,62
211,
26±
2,09
7432
1,47
319,
39±
1,76
286,
20±
1,40
7432
5,97
309,
15±
2,02
313,
84±
1,48
-−
−−
128
346,
3832
2,28±
1,47
323,
41±
1,19
-−
−−
-−
−−
144
157,
0113
8,38±
2,36
145,
66±
1,46
144
137,
1821
0,34±
2,06
167,
80±
1,36
-−
−−
178
358,
9833
7,15±
1,00
340,
97±
1,84
178
350,
5433
9,99±
0,93
338,
30±
1,05
177‡
106,
3883,5
7±
1,70
99,5
0±
2,11
184‡
109,
9595,7
0±
2,72
95,6
7±
3,24
184‡
96,7
289,1
7±
1,86
157,
97±
2,45
181
203,
5822
3,86±
1,48
210,
42±
1,86
188
199,
7219
0,21±
1,53
199,
75±
2,35
188
193,
3418
5,87±
1,21
181,
62±
1,41
Tota
l97
4,59
981,
92±
14,0
296
9,33±
17,7
3To
tal
2281,4
321
59,6
9±
20,9
821
39,7
3±
26,7
3To
tal
1895,3
919
75,1
1±
22,1
819
93,8
8±
21,7
8‡ T
ript
ofan
oco
nstit
uint
edo
subs
ítioS
1′
Alte
raçõ
esna
SAS
são
cons
ider
adas
sign
ifica
tivas
quan
dooc
orre
mflu
tuaç
ões
de24A
2,á
rea
refe
rent
ea
supe
rfíc
iede
cont
ato
deva
nde
rWaa
lsde
uma
mol
écul
ade
água
(Lu
etal
,20
07).
101
Para a avaliação da região catalítica, foram monitoradas as médias e os desvios
padrões da SAS dos resíduos que compõem os subsítios e o sítio catalítico durante os 10
ns de simulação (Tab. 4.11) e em maiores detalhes no último nanosegundo (Tab. 4.12).
A análise dos resultados mostram que:
(i) A região catalítica da papaína se expõe menos ao solvente a 37◦C, sendo a al-
teração mais significativa apresentada pelo subsítio S2, subsítio caracterizado
pela especificidade enzimática em cisteíno proteases. Em relação a SAS apre-
sentada pela estrutura cristalográfica (PDB: 9PAP), observou-se um aumento
da exposição ao solvente do subsítio S3 em ambas as temperatura testadas,
enquanto o subsítio S1 tende a uma diminuição. O subsítio S2 e o sítio cata-
lítico apresentaram comportamentos diferenciados entre as duas temperaturas,
aumentando a SAS a 25◦C e diminuindo a 37◦C, em relação ao cristal. Es-
tes perfis de exposição ao solvente dos subsítios S1, S2 e S3 tornam-se mais
expressivos no último nanossegundo de simulação, enquanto a SAS do sítio
catalítico tende a assemelhar-se com a apresentada pelo cristal.
(ii) Assim como na papaína, a cruzipaína 1 expõe menos a sua região catalítica
ao solvente quando simulada a 37◦C, sendo as alterações mais significativas
apresentadas pelos subsítios S1 e S3. No entanto, o subsítio S2 apresenta uma
tendência de aumento da sua SAS. Quando comparados com a SAS apresentada
pela estrutura cristalográfica (PDB: 1ME4), a região catalítica tende a diminuir
sua exposição ao solvente em ambas temperaturas testadas, destacando-se o
subsítio S2, possivelmente, pelo caráter hidrofóbico de seus resíduos (Tab. 3.10).
Porém, observou-se um aumento da SAS do sítio catalítico e do subsítio S3, a
25◦C, em relação ao cristal. Todas as alterações observadas na SAS apresenta-
ram-se mais significativas durante o 10◦ ns de DM.
102
(iii) Ao contrário da papaína e da cruzipaína 1, a cruzipaína 2 apresenta um aumento
da SAS da região catalítica quando simulada a 37◦C, exceto pela tendência de
menor exposição ao solvente do subsítio S2 e do sítio catalítico. É importante
notar que apesar do subsítio S2 da cruzipaína 2 tender a uma diminuição da
SAS ao longo da simulação a 37◦C, como apresentada pela papaína, no último
nanosegundo ocorre uma inversão neste comportamento havendo um aumento
da sua SAS, semelhante à cruzipaína 1. Ao comparar as médias da SAS da re-
gião catalítica da cruzipaína 2 com o valor apresentado pelo modelo, observou-
se uma tendência de diminuição da SAS em ambas as temperaturas simuladas,
com exceção ao subsítio S3 que teve um aumento da SAS a 37◦C.
103
Tabe
la4.
11:S
uper
fíci
eac
essí
vela
oso
lven
te(á
rea
emA
2)d
ossu
bsíti
ose
tría
deca
talít
ica
dapa
paín
a(9
PAP)
ecr
uzip
aína
s1
(1M
E4)
e2
(1M
E4m
),ao
long
ode
10ns
desi
mul
ação
dedi
nâm
ica
mol
ecul
ar.
Sítio
s9P
AP
1ME
41M
E4m
Cri
stal
25◦ C
37◦ C
Cri
stal
25◦ C
37◦ C
Mod
elo
25◦ C
37◦ C
S2′
227,
7524
6,82±
11,2
122
9,07±
15,0
123
5,07
230,
36±
11,3
023
1,45±
11,0
524
7,10
215,
89±
9,43
217,
66±
13,1
3S
1′52
4,25
523,
23±
23,7
549
3,13±
32,7
553
7,50
460,
00±
30,7
844
5,64±
31,0
051
5,91
440,
65±
19,4
248
8,40±
25,0
9S
125
6,80
248,
40±
24,4
420
5,60±
25,5
523
9,79
252,
09±
27,2
518
9,05±
18,7
221
1,11
180,
66±
13,5
720
5,32±
15,9
4S
255
7,79
580,
12±
46,7
953
2,99±
46,6
573
3,62
672,
60±
47,6
068
6,39±
33,4
471
7,54
711,
46±
44,3
565
7,64±
24,2
6S
320
9,67
270,
12±
26,6
625
1,33±
16,5
817
9,49
303,
26±
54,7
118
7,18±
10,7
618
4,99
178,
71±
10,7
920
7,24±
17,3
7C
atal
ítico
170,
7818
2,79±
9,85
157,
76±
11,8
514
6,72
173,
88±
16,0
815
6,12±
11,3
214
8,36
150,
86±
12,9
613
8,31±
14,0
9
Alte
raçõ
esna
SAS
são
cons
ider
adas
sign
ifica
tivas
quan
dooc
orre
mflu
tuaç
ões
de24A
2,á
rea
refe
rent
ea
supe
rfíc
iede
cont
ato
deva
nde
rWaa
lsde
uma
mol
écul
ade
água
(Lu
etal
,20
07).
Tabe
la4.
12:
Supe
rfíc
ieac
essí
vela
oso
lven
te(á
rea
emA
2)
dos
subs
ítios
etr
íade
cata
lític
ada
papa
ína
(9PA
P)e
cruz
ipaí
nas
1(1
ME
4)e
2(1
ME
4m),
no10
◦ns
desi
mul
ação
dedi
nâm
ica
mol
ecul
ar.
Sítio
s9P
AP
1ME
41M
E4m
Cri
stal
25◦ C
37◦ C
Cri
stal
25◦ C
37◦ C
Mod
elo
25◦ C
37◦ C
S2′
227,
7525
1,25±
8,51
233,
60±
10,3
323
5,07
233,
02±
9,48
230,
24±
9,90
247,
1021
1,01±
9,64
212,
81±
11,0
3S
1′52
4,25
505,
73±
28,4
449
5,56±
24,5
553
7,50
447,
24±
16,0
442
2,92±
16,2
451
5,91
435,
27±
17,7
550
8,15±
26,0
8S
125
6,80
240,
26±
10,6
319
0,91±
17,1
623
9,79
271,
19±
13,4
417
6,45±
8,85
211,
1117
1,62±
14,8
721
5,49±
11,3
2S
255
7,79
649,
77±
18,8
450
1,03±
21,8
673
3,62
640,
92±
14,3
365
9,33±
17,9
171
7,54
625,
63±
15,5
566
9,14±
22,3
4S
320
9,67
300,
91±
9,50
257,
24±
10,2
517
9,49
348,
66±
14,3
519
0,83±
14,5
418
4,99
178,
46±
9,53
219,
85±
8,52
Cat
alíti
co17
0,78
175,
82±
9,22
153,
97±
9,24
146,
7217
4,95±
8,97
155,
49±
8,10
148,
3615
6,61±
7,30
132,
67±
11,9
2
Alte
raçõ
esna
SAS
são
cons
ider
adas
sign
ifica
tivas
quan
dooc
orre
mflu
tuaç
ões
de24A
2,á
rea
refe
rent
ea
supe
rfíc
iede
cont
ato
deva
nde
rWaa
lsde
uma
mol
écul
ade
água
(Lu
etal
,20
07).
104
Para a visualização e comparação destas alterações estruturais na região catalítica
da papaína (9PAP), cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m), em função da tempe-
ratura, foram determinadas as conformações preferencias de cada enzima, tomando-se
diferentes valores de RMSD (1,0-2,0 A) como critério de decisão para o agrupamento.
O número de conformações preferenciais para cada valor de RMSD aplicado, pode ser
observado na Tab 4.13.
Tabela 4.13: Número de grupos de conformações representativas da papaína (9PAP) e cruzipaínas1 (1ME4) e 2 (1ME4m), usando diferentes pontos de corte de RMSD (em A), ao longo de 10 ns desimulação de dinâmica molecular.
RMSD 9PAP 1ME4 1ME4m(cortes) 25◦C 37◦C 25◦C 37◦C 25◦C 37◦C1.00 212 332 157 216 171 2741.25 42 63 21 35 23 571.50 10 21 5 8 5 151.75 3 5 3 3 2 62.00 1 2 1 1 1 2
A representação estrutural da SAS das conformações preferencias obtidas com
RMSD = 1,75 A, estão representadas na Fig. 4.9 para a papaína (9PAP), na Fig. 4.10
para a cruzipaína 1 (1ME4) e na Fig. 4.11 para a cruzipaína 2 (1ME4m).
105
Figura 4.9: Grupo de conformações representativas de papaína (9PAP) usando como ponto de corteRMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular.
25◦C 37◦C
Os sítios estão representados da seguinte forma: S2′ - azul, S1′ - rosa, S1 - vermelho, S2 - verde, S3 -amarelo e Catalítico - laranja.
106
Figura 4.10: Grupo de conformações representativas de cruzipaína 1 (1ME4) usando como ponto decorte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular.
25◦C 37◦C
Os sítios estão representados da seguinte forma: S2′ - azul, S1′ - rosa, S1 - vermelho, S2 - verde, S3 -amarelo e Catalítico - laranja.
107
Figura 4.11: Grupo de conformações representativas de cruzipaína 2 (1ME4m) usando como ponto decorte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular.
25◦C 37◦C
Os sítios estão representados da seguinte forma: S2′ - azul, S1′ - rosa, S1 - vermelho, S2 - verde, S3 -amarelo e Catalítico - laranja.
108
25◦C 37◦C
Os sítios estão representados da seguinte forma: S2′ - azul, S1′ - rosa, S1 - vermelho, S2 - verde, S3 -amarelo e Catalítico - laranja.
109
A análise das propriedades eletrostáticas no sítio catalítico da cruzipaína (Dar-
denne, 2000) mostrou que a atividade catalítica desta enzima está particularmente li-
gada a formação e estabilização do par iônico CYS25− · · ·HIS162+, como apresentado
pela papaína (Dardenne et al, 2003). Resíduos situados a uma distância de até 5 A
em relação a porção sulfidrila (SG) da CYS25 e da porção imidazol (ND1) da HIS162,
são responsáveis pela formação de um campo elétrico intenso e alinhado na direção
SG−ND1 (Dardenne et al, 2003). Desta forma, alterações estruturais na região ca-
talítica das cisteíno proteases podem levar a uma desestabilização da formação do par
iônico.
Para a análise da manutenção do par iônico responsável pela atividade catalítica
destas enzimas, foram monitorados os posicionamentos das cadeias laterais dos seguin-
tes resíduos: (i) papaína: CYS25, ASP158 e HIS159; (ii) cruzipaína 1: CYS25, ASP161
e HIS162; (iii) cruzipaína 2: CYS25, SER161 e HIS162. Os resultados apresentados na
Fig. 4.12 mostram que:
(i) Papaína: a 37◦C ocorreu um "dobramento” no anel imidazol da HIS159 que,
apesar de alterar a organização estrutural da região catalítica, não levou a deses-
tabilização do par iônico. Este fenômeno de "dobramento"não foi observado a
25◦C.
(ii) Cruzipaína 1: em ambas as temperaturas simuladas, ocorreu este fenômeno de
"dobramento” do anel imidazol da HIS162, sem o enfraquecimento da intera-
ção eletrostática CYS25− · · ·HIS162+. No entanto, pôde-se notar que a 37◦C,
houve também uma rotação de 180◦ no anel imidazol, sugerindo uma momen-
tânea desestabilização do par iônico.
(iii) Cruzipaína 2: ao contrário da papaína e da cruzipaína 1, a estrutura do par
iônico da cruzipaína 2 manteve-se estável ao longo de toda a simulação de
DM, em ambas as temperaturas testadas.
110
Figu
ra4.
12:
Con
form
açõe
sas
sum
idas
pelo
sre
sídu
osda
papa
ína
(9PA
P)e
das
cruz
ipaí
nas
1(1
ME
4)e
2(1
ME
4m),
emre
laçã
oao
sse
uscr
ista
ise
mod
elo,
aolo
ngo
de10
nsde
sim
ulaç
ãode
dinâ
mic
am
olec
ular
.
9PA
P1M
E4
1ME
4mC
YS2
5/A
SP15
8/H
IS15
9C
YS2
5/A
SP16
1/H
IS16
2C
YS2
5/SE
R16
1/H
IS16
2
0ns
1ns
2ns
Os
cris
tais
dacr
uzip
aína
1(1
ME
4.pd
b)e
dapa
paín
a(9
PAP.
pdb)
,bem
com
oo
mod
elo
dacr
uzip
aína
2(1
ME
4m.p
db),
estã
ore
pres
enta
dos
emve
rde.
As
conf
orm
açõe
sas
sum
idas
a25
◦ Ce
a37
◦ Ces
tão
repr
esen
tada
spe
las
core
saz
ule
verm
elha
,res
pect
ivam
ente
.
111
9PA
P1M
E4
1ME
4mC
YS2
5/A
SP15
8/H
IS15
9C
YS2
5/A
SP16
1/H
IS16
2C
YS2
5/SE
R16
1/H
IS16
2
3ns
4ns
5ns
Os
cris
tais
dacr
uzip
aína
1(1
ME
4.pd
b)e
dapa
paín
a(9
PAP.
pdb)
,bem
com
oo
mod
elo
dacr
uzip
aína
2(1
ME
4m.p
db),
estã
ore
pres
enta
dos
emve
rde.
As
conf
orm
açõe
sas
sum
idas
a25
◦ Ce
a37
◦ Ces
tão
repr
esen
tada
spe
las
core
saz
ule
verm
elha
,res
pect
ivam
ente
.
112
9PA
P1M
E4
1ME
4mC
YS2
5/A
SP15
8/H
IS15
9C
YS2
5/A
SP16
1/H
IS16
2C
YS2
5/SE
R16
1/H
IS16
2
6ns
7ns
8ns
Os
cris
tais
dacr
uzip
aína
1(1
ME
4.pd
b)e
dapa
paín
a(9
PAP.
pdb)
,bem
com
oo
mod
elo
dacr
uzip
aína
2(1
ME
4m.p
db),
estã
ore
pres
enta
dos
emve
rde.
As
conf
orm
açõe
sas
sum
idas
a25
◦ Ce
a37
◦ Ces
tão
repr
esen
tada
spe
las
core
saz
ule
verm
elha
,res
pect
ivam
ente
.
113
9PA
P1M
E4
1ME
4mC
YS2
5/A
SP15
8/H
IS15
9C
YS2
5/A
SP16
1/H
IS16
2C
YS2
5/SE
R16
1/H
IS16
2
9ns
10ns
Os
cris
tais
dacr
uzip
aína
1(1
ME
4.pd
b)e
dapa
paín
a(9
PAP.
pdb)
,bem
com
oo
mod
elo
dacr
uzip
aína
2(1
ME
4m.p
db),
estã
ore
pres
enta
dos
emve
rde.
As
conf
orm
açõe
sas
sum
idas
a25
◦ Ce
a37
◦ Ces
tão
repr
esen
tada
spe
las
core
saz
ule
verm
elha
,res
pect
ivam
ente
.
114
Para uma análise mais detalhada desta mudança conformacional no sítio catalí-
tico, calculou-se a distância (em A) entre as cadeias laterais dos seguintes resíduos:
(i) papaína: CYS25, ASP158, HIS159 e ASN175; (ii) cruzipaína 1: CYS25, ASP161,
HIS162 e ASN182; (iii) cruzipaína 2: CYS25, SER161, HIS162 e ASN182. Os resul-
tados apresentados na Fig. 4.13 mostram que:
(i) Papaína: a 37◦C ocorreu o rompimento da ligação de hidrogênio HIS159:NE2
· · ·ASN175:OD1, permitindo a interação HIS159:NE2→ASP158:OD2, pro-
movendo o "dobramento” do anel imidazol da HIS159. Este evento favoreceu
a entrada de uma molécula de água na região catalítica, que estabeleceu uma
ligação de hidrogênio com a ASN175:OD1.
(ii) Cruzipaína 1: semelhante ao ocorrido na papaína, o rompimento da ligação de
hidrogênio HIS162:NE2· · ·ASN182:OD1 gerou uma reestruturação da tríade
catalítica, em ambas as temperaturas simuladas. No entanto, pôde-se notar
que a 37◦C, houve também uma rotação de 180◦ no anel imidazol, sugerindo
uma desestabilização momentânea na formação do par iônico, com posterior
restabelecimento através da interação CYS25:SG−HIS162:NE2 e da ligação
de hidrogênio HIS159:ND1· · ·ASP158:OD2.
(iii) Cruzipaína 2: as interações formadas entre os resíduos da tríade catalítica per-
maneceram estáveis tanto em 25◦C quanto em 37◦C, mantendo-se a organiza-
ção estrutural do sítio catalítico.
115
Figu
ra4.
13:D
istâ
ncia
sen
tre
osre
sídu
osdo
ssí
tios
cata
lític
osda
papa
ína
(9PA
P)e
das
cruz
ipaí
nas
1(1
ME
4)e
2(1
ME
4m),
no10
◦ns
desi
mul
ação
dedi
nâm
ica
mol
ecul
ar.
cris
tal/
mod
elo
25◦ C
37◦ C
9PA
P
1ME
4
1ME
4m
As
dist
ânci
asap
rese
ntad
asfo
ram
med
idas
emA
ngst
röm
s(A
).A
ság
uas
fora
mse
leci
onad
asco
mcr
itéri
ode
5,0A
dedi
stân
cia
emre
laçã
oa
ASP
158:
O/A
SP16
1:O
,ASN
175:
O/A
SN18
2:O
eA
SN17
5:O
D1/
ASN
182:
OD
1.
116
Capítulo 5
Conclusões e Perspectivas
O objetivo geral deste trabalho foi aplicar técnicas de bioinformática e modela-
gem computacional ao conjunto de seqüências protéicas preditas a partir de seqüências
genômicas de Trypanosoma cruzi (El-Sayed et al, 2005), visando inicialmente a cons-
trução de modelos protéicos tridimensionais a serem analisados por abordagens enzi-
máticas/evolutivas, com o intuito de identificar alvos moleculares para o tratamento da
doença de Chagas, dentro do contexto de desenho racional de fármacos baseado em es-
trutura. Além disto, objetivou-se estudar o comportamento dinâmico de alguns deste
alvos moleculares, no caso, as cisteíno proteases cruzipaína 1 e cruzipaína 2.
A partir dos objetivos específicos propostos neste trabalho podemos chegar às
seguintes conclusões:
(1) Modelos 3D de T. cruzi e suas classificações enzimáticas: De acordo com o
protocolo estabelecido ao MHOLline, foi possível obter 2.786 modelos estru-
turais protéicos, não redundantes, usando o conjunto de seqüências protéicas
preditas a partir de 25.041 CDS (Seqüência Codificante). O MHOLline tam-
bém foi capaz de identificar 4.719 seqüências que podem estar associadas a
proteínas de membrana.
Através do ECNGet, ferramenta desenvolvida neste trabalho, foi possível as-
sociar automaticamente uma classificação enzimática a 1.876 proteínas de T.
cruzi. Destes modelos, aproximadamente 74% coincidiram com a anotação
genômica de suas seqüências alvos, valor este considerado significativo para
117
a automação de processos classificatórios. Cerca de 12% dos modelos que
foram classificados enzimaticamente apresentaram seqüências alvos original-
mente anotadas como hipotéticas. Através deste resultado pode-se sugerir a
aplicação do MHOLline não somente para a construção de modelos protéicos
tridimensionais mas, também, como ferramenta para a reanotação de seqüên-
cias. Outro resultado que aponta para esta mesma conclusão é o fato de 14%
dos modelos apresentarem perfil enzimático discordante da anotação genômica
de suas seqüências alvos.
Quanto a qualidade dos modelos de enzimas gerados, cerca de 9,5% podem
ser “diretamente” aplicados em estudos de mecanismos catalíticos e no dese-
nho racional de fármacos baseado em estruturas, 34,5% podem ser usados em
estudos de docking receptor-ligante, 35,5% podem ter seus modelos refinados
e também aplicados em estudos de docking, e cerca de 20,5% podem ser ao
menos usados para inferir funções a seqüências protéicas a partir de análises de
alinhamentos estruturais.
(2) Relações de similaridade entre as enzimas de T. cruzi e enzimas humanas (Homo
sapiens): Para este propósito, foi aplicada a ferramenta AnEnπ que classificou
99 seqüências de T. cruzi como possíveis análogas a enzimas humanas, 1.776
como similares e 10 seqüências consideradas como possivelmente específicas
de T. cruzi em relação a humanos. Estes resultados indicam que o AnEnπ,
quando acoplado ao MHOLline, pode ser uma boa ferramenta a ser aplicada na
detecção de enzimas de interesse para estudos de desenho racional de fármacos
baseado em estrutura.
Por trabalhar com o banco de dados do KEGG, o AnEnπ também é capaz de
indicar quais enzimas estão associadas a uma via metabólica já descrita, de
forma a auxiliar estudos computacionais de mecanismos enzimáticos (e.g doc-
king receptor-ligante). Das 39 classificações enzimáticas detectadas neste tra-
balho, associadas a proteínas preditas a partir do genoma de T. cruzi, 26 classi-
ficações (abrangendo 1185 modelos) estão associadas a alguma via metabólica
118
descrita no KEGG, e dentro das 13 classificações associadas a uma via me-
tabólica não descrita (compreendendo 691 modelos enzimáticos de T. cruzi),
identificou-se algumas enzimas já caracterizadas como alvos moleculares de
interesse no combate à doença de Chagas (e. g. cruzipaína - EC: 3.4.22.51).
A partir desta primeira lista de possíveis alvos moleculares de T. cruzi, devem
ser feitos estudos mais detalhados dos modelos classificados como sendo ao
menos de boa qualidade e que sejam integrantes de alguma via metabólica des-
crita, verificando-se a sua importância biológica para o parasita, qual o número
de isoformas detectáveis, se existem possíveis vias enzimáticas alternativas, se
existem dados experimentais indicando sua eficiência catalítica a diferentes ini-
bidores, e demais informações que possam auxiliar no estudo das propriedades
físico-químicas de sua região catalítica.
Nos alvos moleculares descritos da Tab. 1.1 e cujas similaridades e possíveis
analogias com enzimas humanas foram apresentadas na Tab. 4.5, deve ser reali-
zada uma análise comparativa detalhada de suas regiões catalíticas, verificando-
se possíveis similaridades e diferenças de propriedades físico-químicas que su-
giram aspectos relevantes a serem explorados no desenvolvimento de inibido-
res específicos. Destes alvos, vale a pena destacar a enzima NADH-fumarato
redutase que foi classificada como possivelmente análoga a enzimas humanas.
Através destes estudos é possível se obter uma lista de potenciais alvos molecu-
lares de T. cruzi que possam ser cruzados contra bancos de ligantes ou aplicados
em estudos de desenho racional de fármacos baseado em estrutura, auxiliando
nos estudos experimentais de fármacos para o combate da doença de Chagas.
(3) Dinâmicas moleculares da papaína e das cruzipaínas 1 e 2: As simulações
de dinâmica molecular das estruturas da papaína (9PAP) e da cruzipaína 1
(1ME4), bem como do modelo estrutural da cruzipaína 2 (1ME4m), foram
feitas simulando-se as temperaturas encontradas no vetor invertebrado (25◦C
= 298K) e no hospedeiro vertebrado (37◦C = 310K) de T. cruzi. Os resultados
119
obtidos mostram que estas três cisteíno proteases tendem a manter estáveis as
suas estruturas secundárias bem como a organização de seu esqueleto peptídico.
Resultados experimentais realizados com a cruzipaína 1 nas temperaturas de
25◦C e 37◦C, sugerem que esta enzima tenda a diminuir sua porcentagem de
estruturas secundárias e a diminuir sua intensidade de fluorescência quando
incubada a 37◦C, sugerindo alterações, também, na sua conformação terciá-
ria (dos Reis, 2005). A análise da superfície acessível ao solvente (SAS) dos
resíduos de TRP da papaína e das cruzipaínas 1 e 2, mostra que os resíduos de
triptofano da papaína e da cruzipaína 1 tendem a diminuir sua exposição ao sol-
vente, quando simuladas em temperatura de 37◦C, sendo o resíduo TRP74 da
cruzipaína 1 o que apresentou uma redução mais significativa. Na cruzipaína
2, apesar de não se observar nenhuma alteração significativa na SAS, entre as
duas temperaturas testadas, a análise detalhada de cada um de seus resíduos de
TRP mostra que a 37◦C há um aumento significativo na SAS do TRP144, que
é compensado pela diminuição expressiva da SAS do TRP184 (resíduo perten-
cente ao subsítio catalítico S1′).
Nas análises da SAS dos resíduos pertencentes aos subsítios e ao sítio catalí-
tico, observou-se que a região do sítio ativo da papaína tende a ficar menos ex-
posta ao solvente a 37◦C, sendo a alteração mais significativa apresentada pelo
subsítio S2, o qual é responsável pela especificidade enzimática em cisteíno
proteases. Embora a cruzipaína 1 tenha apresentado comportamento global se-
melhante ao da papaína, observou-se uma tendência de aumento na SAS do
subsítio S2. Na cruzipaína 2 verificou-se um aumento da SAS da região cata-
lítica a 37◦C, com o subsítio S2 tendendo a uma menor exposição ao solvente,
como apresentado pela papaína. É importante notar que apesar do subsítio S2
da cruzipaína 2 tender a uma diminuição da SAS ao longo da simulação a 37◦C,
no último nanosegundo ocorreu uma inversão neste comportamento de forma a
haver um aumento da sua SAS, similar ao apresentado pela cruzipaína 1.
De acordo com a análise estrutural realizada neste trabalho, não foram obser-
120
vadas alterações em demais regiões da proteína, além das associadas a região
do sítio ativo, não sendo possível observar a existência de um sítio alostérico
em cruzipaína. Porém, a não observação deste sítio pode estar associada ao
pouco tempo de simulação computacional realizado (escala em nanosegundos
= 10−9), se comparado com o tempo aplicado em estudos experimentais (es-
cala em microssegundos = 10−6), ou ao fato das simulações de DM terem sido
realizadas sem considerar a presença de inibidores.
De acordo com Dardenne et al (2003), as análises das propriedades eletros-
táticas no sítio catalítico de cisteíno proteases, mostram que resíduos situa-
dos a uma distância de até 5 A em relação a porção CYS25:SG e a porção
HIS159:ND1 (numeração da papaína), são responsáveis pela formação de um
campo elétrico intenso e alinhado na direção SG−ND1. Portanto, alterações
estruturais na região catalítica das cisteíno proteases podem levar a uma de-
sestabilização da formação do par iônico. Neste trabalho, foi feita a análise da
manutenção do par iônico responsável pela atividade catalítica das cisteíno pro-
teases, monitorando-se os posicionamentos e distâncias entre as cadeias laterais
dos seguintes resíduos: (i) papaína: CYS25, ASP158, HIS159 e ASN175; (ii)
cruzipaína 1: CYS25, ASP161, HIS162 e ASN182; (iii) cruzipaína 2: CYS25,
SER161, HIS162 e ASN182.
Foram observadas alterações importantes na organização estrutural dos resí-
duos CYS25, HIS159 e ASN175 pertencentes a tríade catalítica e ao resíduo
situado na posição 158, de acordo com a numeração da papaína.
Na papaína, ocorreu um "dobramento” no anel imidazol da HIS159 quando si-
mulada a 37◦C. Este evento deve-se ao rompimento da ligação de hidrogênio
HIS159:NE2· · ·ASN175:OD1, permitindo a interação HIS159:NE2 · · · ASP
158:OD2, com a formação de uma ligação de hidrogênio. Esta alteração con-
formacional favorece a entrada de uma molécula de água na região catalítica,
estabelecendo uma ligação de hidrogênio com a ASN175:OD1. Apesar de al-
terar a organização estrutural da região catalítica, este evento não promove a
121
desestabilização do par iônico.
Na cruzipaína 1, este fenômeno de "dobramento” do anel imidazol da HIS162
ocorreu em ambas as temperaturas simuladas, sem haver o enfraquecimento
da interação eletrostática CYS25− · · ·HIS162+. No entanto, pôde-se notar
que a 37◦C houve também uma rotação de 180◦ no anel imidazol, sugerindo
uma desestabilização momentânea na formação do par iônico, com uma pos-
terior reestruturação deste, agora formado pela interação CYS25:SG−HIS162:
NE2 e com o estabelecimento da ligação de hidrogênio HIS159:ND1 · · · ASP
158:OD2 (numeração da papaína).
A estrutura do par iônico da cruzipaína 2 se manteve estável ao longo de toda a
simulação de DM, em ambas as temperaturas testadas. É importante observar
que na cruzipaína 2 ocorre a substituição do aminoácido negativamente carre-
gado ASP161 por um neutro polar SER161, o que proporcionaria uma esta-
bilização das interações CYS25:SG−HIS162:ND1 e HIS162:NE2−ASN182:
OD1. Desta forma, é possível propor que a desestabilização do anel imidazol
da HIS catalítica, observada na papaína e na cruzipaína 1, esteja associada a
uma forte influência do potencial elétrico negativo formado pelo resíduo ácido
ASP158/ 161, sendo suscetível a variações de temperatura.
Com relação a alterações estruturais apresentadas pela papaína e cruzipaína 1
durante as simulações de DM, se comparadas com suas respectivas estruturas
cristalográficas 9PAP e 1ME4, deve-se ressaltar que estas estruturas foram ob-
tidas por técnicas de raios-X a baixas temperaturas, sendo a 4◦C para a 9PAP e
a ≈17◦C para a 1ME4.
Os resultados deste trabalho indicam que, em cisteíno proteases da família da
papaína, haja uma possível associação entre a carga apresentada pelo resíduo na
posição 158 (na numeração da papaína) e a eficiência catalítica destas enzimas
em diferentes temperaturas. De acordo com revisão apresentada por Goldblum
(1997), o papel do resíduo 158 na estabilização do par iônico já foi alvo de es-
tudo de diferentes trabalhos que questionavam a importância da carga negativa
122
Figura 5.1: Conformação estrutural dos resíduos que compõem a tríade catalítica de serino proteasemutada (SER221CSO) e de cruzipaína 1 (1ME4) após simulação de DM a 37◦C.
Subtilisina BPN’† com mutação SER221CSOa Cruzipaína 1‡ simulada a 37◦C
As distâncias apresentadas foram medidas em Angströms (A).aCSO: S-hidroxicisteína.†PDB 1GNS (Almog et al, 2002). A tríade catalítica de serino protease da família S2 é composta porASP32, HIS64 e SER221.‡PDB 1ME4 (Huang et al, 2003). A tríade catalítica de cisteíno protease é composta por CYS25, HIS159e ASN175 (numeração da papaína).
nesta posição para a formação de conformações catalíticas duplas, estabeleci-
das pelas tríades CYS25/HIS159/ASN175 e CYS25/HIS159/ASP158 (numera-
ção da papaína). Esta última conformação foi observada neste trabalho para as
simulações da papaína e da cruzipaína 1 a 37◦C. Neste sentido é importante no-
tar que a conformação dos resíduos catalíticos da cruzipaína 1 simulada a 37◦C
assemelha-se a conformação apresentada pelos resíduos catalíticos de serino
proteases (ASP32, HIS64 e SER221), como apresentado na Fig. 1.6, principal-
mente quando observada a configuração de serino proteases mutadas na posição
221, alterando-se o resíduo serina por S-hidroxicisteína (CSO) (Fig. 5.1).
123
Referências Bibliográficas
Acosta-Serrano, A., Almeida, I. C., Freitas-Junior, L. H., Yoshida, N. e Schenkman, S.
(2001). The mucin-like glycoprotein super-family of Trypanosoma cruzi: structure
and biological roles. Molecular & Biochemical Parasitology, 114:143–150.
Almog, O., Gallagher, D. T., Ladner, J. E., Strausberg, S., Alexander, P., Bryan, P. e
Gilliland, G. L. (2002). Structural basis of thermostability. The Journal of Biological
Chemistry, 277(30):27553–27558.
Altschul, S. F., Gish, W., Miller, W., Meyers, E. W. e Lipman, D. J. (1990). Basic Local
Alignment Search Tool. Journal of Molecular Biology, 215(3):403–410.
Altschul, S. F., Madden, T. L., Schäffer, A. A., Zhang, J., Zhang, Z., Miller, W. e Lip-
man, D. J. (1997). Gapped BLAST and PSI-BLAST: a new generation of protein
database search programs. Nucleic Acids Research, 25(17):3389–3402.
Atwood III, J. A., Weatherly, D. B., Minning, T. A., Bundy, B., Cavola, C., Opper-
does, F. R., Orlando, R. e Tarleton, R. L. (2005). The Trypanosoma cruzi proteome.
Science, 309(15):473–476.
Bairoch, A., Boeckmann, B., Ferro, S. e Gasteiger, E. (2004). Swiss-prot: juggling
between evolution and stability. Briefings in Bioinformatics, 5(1):39–55.
Baker, D. e Sali, A. (2001). Protein structure prediction and structural genomics. Na-
ture, 294(93):93–96.
Barreiro, E. J. e Fraga, C. A. M. (2001). Química médica: As bases moleculares da
ação dos fármacos. Artmed Editora Ltda., 1a¯ edição.
124
Beard, C. B., Pye, G., Steurer, F. J., Rodriguez, R., Campman, R., Peterson, A. T.,
Ramsey, J., Wirtz, R. A. e Robinson, L. E. (2003). Chagas disease in a domestic
transmission cycle in southern texas, USA. Emerging Infectious Diseases, 9(1):103–
105.
Berendsen, H. J. C., Grigera, J. R. e Straatsma, T. P. (1987). The missing term in
effective pair potentials. The Journal of Physical Chemistry, 91:6269–6271.
Berendsen, H. J. C., Postma, J. P. M., van Gunsteren, W. F., DiNola, A. e Haak, J. R.
(1984). Molecular dynamics with coupling to an external bath. The Journal of
Chemical Physics, 81(8):3684–3690.
Berman, H. M., Westbrook, J., Feng, Z., Gilliland, G., Bhat, T. N., Weissig, H., Shindya-
lov, I. N. e Bourne, P. E. (2000). The Protein Data Bank. Nucleic Acids Research,
28(1):253–242.
Bond, C. S., Zhang, Y., Berriman, M., Cunningham, M. L., Fairlamb, A. H. e Hunter,
W. N. (1999). Crystal structure of Trypanosoma cruzi trypanothione reductase in
complex with trypanothione, and the structure-based discovery of new natural product
inhibitors. Structure, 7:81–89.
Bondi, A. (1964). van der Waals volumes and radii. The Journal of Physical Chemis-
try, 68(3):441–451.
Bonet, C., Branco, T. P., Larrubia, A. F. G., Teixeira, C. O., Teixeira, M. A. B. e Car-
valhal, S. S. (2003). Correlação anatomoclínica: Caso 1/03 - homem, 27 anos, com
sorologia reagente para doença de Chagas e antecedente de febre reumática há 11
anos (Pontifícia Universidade Católica - Campinas, SP). Arquivo Brasileiro de Car-
diologia, 80(2):220–223.
Bonse, S., Richards, J. M., Ross, S. A., Lowe, G. e Krauth-Siegel, R. L. (2000).
(2,2’:6’,2”-Terpyridine)platinum(ii) complexes are irreversible inhibitors of Trypano-
soma cruzi trypanothione reductase but not of human glutathione reductase. Journal
of Medicinal Chemistry, 43(25):4812–4821.
125
Borin, I. A. (1999). Propriedades estruturais e dinâmicas de misturas líquidas biná-
rias associativas. Tese de Doutorado, Instituto de Química - Universidade Estadual
de Campinas / Brasil.
Brooks, B. R., Bruccoreli, R. E., Olafson, B. D., States, D. J., Swaminathan, S. e Kar-
plus, M. (1983). CHARMM: a program for macromolecular energy minimization and
dynamics calculation. Journal of Computational Chemistry, 4(2):187–217.
Buckner, F., Yokoyama, K., Lockman, J., Aikenhead, K., Ohkanda, J., Sadilek, M.,
Sevti, S., Voorhis, W. V., Hamilton, A. e Gelb, M. H. (2003). A class of sterol 14-
demethylase inhibitors as anti-Trypanosoma cruzi agents. Proceedings of the Natio-
nal Academy of Sciences of the United States of America, 100(5):15149–15153.
Buckner, F. S., Griffin, J. H., Wilson, A. J. e van Voorhis, W. C. (2001). Potent anti-
Trypanosoma cruzi activities of oxidosqualene cyclase inhibitors. Antimicrobial
Agents and Chemotherapy, 45(4):1210–1215.
Buschiazzo, A., Tavares, G. A., Campetella, O., Spinelli, S., Cremona, M. L., París, G.,
Amaya, M. F., Frasch, A. C. C. e Alzari, P. M. (2000). Structural basis of sialyltrans-
ferase activity in trypanosomal sialidases. The EMBO Journal, 19(1):16–24.
Carson, M. e Bugg, C. E. (1986). Algorithm for ribbon models of proteins. Journal of
Molecular Graphics, 4:121–122.
Catanho, M., Mascarenhas, D., Degrave, W. e de Miranda, A. B. (2006). Bioparser: A
tool for processing of sequence similarity analysis reports. Applied Bioinformatics,
5(1):49–53.
Cavalcanti, M. C., Targino, R., Baião, F., Rössle, S. C., Bisch, P. M., Pires, P. F., Cam-
pos, M. L. M. e Mattoso, M. (2005). Managing structural genomic workflows using
web services. Data & Knowledge Engineering, 53:45–74.
Cazzulo, J. J., Stoka, V. e Turk, V. (2001). The major cysteine proteinase of Trypano-
soma cruzi: a valid target for chemotherapy of Chagas disease. Current Pharma-
ceutical Design, 7:1143–1156.
126
Chan, C., Yin, H., Garforth, J., McKie, J. H., Jaouhari, R., Speers, P., Douglas, K. T.,
Rock, P. J., Yardley, V., Croft, S. L. e Fairlamb, A. H. (1998). Phenothiazine inhibitors
of trypanothione reductase as potential antitrypanosomal and atileishmanial drugs.
Journal of Medicinal Chemistry, 41:148–156.
Chance, M. R., Bresnick, A. R., Burley, S. K., Jiang, J.-S., Lima, C. D., Sali, A., Almo,
S. C., Bonanno, J. B., Buglino, J. A., Boulton, S., Chen, H., Eswar, N. Y., He, G.,
Huang, R., Ilyin, V., McMahan, L., Pieper, U., Ray, S., Vidal, M. e Wang, L. K.
(2002). Strucutural genomics: a pipeline for providing structures for the biologist.
Protein Science, 11:723–738.
Cherkasov, A., Sui, S. J. H., Brunham, R. C. e Jones, S. J. (2004). Structural cha-
racterization of genomes by large scale sequence-structure threading: application of
reliability analysis in structural genomics. BMC Bioinformatics, 5(37):1–16.
Connolly, M. L. (1983). Solvent-accessible surfaces of proteins and cucleic acids. Sci-
ence, 221(4612):709–713.
Connolly, M. L. (1986). Mds molecular dot surface. Ported to Macintosh and Language
Systems Fortran in July, 1993.
Cornell, W. D., Cieplak, P., Bayly, C. I., Gould, I. R., Merz Jr., K. M., Ferguson, D. M.,
Spellmeyer, D. C., Fox, T., Caldwell, J. W. e Kollman, P. A. (1995). A second gene-
ration force field for the simulation of proteins, nucleic acids and organic molecules.
Journal of the American Chemical Society, 117:5179–5197.
Coura, J. R. e de Castro, S. L. (2002). A critical review on Chagas disease chemotherapy.
Memórias do Instituto Oswaldo Cruz, 97(1):3–24.
Cuevas, I. C., Cazzulo, J. J. e Sánchez, D. O. (2003). gp63 homologues in Trypanosoma
cruzi: surface antigens with metalloprotease activity and a possible role in host cell
infection. Infection and Immunity, 71(10):5397–5749.
127
Dardenne, L. E. (2000). Propriedades eletrostáticas do sítio ativo de cisteíno pro-
teinases da família da papaína. Tese de Doutorado, Instituto de Biofísica Carlos
Chagas Filho - Universidade Federal do Rio de Janeiro / Brasil.
Dardenne, L. E., Werneck, A. S., Neto, M. O. e Bisch, P. M. (2003). Eletrostatic proper-
ties in the catalytic site of papain: a possible regulatory mechanism for the reactivity
of the ion pair. PROTEINS: Structure, Function and Genetics, 52:236–253.
Daura, X., Gademann, K., Jaun, B., Seebach, D., van Gusteren, W. F. e Mark, A. E.
(1999). Peptide folding: When simulation meets experiment. Angewandte Chemie
International Edition, 38(1-2):236–240.
de Moura, K. C. G., Emery, F. S., Neves-Pinto, C., Pinto, M. C. F. R., Dantas, A. P.,
ao, K. S., de Castro, S. L. e Pinto, A. V. (2001). Trypanocidal activity of isolated
naphthoquinones from Tabebuia and some heterocyclic derivatives: A review from
an interdisciplinary study. J. Braz. Chem. Soc., 12(3):325–338.
del Nery, E., Juliano, M. A., Lima, A. P. C. A., Scharfstein, J. e Juliano, L. (1997). Ki-
ninogenase activity by the major cysteinyl proteinase (cruzipain) from Trypanosoma
cruzi. The Journal of Biological Chemistry, 272(41):25713–25718.
Devera, R. A. (2002). Caracterização biológica, bioquímica e molecular de cepas do
Trypanosoma cruzi, antes e após passagens em camundongos e em cultura. Tese
de Doutorado, Fundação Instituto Oswaldo Cruz / Brasil.
Dias, J. C. P. (1999). O tratamento específico da doença de Chagas. X Conferência
Nacional de Saúde On-Line. URL www.datasus.gov.br/cns
Dias, J. C. P. (2006). Notas sobre o Trypanosoma cruzi e suas características bio-
ecológicas, como agente de enfermidades transmitidas por alimentos. Revista da
Sociedade Brasileira de Medicina Tropical, 39(4):370–375.
dos Reis, F. C. G. (1999). Caracterização cinética de isoformas de cisteíno protease
do Trypanosoma cruzi. Dissertação de Mestrado, Instituto de Biofísica Carlos Chagas
Filho - Universidade Federal do Rio de Janeiro / Brasil.
128
dos Reis, F. C. G. (2005). Mecanismo de regulação da atividade de cisteíno proteases
do Trypanosoma cruzi. Tese de Doutorado, Instituto de Biofísica Carlos Chagas Filho
- Universidade Federal do Rio de Janeiro / Brasil.
dos Reis, F. C. G., Júdice, W. A. S., Juliano, M. A., Juliano, L., Scharfstein, J. e Lima,
A. P. C. A. (2006). The substrate specificit of cruzipain 2, a cysteine protease isoform
from Trypanosoma cruzi. FEMS Microbiology Letters, 259:215–220.
Drenth, J., Jansoniu, J. N., Koekoek, R., Swen, H. M. e Wolthers, B. G. (1968). Structure
of papain. Nature, 218:929–932.
Du, X., Hansell, E., Engel, J. C., Caffrey, C. R., Cohen, F. E. e McKerrow, J. H. (2000).
Aryl ureas represent a new class of anti-trypanosomal agents. Chemistry & Biology,
7:733–742.
Eddy, S. R. (2004). Where did the blosum62 alignment score matrix come from. Nature
Biotechnology, 22(8):1035–1036.
El-Sayed, N. M., Myler, P. J., Bartholomeu, D. C., Nilsson, D., Aggarwal, G., Tran,
A. N., Ghedin, E., Worthey, E. A., Delcher, A. L., Blandin, G., Westenberger, S. J.,
Caler, E., Cerqueira, G. C., Branche, C., Haas, B., Anupama, A., Arner, E., Aslund,
L., Attipoe, P., Bontempi, E., Bringaud, F., Burton, P., Cadag, E., Campbell, D. A.,
Carrington, M., Crabtree, J., Darban, H., da Silveira, J. F., de Jong, P., Edwards, K.,
Englund, P. T., Fazelina, G., Feldblyum, T., Ferella, M., Frasch, A. C., Gull, K., Horn,
D., Hou, L., Huang, Y., Kindlund, E., Klingbeil, M., Kluge, S., Koo, H., Lacerda, D.,
Levin, M. J., Lorenzi, H., Louie, T., Machado, C. R., McCulloch, R., an Y. Mizuno,
A. M., Mottran, J. C., Nelson, S., Ochaya, S., Osoegawa, K., Pai, G., Parsons, M.,
Pentony, M., Pettersson, U., Pop, M., Ramirez, J. L., Rinta, J., Robertson, L., Salz-
berg, S. L., Sanchez, D. O., Seyler, A., Sharma, R., Shetty, J., Simpson, A. J., Sisk, E.,
Tammi, M. T., Tarleton, R., Teixeira, S., Aken, S. V., Vogt, C., Ward, P. N., Wickstead,
B., Wortman, J., White, O., Fraser, C. M., Stuart, K. D. e Anderson, B. (2005). The
genome sequence of Trypanosoma cruzi, etiologic agent of Chagas disease. Science,
309(15):409–415.
129
Engel, J. C., Doyle, P. S., Palmer, J., Hsieh, I., Bainton, D. F. e McKerrow, J. H. (1999).
Cysteine protease inhibitors alter golgi complex ultrastructure and function in Trypa-
nosoma cruzi. Journal of Cell Science, 111:597–606.
Engman, D. M. e Leon, J. S. (2002). Pathogenesis of Chagas heart disease: role of
autoimmunity. Acta Tropica, 81:123–132.
Esteva, M. I., Kettler, K., Maidana, C., Fichera, L., Ruiz, A. M., Bontempo, W. J.,
Andersson, B., Dahse, H.-M., Haebel, P., Ortmann, R., Klebe, G. e Schlitzer, M.
(2006). Benzophenone-based farnesyltransferase inhibitors with hig activity against
Trypanosoma cruzi. Journal of Medicinal Chemistry, 48(23):7186–7191.
Faerman, C. H., Savvides, S. N., Strickland, C., Breidenbach, M. A., Ponasik, J. A.,
Ganem, B., Ripoll, D., Krauth-Siegel, R. L. e Karplus, P. A. (1996). Charge is the
major discriminating factor for glutathione reductase versus trypanothione reductase
inhibitors. Bioorganic & Medicinal Chemistry, 4(8):1247–1253.
Fan, H. e Mark, A. E. (2004). Refinement of homology-based protein structures by
molecular dynamics simulation techniques. Protein Science, 13:211–220.
Fitch, W. M. (2000). Homology: A personal view on some of the problems. Trends in
Genetics, 16(5):227–231.
Galperin, M. Y. e Koonin, E. V. (1999). Searching for drug targets in microbial genomes.
Current Opinion in Biotechnology, 10:571–578.
Galperin, M. Y., Walker, D. R. e Koonin, E. V. (1998). Analogous enzymes: Independent
inventions in enzyme evolution. Genome Research, 8:779–790.
Garcia, E. S. e Azambuja, P. (2000). Fisiologia de triatomíneos: desenvolvimento,
reprodução e interação com Trypanosoma cruzi. In: Brener, Z., Andrade, Z. A.
e Barral-Netto, M. (editores), Trypanosoma cruzi e Doença de Chagas, 2a¯ edição.
Capítulo 8, Guanabara Koogan.
130
Garg, N., Postan, M., Mensa-Wilmot, K. e Tarleton, R. L. (1997). Searching for drug
targets in microbial genomes. Infection and Immunity, 65(10):4055–4060.
Garzoni, L. R., Caldera, A., Meirelles, M. N. L., de Castro, S., Docampo, R., Meints,
G. A., Oldfield, E. e Urbina, J. A. (2004). Searching for drug targets in microbial
genomes. International Journal of Antimicrobial Agents, 23:273–285.
Gelb, M. H. e Hol, W. G. J. (2002). Drugs to combat tropical protozoan parasites.
Science, 297(19):343–344.
Gironès, N., Rodríguez, C. I., Crrasco-Marín, E., Hernáez, R. F., de Rego, J. L. e Fresno,
M. (2001). Dominant t- and b-cell epitopes in an autoantigem linked to Chagas’
disease. The Journal of Clinical Investigation, 107(8):985–983.
Goldblum, A. (1997). On the mechanisms of proteinases. In: Náray-Szabó, G. e
Warshel, A. (editores), Computational approaches to biochemical reativity, 1a¯ edi-
ção. Capítulo 7, Kluwer Academic Publishers.
Goldsmith-Fischman, S. e Honig, G. (2003). Structural genomics: Computational
methods for structure analysis. Protein Science, 12:1813–1821.
Gomes, D. E. B. (2006). Estudo da falcipaína-2 em complexo com ligantes por mo-
delagem e dinâmica molecular como suporte ao desenvolvimento racional de no-
vos fármacos antimaláricos. Dissertação de Mestrado, Instituto de Biofísica Carlos
Chagas Filho - Universidade Federal do Rio de Janeiro / Brasil.
Goulding, C. W., Perry, L. J., Anderson, D., Sawaya, M. R., Cascio, D., Apostol, M. I.,
Chan, S., Parseghian, A., an Y. Wu, S.-S. W., Cassano, V., Gill, H. S. e Eisenberg, D.
(2003). Structural genomics of Mycobacterium tuberculosis: a preliminary report of
progress at ucla. Biophysical Chemistry, 105:361–370.
Guex, N. e Peitsch, M. C. (1997). Swiss-model and swiss-pdb viewer: An environment
for comparative protein modeling. Electrophoresis, 18:2714.
131
Guimarães, A. C. R. (2006). Identificação, classificação e anotação de enzimas análo-
gas em tripanossomatídeos. Dissertação de Mestrado, Pós-Graduação em Biologia
Celular e Molecular - Instituto Oswaldo Cruz / Brasil.
Halgren, T. A. (1996a). Merck molecular force field. I. basis, form, scope, parame-
trization and performance of MMFF94. Journal of Computational Chemistry,
17(5&6):490–519.
Halgren, T. A. (1996b). Merck molecular force field. II. MMFF94 van der waals and
electrostatic parameters for intermolecular interactions. Journal of Computational
Chemistry, 17(5&6):520–552.
Halgren, T. A. (1996c). Merck molecular force field. III. molecular gemetries and
vibrational frequencies for MMFF94. Journal of Computational Chemistry,
17(5&6):553–586.
Halgren, T. A. (1996d). Merck molecular force field. IV. conformational energies and
geometries for MMFF94. Journal of Computational Chemistry, 17(5&6):587–615.
Halgren, T. A. (1996e). Merck molecular force field. V. extension of MMFF94 using
experimental data, additional computational data and empirical rules. Journal of
Computational Chemistry, 17(5&6):616–641.
Hess, B., Bekker, H., Berendsen, J. J. C. e Fraaije, J. G. E. M. (1997). Lincs: A linear
constraint solver for molecular simulations. Journal of Computational Chemistry,
18:1463–1472.
Hockney, R. W. (1970). The potential calculation and some applications. Methods in
Computational Physics, 9:136–211.
Hopkins, A. L. e Groom, C. R. (2002). The druggable genome. Nature Reviews,
1:727–730.
Huang, L., Brinen, L. S. e Ellman, J. A. (2003). Crystal structures of reversible ketone-
132
based inhibitors of the cysteine protease cruzain. Bioorganic & Medicinal Chemis-
try, 11:21–29.
Hucke, O., Gelb, M. H., Verlinde, C. L. M. J. e Buckner, F. S. (2005). Prediction
of binding affinities between the human amphiphysin-1 sh3 domain and its peptide
ligands using homology modeling, molecular dynamics and molecular field analysis.
Journal of Medicinal Chemistry, 48(17):5415–5418.
Huerta, M., Downing, G., Haseltine, F., Seto, B. e Liu, Y. (2000). NIH wor-
king definition of bioinformatics and computational biology. Biomedical Infor-
mation Science and Technology Initiative Consortium, National Institutes of He-
alth, Bethesda, USA. Disponível on-line, último acesso em: 20 abr 2007. URL
www.bisti.nih.gov/CompuBioDef.pdf
Jacoby, E. M., Schlichting, I., Lantwin, C. B., Kabsch, W. e Krauth-Siegel, R. L. (1996).
Crystal structure of the Trypanosoma cruzi trypanothione reductase-mepacrine com-
plex. PROTEINS: Structure, Function, and Genetics, 24:73–80.
Joachimiak, M. R., Chang, C., Rosenthal, P. J. e Cohen, F. E. (2001). The impact of
whole genome sequence data on drug discovery - a malaria case study. Molecular
Medicine, 7(10):698–710.
Judice, W. A. S., Cezari, M. H. S., Lima, A. P. C. A., Scharfstein, J., Chagas, J. R.,
Tersariol, I. L. S., Juliano, M. A. e Juliano, L. (2001). Comparison of the specificity,
stability and individual rate constants with respective activation parameters for the
peptidase activity of cruzipain and its recombinant form, cruzain, from Trypanosoma
cruzi. European Journal of Biochemistry, 268:6578–6586.
Kamphuis, I. G., Kalk, K. H., Swarte, M. B. A. e Drenth, J. (1984). Structure of papain
refined at 1.65 A resolution. Journal of Molecular Biology, 179(2):233–256.
Kanehisa, M., Goto, S., Hattori, M., Aoki-Hinoshita, K., Itoh, M., Kawashima, S., Ka-
tayama, T., Araki, M. e Hirakawa, M. (2006). From genomics to chemical genomics:
new developments in KEGG. Nucleic Acids Research, 34(D):354–357.
133
Karlin, S. e Altschul, S. F. (1990). Methods for assessing the statistical significance of
molecular sequence features by using general scoring schemes. Proceedings of the
National Academy of Sciences of the United States of America, 87:2264–2268.
Kirchhoff, L. V., Paredes, P., Lomeli-Guerrero, A., Paredes-Espinoza, M., Ron-
Guerrero, C. S., Delgado-Mejia, M. e Pena-Munoz, J. G. (2006). Transfusion-
associated Chagas disease (american trypanosomiasis) in mexico: implications for
transfusion medicine in the united states. Transfusion, 46(2):298–304.
Klemba, M. e Goldberg, D. E. (2002). Biological roles of proteases in parasitic protozoa.
Annual Review of Biochemistry, 71:275–305.
Kola, I. e Landis, J. (2004). Can the pharmaceutical industry reduce attrition rates?
Nature Reviews, 3:711–715.
Korf, I., Yandell, M. e Bedell, J. (2003). BLAST. O′Reilly, 1a¯ edição.
Laskowski, R. A., MacArthur, M. W., Moss, D. S. e Thornton, J. M. (1993). Procheck: a
program to check the stereochemical quality of protein structures. Journal of Applied
Crystallography, 26(2):283–291.
Laskowski, R. A., Watson, J. D. e Thornton, J. M. (2003). From protein structure to
biochemical function. Journal of Structural and Functional Genomics, 4:167–
177.
Leach, A. R. (2001). Molecular modelling: principles and applications. Pearson
Education Ltda, 2a¯ edição.
Lee, R. e Richards, F. M. (1971). The implementation of protein structures: Estimation
of static accessibility. Journal of Molecular Biology, 55:379–400.
Leiby, D. A., Herron, R. M., Read, E. J., Lenes, B. A. e Stumpf, R. J. (2002). Trypano-
soma cruzi in los angeles and miami blood donors: impact of evolving donor demo-
graphics on seroprevalence an d implications for transfusion transmission. Transfu-
sion, 42(5):549–555.
134
Lesk, A. M. (2002). Introduction to bioinformatics. Oxford University Press, 1a¯
edição.
Li, A. e Nussinov, R. (1998). A set of van der Waals and coulombic radii of protein
atoms for molecular and solvent-accessible surface calculation, packing evaluation,
and docking. Proteins: Structure Function and Genetics, 32:111–127.
Lima, A. P., Scharfstein, J., Storer, A. C. e Menard, R. (1992). Temperature-dependet
substrate inhibiton of the cysteine proteinase (gp57/51) from Trypanosoma cruzi. Mo-
lecular & Biochemical Parasitology, 56:335–338.
Lima, A. P., Tessier, D. C., Thomas, D. Y., Scharfstein, J., Storer, A. C. e Vernet, T.
(1994). Identification of new cysteine protease gene isoforms in Trypanosoma cruzi.
Molecular & Biochemical Parasitology, 67(2):333–338.
Lima, A. P. C. A., dos Reis, F. C. G., Serveau, C., Lalmanach, G., Juliano, L., Ménard,
R., Vernet, T., Thomas, D. Y., Storer, A. C. e Scharfstein, J. (2001). Cysteine protease
isoforms from Trypanosoma cruzi, cruzipain 2 and cruzain, present different substrate
preference and susceptibility to inhibitors. Molecular & Biochemical Parasitology,
114:41–52.
Lira, R., Contreras, L. M., Santa Rita, R. M. e Urbina, J. A. (2001). Mechanism of
action of anti-proiferative lysophospholipid analogues against the protozoan parasite
Trypanosoma cruzi: potentiation of in vitro activity by the sterol biosynthesis inhibitor
ketoconazole. Jounal of Antimicrobial Chemotherapy, 47:537–546.
Liñares, G. E. G., Ravaschino, E. L. e Rodriguez, J. B. (2006). Progresses in the field
of drug design to combat tropical protozoan parasitic diseases. Current Medicinal
Chemistry, 13:335–360.
Lo Presti, M. S., Rivarola, H. W., Bustamante, J. M., Fernández, A. R., Enders, J. E.,
Fretes, R., Gea, S. e Paglini-Oliva, P. A. (2004). Thioridazine treatment prevents
cardiopathy in Typanosoma cruzi infected mice. International Journal of Antimi-
crobial Agents, 23:634–636.
135
Lorente, S. O., Gómez, R., Jiménez, C., Cammerer, S., Yardley, V., de Luca-Fradley,
K., Croft, S. L., Perez, L. M. R., Urbina, J., Pacanowska, D. G. e Gilbert, I. H.
(2005a). Biphenylquimuclidines as inhibitors of squalene synthase and growth of
parasitic protozoa. Bioorganic & Medicinal Chemistry, 13:3519–3529.
Lorente, S. O., Jiménez, C. J., Gros, L., Yardley, V., de Luca-Fradley, K., Croft, S. L.,
Urbina, J. A., Ruiz-Perez, L. M., Pacanowska, D. G. e Gilbert, I. H. (2005b). Prepa-
ration of transition-state analogues of sterol 24-methyl transferase as potential anti-
parasitics. Bioorganic & Medicinal Chemistry, 13:5435–5453.
Lovell, S., Word, J., Richardson, J. e Richardson, D. (2000). The penultimate rotamer
library. Proteins: Structure Function and Genetics, 40:389–408.
Lu, Y., Wang, R., Yang, C. Y. e Wang, S. (2007). Analysis of ligand-bound water
molecules in high-resolution crystal structures of protein-ligand complexes. Journal
of Chemical Information and Modeling, page EST7.8.
Luchtan, M., Warade, C., Weatherly, D. B., Degrave, W. M., Tarleton, R. L. e Kissinger,
J. C. (2004). Tcruzidb: an integrated Trypanosoma cruzi genome resource. Nucleic
Acids Research, 32:D344–D346.
Luquetti, A. O. e Rassi, A. (2000). Diagnóstico laboratorial da infecção pelo Trypano-
soma cruzi. In: Brener, Z., Andrade, Z. A. e Barral-Netto, M. (editores), Trypanosoma
cruzi e Doença de Chagas, 2a¯ edição. Capítulo 8, Guanabara Koogan.
MacRae, J. I., Obado, S. O., Turnock, D. C., Roper, J. R., Kerans, M., Kelly, J. M.
e Ferguson, M. A. J. (2006). The suppression of galactose metabolism in Trypano-
soma cruzi epimastigotes causes changes in cell surface molecular architectue and
cell morphology. Molecular & Biochemical Parasitology, 147:126–136.
Magaraci, F., Jimenez, C. J., Rodrigues, C., Rodrigues, J. C. F., Braga, M. V., Yar-
dley, V., de Luca-Fradley, K., Croft, S. L., de Souza, W., Ruiz-Perez, L. M., Urbina,
J., Pacanowska, D. G. e Gilbert, I. H. (2003). Azasterol as inhibitors of sterol 24-
136
methyltransferase in Leishmania species and Trypanosoma cruzi. Journal of Medi-
cinal Chemistry, 46(22):4717–4727.
Marsden, R. L., Maibaum, D. L. M., Yeats, C. e Orengoe, C. A. (2006). Comprehensive
genome analysis of 203 genomes provides structural genomics with new insights into
protein family space. Nucleic Acids Research, 34(3):1066–1080.
Marti-Renom, M. A., Yerkovich, B. e Sali, A. (2002). Comparative protein structure
prediction. Current Protocols in Protein Science, 2.9(28):2.9.1–2.9.22.
Maya, J. D., Cassels, B. K., Iturriaga-Vásquez, P., Ferreira, J., Faúndez, M., Galanti,
N., Ferreira, A. e Morello, A. (2006). Mode of action of natural and synthetic drugs
against Trypanosoma cruzi and their interaction with the mammalian host [in press].
Comparative Biochemistry and Physiology, Part A.
McGrath, M. E. (1999). The lysosomal cysteine proteases. Annual Review of Biophy-
sics & Biomolecular Structure, 28:181–204.
McGrath, M. E., Eakin, A. E., Engel, J. C., McKerrow, J. H., Craik, C. S. e Fletterick,
R. J. (1995). The crystal structure of cruzain: a therapeutic target for Chagas’ disease.
Journal of Molecular Biology, 247:251–259.
McGuffin, L. J., Bryson, K. e Jones, D. T. (2000). The psipred protein structure predic-
tion server. Bioinformatics, 4:401–405.
Miller, R. T., Jones, D. T. e Thornton, J. M. (1996). Protein fold recognition by sequence
threading: tools and assessment techniques. FASEB Journal, 10(1):171–178.
Miyamoto, S. e Kollman, P. A. (1992). SETTLE: An analytical version of the SHAKE
and RATTLE algorithms for rigid water models. Journal of Computational Che-
mistry, 13:952–962.
Molina, J., Martins-Filho, O., Brener, Z., Romanha, A. J., Loebenberg, D. e Urbina,
J. A. (2000). Activities of the triazolde derivative SCH 56592 (posaconazole) against
drug-resistant strains of the protozoan parasite Trypanosoma (Schizotrypanum) cruzi
137
in immunocompetent and immunosuprressed murine hosts. Antimicrobial Agents
and Chemotherapy, 44(1):150–155.
Naula, C., Parsons, M. e Mottram, J. C. (2005). Protein kinases as drug targets in
trypanosomes and Leishmania. Biochimica et Biophysica Acta, 1754:151–159.
Notredame, C., Higgins, D. G. e Heringa, J. (2000). T-coffee: A novel method for
fast and accurate multiple sequence alignment. Journal of Molecular Biology,
302(1):205–217.
Nyame, A. K., Kawar, Z. S. e Cummings, R. D. (2004). Antigenic glycans in parasitic
infections: implications for vaccines and diagnostics. Archivs of Biochemistry and
Biophysics, 426:182–200.
Ohlstein, E. H., Ruffolo Jr., R. R. e Elliott, J. D. (2000). Drug discovery in the next
millennium. Annual Reviews on Pharmacology and Toxicology, 40:177–191.
Oliveira, D. A., Pereira, D. G., Fernandes, A. M. A. P., de Castro, S. L., Souza Brito,
A. R. M., de Souza, A. O. e Durán, N. (2005). Trypanocidal activity of 2-propen-
1-amine derivatives on trypomastigotes culture and in animal model. Parasitology
Research, 95:161–166.
Otto, T. D., Guimaraes, A. C. R., Lemos, M., Seibel, L. F. B., Macedo, J. A.,
Degrave, W. S. e Basílio, A. B. (2006). Anenπ: Identification and annota-
tion of analogous enzymes. Submited to Bioinformatics. AnEnΠ is available at
http://www.dbbm.fiocruz.br/AnEnPi for academic use.
Ouzounis, C. A. e Valencia, A. (2003). Early bioinformatics: the birth of a discipline –
a personal view. Bioinformatics, 19(17):2176–2190.
Pantoliano, M. W., Whitlow, M., Wood, J. F., Dodd, S. W., Hardman, K. D. e Rol-
lence, M. L. (1989). Large increases in general stability for subtilisin BPN´ through
incremental changes in the free energy of unfolding. Biochemistry, 28:7205–7213.
138
Paris, G., Ratier, L., Amaya, M. F., Nguyen, T., Alzari, P. M. e Frasch, A. C. C. (2005).
A sialidase mutant displaying trans-sialidase activity. Journal of Molecular Biology,
345:923–934.
Pascutti, P. G. (2004). Introdução à modelagem e dinâmica molecu-
lar. Disponível on-line, último acesso em: 20 mar 2007. URL
www.nacad.ufrj.br/˜amit/DinamicaMolecular.pdf
Paveto, C., Güida, M. C., Esteva, M. I., Martino, V., Coussio, J., Flawiá, M. M. e Tor-
res, H. N. (2004). Anti-Trypanosoma cruzi activity of green tea (Camellia sinensis)
catechins. Antimicrobial Agents and Chemotherapy, 48(1):69–74.
Pertsemlidis, A. e Fondon III, J. W. (2002). Having a blast with bioinformatics (and
avoiding blastphemy). Genome Biology, 2(10):1–10.
Pevsner, J. (2003). Bioinformatics and Functional Genomics. Wiley-Liss, 1a¯ edição.
Peña-Diaz, J., Akbari, M., Sundheim, O., Farez-Vidal, M. E., Andersen, S., Sneve, R.,
Gonzalez-Pacanowska, D., Krokan, H. E. e Slupphaug, G. (2004). Trypanosoma cruzi
contains a single detectable uracil-DNA glycosylase and repairs uracil exclusively via
short patch base excision repair. Journal of Molecular Biology, 342:787–799.
Ramakrishnan, C. (2001). Ramachandran and his map. Ressonance, Oct:48–56.
Ravaschino, E. L., Docampo, R. e Rodriguez, J. B. (2003). Synthesis and biological
evaluation of glutathione-like tripeptides against Trypanosoma cruzi. ARKIVOC,
x:298–313.
Ravaschino, E. L., Docampo, R. e Rodriguez, J. B. (2006). Design, synthesis and bi-
ological evaluation of phosphinopeptides against Trypanosoma cruzi targeting trypa-
nothione biosynthesis. Journal of Medicinal Chemistry, 49(1):426–435.
Rawlings, N. D. e Barret, A. J. (1993). Evolutionary families of peptidases. Biochemi-
cal Journal, 290:205–218.
139
Rawlings, N. D., Morton, F. R. e Barret, A. J. (2006). Merops: the peptidase database.
Nucleic Acids Research, 34:D270–D272.
Reesink, H. W. (2005). European strategies against the parasite transfusion risk. Trans-
fusion Clinique et Biologique, 12:1–4.
Rey, L. (1991). Trypanosoma cruzi e Doença de Chagas: Ecologia, Epidemiologia e
Controle. In: Rey, L. (editor), Parasitologia, 2a¯ edição. Guanabara Koogan.
Rivarola, H. W. e Paglini-Oliva, P. A. (2002). Trypanosoma cruzi trypanothione reduc-
tase inhibitors: phenothiazines and related compounds modify experimental Chagas’
disease evolution. Current Drug Targets & Haematological Disorders, 2:43–52.
Rockey, W. M. e Elcock, A. H. (2002). Progress toward virtual screening for drug side
effects. PROTEINS: Structure, Function, and Genetics, 48:664–671.
Rose, M. R. (2001). Infection, mimcs, and autoimmune disease. The Journal of Clini-
cal Investigation, 107(8):943–944.
Rössle, S. C. S. (2004). Desenvolvimento de um sistema computacional para mode-
lagem comparativa em genômica estrutural: Análise de seqüências do genama
da Gluconacetobacter diazotrophicus. Tese de Doutorado, Instituto de Biofísica Car-
los Chagas Filho - Universidade Federal do Rio de Janeiro / Brasil.
Sajid, M. e McKerrow, J. H. (2002). Cysteine proteases of parasitic organisms. Mole-
cular & Biochemical Parasitology, 120:1–21.
Sali, A. e Overington, J. P. (1994). Derivation of rules for comparative protein modeling
from a database of protein structure alignments. Protein Science, 3:1582–1596.
Salmon, D., do Aido-Machado, R., Diehl, A., Leidert, M., Schmetzer, O., Lima, A.
P. C. A., Scharfstein, J., Oschkinat, H. e Pires, J. R. (2006). Solution structure and
backbone dynamics of the Trypanosoma cruzi cysteine protease inhibitor chagasin.
Jounal of Molecular Biology, 357:1511–1521.
140
Salmon-Chemin, L., Buisine, E., Yardley, V., Kohler, S., Debreu, M.-A., Landry, V.,
Sergheraert, C., Croft, S. L. e adn E. Davioud-Charvet, R. L. K. (2001). 2- and
3-substituted 1,4-naphthoquinone derivatives as subversive substrates of trypanothi-
one reductase and lipoamide dehidrogenase from Trypanosoma cruzi: synthesis and
correlation between redox cycling activities and in vitro cytotoxicity. Journal of Me-
dicinal Chemistry, 44(4):548–565.
Santos, C. C., Sant’Anna, C., Terres, A., Cunha-e-Silva, N. L., Scharfstein, J. e Lima,
A. P. C. A. (2005). Chagasin, the endogenous cysteine-protease inhibitor of Trypa-
nosoma cruzi, modulates parasite differentiation and invasion of mammalian cells.
Journal of Cell Science, 118(5):901–915.
Scheidig, A. J., Hynes, T. R., Pelletier, L. A., Wells, J. A. e Kossiakoff, A. A. (1997).
Crystal structures of bovine chymotrypsin and trypsin complexed to the inhibitor do-
main of alzheimer’s amyloid {beta}-protein precursor (APPI) and basic pancreatic
trypsin inhibitor (BPTI): Engineering of inhibitors with altered specificities. Protein
Science, 6(9):1806–1824.
Schlick, T. (2000). Molecular modeling and simulation: An interdisciplinary guide.
Springer, 1a¯ edição.
Serveau, C., Lalmanach, G., Juliano, M. A., Scharfstein, J., Juliano, L. e Gauthier,
F. (1996). Investigation of the substrate specificity of cruzipain, the major cysteine
proteinase of Trypanosoma cruzi, through the use of cystatin-derived. Biochemical
Journal, 313(1):951–956.
Sigman, L., Sánchez, V. M. e Turjanski, A. G. (2006). Characterization of the farnesyl
pyrophosphate synthase of Trypanosoma cruzi by homology modeling and molecular
dynamics. Journal of Molecular Graphics and Modelling, 25:345–352.
Smith, G. R., Sternberg, M. J. E. e Bates, P. A. (2005). The relationship between the
flexibility of proteins and their conformational states on forming protein-protein com-
141
plexes with an application to protein-protein docking. Journal of Molecular Biology,
347:1077–1101.
Smith, P. E. e van Gunsteren, W. F. (1994). Consistent dielectric properties of the sim-
ple point charge and extended simple point charge water models at 277 and 300K.
Journal of Chemical Physics, 100(4):3169–3174.
Stajich, J. E., Block, D. e Boulez, K. (2002). The bioperl toolkit: perl modules for the
life sciences. Genome Research, 12:1611–1618.
Sánchez, R., Pieper, U., Melo, F., Eswar, N., Martí-Renom, M. A., Madhusudhan, M. S.,
Mirkovi, N. C. e Sali, A. (2000). Protein structure modeling for structural genomics.
Nature Structural Biology, 7:986–990.
Sánchez, R. e Sali, A. (1997). Evaluation of comparative protein structure modeling by
modeller-3. PROTEINS: Structure, Function, and Genetics, 29(S1):50–58.
Taranto, G. (1991). Doença de Chagas. In: Cotran, R. S., Kumar, V. Y. e Robbins, S. L.
(editores), Patologia Estrutural e Funcional, 4a¯ edição. Guanabara Koogan.
Turrens, J. F., Newton, C. L., Zhong, L., Hernandez, F. R., Whitfield, J. e Docampo, R.
(1999). Mercaptopyridine-n-oxide, an nadh-fumarate reductase inhibitor, blocks Try-
panosoma cruzi growth in culture and in infected myoblasts. FEMS Microbiology
Letters, 175:217–221.
Turrens, J. F., Watts Jr., B. P., Zhong, L. e Docampo, R. (1996). Inhibition of Trypano-
soma cruzi and T. brucei nadh-fumarate reductase by benzinidazole and anthelmintic
imidazole derivatives. Molecular and Biochemical Parasitology, 82:125–129.
Tusnady, G. E. e Simon, I. (2001). The hmmtop transmembrane topology prediction
server. Bioinformatics, 17(9):849–850.
Urbina, J. A., Comcepcion, J. L., Montalvetti, A., Rodriguez, J. B. e Docampo, R.
(2003). Mechanism of action of 4-phenoxyphenoxyethyl thiocyanate (WC-9) against
142
Trypanosoma cruzi, the causative agent of Chagas’ disease. Antimicrobial Agents
and Chemotherapy, 47(6):2047–2050.
Urbina, J. A., Comcepcion, J. L., Rangel, S., Visbal, G. e Lira, R. (2002). Squalene
synthase as a chemotherapeutic target in Trypanosoma cruzi and Leishmania mexi-
cana. Molecular & Biochemical Parasitology, 125:35–45.
Urbina, J. A., Lira, R., Visbal, G. e Bartrolí, J. (2000). In vitro antiproliferative ef-
fects and mechanism of action of the new triazole derivative ur-9825 against the pro-
tozoan parasite Trypanosoma (Schizotrypanum) cruzi. Antimicrobial Agents and
Chemotherapy, 44(9):2498–2502.
U.S. Department of Energy Office of Science (2003). Human genome pro-
ject information. Office of Biological and Environmental Research, Hu-
man Genome. Disponível on-line, último acesso em: 20 mar 2007. URL
http://www.ornl.gov/sci/techresources/Human_Genome/
home.shtml
van der Spoel, D., Lindahl, E., Hess, B., van Buuren, A. R., Apol, E., Meulenhoff, P. J.,
Tielenam, D. P., Sijbers, A. L. T. M., Feenstra, K. A., van Drunen, R. e Berendsen, H.
J. C. (2004). Gromacs user manual version 3.2. URL www.gromacs.org
van der Spoel, D., van Maaren, P. J. e Berendsen, H. J. C. (1998). A systematic study
of water models for molecular simulation: Derivation of water models optimized for
use with a reaction field. Journal of Chemical Physics, 108(24):10220–10230.
van Gunsteren, W. F. e Berendsen, H. J. C. (1987). Gromos-87 manual. Biomos BV
Nijenborgh 4, 9747 AG Groningen, The Netherlands.
Verlett, L. (1967). Computer ‘experiments‘ on classical fluids. I. Thermodynamical
properties of Lennard-Jones molecules. Physical Review, 159:98–103.
Wallin, E. e von Heijne, G. (1998). Genome-wide analysis of integral membrane
proteins from eubacterial, archaean, and eukaryotic organisms. Protein Science,
7(4):1029–1038.
143
Walser, R., Mark, A. E. e van Gunsteren, W. F. (2000). On the temperature and pressure
dependence of a range of properties of a type of water model commonly used in high-
temperature protein unfolding simulations. Biophysical Journal, 8:2752–2760.
Weiner, S. J., Kollman, P. A., Case, D. A., Singh, U. C., Ghio, C., Alagona, G., Profeta,
S. e Weiner, P. (1984). A new foce field for molecular mechanical simulation of
nucleic acids and proteins. Journal of the American Chemical Society, 106:765–
784.
Westbrook, J., Feng, Z., Jain, S., Bhat, T. N., Thanki, N., Ravichandran, V., Gilliland,
G. L., Bluhm, W. F., Weissig, H., Greer, D. S., Bourne, P. E. e Berman, H. M. (2002).
The protein data bank: unifying the archive. Nucleic Acids Research, 30(1):245–
248.
WHO, Expert e Committee (2002). Control of Chagas disease. Technical Report 905,
World Health Organization/ Geneva.
Xiao, J., Guo, Z., Guo, Y., Chu, F. e Sun, P. (2006). Computational study of human
phosphomannosi isomerase: insights from homology modeling and molecular dyna-
mics simulation of enzyme bound substrate. Jounal of Molecular Graphics and
Modelling, 25:289–295.
Yoshida, N. (2006). Molecular basis of mammalian cell invasion by Trypanosoma cruzi.
Annals of the Brazilian Academy of Sciences, 78(1):87–111.
Zingales, B., Pereira, M. E., Oliveira, R. P., Almeida, K. A., Umezawa, E. S., Souto,
R. P., Vargas, N., Cano, M. I., da Silveira, J. F., Nehme, N. S., Morel, C. M., Brener, Z.
e Macedo, A. (1997). Trypanosoma cruzi genome project: biological characteristics
and molecular typing of clone cl brener. Acta Tropica, 68(2):159–173.
144
Apêndice A
Arquivo.mdp usado em dinâmica molecular
com temperatura a 37◦C
; User Priscila Capriles
; Input file
; 9pap molecular dynamics
;
; PROCESSING
;
title = Molecular Dynamics - CALCULATION
cpp = /lib/cpp
define =
;
; RUN CONTROL
;
integrator = md
tinit = 0
dt = 0.002 ;ps=2fs
nsteps = 500000 ;steps=1000ps=1ns
init_step = 0
comm_mode = linear
nstcomm = 1
comm_grps =
;
; SHELL MOLECULAR DYNAMICS
;
145
emtol = 100.0 ;KJ.mol-1.nm-1
niter = 20
;
; OUTPUT CONTROL
;
nstxout = 2500 ;steps=5ps
nstvout = 2500 ;steps=5ps
nstfout = 2500 ;steps=5ps
nstlog = 2500 ;steps=5ps
nstenergy = 10
nstxtcout = 2500 ;steps=5ps
nstcheckpoint = 2500 ;steps=5ps
xtc_precision = 2500 ;precision to write to xtc trajectory(real)
xt_grps =
energygrps = Protein SOL VAL Cl
;
; NEIGHBOR SEARCHING
;
rlist = 1.4 ;nm=14A
domain-decomposition = no
;
; ELECTROSTATIC AND VdW
;
coulombtype = reaction-field
rcoulomb_switch = 0 ;nm
rcoulomb = 1.6 ;nm=16A
epsilon_r = 54 ;dieletric constant
vdwtype = cut-off
rvdw = 1.4 ;nm=14A
;
; TEMPERATURE COUPLING
;
tcoupl = berendsen
tc_grps = Protein SOL VAL Cl
tau_t = 0.1 0.1 0.1 0.1 ;ps
146
ref_t = 310 310 310 310 ;K (OBS: para DM a 25oC usou-se 298K)
;
; PRESSURE COUPLING
;
pcoupl = berendsen
pcoupltype = isotropic
tau_p = 0.5 ;ps
compressibility = 4.5e-5 ;bar-1
ref_p = 1.0
andersen_seed = 815131 ;random seed for Andersen thermostat
;
; VELOCITY GENERATION
;
gen_vel = yes
gen_temp = 310 ;K
gen_seed = 173529 ;interger
;
; BONDS
;
constraints = all-bonds
constraint_algorithm = lincs
unconstrained_start = no
shake_tol = 0.0001 ;relative tolerance for shake
lincs_order = 4
lincs_iter = 4
lincs_warnangle = 30 ;degrees
morse = no ;(bonds are represented by harmonic potential)
147
Apêndice B
Alinhamento entre as sequências de cruzipaína
1 e cruzipaína 2
Investigou-se dentre as sequências genômicas de T. cruzi (El-Sayed et al, 2005)
anotadas como cisteíno proteases, a presença da isoforma 2 da cruzipaína a partir da ve-
rificação da substituição do ASP161 no subsítio S2, comum entre as isoformas de cru-
zipaína, por SER161 presente na cruzipaína 2 (dos Reis et al, 2006). Do alinhamento
entre as 13 sequências de T. cruzi anotadas como pertencentes a família das cisteíno pro-
teases e o modelo gerado da cruzipaína 2, via programa BLAST (Altschul et al, 1990),
apenas duas sequências apresentaram a mutação ASP161SER sendo que somente uma
sequência (8091.m00003) apresentou alta similaridade (82% de identidade). O alinha-
mento múltiplo entre a sequência M90067 da cruzipáina 2, o molde 1ME4 da cruzipaína
1, o modelo gerada da cruzipaína 2 (1ME4m) e a sequência 8091.m00003 investigada
no genoma de T. cruzi, está representado na Fig. B.1, destacando-se as regiões do sítio
e subsítios catalíticos.
148
Figu
raB
.1:A
linha
men
tom
últip
loen
tre
cruz
ipaí
nas
1e
2.
1me4m.pdb ------------------------------------------------------------------------------------------------------------------------
M90067 ---------------------------------MSGWARALSLAAVLVVMACLVPAATASLHAEETLASQFAEFKQKHGRVYGSAAEEAFRLSVFRANLFLARLHAAANPHATFGVTPFS 87
8091.m00003 MLLLSTSTPAHHHSLKVTLLKAHKEGNTPTQAVMSGWARALSLAAVLVVMACLVPAATASLHAEETLASQFAEFKQKHGRVYGSAAEEAFRLSVFRANLFLARLHAAANPHATFGVTPFS 120
1me4.pdb ------------------------------------------------------------------------------------------------------------------------
1me4m.pdb -----------------------------------APAAKDWREEGAVTAVKNQGICGSCWAFAAIGNIEGQWFLAGNPLTRLSEQMLVSCDNTNSGCGGGLSSKAFEWIVQENNGAVYT 85
M90067 DLTREEFRSRYHNGAAHFAAAEERARVPVDVEVVGAPAAKDWREEGAVTAVKNQGICGSCWAFAAIGNIEGQWFLAGNPLTRLSEQMLVSCDNTNSGCGGGLSSKAFEWIVQENNGAVYT 207
8091.m00003 DLTREEFRSRYHNGAAHFAAAQERARVPVDVEFVGAPAAKDWREEGAVTAVKNQGMCGSCWAFAAIGNIECQWFLAGNPLTRLSEQMLVSCDNTNSGCGGGWPLVAFKWIVDRNNGTVYT 240
1me4.pdb -----------------------------------APAAVDWRARGAVTAVKDQGQCGSCWAFSAIGNVECQWFLAGHPLTNLSEQMLVSCDKTDSGCSGGLMNNAFEWIVQENNGAVYT 85
* *oo>
<< oooxx
1me4m.pdb EDSYPYHSCIGIKLPCKDSDRTVGATITGHVELPQDEAQIAASGAVKGPLSVAVDASSWFFYTGGVLTNCVSKRLSHAVLLVGYNDSAAVPYWIIKNSWTTHWGEGGYIRIAKGSNQCLV 205
M90067 EDSYPYHSCIGIKLPCKDSDRTVGATITGHVELPQDEAQIAASGAVKGPLSVAVDASSWFFYTGGVLTNCVSKRLSHAVLLVGYNDSAAVPYWIIKNSWTTHWGEGGYIRIAKGSNQCLV 327
8091.m00003 EESYPYHSCIGISPPCTTSGHTVGATITGYVTIPRDENGIAAWLAVNGPVAVVVDASSWIFYTGGVMTSCVSKQLSHAVLLVGYNDSATVPHWIIKNSWTTHWGEDGYIRIAKGSNQCLV 360
1me4.pdb EDSYPYASGEGISPPCTTSGHTVGATITGHVELPQDEAQIAAWLAVNGPVAVAVDASSWMTYTGGVMTSCVSEQLDHGVLLVGYNDSAAVPYWIIKNSWTTQWGEEGYIRIAKGSNQCLV 205
x ## # xo>x > #
1me4m.pdb KEEVSSAVV---------------------------------------------------------------------------------------------------------------
M90067 KEEVSSAVVGGPGTTPEPTTTTTTSAPGPSPSYFVQMSCTDAACSVGCENVTLPTGQCLLTTSGVSAIVTCGAETLTEEVFLTSTHCSGPSVRSSVPLNKCNRLIRGSVEFFRSSNSSGR 447
8091.m00003 KEGVSSAVVGGPGATPEPTTTTTTSAPGPSPSYFVQMSCTDDACIVGCENVTLPTGQCLLTTSGASAIVTCGAETLTEEVFLTSTHCSGPSVRSSVPLNKCNRLLRGSVEFFRGSSSSGR 480
1me4.pdb KEEASSAVVG--------------------------------------------------------------------------------------------------------------
x
1me4m.pdb --------------------
M90067 LADVDRQRRYQPYHSRHRRL 467
8091.m00003 LADVDRQRRYQPYHSRHRRL 500
1me4.pdb --------------------
>SÍTIO CATALÍTICO
*S2'
#S1'
oS1
xS2
<S3
1ME
4m.p
db:m
odel
oes
trut
ural
dacr
uzip
aína
2ge
rado
porm
odel
agem
com
para
tiva
via
MH
OL
line.
M90
067:
seqü
ênci
ada
cruz
ipaí
na2
mad
ura
(Lim
aet
al,1
994)
,dep
osita
dano
Gen
Ban
k(d
ispo
níve
lem
http
://w
ww
.ncb
i.nlm
.nih
.gov
).Se
qüên
cia
usad
aco
mo
alvo
naco
nstr
ução
dom
odel
oes
trut
ural
dacr
uzip
aína
2(1
ME
4m).
8091
.m00
003:
prov
ável
cruz
ipaí
na2
emT.
cruz
iobt
ida
doba
nco
deda
dos
públ
ico
Tcr
uziD
B(h
ttp://
Tcr
uziD
B.o
rg-v
ersã
oT
CA
1.pe
p)(L
ucht
anet
al,2
004)
.1M
E4.
pdb:
estr
utur
ada
cruz
ipaí
na1
obtid
ado
banc
ode
dado
sPD
B(P
rote
inD
ata
Ban
k)(B
erm
anet
al,2
000;
Wes
tbro
oket
al,2
002)
.Seq
üênc
iaus
ada
com
om
olde
naco
nstr
ução
dom
odel
oes
trut
ural
dacr
uzip
aína
2(1
ME
4m).
149
Glossário
• Alinhamento de seqüência: arranjo linear entre duas seqüências de forma a se
obter o maior número possível de regiões idênticas e/ou similares.
• Alinhamento estrutural: sobreposição de estruturas tridimensionais.
• Alinhamento local: alinhamento entre regiões de seqüências com maior densi-
dade de resíduos idênticos ou similares.
• Alinhamento global: alinhamento entre seqüências em toda a sua extensão, de
forma a coincidir o maior número de resíduos idênticos ou similares.
• Alinhamento múltiplo de seqüências: alinhamento entre três ou mais seqüên-
cias, de forma que porções evolutivamente relacionadas estejam alinhadas (Pevs-
ner, 2003).
• Alvo molecular: enzima que desempenhe papel importante na manutenção bi-
ológica de um organismo patogênicos, e que esteja intrinsicamente ligada com
a doença em questão.
• Alvo terapêutico: sítio receptor eleito (enzima ou biorreceptor) com bases far-
macológicas para a ação de um fármaco ou protótipo capaz de permitir um
determinado efeito terapêutico (Barreiro e Fraga, 2001).
• Biorreceptor: Estrutura complexa, geralmente de natureza protéica, capaz de
reconhecer esteroespecificamente um determinado ligante (vide Receptor).
• Enzima: proteína que atua como um catalisador, acelerando reações bioquími-
cas sem alterar a direção ou a natureza da reação (Pevsner, 2003).
• Enzimas análogas: são enzimas capazes de catalisar uma mesma reação enzi-
mática, porém, sem serem ortólogos, nem parálogos. Apresentam seqüência
150
primária sem similaridade, bem como diferenças em suas estruturas terciá-
rias (Otto et al, 2006). Estas enzimas são resultantes de eventos evolutivos
independentes, em vez de descenderem de uma enzima ancestral comum (Gal-
perin et al, 1998).
• Enzimas similares: enzimas que desempenham papéis biológicos relacionados,
devido possíveis relações evolutivas.
• Fármaco: substância útil para tratar, curar ou prevenir um estado patológico
em seres humanos ou outros animais. Considera-se um fármaco as substân-
cias ativas empregadas em diagnóstico clínico ou capazes de modificar funções
fisiológicas (Barreiro e Fraga, 2001).
• Gaps: são deslocamentos feitos em uma ou mais seqüências, de forma a com-
pensar eventos de inserção e/ou deleção, e se obter um melhor alinhamento
entre elas.
• Genômica: tecnologia de alto desempenho que estuda a organização e a com-
posição de genomas (Guimarães, 2006).
• Genômica Funcional: estudo de genes, de suas proteínas resultantes e o papel
desempenhado por estas em processos bioquímicos (Pevsner, 2003).
• Genoma: todo o material genético de um organismo.
• Hidrólise: é a clivagem de uma ligação química com o envolvimento de molé-
cula de água na formação do produto da reação catalítica.
• Homologia: similaridade atribuída a descendentes, usualmente divergentes, de
um ancestral comum (Fitch, 2000).
• Identidade: extensões invariantes entre seqüências alinhadas.
• in vitro: estudos laboratoriais realizados fora de organismos vivos.
• in vivo: estudos realizados em organismos vivos.
151
• Inibidor Enzimático: Substância capaz de diminuir ou suprimir a atividade de
uma determinada enzima (Barreiro e Fraga, 2001).
• Isoenzima: enzima que desempenha uma mesma função de outra enzima, po-
rém, apresentando diferenças na seqüência de aminoácidos (Pevsner, 2003).
• Proteases: grupo de enzimas capazes de hidrolisar seletivamente ligações pep-
tídicas (vide Hidrólise).
• Proteoma: proteínas expressas por uma célula ou organismo sob condições
específicas em determinado tempo (Pevsner, 2003).
• Proteômica: tecnologia de alto desempenho que estuda simultaneamente todo
o comportamento protéico de uma célula (Guimarães, 2006).
• Protótipo: primeiro tipo ou exemplar original, modelo. Diz-se do composto
originalmente identificado que apresenta atividade farmacológica in vivo (Bar-
reiro e Fraga, 2001).
• Quimioterapia: terapias baseadas no uso de substâncias químicas. No entanto,
este termo está condicionado a fármacos que apresentem toxicidez seletiva con-
tra microorganismos, protozoários, parasitas, helmintos, vírus e células cance-
rosas (Barreiro e Fraga, 2001).
• Receptor: é uma biomacromolécula presente em uma célula, de natureza mem-
brânica, trasmembrânica ou intracelular, que “reconhece” específicos bioligan-
tes ativos (e.g. neurotransmissores, hormônios e fármacos) (Barreiro e Fraga,
2001).
• Seqüências conservadas: seqüência de bases nucleotídicas do DNA ou de ami-
noácidos da proteína que permaneceram essencialmente inalteradas no decorrer
de eventos evolutivos (Pevsner, 2003).
• Similaridade seqüencial: extensões de seqüências ou protéicas relacionadas,
baseando-se em fenômenos de conservação (Pevsner, 2003).
152
• Similaridade estrutural: regiões da estrutura 3D que apresentam conformações
preservadas.
• Transcriptômica: tecnologia de alto desempenho que implica pesquisa na ex-
pressão dos genes em diferentes espécies e condições (Guimarães, 2006).
153