Download pdf - Download (10.9 MBytes)

Laboratório Nacional de Computação Científica

Curso de Pós Graduação em Modelagem Computacional

Técnicas de Bioinformática e Modelagem Computacional

Aplicadas ao Estudo do Genoma de Trypanosoma cruzi e de

Enzimas Consideradas de Interesse no Tratamento da Doença de

Chagas: Estudo Particular das Cruzipaínas 1 e 2

Por

Priscila Vanessa Zabala Capriles Goliatt

PETRÓPOLIS, RJ - BRASIL

MARÇO DE 2007

TÉCNICAS DE BIOINFORMÁTICA E MODELAGEM COMPUTACIONAL

APLICADAS AO ESTUDO DO GENOMA DE TRYPANOSOMA CRUZI E DE

ENZIMAS CONSIDERADAS DE INTERESSE NO TRATAMENTO DA

DOENÇA DE CHAGAS: ESTUDO PARTICULAR DAS CRUZIPAÍNAS 1 E 2


DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO LABORATÓRIO NA-

CIONAL DE COMPUTAÇÃO CIENTÍFICA COMO PARTE DOS REQUISITOS NE-

CESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM MODELAGEM

COMPUTACIONAL

Aprovada por:

Laurent Emmanuel Dardenne, D.Sc.

(Presidente)

Wim Maurits Sylvain Degrave, Ph.D.

Claudia B. M. Vitorello, Ph.D.

Helio J. C. Barbosa, D.Sc.

Ana Paula C. de A. Lima, Ph.D.

Ernesto Raul Caffarena, Ph.D.

PETRÓPOLIS, RJ - BRASILMARÇO DE 2007

Goliatt, Priscila Vanessa Zabala Capriles

C253t Técnicas de bioinformática e modelagem computacional aplicadas ao estudo

do genoma de Trypanosoma cruzi e de enzimas consideradas de interesse no tra-

tamento da doença de chagas: estudo particular das cruzipaínas 1 e 2 / Priscila

Vanessa Zabala Capriles Goliatt. Petropólis, RJ. : Laboratório Nacional de Compu-

tação Científica, 2007.

xxii, 153 p. : il.; 29 cm

Orientadore(s): Laurent Emmanuel Dardenne e Wim Maurits Sylvain Degrave

Dissertação (M.Sc.) – Laboratório Nacional de Computação Científica, 2007.

1. Doença de Chagas. 2. Trypanosoma cruzi. 3. Alvos Moleculares. 4.

Modelagem Comparativa. I. Dardenne, Laurent Emmanuel. II. LNCC/MCT. III.

Título.

CDD 616.936 3

“Pensar é uma forma de represar poemas

Até que saiam pelas turbinas

em estado de força.

Tenho muita admiração por hidrelétricas.”

Viviane Mosé

iv

Ao homem que

calou-me as palavras duras,

abriu meu sorriso e

fez-me entender o que é o

AMOR.

“Ao meu marido Leonardo”.

v

Agradecimentos

“A construção de todo um pensamento e uma postura científica leva anos e é

cercada por várias pessoas que nos apresentam suas vivências, idéias, barreiras e solu-

ções”. É por consideração e respeito, que não agradecerei nominalmente à cada uma

destas pessoas que contribuíram até o último ponto final desta tese (o que faz-me crer

cada vez mais que estes textos de gratidão deveriam vir ao final dos trabalhos), mesmo

por que uma parte delas não tem conhecimento de minha existência, das que me co-

nhecem a maioria não tem noção da importância que teve neste processo, as que sabem

que desempenharam um papel significativo em minha vida, possivelmente, nunca lerão

estas palavras e, as que por ventura venham a ter acesso à estas, podem sentir-se supra

ou supervalorizados pelas expressões de agradecimento.

Desta forma, aterei-me a agradecer usando o termo mais comum à todas estas pes-

soas que foram minhas “orientadoras”. Agradeço àqueles que orientaram minha imper-

suasiva decisão de ser biomédica, biomédica/geneticista e, por fim, biomédica/geneticis-

ta/modeladora-computacional. Aos meus orientadores familiares, pessoais, emocionais,

profissionais, intelectuais e, por quê não citar, os que me orientaram filosófica e espiri-

tualmente, afinal, como um grande amigo meu diz “Não importa se um pesquisador tem

ou não religião, o que ele não pode negar é que pesquisar é um processo de fé”.

À todos que orientaram minha vida até este ponto, um muito obrigada e, como

sempre, saibam que continuarei empenhada em honrar minha palavra de seguir em

frente na fé que tenho em poder transformar meu trabalho no que ele exatamente se

destina, em produto de utilidade pública.

vi

Este trabalho está integrado ao Projeto Temático: Desenvolvimento de Métodos

de Docking Acoplado a Computação de Alto Desempenho Visando o Desenho Racional

de Compostos Bioativos (Nº E26/171.401/01 - FAPERJ), sob coordenação do Ph.D.

Luiz Bevilacqua - LNCC; e ao projeto coordenado pelo D.Sc. Lauren E. Dardenne -

LNCC, sob o número E26/170.648/2004 - FAPERJ. Mais recentemente este trabalho

também foi integrado ao projeto Instituto do Milênio - Inovação e Desenvolvimento de

Fármacos e Medicamentos (IM-INOFAR/CNPq 420.015/2005-1).

Conta também com as seguintes colaborações:

• Laboratório de Genômica Funcional e Bioinformática - DBBM/FIOCRUZ:

* Ph.D. Antônio Basílio

* D.Sc. Thomas D. Otto

* M.Sc. Ana Carolina Guimarães

* M.Sc. Marcos Catanho

• Instituto de Biofísica Carlos Chagas Filho - UFRJ:

* Ph.D. Shaila C. S. Rössle

vii

Resumo da Dissertação apresentada ao LNCC/MCT como parte dos requisitos neces-

sários para a obtenção do grau de Mestre em Ciências (M.Sc.)

TÉCNICAS DE BIOINFORMÁTICA E MODELAGEM COMPUTACIONAL

APLICADAS AO ESTUDO DO GENOMA DE TRYPANOSOMA CRUZI E DE

ENZIMAS CONSIDERADAS DE INTERESSE NO TRATAMENTO DA

DOENÇA DE CHAGAS: ESTUDO PARTICULAR DAS CRUZIPAÍNAS 1 E 2


Março, 2007

Orientador: Laurent Emmanuel Dardenne, D.Sc.

Co-orientador: Wim Maurits Sylvain Degrave, Ph.D.

Quase 100 anos após a descoberta do Trypanosoma cruzi, agente etiológico da

doença de Chagas, não existem tratamentos efetivos para esta doença tanto em sua fase

aguda quanto crônica. Neste trabalho é apresentado um estudo em grande escala das

proteínas preditas a partir de seqüências genômicas de T. cruzi, através de técnicas de

bioinformática e modelagem comparativa, visando investigar e discutir os seguintes as-

pectos: (i) quais seqüências podem ter suas estruturas tridimensionais (3D) geradas e

qualificadas por técnicas de modelagem comparativa, usando o workflow MHOLline;

(ii) associar a estes modelos protéicos uma classificação enzimática (EC), através da

ferramenta ECNGet (desenvolvida neste trabalho); (iii) através desta associação enzi-

mática aos modelos, usá-los para inferir possíveis funções biológicas às suas seqüências

alvos originalmente anotadas como hipotéticas, e/ou sugerir uma possível reanotação

de seqüências; (iv) investigar dentre as enzimas com estruturas 3D geradas quais pos-

suem similaridades (ortologias) com enzimas humanas (genoma de Homo sapiens); (v)

determinar quais das enzimas identificadas fazem parte de alguma via metabólica repre-

sentativa depositada em bancos de dados específicos.

Dentre as enzimas de T. cruzi consideradas como alvos moleculares para o trata-

viii

mento da doença de Chagas, as cisteíno proteases têm sido extensivamente estudadas

experimentalmente. Neste presente estudo, as isoformas 1 e 2 da cruzipaína foram in-

vestigadas por simulações de dinâmica molecular (DM), nas temperaturas de 25◦C e

37◦C , tendo como controle a papaína, enzima representativa da família C1 de cisteíno

proteases.

Analisando 20.679 seqüências protéicas preditas a partir de CDS (Seqüência Co-

dificante) não redundantes do genoma de T. cruzi (cepa CL Brener), 4.719 seqüências

foram associadas a proteínas de membrana e foram gerados 2.786 modelos estruturais

protéicos. Destes modelos, 1.888 foram associados a um EC, dos quais aproximada-

mente 79,5% foram classificados como tendo uma qualidade suficientemente boa para

serem usados em estudos de desenho racional de fármacos baseado em estrutura, através

de métodos de modelagem molecular. Dos 1.876 modelos enzimáticos com, pelo menos,

uma sub-subclasse enzimática, foram identificadas 99 seqüências possivelmente análo-

gas a enzimas humanas, 1.776 como similares e 1 bifuncional como análoga/similar.

Também foi possível detectar um subgrupo de 10 modelos considerados como prová-

veis enzimas específicas de T. cruzi em relação a H. sapiens, não descartando possíveis

relações destas seqüências com outros organismos. Nos estudos de DM realizados,

o principal resultado obtido indica que a presença de resíduos ácidos na posição 158

(numeração da papaína) no sítio catalítico, pode induzir uma reorganização estrutural,

suscetível a variações de temperatura, dos resíduos catalíticos em cisteíno proteases da

família da papaína. Esta reorganização estrutural gera uma conformação semelhante à

apresentada pela tríade catalítica (ASP/HIS/SER) em serino proteases.

ix

Abstract of Dissertation presented to LNCC/MCT as a partial fulfillment of the

requirements for the degree of Master of Sciences (M.Sc.)

BIOINFORMATICS AND COMPUTATIONAL MODELLING TECHNIQUES

APPLIED TO THE TRYPANOSOMA CRUZI GENOME STUDY AND ENZYMES

CONSIDERED AS POTENTIAL MOLECULAR TARGETS FOR CHAGAS’

DISEASE TREATMENT: PARTICULAR STUDY OF CRUZIPAINS 1 AND 2


March, 2007

Advisor: Laurent Emmanuel Dardenne, D.Sc.

Co-advisor: Wim Maurits Sylvain Degrave, Ph.D.

Nearly 100 years after the discovery of Trypanosoma cruzi, the parasitic agent

of Chagas’ disease, there are no appropriate therapies that lead to cure the acute or the

chronic phases of this disease. In this work, it is presented a high-throughput compa-

rative modelling study of the predicted proteins from genomic sequences of T. cruzi,

aiming to investigate and discuss the following topics: (i) which sequences could gene-

rate structural models of different qualities, by MHOLline workflow; (ii) the association

of the modelled proteins with a different enzymatic classification (EC), using the ECN-

Get tool (developed in this work); (iii) the use of the structural models with EC to infer

a possible biological function to hypothetical protein sequences and/or to infer a dis-

tinct function to already annotated ones; (iv) to investigate amongst enzymes, with 3D

structures generated, which have similarities (orthologies) with human enzymes (Homo

sapiens genome); (v) to determine which of the identified enzymes have a representative

metabolic pathway in specific databanks.

Amongst enzymes of T. cruzi already considered as molecular target for Chagas’

disease treatment, the cysteine proteases had been extensively studied by experimen-

tal approaches. In present work, the isoforms 1 and 2 of cruzipains were investigated

x

by molecular dynamics simulations (MD) at 25◦C and 37◦C temperatures, having as

control the papain, the representative enzyme of cysteine proteases family C1.

Analysing the 20,679 predicted protein sequences from non redundant CDS (Co-

ding Sequence) of T. cruzi genome (CL Brener strain), 4,719 sequences were associated

to membrane proteins and 2,786 structural protein models were generated. From these

ones, 1,888 models were associated to an EC, of which approximately 79.5% were clas-

sified as having a enough good quality for rational drug design studies, by molecular

modelling methods. From 1,876 enzyme models with at least sub-subclass classifi-

cation, 99 sequences were identified as possible analogs to human enzymes, 1,776 as

similar and 1 bifunctional as analog/similar. It was also possible to identify a subset of

10 models considered as probably specific enzymes of T. cruzi in relation to H. sapiens,

which does not exclude relations with other organisms. In the MD studies, the main

result showed that the presence of an acidic residue in position 158 (papain numbering)

of the catalytic site, can induce a structural reorganisation, susceptible to temperature

variations, of the catalytic amino acids in cysteine proteases from papain family. This

structural reorganisation generates a similar conformation to that presented by the ca-

talytic triad (ASP/HIS/SER) in serine proteases.

xi

Sumário

1 Introdução 1

1.1 O Trypanosoma cruzi e seu Impacto Médico e Social . . . . . . . . . . 2

1.1.1 O Genoma de Trypanosoma cruzi . . . . . . . . . . . . . . . . 4

1.1.2 O Ciclo de Vida do Trypanosoma cruzi . . . . . . . . . . . . . 5

1.1.3 A Doença de Chagas . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.4 Tratamentos da Doença de Chagas . . . . . . . . . . . . . . . . 8

1.2 Alvos Moleculares de Trypanosoma cruzi em Estudo . . . . . . . . . . 11

1.2.1 Enzimas Proteolíticas . . . . . . . . . . . . . . . . . . . . . . . 20

1.2.2 Cisteíno Proteases de Trypanosoma cruzi: Cruzipaínas 1 e 2 . . 24

1.3 Desenho Racional de Fármacos Baseado em Estrutura . . . . . . . . . . 29

1.4 Geração de Modelo Protéico via Modelagem Comparativa . . . . . . . 30

1.5 Simulação por Dinâmica Molecular . . . . . . . . . . . . . . . . . . . 39

2 Objetivos 50

2.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.2 Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3 Metodologia 51

3.1 Alinhamento de Seqüências . . . . . . . . . . . . . . . . . . . . . . . . 51

3.2 Construção de Modelos Protéicos Tridimensionais via MHOLline . . . 56

3.2.1 Refinamento na Busca da Estrutura Molde . . . . . . . . . . . . 58

xii

3.3 Classificação Enzimática de Modelos Protéicos Tridimensionais de Try-

panosoma cruzi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.4 Determinação de Enzimas Análogas entre Trypanosoma cruzi e Homo

sapiens via AnEnπ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.5 Dinâmicas Moleculares da Papaína, Cruzipaína 1 e Cruzipaína 2 . . . . 72

3.5.1 Método de Simulação de Dinâmica Molecular . . . . . . . . . . 72

4 Resultados e Discussão 80

4.1 Modelos Protéicos Tridimensionais e Classificação Enzimática . . . . . 80

4.2 Enzimas Análogas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.3 Dinâmicas Moleculares . . . . . . . . . . . . . . . . . . . . . . . . . . 91

5 Conclusões e Perspectivas 117

Referências Bibliográficas 124

Apêndice

A Arquivo.mdp usado em dinâmica molecular com temperatura a 37◦C 145

B Alinhamento entre as sequências de cruzipaína 1 e cruzipaína 2 148

Glossário 150

xiii

Lista de Figuras

Figura

1.1 Trypanosoma cruzi e seu vetor invertebrado. . . . . . . . . . . . . . . . . . . . 3

1.2 Incidência da doença de Chagas pela América do Sul, América Central e EUA. . . . 4

1.3 Ciclo de vida do Trypanosoma cruzi. . . . . . . . . . . . . . . . . . . . . . . 6

1.4 Doença de Chagas: Fase Crônica. . . . . . . . . . . . . . . . . . . . . . . . 7

1.5 Porcentagem dos alvos farmacológicos de interesse comercial em 2002. . . . . . . . 11

1.6 Conformação estrutural dos resíduos que compõem a tríade catalítica das famílias S1

e S2 em serino proteases. . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.7 Diagrama esquemático apresentando a classe das cisteíno proteases, suas principais

famílias e clans. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

1.8 Representação esquemática da estrutura primária da cruzipaína. . . . . . . . . . . 25

1.9 Representação esquemática do domínio catalítico da cruzipaína e seu sítio de catálise. 26

1.10 Representação esquemática do mecanismo catalítico de cisteíno protease. . . . . . . 28

1.11 Possíveis aplicações de modelos tridimensionais de acordo com os valores de RMSD. 33

1.12 Exemplo de gráfico de Ramachandran apresentando correlações entre os ângulos φ e

ψ de uma cadeia polipeptídica. . . . . . . . . . . . . . . . . . . . . . . . . . 37

1.13 Esquema geral das etapas de construção de um modelo protéico tridimensional por

técnica de modelagem comparativa. . . . . . . . . . . . . . . . . . . . . . . . 38

1.14 Representação esquemática bidimensional de condições periódicas de contorno para a

simulação de um sistema pseudo-infinito. . . . . . . . . . . . . . . . . . . . . 48

1.15 Representação do potencial de Coulomb com e sem a aplicação do Campo de Reação. 49

3.1 Esquema apresentando parte da matriz BLOSUM62. . . . . . . . . . . . . . . . 53

xiv

3.2 Parte de um arquivo de saída apresentando o resultado de um BLASTP. . . . . . . . 55

3.3 Página de navegação on-line do BioParser. . . . . . . . . . . . . . . . . . . . . 56

3.4 Exemplo de uma seqüência protéica no formato FASTA. . . . . . . . . . . . . . 57

3.5 Exemplo de análise do Procheck classificando um modelo 3D como de boa qualidade. 59

3.6 Esquema representando o fluxo de dados em todas as etapas de funcionamento do

workflow MHOLline. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

3.7 Classificação enzimática da cruzipaína apresentando sua numeração EC de acordo com

o NC-IUBMB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.8 Esquema apresentando o resumo das metodologias aplicadas na elaboração de uma

primeira lista de possíveis alvos moleculares para o tratamento da doença de Chagas. . 71

4.1 Modelo estrutural de cruzipaína obtido de seqüência genômica de T. cruzi anotada

como proteína hipotética. . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.2 Alinhamento entre as seqüências de cisteíno proteases de T. cruzi e H. sapiens classi-

ficadas pelo AnEnπ como similares. . . . . . . . . . . . . . . . . . . . . . . 87

4.3 Esquema apresentando o resumo dos resultados obtidos na elaboração de uma primeira

lista de possíveis alvos moleculares para o tratamento da doença de Chagas. . . . . . 90

4.4 Média da energia total por átomo do sistema (Kcal/mol/átomo), ao longo de 10 ns

de simulação de dinâmica molecular da papaína (9PAP) e cruzipaínas 1 (1ME4) e 2

(1ME4m). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

4.5 Estrutura secundária da papaína (9pap), ao longo de 10 ns de simulação de dinâmica

molecular, considerando CYS25 com carga total igual a -1,0. . . . . . . . . . . . 95

4.6 Estrutura secundária da cruzipaína 1 (1ME4), ao longo de 10 ns de simulação de dinâ-

mica molecular, considerando CYS25 com carga total igual a -1,0. . . . . . . . . . 96

4.7 Estrutura secundária da cruzipaína 2 (1ME4m), ao longo de 10 ns de simulação de

dinâmica molecular, considerando CYS25 com carga total igual a -1,0. . . . . . . . 97

4.8 RMSF (em nanômetros) dos carbonos-α da papaína (9PAP) e cruzipaínas 1 (1ME4)

e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, em relação a

estrutura original apresentada no cristal/modelo. . . . . . . . . . . . . . . . . . 99

xv

4.9 Grupo de conformações representativas de papaína (9PAP) usando como ponto de

corte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular. . . . . 106

4.10 Grupo de conformações representativas de cruzipaína 1 (1ME4) usando como ponto

de corte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular. . . 107

4.11 Grupo de conformações representativas de cruzipaína 2 (1ME4m) usando como ponto

de corte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular. . . 108

4.12 Conformações assumidas pelos resíduos da papaína (9PAP) e das cruzipaínas 1 (1ME4)

e 2 (1ME4m), em relação aos seus cristais e modelo, ao longo de 10 ns de simulação

de dinâmica molecular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

4.13 Distâncias entre os resíduos dos sítios catalíticos da papaína (9PAP) e das cruzipaínas

1 (1ME4) e 2 (1ME4m), no 10◦ ns de simulação de dinâmica molecular. . . . . . . 116

5.1 Conformação estrutural dos resíduos que compõem a tríade catalítica de serino prote-

ase mutada (SER221CSO) e de cruzipaína 1 (1ME4) após simulação de DM a 37◦C. . 123

B.1 Alinhamento múltiplo entre cruzipaínas 1 e 2. . . . . . . . . . . . . . . . . . . 149

xvi

Lista de Tabelas

Tabela

1.1 Principais enzimas de Trypanosoma cruzi considerados alvos moleculares para o de-

senvolvimento racional de fármacos contra a doença de Chagas . . . . . . . . . . 14

1.2 Exemplos de classes de proteases com alguns de seus clans e famílias. . . . . . . . 22

3.1 Classificação dos tipos de alinhamentos entre seqüências. . . . . . . . . . . . . . 52

3.2 Exemplo de resultado de BLAST filtrado pelo BATS e depositado no banco de dados

MHOLdb. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.3 Exemplo de valores de LVI e GRSI calculados pelo BATS e depositados no banco de

dados MHOLdb. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.4 Exemplo de pontuação final calculada pelo BATS para os tipos de alinhamentos entre

seqüências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.5 Exemplo de classificação do BATS para os tipos de alinhamentos entre seqüências. . . 63

3.6 Classificação dos modelos construídos via MHOLline, de acordo com os valores de

identidade e cobertura† apresentados no alinhamento entre as seqüências alvo e molde. 66

3.7 Exemplo de resultado do AnEnπ mostrando seqüências de T. cruzi similares, possíveis

análogas e possíveis específicas a este organismo, em relação a enzimas humanas. . . 70

3.8 Cargas dos resíduos ácidos e básicos e resíduos de histidina e cisteína da papaína

(9PAP), cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m). . . . . . . . . . . . . . . 75

3.9 Resíduos de cisteína que participam de ligações dissulfídicas (S-S) na papaína (9PAP),

cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m). . . . . . . . . . . . . . . . . . . 75

3.10 Triptofanos e resíduos que compõem o sítio e os subsítios catalíticos da papaína (9PAP),

cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m). . . . . . . . . . . . . . . . . . . 79

xvii

4.1 Número de modelos protéicos de T. cruzi com e sem classificação enzimática, clas-

sificados de acordo com a qualidade de suas estruturas tridimensionais geradas pelo

MHOLline. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.2 Número e porcentagem de modelos protéicos de T. cruzi de acordo com a classe enzi-

mática pertencente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

4.3 Categorias dos modelos protéicos de T. cruzi de acordo com comparação entre sua

classificação enzimática e a anotação genômica de sua seqüência alvo. . . . . . . . 83

4.4 Modelos protéicos de T. cruzi: categoria de anotação, analogia a H. sapiens via AnEnπ,

classificação enzimática e qualidade do modelo via MHOLline. . . . . . . . . . . 85

4.5 Exemplos de grupos enzimáticos classificados pelo AnEnπ, de acordo com a relação

entre o número de enzimas presentes em H. sapiens e T. cruzi, e pela presença de alvos

moleculares de T. cruzi já em estudo. . . . . . . . . . . . . . . . . . . . . . . 89

4.6 Porcentagem de estruturas secundárias em papaína (9PAP) e cruzipaínas 1 (1ME4) e

2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular. . . . . . . . . 94

4.7 RMSD médio (em A) do esqueleto peptídico da papaína (9PAP) e cruzipaínas 1 (1ME4)

e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, em relação a

estrutura original apresentada no cristal/modelo. . . . . . . . . . . . . . . . . . 98

4.8 RMSD médio (em A) do esqueleto peptídico dos subsítios e tríade catalítica da papaína

(9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m), ao longo de 10 ns de simulação de

dinâmica molecular, em relação a estrutura original apresentada no cristal/modelo. . . 98

4.9 Superfície acessível ao solvente (área em A2) dos triptofanos da papaína (9PAP) e

cruzipaínas 1 (1ME4) e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica

molecular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4.10 Superfície acessível ao solvente (área em A2) dos triptofanos da papaína (9PAP) e

cruzipaínas 1 (1ME4) e 2 (1ME4m), no 10◦ ns de simulação de dinâmica molecular. . 101

4.11 Superfície acessível ao solvente (área em A2) dos subsítios e tríade catalítica da pa-

paína (9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m), ao longo de 10 ns de simulação

de dinâmica molecular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

xviii

4.12 Superfície acessível ao solvente (área em A2) dos subsítios e tríade catalítica da pa-

paína (9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m), no 10◦ ns de simulação de dinâ-

mica molecular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

4.13 Número de grupos de conformações representativas da papaína (9PAP) e cruzipaínas 1

(1ME4) e 2 (1ME4m), usando diferentes pontos de corte de RMSD (em A), ao longo

de 10 ns de simulação de dinâmica molecular. . . . . . . . . . . . . . . . . . . 105

xix

Lista de Siglas e Abreviaturas

• 1ME4: Cristal da cruzipaína 1, obtido do PDB

• 1ME4m: Modelo da cruzipaína 2, gerado por modelagem comparativa

• 24-SMT: 24-metiltransferase

• 3D: Tridimensional

• 9PAP: Cristal da papaína, obtido do PDB

• A: Angströms

• AK: Arginina cinase

• ALA: Alanina

• ARG: Arginina

• ASN: Asparagina

• ASP: Ácido aspártico

• BATS: BLAST Automatic Targeting for Structures

• BISTIC: Biomedical Information Science and Technology Initiative Consortium

• BLAST: Basic Local Alignment Search Tool

• Cα: Carbono-α

• CDS: Sequência codificante

• Cl−: Íon Cloro

• CSO: S-Hidroxicisteína

• CYP51: Citocromo-P450 em T. cruzi

• CYS: Cisteína

• DM: Dinâmica Molecular

• DNA (ou ADN): Ácido Desoxirribonucléico

xx

• EC: Enzyme Comission

• ED50: Dose Média Efetiva

• FTase: Farnesiltransferase

• GLN: Glutamina

• GLU: Ácido glutâmico

• gp = GP: Glicoproteína

• GPI: Glicosilfosfatidilinositol

• GPCR: G-protein-coupled receptor

• GR: glutationa redutase

• GRSI: Gap Relative Strengh Index

• GUS: Genomics Unified Schema

• H. sapiens = h = HSA: Homo sapiens

• HIS: Histidina

• IC50: Concentração Média Inibitória

• ID50: Dose Média Inibitória

• Ki: Constante de dissociação

• KEGG: Kyoto Encyclopedia of Genes and Genomes

• LC50: Concentração Média Letal

• LEU: Leucina

• LIT: Liver Infusion Tryptose

• LVI: Lenght Variation Index

• LYS: Lisina

• MET: Metionina

• MIC: Concentração Mínima Inibitória

• Na+: Íon Sódio

• NADH: estado reduzido da Nicotinamida Adenina Dinucleotídeo (NAD)

• NC-IUBMB: Nomenclature Committee of the International Union of Biochemistry and Mole-

cular Biology

xxi

• NIH: National Institutes of Health

• OMS: Organização Mundial da Saúde

• PDB: Protein Data Bank

• PDF: Função Densidade de Probabilidade

• PHE: Fenilalanina

• PRO: Prolina

• RMN: Ressonância Magnética Nuclear

• RMSD: Desvio Médio Quadrático

• Rx: Raios-X

• SAS: Superfície Acessível ao Solvente

• SER: Serina

• SQS: Esqualeno sintase

• S-S: Ligação dissulfídica

• T. cruzi = Tc = TCR: Trypanosoma cruzi

• TR: Tripanotiona redutase

• TRP: Triptofano

• TYR: Tirosina

• TS: Trans-sialidase

• T[SH]2: Tripanotiona (N1,N8-bis(glutationil)spermidina) redutase

• UNG: Uracil-DNA glicosilase

• VAL: Valina

xxii

Capítulo 1

Introdução

Pesquisas nas áreas de bioinformática e biologia computacional iniciaram-se na

década de 60, combinando algoritmos e dados experimentais da biologia celular e mole-

cular, para a resolução computacional de problemas biológicos, como análises de estru-

turas, funções e evoluções de moléculas. Desde então, as tecnologias computacionais

sofreram grandes avanços que, juntamente com a rede mundial de computadores, foi

possível aumentar a capacidade de processamento e transmissão de dados, permitindo

que sistemas biológicos cada vez mais complexos pudessem ser estudados. Estes avan-

ços ocorreram tão rapidamente que atualmente existe um grande esforço para a unifi-

cação e integração de bases de dados e ferramentas de análises existentes (Ouzounis e

Valencia, 2003).

Contudo, somente em junho de 2000 o National Institutes of Health (NIH) orga-

nizou, através do Biomedical Information Science and Technology Initiative Consortium

(BISTIC), um comitê para definir os termos bioinformática e biologia computacional.

De acordo com o relatório publicado (Huerta et al, 2000), estas abordagens interdisci-

plinares são descritas como:

• Bioinformática: pesquisa, desenvolvimento ou aplicação de ferramentas e abor-

dagens computacionais para ampliar o uso de dados de origem biológica, mé-

dica, comportamental ou de saúde, incluindo adquirir, armazenar, organizar,

arquivar, analisar ou visualizar tais dados.

• Biologia Computacional: desenvolvimento e aplicação de métodos analíticos e

1

teóricos de dados e técnicas de modelagem matemática e simulação computa-

cional para o estudo de sistemas biológicos, comportamentais e sociais.

Desta forma, estas abordagens tornaram-se parte integral no desenvolvimento de

pesquisas na área das ciências biomédicas, desempenhando um papel essencial na ge-

ração e análise de dados provenientes da genômica, transcriptômica e proteômica, pro-

duzidos em grande escala por diferentes grupos de pesquisa e consórcios (Guimarães,

2006). Dentre estes, pode-se citar os projetos de seqüenciamento dos genomas hu-

mano (U.S. Department of Energy Office of Science, 2003) e de Trypanosoma cruzi (El-

Sayed et al, 2005).

Neste trabalho, serão apresentadas técnicas de bioinformática e modelagem com-

parativa aplicadas ao estudo em grande escala das proteínas preditas a partir de seqüên-

cias genômicas de T. cruzi. O principal objetivo é investigar e discutir diferentes as-

pectos biológicos deste parasita, bem como a aplicação dos resultados obtidos para a

identificação de possíveis alvos moleculares para o tratamento da doença de Chagas.

1.1 O Trypanosoma cruzi e seu Impacto Médico e Social

O Trypanosoma cruzi foi descoberto em fins de 1907 por Carlos Justiniano Ri-

beiro Chagas, em triatomíneos alojados nas paredes de casas de “pau-a-pique", em

Lassance (Minas Gerais/ Brasil) (Fig. 1.1). Carlos Chagas verificou a patogenicidade

deste novo parasita em animais de laboratório e sua presença em animais domésticos.

Tendo detectado na população local alterações patológicas de fundo desconhecido, Car-

los Chagas iniciou um trabalho de correlação entre o T. cruzi e a condição mórbida dos

pacientes. Em 23 de abril de 1909, Carlos Chagas descobriu pela primeira vez o pa-

rasita no sangue de um ser humano (durante a fase aguda da doença), uma menina de

três anos chamada Berenice, cujo nome batizou esta primeira cepa ou linhagem (fonte:

http://www.fiocruz.br/coc/fioch1.html).

A doença de Chagas, também conhecida como Tripanossomíase Americana, é

uma doença endêmica em países da América do Sul e América Central e no México

(Fig. 1.2) (Kirchhoff et al, 2006). Segundo a Organização Mundial da Saúde (OMS),

2

cerca de 18 milhões de pessoas estão infectadas por T. cruzi, pelo menos outras 100

milhões encontram-se em risco de infecção e aproximadamente 660.000 novos casos

e 21.000 mortes são relatados anualmente (WHO et al, 2002). Alguns casos foram

descritos no Canadá, Estados Unidos da América (EUA) (Leiby et al, 2002; Beard et

al, 2003) e regiões da Europa (Reesink, 2005), tendo como possível causa a imigração

de pessoas infectadas para estas regiões, representando um potencial reservatório para a

transmissão do T. cruzi via transfusão sanguínea (Leiby et al, 2002).

Figura 1.1: Trypanosoma cruzi e seu vetor invertebrado.

(a) Trypanosoma cruzi. (b) Barbeiro em repasto sanguíneo.Fonte: http://www.ioc.fiocruz.br/pages/ Fonte: www.fiocruz.br/ccs/estetica/informerede/corpo/noticia/2006/ chagas1.jpg.fevereiro/23_02_06_02.htm.

O parasita possui um ciclo de vida dependente de um vetor invertebrado e de

um hospedeiro vertebrado (preferencialmente mamíferos), circulando entre os meios

silvestres e domésticos. As principais formas de transmissão do T. cruzi aos humanos

são (Yoshida, 2006): (i) durante o repasto de triatomíneos infectados, seguido de defe-

cação contaminada; (ii) por transfusão de sangue; (iii) por via placentária ou durante a

amamentação; (iv) via oral por alimento contaminado com vetores infectados ou com as

fezes e urina de triatomíneos e mamíferos parasitados, bem como pela ingestão de carne

mal cozida de mamíferos infectados (Dias, 2006). Uma vez alcançando o sistema san-

guíneo, o parasita se dispersa instalando-se em diferentes tecidos, dando continuidade

ao seu ciclo de vida.

3

Figura 1.2: Incidência da doença de Chagas pela América do Sul, América Central e EUA.

Valores de incidência anual/1000 pessoas.Fonte: http://www.dbbm.fiocruz.br/tropical/chagas/incidenc.html.

1.1.1 O Genoma de Trypanosoma cruzi

O Trypanosoma cruzi é uma espécie composta por uma população heterogênea

denominada de cepas, estoques ou isolados. O consórcio de seqüenciamento do ge-

noma de T. cruzi escolheu a cepa CL Brener, isolada do vetor invertebrado Triatoma

infestans, para o projeto genoma de Trypanosoma cruzi (Zingales et al, 1997). Os da-

dos do seqüenciamento indicam que trata-se de um organismo diplóide, cujo tamanho

do genoma consiste entre 50− 100× 106 pares de base (pb), contendo cerca de 12.000

genes.

Os dados genômicos de T. cruzi podem ser encontrados no banco de dados pú-

blico TcruziDB (http://TcruziDB.org) (Luchtan et al, 2004), que abriga a montagem do

genoma recém publicado por El-Sayed et al (2005) e a anotação fornecida pelo consór-

cio, em uma base de dados relacional, suportada pela arquitetura do Genomics Unified

Schema (GUS) (Guimarães, 2006).

4

1.1.2 O Ciclo de Vida do Trypanosoma cruzi

O Trypanosoma cruzi é um protozoário hemoflagelado pertencente à Ordem Ki-

netoplastida e à Família Trypanosomatidae, que possui formas morfológicas distintas

correspondentes aos diferentes estágios do seu ciclo de vida. O T. cruzi possui ciclo

heteroxeno, caracterizado por uma alternância entre o hospedeiro invertebrado e ver-

tebrado (Fig. 1.3). No Brasil, os principais vetores invertebrados são o Triatoma

infestans e o Panstrogylus megistus, comumente conhecidos como barbeiro, nos quais

observam-se as formas epimastigotas (forma replicativa) e tripomastigotas metacíclicas

(forma infectiva). Os hospedeiros vertebrados (humanos e animais domésticos e sil-

vestres) contém as formas tripomastigotas sanguíneas e amastigotas tissulares (Garcia e

Azambuja, 2000).

Um pequeno número de tripomastigotas sanguíneos se encontra no sangue cir-

culante dos hospedeiros vertebrados na fase crônica. Caso aconteça a ingestão destas

formas pelo vetor durante a alimentação, este pode se infectar. No estômago do vetor

ocorre a primeira diferenciação do parasita ingerido, com a transformação das formas

tripomastigotas em epimastigotas e esferomastigotas.

A segunda diferenciação do parasita ocorre no final do tubo digestivo do vetor,

quando os epimastigotas e esferomastigotas se transformam em tripomastigotas metací-

clicos. Durante novo repasto, estas formas migram para a ampola retal do vetor sendo

liberadas nas fezes e urina de forma que, através de uma lesão com solução de continui-

dade da pele ou mucosa, infectam os hospedeiros vertebrados.

Os parasitas alcançam o interior de diversas células do hospedeiro vertebrado

diferenciando-se em amastigotas e reproduzindo-se por divisão binária. A primeira di-

ferenciação ocorre ainda no sítio primário de infecção quando os tripomastigotas meta-

cíclicos invadem diferentes células do sistema imunológico. Posteriormente, os amas-

tigotas se diferenciam em tripomastigotas, são liberados para o sangue após ruptura

da membrana celular, disseminam-se para outras regiões do hospedeiro e, assim, dá-se

início a mais um ciclo biológico do parasita (Garcia e Azambuja, 2000).

5

Figura 1.3: Ciclo de vida do Trypanosoma cruzi.

Durante repasto sanguíneo em mamíferos infectados, insetos triatomíneos ingerem formas tripomastigo-tas de T. cruzi que, no estômago deste vetor, se diferenciam em epimastigotas e, no fim do tubo digestivo,em tripomastigotas metacíclicos. Durante novo repasto sanguíneo, o vetor libera saliva, fezes e urina con-taminadas que penetram a pele ou mucosa, alcançando as células do hospedeiro onde se diferenciam emamastigotas, depois em tripomastigotas e, por ruptura celular, alcançam a corrente sanguínea, iniciandoum novo ciclo.Fonte: Adaptado de http://www.who.int/tdr/diseases/chagas/lifecycle.htm.

1.1.3 A Doença de Chagas

O impacto médico e social da doença de Chagas é alto. Somente no Brasil, cuja

doença é endêmica em aproximadamente 44, 5% do território nacional, estima-se que

aproximadamente 75.000 pessoas abandonem seus empregos pelo agravamento dos sin-

tomas ou por morte prematura, tendo como principais acometimentos os cardíacos e

neurológicos (Devera, 2002).

A doença de Chagas apresenta-se sob diferentes manifestações clínicas: a fase

aguda que pode ser assintomática ou caracterizada por febre e miocardite aguda e a fase

crônica que resulta em insuficiência cardíaca progressiva e constitui a causa mais impor-

tante de morte por cardiopatia em vários países latino-americanos. A doença de Chagas

crônica constitui, também, casos de megaesôfago e megacólon (Fig. 1.4-a) (Taranto,

1991).

Na fase aguda ocorre uma parasitemia patente (presença do parasita no sangue

periférico) com aumento na concentração de IgM (imunoglobulina-M). Nesta fase, a

6

Figura 1.4: Doença de Chagas: Fase Crônica.

(a) Caso cirúrgico de megacólon chagásico. (b) Exame de Rx apresentando cardiomegaliaFonte: http://www.itg.be/itg/Distance causada por doença de Chagas.Learning/LectureNotesVandenEndenE/ Fonte: Bonet et al (2003).imagehtml/ppages/CD_1056_012c.htm.

detecção do parasita é feita por exame direto (análise de sangue fresco ao microscó-

pio, esfregaço corado de sangue ou métodos de concentração) (Luquetti e Rassi, 2000).

Clinicamente, caracteriza-se por febre, astenia, poliadenite, hepato e esplenomegalia,

sendo o dano resultante da invasão direta das células pelos parasitas e das subseqüentes

alterações inflamatórias (Rey, 1991).

A fase crônica apresenta aumento na concentração de IgG (imunoglobulina-G)

e parasitemia escassa dificultando o encontro do parasita pelos testes parasitológicos

diretos (Rey, 1991). Os exames que podem ser usados nesta fase são: xenodiagnóstico,

hemocultura, ELISA e Reação em Cadeia da Polimerase (PCR) seguida de hibridação

com sondas de DNA sítio específicas (Luquetti e Rassi, 2000).

A doença crônica manifesta-se principalmente na forma de um início progressivo

de insuficiência cardíaca. Nesse estágio tardio, a parasitemia continua escassa e os or-

ganismos dentro dos tecidos também costumam diminuir de número sendo difícil de os

encontrar em cortes histológicos. Apesar disto, existe infiltração inflamatória do miocár-

dio (Fig. 1.4-b) e, às vezes, dos músculos esqueléticos que se encontram completamente

fora de proporção com relação ao baixo número de parasitas demonstráveis (Taranto,

1991).

7

1.1.4 Tratamentos da Doença de Chagas

Os métodos profiláticos ainda são os principais meios para a diminuição dos ca-

sos de doença de Chagas. Através do controle dos vetores, com o uso de inseticidas

e a melhora nas condições habitacionais das regiões de risco, bem como precauções

em transfusão de sangue e transplantes, pode-se conseguir uma diminuição significa-

tiva na incidência de novos casos. Em pessoas já infectadas, o tratamento precoce dos

casos agudos e congênitos diminuem significativamente o estado de morbidade destes

pacientes. Os tratamentos sintomáticos mais indicados são:

• Cardiopatias: cardiotônicos, diuréticos, antiarrítmicos, vasodilatadores, dentre

outros. Por vezes, é necessária a colocação de marcapasso.

• Formas digestivas: dietas, laxativos, lavagens e, em casos mais graves, inter-

venções cirúrgicas.

Quanto aos métodos farmacoterápicos, durante os últimos quase 100 anos, dife-

rentes abordagens foram testadas (Dias, 1999; Coura e de Castro, 2002):

• De 1911 à 1940: os arsenicais, antimoniais, derivados do quinino, aminas,

sulfas e antibióticos, que se mostravam ativos em outras infecções e doenças

tropicais como sífilis, malária, doença do sono, leishmanioses, tuberculose e

amebíase, mostravam-se inócuos contra o T. cruzi.

• Década de 40: o quinoleínico Bayer 7.602 apresentava discreta atividade para-

siticida e era ineficaz para a fase crônica, além de ser muito tóxico ao paciente.

• Década de 50: o arsenical Spirotrypan reduzia efetivamente o número de para-

sitas circulantes na fase aguda, mas era praticamente ineficaz na fase crônica.

Adicionalmente, a violeta genciana passou a ser usada na esterilização de san-

gue contaminado com T. cruzi.

• Década de 60: houve o surgimento de fármacos mais ativos como os nitrofura-

nos. Dentre estes, o mais efetivo era o nifurtimox (Lampitr), que de fato levava

8

à cura vários casos agudos e mesmo alguns crônicos, trazendo esperanças aos

doentes e à comunidade científica.

• Década de 80: surgia um derivado imidazólico denominado benznidazol (Ro-

chaganr), sendo um pouco mais efetivo que os seus antecessores.

• Década de 90: o Lampitr deixa de ser produzido e novos medicamentos como

o Alopurinol e anti-fúngicos começam a ser investigados, obtendo-se resulta-

dos, em alguns casos, mais eficazes que o benznidazol.

• Atualmente: alguns derivados de Nitrofuranos e Nitroimidazóis (e.g. alopuri-

nol, cetoconazol, fluconazol e itraconazol) têm mostrado maior eficiência em

casos agudos e crônicos.

Além destes, diferentes compostos vêm sendo testados in vitro e em modelos

animais, dentre estes, substâncias isoladas de produtos naturais:

• Metilpluviatolido das folhas do arbusto “mamica de cadela” (Zanthoxylum na-

ranjillo) (desenvolvido pela Faculdade de Farmácia da UNIFRAN).

• Naftoquinonas de “ipês” (Tabebuia sp.) (de Moura et al, 2001).

• Catequinas do “chá verde” (Camellia sinensis) (Paveto et al, 2004).

O Trypanosoma cruzi possui diversas linhagens com características e morfolo-

gias distintas para cada uma das fases de seu ciclo de vida. Durante cada uma destas

fases, o parasita expressa diferentes proteínas em diferentes concentrações, o que di-

ficulta bastante o desenvolvimento de fármacos parasita/específico (Atwood III et al,

2005). Além disso, o T. cruzi possivelmente mimetiza uma ou mais moléculas de teci-

dos humanos, podendo levar seu hospedeiro a desenvolver doenças auto-imunes (Rose,

2001; Gironès et al, 2001), agravando a debilidade de certos tecidos já comprometidos,

principalmente os cardíacos (Engman e Leon, 2002).

Quase 100 anos após a descoberta do T. cruzi, as terapias disponíveis contra a

doença de Chagas não são capazes de levar à cura mais de 50% dos infectados tanto na

9

fase aguda quanto crônica (Liñares et al, 2006). A crescente incidência, as altas taxas

de morte, a toxicidade dos fármacos mais aplicados bem como a capacidade do parasita

de desenvolver resistência a estes fármacos, reforçam a importância do desenvolvimento

de novas quimioterapias contra esta enfermidade (Bond et al, 1999; Gelb e Hol, 2002).

Uma nova abordagem denominada pesquisa racional de fármacos, tem contri-

buído na busca por novos tratamentos. Neste método, fármacos sítio-direcionados são

elaborados através de análise de vias metabólicas do parasita que sejam mais vulneráveis

a uma ação farmacológica (e.g. síntese de esteróis e metabolismo oxidativo), de forma a

minimizar os riscos ao hospedeiro. Um exemplo de fármaco racional para o tratamento

da doença de Chagas é a fenotiazina, que tem como alvo a enzima tripanotiona redutase,

responsável por manter os níveis intracelulares de radicais livres em T. cruzi (Chan et al,

1998). Apesar de seu uso clínico em tratamentos psiquiátricos, ações anti-histamínicas

e efeitos antitumorais, a aplicação da fenotiazina e seus derivados para o tratamento

da doença de Chagas ainda encontram-se em fase de testes laboratoriais tanto in vitro

quanto in vivo (Rivarola e Paglini-Oliva, 2002; Lo Presti et al, 2004).

No contexto de desenho racional de fármacos é importante ressaltar que, em sis-

temas biológicos existem basicamente quatro tipos de macromoléculas com as quais

agentes terapêuticos podem interagir: proteínas, polissacarídeos, lipídios e ácidos nu-

cléicos. No entanto, as dificuldades em se trabalhar com estes três últimos incentivam

cada vez mais as pesquisas sobre inibidores protéicos, mais precisamente enzimas, que

compreendem cerca de 47% do total de alvos farmacologicamente abordados, como

apresentado na Fig. 1.5 (Hopkins e Groom, 2002).

10

Figura 1.5: Porcentagem dos alvos farmacológicos de interesse comercial em 2002.

GPCR: G-protein-coupled receptor.Fonte: Adaptado de Hopkins e Groom (2002).

1.2 Alvos Moleculares de Trypanosoma cruzi em Estudo

Até o presente momento, o combate à doença de Chagas conta oficialmente com

quimioterapias baseadas em apenas dois fármacos, nifurtimox e benznidazol, capazes de

curar apenas 50% das infecções recentes. As principais desvantagens da administração

destes fármacos consiste em serem (i) ineficazes em pacientes na fase crônica da do-

ença; (ii) na fase aguda são sensíveis as diferentes cepas do parasita; (iii) causadores de

diversos efeitos colaterais (e.g. vômito, anorexia, neuropatias periféricas e dermopatias

alérgicas); (iv) tratamentos de longo-termo, levando a toxicidade e/ou descontinuidade

de seu uso por parte dos pacientes (Liñares et al, 2006).

Por estes motivos, o estudo e desenvolvimento de novos fármacos mais efetivos e

menos tóxicos ao paciente fazem-se necessários. Pesquisas baseadas nas propriedades

fisiológicas e bioquímicas particulares ao T. cruzi têm apresentado algumas enzimas

como potenciais alvos moleculares para o desenvolvimento de novos fármacos.

Para ser considerada um alvo molecular, a enzima precisa de estar ligada com

a sobrevivência do parasita. Outro aspecto importante a se observar é se tais enzimas

possuem diferentes isoformas gênicas e/ou possíveis vias metabólicas compensatórias,

11

o que poderia torná-las farmacologicamente desinteressantes (Joachimiak et al, 2001).

A quimioterapia racional aborda as principais diferenças metabólicas entre o mi-

croorganismo patogênico e o seu hospedeiro, desta forma, pode-se antecipar quais são

as vias metabólicas de fundamental importância para a sobrevivência do patógeno, ana-

lisar quais poderiam ser consideradas alvos de uma inibição seletiva e, por conseguinte,

apresentar baixo risco de toxicidade ao paciente. No desenvolvimento de fármacos sítio-

direcionados a um alvo molecular, métodos que visem o estudo estrutural da enzima po-

dem contribuir significativamente, bem como a análise de sítios ativos que sirvam como

alvos para o acoplamento de inibidores (Galperin e Koonin, 1999; Hopkins e Groom,

2002)

Dentre os alvos moleculares em estudo, encontram-se as enzimas pertencentes as

biossínteses de esteróis e de tripanotiona, produção de energia, mecanismos de evasão

ao sistema imunológico do hospedeiro e reparo do DNA, bem como outras considera-

das fundamentais para a sobrevivência do T. cruzi. As proteínas cinases estão presente

em grande número (≈171 proteínas) em T. cruzi e desempenham diferentes funções vi-

tais como regulação do ciclo celular, diferenciação e resposta a estresses, tornando-as

atrativos alvos moleculares (Naula et al, 2005).

Proteínas de superfície de T. cruzi, associadas por âncoras GPI (glicosilfosfatidi-

linositol) à membrana celular, têm sido consideradas relevantes por estarem implicadas

em mecanismos de evasão ao sistema imune (Garg et al, 1997) e pelo mecanismo de

invasão celular como no caso das mucinas (Acosta-Serrano et al, 2001) e Tcgp63 (ho-

móloga a leishmanolisina) (Cuevas et al, 2003). As mucinas são aceptoras de ácido

siálico, um monossacarídeo que desempenha um papel importante na interação celular

parasita-hospedeiro, bem como na adesão e invasão celular (Buschiazzo et al, 2000).

Os tripanosomatídeos não são capazes de sintetizar o ácido siálico que precisa de

ser obtido da célula hospedeira (Buschiazzo et al, 2000). Para isto, o parasita possui

as sialidases, enzimas de superfície ancoradas via GPI. A trans-sialidase (TcTS) é capaz

de transferir ácido siálico de glicoconjugados do hospedeiro para a β-galactose presente

nas mucinas do parasita (Paris et al, 2005). Por esta propriedade, a TcTS tem sido

12

estudada como alvo para o desenvolvimento de vacinas (Nyame et al, 2004) e, além

disto, recentemente MacRae et al (2006) mostraram que a supressão de glicoproteínas

de superfície, através da redução do metabolismo de galactose, é capaz de alterar a

superfície molecular e a morfologia celular de T. cruzi.

Uma das preocupações dos pesquisadores consiste no fato das diferentes cepas

de T. cruzi apresentarem variados graus de suscetibilidade em relação ao benznidazol,

nifurtimox e seus derivados. Desta forma, tem-se buscado o desenvolvimento de fárma-

cos capazes de curar a doença de Chagas mesmo em cepas resistentes aos tratamentos

usuais. Molina et al (2000) apresentam em seu trabalho o desempenho promissor de

um derivado de azol, o SCH 56592 (posaconazol), contra cepas caracterizadas como

suscetíveis (cepa CL), parcialmente resistentes (cepa Y) e altamente resistentes (cepas

Colombiana, SC-28 e VL-10) ao nifurtimox, benznidazol e a outros derivados azóicos

testados in vivo, como o anti-fúngico cetoconazol.

Em recentes trabalhos publicados, Liñares et al (2006) e Maya et al (2006)

fazem uma revisão dos principais fármacos, naturais e sintéticos, usados em enzimas

consideradas alvos moleculares em protozoários responsáveis por doenças tropicais. Na

Tab. 1.1 estão descritos alguns destes fármacos usados em testes anti-tripanossomíase e

uma revisão não exaustiva de inibidores usados em alvos moleculares de T. cruzi.

13

Tabe

la1.

1:Pr

inci

pais

enzi

mas

deTr

ypan

osom

acr

uzic

onsi

dera

dos

alvo

sm

olec

ular

espa

rao

dese

nvol

vim

ento

raci

onal

defá

rmac

osco

ntra

ado

ença

deC

haga

s

Bio

ssín

tese

deE

ster

óis:

tem

porp

rodu

tofin

alo

ergo

ster

olao

invé

sdo

cole

ster

ol,p

rinc

ipal

este

role

ncon

trad

oem

mam

ífer

os.

ALV

OM

OL

EC

UL

AR

FÁR

MA

CO

/IN

IBID

OR

CO

NSI

DE

RA

ÇÕ

ES

Esq

uale

noE

poxi

dase

,con

-ve

rte

esqu

alen

oem

2,3-

oxid

oesq

uale

no

Der

ivad

osde

2-pr

open

o-1-

amin

aTe

stad

osem

form

asep

imas

tigot

as(c

epa

Y)c

ultiv

adas

emm

eio

LIT

,apr

esen

ta-

ram

,em

anál

ise

crom

atog

ráfic

a,um

adi

min

uiçã

ono

sní

veis

deer

gost

erol

(de

63µ

g/m

Lpa

ra52µ

g/m

L)

eau

men

tona

conc

entr

ação

dees

qual

eno

(de

18µ

g/m

Lpa

ra76µ

g/m

L)(

Oliv

eira

etal

,200

5).

Oxi

does

qual

eno

Ci-

clas

e,co

nver

tea

2,3-

oxid

oesq

uale

noem

lano

ster

ol.

N-(

4E,8

E)-

5,9,

13-t

rim

ethy

l-4,

8,12

-te

trad

ecat

rien

-1-y

lpyr

idin

ium

e27

com

post

osco

rrel

atos

Test

adas

cont

raT.

cruz

ina

fase

dein

fecç

ãoao

hosp

edei

rom

amíf

ero.

12co

m-

post

osin

ibir

amo

cres

cim

ento

celu

lare

m50

%co

mco

ncen

traç

ões

abai

xode

25nM

.Oco

mpo

sto

base

prod

uziu

acúm

ulo

deox

idos

qual

eno

ede

crés

cim

ona

pro-

duçã

ode

lano

ster

ole

ergo

ster

ol,c

arac

terí

stic

asco

ndiz

ente

sco

ma

inib

ição

daox

idoe

squa

leno

cicl

ase

(Buc

kner

etal

,200

1).

Esq

uale

nosi

ntas

e(S

QS,

EC

:2.5

.1.2

1)3-

(bip

heny

l-4-

yl)-

3-hy

drox

yqui

nucl

idin

e(B

PQ-O

H)

Pode

roso

inib

idor

não

com

petit

ivo

deSQ

Sem

T.cr

uzie

Leis

hman

iam

exic

ana,

com

Ki

12-6

2nM

.Ind

uziu

are

duçã

odo

se-d

epen

dent

eda

prol

ifer

ação

extr

ace-

lula

rde

stes

para

sita

s,co

mM

ICde

10-3

0m

M.A

inib

ição

docr

esci

men

toe

alis

ece

lula

rest

ãoas

soci

adas

com

ade

pleç

ãoco

mpl

eta

dees

qual

eno

endó

geno

ees

teró

is,c

onsi

sten

teco

mum

bloq

ueio

dasí

ntes

ede

novo

dees

teró

isna

fase

deat

uaçã

oda

SQS.

Éca

paz

deer

radi

carf

orm

asam

astig

otas

deT.

cruz

iem

cultu

rade

célu

las

Ver

oco

mM

ICde

30nM

,se

mpr

oduz

iref

eito

sde

leté

rios

acé

lula

hosp

edei

ra(U

rbin

aet

al,2

002)

.

Der

ivad

osde

bife

nilq

uinu

clid

inos

(BPQ

-OH

)In

ibiu

ocr

esci

men

tode

form

asam

astig

otas

(ED

50

0,36

µM

),po

ssiv

elm

ente

,de

vido

inib

ição

daSQ

S(L

oren

teet

al,2

005a

).

4-ph

enox

yphe

noxy

ethy

lth

iocy

anat

e(W

C-9

)In

duzi

uum

ain

ibiç

ãodo

se-d

epen

dent

eno

cres

cim

ento

defo

rmas

epim

astig

otas

dace

paE

Pdo

para

sita

,cul

tivad

asem

mei

oL

IT,c

omM

ICde

1,0µ

M.E

stes

efei

-to

ses

tão

asso

ciad

osco

ma

depl

eção

com

plet

ade

esqu

alen

oen

dóge

noe

este

róis

,co

nsis

tent

eco

mum

bloq

ueio

dasí

ntes

ede

novo

dees

teró

isna

fase

deat

uaçã

oda

SQS

(Urb

ina

etal

,200

3).

EC

:E

nzym

eC

omm

issi

on.

Cla

ssifi

caçã

onu

mér

ica

deac

ordo

com

NC

-IU

BM

B(N

omen

clat

ure

Com

mitt

eeof

the

Inte

rnat

iona

lU

nion

ofB

ioch

emis

try

and

Mol

ecul

arB

iolo

gy-

disp

onív

elem

http

://w

ww

.che

m.q

mul

.ac.

uk/iu

bmb/

enzy

me/

).K

i:co

nsta

nte

dedi

ssoc

iaçã

o.M

IC(M

inim

alIn

hibi

tory

Con

cent

ratio

ns):

conc

entr

ação

mín

ima

capa

zde

inib

iro

cres

cim

ento

deum

aor

gani

smo.

ED

50

(Med

ian

Effe

ctiv

eD

ose)

:dos

ede

uma

subs

tânc

iaca

paz

depr

ovoc

aref

eito

não

leta

lem

50%

dapo

pula

ção

expe

rim

enta

l.

14

Bio

ssín

tese

deE

ster

óis(

cont

inua

ção)

ALV

OM

OL

EC

UL

AR

FÁR

MA

CO

/IN

IBID

OR

CO

NSI

DE

RA

ÇÕ

ES

24-m

etilt

rans

fera

se(2

4-SM

T,E

C:2

.1.1

.41)

Aza

ster

óis

base

ados

em(2

0R,2

2ξ)-

5α-p

regn

an-2

0-(p

iper

idin

-2-y

l)-

3β,2

0-di

ol

Todo

sos

com

post

osap

rese

ntar

amef

eito

anti-

prol

ifer

ativ

opa

raa

form

aep

imas

-tig

ota

(IC

50

0,6-

1,2µ

M)

e4

dos

com

post

oste

stad

osin

ibir

amo

cres

cim

ento

defo

rmas

amas

tigot

as(I

C50

6,1-

18µ

M)(

Mag

arac

iet

al,2

003)

.E

mL

oren

teet

al(2

005b

),te

stes

emfo

rmas

amas

tigot

asm

ostr

aram

ativ

idad

ean

ti-pa

rasi

tári

am

as,s

emap

rese

ntar

inib

ição

daen

zim

a24

-SM

T.C

itocr

omo-

P450

Est

erol

14-d

emet

ilase

(CY

P51,

EC

:1.1

4.13

.70)

UR

-982

5,de

rivad

odo

antif

úngi

coTr

iazo

lTe

stad

oem

cultu

rade

epim

astig

otas

com

MIC

de30

nM.

Ain

ibiç

ãodo

cres

cim

ento

coin

cidi

uco

ma

depl

eção

de4,

14-d

esm

etil

este

róis

endó

geno

s(e

rgos

tero

l,24-

ethy

lcho

lest

a-5,

7,22

-tri

en-3

b-ol

,epr

ecur

sore

s),s

ubst

ituíd

ospo

res

teró

ism

etila

dos

(lan

oste

rol,

24-m

ethy

lene

dihy

drol

anos

tero

leob

tusi

folio

l),o

que

indi

caa

inib

ição

da14

-dem

etila

se(U

rbin

aet

al,2

000)

.

Der

ivad

osde

FTI-

2220

Os

com

post

os4

e5

mos

trar

am-s

epo

tent

esin

ibid

ores

tant

oem

test

esin

vitr

o,co

m23

%e

16%

dein

ibiç

ãoda

enzi

ma

com

50nM

dos

resp

ectiv

osco

mpo

stos

,co

mo

emm

odel

osan

imai

s(B

AL

B/c

),ap

rese

ntan

dodi

min

uiçã

oda

para

site

mia

e10

0%de

sobr

eviv

ênci

ado

san

imai

s(B

uckn

eret

al,2

003)

.

Tipi

farn

ib(R

1157

77),

fárm

aco

usad

ono

trat

amen

toan

ti-câ

ncer

Inib

idor

dafa

rnes

iltra

nsfe

rase

(PFT

)em

H.s

apie

ns,

mos

trou

-se,

tam

bém

,um

pote

nte

inib

idor

daTc

CY

P51.

Est

udos

dem

odel

agem

porh

omol

ogia

edo

ckin

gm

ostr

aram

que

asdi

fere

nças

nafo

rma

delig

ação

doco

mpo

sto

com

esta

sen

zi-

mas

,m

ais

asu

aba

ixa

oune

nhum

aafi

nida

depo

rci

tocr

omo-

P450

hepá

tica

dem

amíf

eros

,pod

emse

ra

base

para

ode

senh

ode

novo

sfá

rmac

os,d

eriv

ados

doTi

pifa

rnib

,con

tra

ado

ença

deC

haga

s(H

ucke

etal

,200

5).

EC

:E

nzym

eC

omm

issi

on.

Cla

ssifi

caçã

onu

mér

ica

deac

ordo

com

NC

-IU

BM

B(N

omen

clat

ure

Com

mitt

eeof

the

Inte

rnat

iona

lU

nion

ofB

ioch

emis

try

and

Mol

ecul

arB

iolo

gy-

disp

onív

elem

http

://w

ww

.che

m.q

mul

.ac.

uk/iu

bmb/

enzy

me/

).IC

50

(Med

ian

Inhi

bito

ryC

once

ntra

tion)

:con

cent

raçã

oda

subs

tânc

iane

cess

ária

para

prod

uzir

inte

raçã

o(i

nibi

tóri

a)co

m50

%de

seus

rece

ptor

es.

15

Bio

ssín

tese

deFo

sfat

idilc

olin

aA

LVO

MO

LE

CU

LA

RFÁ

RM

AC

O/I

NIB

IDO

RC

ON

SID

ER

AÇ

ÕE

SPE

-PC

-N-m

etil-

tran

sfer

ase

ET-

18-O

CH

3,

milt

efos

ine

eilm

ofo-

sine

,an

álog

osde

lisof

osfo

lipíd

ios

(LPA

s)

Test

adas

emcu

ltura

sde

célu

las

Ver

o,le

vara

ma

erra

dica

ção

defo

rmas

amas

-tig

otas

emco

ncen

traç

ões

de0,

1,0,

1e

1,0µ

M,r

espe

ctiv

amen

te.

Obs

ervo

u-se

alte

raçã

ona

razã

oPC

/PE

de1,

5(n

ascé

lula

sco

ntro

le)

para

0,67

(nas

célu

las

trat

adas

)e,

sine

rgis

mo

antip

rolif

erat

ivo

emep

imas

tigot

astr

atad

asco

mE

T-18

-O

CH

3co

mbi

nado

com

ceto

cona

zol(

inib

idor

dabi

ossí

ntes

ede

este

róis

)(L

ira

etal

,200

1).

Tran

sduç

ãode

Sina

lInt

race

lula

rA

LVO

MO

LE

CU

LA

RFÁ

RM

AC

O/I

NIB

IDO

RC

ON

SID

ER

AÇ

ÕE

SFa

rnes

iltra

nsfe

rase

(FTa

se,

EC

:2.

5.1.

58e

2.5.

1.21

),pr

omov

em

odifi

caçã

opó

s-tr

ansd

ucio

nal

Der

ivad

osde

2-am

ino-

5-ni

trob

en-

zofe

nona

Nos

test

esin

vitr

o,os

com

post

os4a

e2f

inib

iram

form

astr

ipom

astig

otas

com

LC

50

1nM

e10

mM

,res

pect

ivam

ente

e,in

vivo

(em

BA

LB

/c),

houv

eau

men

tona

sobr

evid

ade

anim

ais

trat

ados

com

6,4

e7

mg/

kg/d

ia,r

espe

ctiv

amen

te.A

tra-

vés

dem

odel

agem

por

hom

olog

iada

TcFT

ase

ede

estu

dode

dock

ing,

pôde

-se

cara

cter

izar

are

gião

dosí

tioat

ivo

daen

zim

a,au

xilia

ndo

futu

ros

estu

dos

dede

-se

nho

raci

onal

defá

rmac

os(E

stev

aet

al,2

006)

.B

ioss

ínte

sede

Isop

renó

ides

ALV

OM

OL

EC

UL

AR

FÁR

MA

CO

/IN

IBID

OR

CO

NSI

DE

RA

ÇÕ

ES

Farn

esil

piro

fosf

ato

sint

ase

(EC

:2.5

.1.1

0)R

ised

rona

tobi

sfos

fona

do(R

is),

usad

ono

trat

amen

tode

deso

rden

sde

reab

sorç

ãoós

sea

Apr

esen

tou

sele

tiva

ativ

idad

ean

ti-tr

ipan

osso

mat

ídic

a,co

min

ibiç

ãodo

se-

depe

nden

tedo

cres

cim

ento

defo

rma

amas

tigot

a,at

ingi

ndo

alis

ece

lula

ra

150

µM

.Est

ain

ibiç

ãoes

táas

soci

ada

ade

pleç

ãode

este

róis

endó

geno

se,

ape

rda

davi

abili

dade

celu

lar

está

asso

ciad

aao

desa

pare

cim

ento

depo

li-is

opre

nóid

eses

-se

ncia

is(G

arzo

niet

al,2

004)

.A

trav

ésde

técn

icas

dem

odel

agem

por

hom

olog

iae

dinâ

mic

am

olec

ular

pôde

-se

estu

dar

afo

rma

delig

ação

doR

isao

sítio

ativ

ode

sta

enzi

ma,

bem

com

oa

elab

oraç

ãoe

estu

dos

dein

tera

ção

dede

rivad

osdo

Ris

(Sig

man

etal

,200

6).

EC

:E

nzym

eC

omm

issi

on.

Cla

ssifi

caçã

onu

mér

ica

deac

ordo

com

NC

-IU

BM

B(N

omen

clat

ure

Com

mitt

eeof

the

Inte

rnat

iona

lU

nion

ofB

ioch

emis

try

and

Mol

ecul

arB

iolo

gy-

disp

onív

elem

http

://w

ww

.che

m.q

mul

.ac.

uk/iu

bmb/

enzy

me/

).L

C50

(Med

ian

Leth

alC

once

ntra

tion)

:con

cent

raçã

oda

subs

tânc

ia(e

mág

ua)c

apaz

dele

vara

mor

te50

%da

popu

laçã

ote

ste.

16

Prod

ução

deE

nerg

iaA

LVO

MO

LE

CU

LA

RFÁ

RM

AC

O/I

NIB

IDO

RC

ON

SID

ER

AÇ

ÕE

SN

AD

H-f

umar

ato

redu

tase

,pr

esen

teem

dive

rsos

mem

-br

osdo

gêne

roTr

ypan

o-so

ma

mas

,aus

ente

emm

a-m

ífer

os

Der

ivad

osde

imid

azol

usad

osco

mo

anti-

helm

íntic

os(n

itro

ebe

nzim

ida-

zóis

)

Test

ados

emcu

ltura

deep

imas

tigot

as(c

epa

Y),

todo

sos

com

post

osin

ibir

ama

fum

arat

ore

duta

seem

uma

ampl

aes

cala

deco

ncen

traç

ão(I

C50

1,27

-420

µM

).E

stud

osde

corr

elaç

ãosu

gere

mqu

ea

inib

ição

docr

esci

men

toce

lula

res

teja

re-

laci

onad

aco

ma

inib

ição

dafu

mar

ato

redu

tase

(Tur

rens

etal

,199

6).

2-m

erca

ptop

irid

ina-

N-o

xido

(MPN

O)

Inib

iuo

cres

cim

ento

deep

imas

tigot

as(c

epa

Y)(

ID50

0,08µ

M)e

deam

astig

otas

(cul

tura

dem

iobl

asto

sL6E

9)e

mco

ncen

traç

ãode

2,4µ

Mde

MPN

O,b

emco

mo

aca

paci

dade

infe

ctiv

ade

trip

omas

tigot

as(I

D50

20µ

M)a

mio

blas

tos.

Est

esef

eito

ses

tão

asso

ciad

osco

ma

inib

ição

doac

úmul

ode

succ

inat

o,pr

odut

oda

fum

arat

ore

duta

se(T

urre

nset

al,1

999)

.A

rgin

ina

cina

se(A

K,

EC

:2.

7.3.

3)C

ateq

uina

sdo

chá

verd

e(C

amel

liasi

-ne

nsis

)D

asca

tequ

ina

test

adas

,ape

nasa

Cg

eG

Cg,

emco

ncen

traç

õesd

e1

nM,a

pres

en-

tara

min

ibiç

ãode

apro

xim

adam

ente

50%

dafu

nção

enzi

mát

ica

deA

K(P

avet

oet

al,2

004)

.M

ecan

ism

osde

Rep

aro

doD

NA

ALV

OM

OL

EC

UL

AR

FÁR

MA

CO

/IN

IBID

OR

CO

NSI

DE

RA

ÇÕ

ES

Ura

cil-

DN

Agl

icos

ilase

(UN

G,

EC

:3.

2.2.

3),

res-

pons

ável

pela

exci

são

deur

acil

doD

NA

(i)

Ura

cil

ean

álog

osde

urac

il(6

-clo

rour

acil,

6-am

inou

raci

le

5-flu

orou

raci

l);(

ii)sí

tios-

AP;

(iii)

inib

i-do

rpro

téic

oPB

S2(U

gi)

(i)

ATc

UN

Gfo

iini

bida

pela

urac

ilco

mIC

50

0,3

mM

,bem

com

ope

los

3an

á-lo

gos

test

ados

com

IC50

0,1

mM

,2m

Me

5mM

,res

pect

ivam

ente

.(ii)

Aen

zim

afo

iini

bida

emm

ais

de50

%na

pres

ença

de8µ

Mde

olig

onuc

leot

ídeo

dupl

afit

aco

nten

dosí

tios-

AP,

aum

enta

ndo

para

80%

dein

ibiç

ãoa

16µ

M.(

iii)

Foii

nibi

dair

reve

rsiv

elm

ente

porU

gico

mIC

50

3,1

fmol

.A

prin

cipa

ldif

eren

çaen

tre

aU

NG

deT.

cruz

iede

H.s

apie

nsco

nsis

tena

pro-

prie

dade

func

iona

ldos

dom

ínio

sre

gula

tóri

osdo

N-t

erm

inal

dapr

oteí

na.

Est

esre

sulta

dos

pode

mau

xilia

rem

estu

dos

dede

senh

ora

cion

alde

fárm

aco

espe

cífic

opa

raes

teal

vo(P

eña-

Dia

zet

al,2

004)

.

EC

:E

nzym

eC

omm

issi

on.

Cla

ssifi

caçã

onu

mér

ica

deac

ordo

com

NC

-IU

BM

B(N

omen

clat

ure

Com

mitt

eeof

the

Inte

rnat

iona

lU

nion

ofB

ioch

emis

try

and

Mol

ecul

arB

iolo

gy-

disp

onív

elem

http

://w

ww

.che

m.q

mul

.ac.

uk/iu

bmb/

enzy

me/

).IC

50

(Med

ian

Inhi

bito

ryC

once

ntra

tion)

:con

cent

raçã

oda

subs

tânc

iane

cess

ária

para

prod

uzir

inte

raçã

o(i

nibi

tóri

a)co

m50

%de

seus

rece

ptor

es.

ID50

(Med

ian

Inhi

bito

ryD

ose)

:dos

ede

uma

subs

tânc

iaca

paz

dein

ibir

ocr

esci

men

tode

50%

dapo

pula

ção

expe

rim

enta

l.

17

Met

abol

ism

oO

xida

tivo

ALV

OM

OL

EC

UL

AR

FÁR

MA

CO

/IN

IBID

OR

CO

NSI

DE

RA

ÇÕ

ES

Trip

anot

iona

(N1,N

8-(

bis

glut

atio

nil)

sper

mid

ina)

redu

tase

(T[S

H] 2

,E

C:

1.8.

1.12

),ex

clus

ivo

apr

o-to

zoár

ios

Kin

etop

last

idas

Aná

logo

sam

ídic

osde

glut

atio

na(L

-γ

-Glu

-L-L

eu-G

ly-N

HR

),on

deR

são

grup

osal

quil

linea

res

Todo

sos1

6co

mpo

stos

test

ados

inib

iram

apr

olif

eraç

ãode

form

asep

imas

tigot

as,

com

conc

entr

açõe

sa

part

irde

20µ

g/m

l(R

avas

chin

oet

al,2

003)

.

Fosfi

nope

ptíd

eos

estr

utur

alm

ente

re-

laci

onad

osà

glut

atio

naTo

dos

os7

com

post

osde

senv

olvi

dos

ete

stad

osin

ibir

am(I

C50>

50µ

M)o

cres

-ci

men

tode

form

asep

imas

tigot

ase

amas

tigot

asem

cultu

rade

mio

blas

tos,

send

oos

com

post

os53

e54

cons

ider

ados

osm

ais

pote

ntes

cont

raas

form

asam

astig

o-ta

s,co

mIC

50

9,8µ

Me

14,2µ

M,r

espe

ctiv

amen

te(R

avas

chin

oet

al,2

006)

.Tr

ipan

otio

nare

duta

se(T

R,

EC

:1.

8.1.

12),

form

aox

i-da

dada

T[S

H] 2

,pr

esen

teem

trip

anos

omat

ídeo

sno

luga

rda

glut

atio

nare

du-

tase

(GR

)em

hum

anos

Mep

acri

na,

acri

dina

ede

rivad

osde

acri

dina

Ens

aios

enzi

mát

icos

mos

trar

amqu

ea

mep

acri

naé

capa

zde

inib

ira

TcT

Rco

mK

i25

µM

.Ade

term

inaç

ãoda

estr

utur

acr

ista

logr

áfica

dam

epac

rina

ligad

aao

sítio

ativ

oda

TcT

Rse

rve

deba

sepa

rao

dese

nho

raci

onal

deno

vos

inib

ido-

res

(Jac

oby

etal

,199

6).

Clo

rpro

maz

ina

(ant

idep

ress

ivo

tric

í-cl

ico)

ede

rivad

osPo

ren

saio

enzi

mát

ico

mos

trou

-se

que

acl

orpr

omaz

ina

éum

inib

idor

com

peti-

tivo

daTc

TR

com

Ki

10µ

Mem

rela

ção

ahG

R(K

i76

2µ

M).

Dos

3de

rivad

oste

stad

os,a

pena

sos

com

post

os2

e3

apre

sent

aram

capa

cida

dein

ibitó

ria

com

Ki

65µ

Me

17µ

M,r

espe

ctiv

amen

te(F

aerm

anet

al,1

996)

.

Der

ivad

osde

Feno

tiazi

naA

trav

ésde

dese

nho

raci

onal

defá

rmac

osba

sead

ona

estr

utur

ada

TcT

R,

mos

trou

-se

que

osco

mpo

stos

test

ados

inib

emre

vers

ivel

men

tees

taen

zim

a,co

mdi

fere

ntes

form

asde

ligaç

ãoa

regi

ãodo

sítio

ativ

o(C

han

etal

,199

8).

Est

udos

post

erio

res

mos

trar

amqu

eo

deriv

ado

tiori

dazi

naé

capa

zde

inib

irir

reve

rsiv

el-

men

tea

TR

(Riv

arol

ae

Pagl

ini-

Oliv

a,20

02;L

oPr

esti

etal

,200

4).

Com

plex

os(2

,2’:

6’,2

”-Te

rpir

idin

e)pl

atin

um(I

I)D

os10

com

plex

oste

stad

osap

enas

2(1

ae

2e)i

nibi

ram

irre

vers

ivel

men

tea

TcT

Rna

pres

ença

deN

AD

PH(I

C50

108

nMe

100

nM,r

espe

ctiv

amen

te),

não

prom

o-ve

ndo

efei

toin

ibitó

rio

nahG

R(B

onse

etal

,200

0).

Naf

toqu

inon

asde

rivad

asde

men

adi-

ona,

plum

bagi

nae

jugl

ona

As

séri

es19

-20

(3,3

’-[p

olia

min

obis

(car

boni

lalq

uil)

]bis

(1,4

-NQ

))in

ibir

amir

re-

vers

ivel

men

tea

TcT

Rco

mIC

50>

10µ

M(S

alm

on-C

hem

inet

al,2

001)

.E

C:

Enz

yme

Com

mis

sion

.C

lass

ifica

ção

num

éric

ade

acor

doco

mN

C-I

UB

MB

(Nom

encl

atur

eC

omm

ittee

ofth

eIn

tern

atio

nal

Uni

onof

Bio

chem

istr

yan

dM

olec

ular

Bio

logy

-di

spon

ível

emht

tp://

ww

w.c

hem

.qm

ul.a

c.uk

/iubm

b/en

zym

e/).

Ki:

cons

tant

ede

diss

ocia

ção.

IC50

(Med

ian

Inhi

bito

ryC

once

ntra

tion)

:con

cent

raçã

oda

subs

tânc

iane

cess

ária

para

prod

uzir

inte

raçã

o(i

nibi

tóri

a)co

m50

%de

seus

rece

ptor

es.

18

Mec

anis

mo

deD

ifere

ncia

ção

eIn

vasã

oC

elul

arA

LVO

MO

LE

CU

LA

RFÁ

RM

AC

O/I

NIB

IDO

RC

ON

SID

ER

AÇ

ÕE

SC

ruzi

paín

a,cr

uzaí

naou

GP5

7/51

(EC

:3.

4.22

.51)

,pa

rtic

ipa

dopr

oces

sode

di-

fere

ncia

ção

celu

lar

deT.

cruz

iede

inva

são

decé

lu-

las

dem

amíf

eros

Z-P

he-A

la-fl

uoro

met

ilce

tona

(Z-

Phe-

Ala

-FM

K)

Test

ado

emcu

ltura

dem

acró

fago

sU

774,

foic

apaz

dein

ibir

form

astr

ipom

asti-

gota

sem

conc

entr

ação

de25

µM

.Ade

term

inaç

ãocr

ista

logr

áfica

,por

raio

s-X

,do

inib

idor

ligad

oao

sítio

ativ

oda

cruz

ipaí

na,

serv

ede

mod

elo

inic

ial

para

ode

senh

ora

cion

alde

fárm

acos

base

ado

emes

trut

ura

(McG

rath

etal

,199

5).

Mu-

F-hF

-VSP

hw

Mu-

F-hF

-FM

KIn

ibir

amem

60%

ocr

esci

men

tode

form

asep

imas

tigot

as(c

epa

Y)a

5µ

M,c

omin

ibiç

ãoto

talaleq1

0µ

M(E

ngel

etal

,199

9).

Der

ivad

osde

uréi

aE

stud

ode

dock

ing

por

busc

aem

banc

ode

dado

sdo

prog

ram

aD

OC

K4.

0.1

ras-

treo

u9

mol

écul

asca

paze

sde

inib

ira

cruz

ipaí

naco

mIC

50>

10µ

M.D

eriv

ados

deur

éia

etio

uréi

afo

ram

sint

etiz

ados

ete

stad

os,s

endo

oco

mpo

sto

D16

(5’(

1-m

ethy

l-3-

trifl

uoro

met

hylp

yraz

ol-5

-yl)

-thi

ophe

ne3’

-tri

fluor

omet

hylp

heny

lure

a)o

que

apre

sent

oum

elho

res

resu

ltado

sem

cultu

rade

célu

las

dem

amíf

ero,

com

sobr

eviv

ênci

a3,

7ve

zes

mai

orqu

eem

célu

las

não

trat

adas

ein

ibiç

ãodo

cres

ci-

men

tode

form

asam

astig

otas

(cep

aY

)a3,

1µ

M(D

uet

al,2

000)

.

Cha

gasi

na,

prot

eína

deT.

cruz

ire

s-po

nsáv

elpe

lare

gula

ção

endó

gena

deci

steí

nopr

otea

ses

Test

esen

zim

átic

osfo

ram

feito

sno

intu

itode

dem

onst

rara

inte

raçã

oen

tre

chag

a-si

nae

cruz

ipaí

na(S

anto

set

al,2

005)

ese

uef

eito

regu

lató

rio

sobr

ees

taci

steí

nopr

otea

se(K

i0,

095±

0,00

76nM

)(S

alm

onet

al,2

006)

.A

dete

rmin

ação

estr

u-tu

rald

ach

agas

ina,

por

RM

N,e

oes

tudo

dese

uco

mpo

rtam

ento

dinâ

mic

o,be

mco

mo

om

apea

men

tode

seus

sítio

sde

ligaç

ão,s

ãoas

etap

asin

icia

ispa

rao

estu

dora

cion

alde

inib

idor

estip

o-ch

agas

ina

(Sal

mon

etal

,200

6).

EC

:E

nzym

eC

omm

issi

on.

Cla

ssifi

caçã

onu

mér

ica

deac

ordo

com

NC

-IU

BM

B(N

omen

clat

ure

Com

mitt

eeof

the

Inte

rnat

iona

lU

nion

ofB

ioch

emis

try

and

Mol

ecul

arB

iolo

gy-

disp

onív

elem

http

://w

ww

.che

m.q

mul

.ac.

uk/iu

bmb/

enzy

me/

).IC

50

(Med

ian

Inhi

bito

ryC

once

ntra

tion)

:con

cent

raçã

oda

subs

tânc

iane

cess

ária

para

prod

uzir

inte

raçã

o(i

nibi

tóri

a)co

m50

%de

seus

rece

ptor

es.

Ki:

cons

tant

ede

diss

ocia

ção.

19

1.2.1 Enzimas Proteolíticas

Proteases, ou enzimas proteolíticas, hidrolisam1 ligações peptídicas de proteí-

nas e peptídeos, podendo ser classificadas em (i) endopeptidases, ou proteinases, que

catalisam a clivagem de ligações peptídicas localizadas no interior de uma cadeia poli-

peptídica; (ii) exopeptidases, que catalisam a clivagem de um a três aminoácidos a partir

das extremidades amino-terminal (aminopeptidases) ou carboxi-terminal (carboxipepti-

dases).

Através do alinhamento entre as seqüências de aminoácidos de proteínas classifi-

cadas como proteases e o estudo de seus sítios catalíticos, foi possível propor uma pri-

meira organização de famílias de peptidades (Rawlings e Barret, 1993), de acordo com o

grupamento químico responsável pela catálise: serino (S), cisteíno (C), aspartil (A), me-

talo (M) e desconhecido (U). Atualmente, o banco de dados MEROPS (http://merops.

sanger.ac.uk/index.htm), distingue 7 diferentes famílias de peptidases (aspartil, cisteíno,

glutâmico, metalo, serino, treonino e desconhecido) (Rawlings et al, 2006).

Em cada classe, o termo família é usado para descrever um grupo de enzimas que

apresentam relação evolutiva entre si, determinada pela similaridade ao longo de toda a

seqüência de aminoácidos ou pelo menos na região do sítio catalítico. Já o termo clan

compreende um grupo de famílias que possuem indicação de relação evolutiva, apesar

de apresentar estatisticamente uma similaridade pouco significativa entre as seqüências.

No alinhamento entre duas seqüências de aminoácidos pertencentes a um mesmo

clan, por vezes, a ordem de alguns resíduos, principalmente os que compõem o sítio ca-

talítico, podem aparecer invertidas. Desta forma, a pontuação de similaridade entre estes

resíduos será baixa e, durante a análise estatística deste alinhamento, estas seqüências

serão apontadas como evolutivamente distantes. Um exemplo deste tipo de troca de po-

sição entre resíduos do sítio catalítico pode ser observada na Tab. 1.2, onde os resíduos

HIS e ASP da região catalítica do clan SA, aparecem com posições trocadas entre as

famílias S1 e S2, dentro da classe das serino proteases. Na Fig. 1.6 é apresentada a con-

formação estrutural das enzimas quimotripsina (PDB: 1CA0) e subtilisina (PDB: 1S01),

1 Hidrólise é a clivagem de uma ligação química com o envolvimento de molécula de água na forma-ção do produto da reação catalítica.

20

Figura 1.6: Conformação estrutural dos resíduos que compõem a tríade catalítica das famílias S1 e S2em serino proteases.

Família S1: Quimotripsina† Família S2: Subtilisina‡

As distâncias apresentadas foram medidas em Angströms (A).†PDB 1CA0 (Scheidig et al, 1997). A tríade catalítica da família S1 é composta por HIS57, ASP102 eSER195.‡PDB 1S01 (Pantoliano et al, 1989). A tríade catalítica da família S2 é composta por ASP32, HIS64 eSER221.

serino proteases das famílias S1 e S2, respectivamente, nas quais pode-se notar que ape-

sar de haver uma inversão na posição dos resíduos HIS e ASP em suas seqüências de

aminoácidos, o posicionamento destes na estrutura terciária é equivalente, mantendo-se

a conformação necessária para a ação catalítica característica de uma serino protease.

A nomenclatura das famílias é dada pela letra do grupamento catalítico seguida

de um número definido arbitrariamente e, de forma similar, a nomenclatura dos clans

é definida pela letra do tipo catalítico seguida de uma letra maiúscula arbitrariamente

selecionada (Rawlings et al, 2006). Na Tab. 1.2 é apresentado um resumo das classes

de proteases, suas famílias e principais clans e representantes.

A classe das cisteíno proteases possui diversos representantes em diferentes orga-

nismos desde vírus até vertebrados, como mostrado na Fig. 1.7, que têm sido alvos de

estudos no combate à organismos patogênicos. Em 1879, o primeiro representante desta

classe foi purificado e caracterizado a partir do “mamão papaia” (Carica papaya) e, por

isso, denominado papaína (Sajid e McKerrow, 2002).

A papaína foi, também, a primeira cisteíno protease a ter sua estrutura tridimen-

sional (3D) resolvida, em 1968, por cristalografia de raios-X (Drenth et al, 1968). Pos-

teriormente, tornou-se o protótipo de uma família (C1) e desde então proteases que

21

Tabela 1.2: Exemplos de classes de proteases com alguns de seus clans e famílias.

CLASSE CLAN FAMÍLIA SÍTIO ATIVO EXEMPLOS

SerinoProtease

(EC: 3.4.21)

SA S1:Quimo-tripsina

HIS, ASP, SERQuimotripsina, Tripsina,Trombina, Catepsina G,Fatores de CoagulaçãoVII, IX, X, XI e XII.

SA

S2:Subti-lisina

ASP, HIS, SERSubtilisina, Cerevisina,Kexina, Furina, Endo-peptidases K, R e T.

CisteínoProtease

(EC: 3.4.22)

CA C1:Papaína GLN, CYS,HIS, ASN

Papaína, Quimopapaína,Caricaína, Cruzipaína,Catepsinas L, S, H e B.

AspartilProtease

(EC: 3.4.23)

AA A1:Pepsina ASP, ASPPepsina, Gastricsina,Quimosina, Renina,Catepsinas D e E.

MetaloProtease

(EC: 3.4.24)

MA M4:Termo-lisina

MotivoHEXXH

zinc-binding

Termolisina, Pseudoli-sina, Vibriolisina, Baci-lolisina, Coccolisina.

MAM8:Leishma-

nolisina

MotivoHEXXH

zinc-binding

Leishmanolisina.

EC: Enzyme Commission. Classificação numérica de acordo com NC-IUBMB (NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).Fonte: Rawlings e Barret (1993).

apresentem, através de suas seqüências de aminoácidos, uma relação evolutiva com a

papaína, são classificadas como proteases tipo-papaína tornando-se membros da família

C1. Dentre estas, encontram-se enzimas em estudo contra doenças parasitárias como a

cisteíno protease majoritária de T. cruzi, a cruzipaína.

22

Figura 1.7: Diagrama esquemático apresentando a classe das cisteíno proteases, suas principais famíliase clans.

Fonte: Diagrama baseado em Sajid e McKerrow (2002).

23

1.2.2 Cisteíno Proteases de Trypanosoma cruzi: Cruzipaínas 1 e 2

A cruzipaína, cruzaína ou GP57/51, constitui-se na principal cisteíno protease de

T. cruzi. É uma enzima lisossomal que pode ser encontrada, também, na superfície ce-

lular de formas epimastigotas e amastigotas, e é expressa em todos os estágios do ciclo

de vida do T. cruzi exercendo diferentes funções. As mais comuns são a participação

no processo de diferenciação celular do parasita e da invasão deste à células de mamí-

feros (Klemba e Goldberg, 2002), funções de grande relevância para a sobrevivência do

T. cruzi, o que caracteriza esta enzima como um alvo molecular importante no combate

à doença de Chagas, conforme apresentado na Tab. 1.1.

Como em todas as proteases do clan CA da família C1, a cruzipaína é sintetizada

sob a forma de pré-pró-enzima, como apresentado na Fig. 1.8. O domínio pré é cons-

tituído de ≈20 aminoácidos e é responsável pelo endereçamento da cisteíno protease

ao retículo endoplasmático, onde será removido por proteólise pela enzima peptidase

sinal. A região pró é formada de ≈130 aminoácidos e suas principais funções estão

na participação do correto enovelamento da proteína, a manutenção da estabilidade da

enzima em pHs neutros e alcalinos, o direcionamento para compartimentos endosso-

mais/lisossomais e a manutenção da enzima inibida, impedindo a atividade proteolítica

indesejável fora dos compartimentos lisossomais (dos Reis, 2005).

A cruzipaína madura é formada após a remoção da região pró e é composta por

345 aminoácidos sendo 215 do domínio central (domínio catalítico), onde se encon-

tram os resíduos conservados característicos do Clan CA: glutamina (GLN19), cisteína

(CYS25), histidina (HIS162) e asparagina (ASN182) , sendo os três últimos os formado-

res da tríade catalítica. Os últimos 130 resíduos constituem a porção C-terminal, que é

uma região exclusiva das proteases de tripanosomatídeos, não apresentando importância

na ação enzimática da proteína (Cazzulo et al, 2001; dos Reis, 2005). No entanto, al-

guns estudos mostram que esta porção está intrinsecamente envolvida na resposta imune

do hospedeiro a cruzipaína (Cazzulo et al, 2001; dos Reis, 2005). A seqüência de ami-

noácidos do domínio central possui cerca de 35% de identidade com a papaína e, a partir

da resolução de sua estrutura 3D por cristalografia de raios-X, verificou-se que ambas

24

possuem o mesmo tipo de enovelamento (McGrath et al, 1995).

Figura 1.8: Representação esquemática da estrutura primária da cruzipaína.

A região PRE é o peptídeo sinal com ≈20 aminoácidos, a região PRO, com cerca de 130 aminoácidos,confere estabilidade a proteína e é removida após a ativação da enzima. O Domínio Central (215 resíduos)confere atividade catalítica a enzima e o C-terminal (130 aminoácidos) possui função desconhecida. Osresíduos limítrofes de cada domínio estão indicados na porção superior do esquema, onde as setas apon-tam o local de separação entre eles.Fonte: Esquema baseado em dos Reis (2005)

O domínio catalítico da cruzipaína é formado por 5 subsítios (S3, S2, S1, S1′

e S2′), conforme apresentado na Fig. 1.9, onde encontra-se a tríade catalítica CYS25,

HIS162 e ASN182. Estudos bioquímicos e a determinação experimental de estruturas

tridimensionais complexadas a diferentes inibidores, mostram que o subsítio S2 é a re-

gião que confere especificidade de substrato a cruzipaína (Serveau et al, 1996; Judice et

al, 2001). Os subsítios S1 e S1′ auxiliam nesta especificidade e, os demais subsítios,

aparentemente não contribuem muito neste aspecto (McGrath, 1999).

A análise das propriedades eletrostáticas no sítio catalítico da cruzipaína (Dar-

denne, 2000) mostrou que a atividade catalítica desta enzima está particularmente li-

gada a formação e estabilização do par iônico CYS25− · · ·HIS162+, como apresentado

pela papaína (Dardenne et al, 2003). Resíduos situados a uma distância de até 5 A

em relação a porção sulfidrila (SG) da CYS25 e da porção imidazol (ND1) da HIS162,

são responsáveis pela formação de um campo elétrico intenso e alinhado na direção

SG−ND1, exluindo-se a contribuição dos resíduos CYS25 e HIS162 (Dardenne et al,

2003). Estes estudos também mostram a participação em particular da GLN19 no favo-

recimento desta formação, quando encontra-se na sua configuração usual estando o seu

nitrogênio NE2 voltado para o nitrogênio N da CYS25 (Dardenne, 2000). A participa-

ção destes três resíduos (GLN19, CYS25 e HIS162) no processo catalítico da cruzipaína

pode ser observada na Fig. 1.10.

25

Figura 1.9: Representação esquemática do domínio catalítico da cruzipaína e seu sítio de catálise.

Representação da interação de um substrato com a região catalítica da cruzipaína. Os resíduos do substratosão denotados por P e os subsítios de interação da enzima são descritos por S. O grupo tiol da CYS25é representado por S− e a seta aponta para a ligação peptídica do substrato a ser hidrolisada. A porçãocarboxil (prime side) do substrato e da protease são denominadas P1′ e P2′ e S1′ e S2′, respectivamente.A porção amino do substrato e os subsítios enzimáticos correspondentes (non-prime side) são designadospor P1, P2 e P3 e S1, S2 e S3, respectivamente.Fonte: Esquema baseado em Sajid e McKerrow (2002)

A cruzipaína possui diferentes isoformas sendo a cruzipaína 1 caraterizada como

a isoforma majoritária de T. cruzi. Estas diferentes isoformas são obtidas de diferentes

cepas e em diferentes estágios de desenvolvimento do parasita, sendo a cruzipaína 2

uma delas (dos Reis, 2005).

A cruzipaína 2 foi clonada e seqüenciada (Lima et al, 1994), apresentando 86%

de identidade entre a sua seqüência de amiácidos e a da cruzipaína 1, estando as prin-

cipais diferenças nos subsítios catalíticos. Estudos bioquímicos mostram que estas

duas isoformas possuem diferentes preferências a substratos, bem como suscetibili-

dade a inibidores (del Nery et al, 1997; Lima et al, 2001). Além disso, apontam

que a substituição do ASP161 no subsítio S1′, comum entre as isoformas de cruzipaína,

por SER161 no mesmo subsítio da cruzipaína 2, seria responsável pela caracterização

desta isoforma (dos Reis et al, 2006). Estudos computacionais simulando a mutação

SER161ASP na cruzipaína 2, mostraram que a introdução de um resíduo ácido à esta

isoforma favorece mais a formação do par iônico CIS25− · · ·HIS162+, em relação a sua

conformação original com a presença do resíduo neutro SER161 (Dardenne, 2000). A

substituição ASP161→SER161 somada a possibilidade da GLN19 assumir uma confor-

26

mação não usual, poderiam justificar a baixa eficiência enzimática da cruzipaína 2, em

relação a cruzipaína 1, para os substratos mais usuais em cisteíno proteases, conforme

apresentado em dos Reis (1999).

Tem sido proposto que a atividade enzimática das isoformas da cruzipaína pode-

ria ser modulada por alterações conformacionais na região do sítio ativo bem como pela

presença de um possível sítio alostérico (dos Reis, 2005). A regulação deste possível

sítio alostérico estaria condicionada a temperatura de forma que, a atividade enzimática

seria inibida por excesso de substrato a 25◦C (temperatura encontrada no vetor inver-

tebrado), desaparecendo a 37◦C (temperatura no hospedeiro vertebrado) (Lima et al,

1992). Além disto, a temperatura também exerceria um importante papel na manuten-

ção da estrutura secundária da enzima que sofreria uma diminuição do seu conteúdo

a 37◦C (dos Reis, 2005). Estas análises do perfil enzimático da cruzipaína em rela-

ção a diferentes inibidores e temperaturas, bem como sua caracterização estrutural, em

particular para os subsítios catalíticos, podem auxiliar significativamente no desenvol-

vimento de novos fármacos.

27

Figu

ra1.

10:R

epre

sent

ação

esqu

emát

ica

dom

ecan

ism

oca

talít

ico

deci

steí

nopr

otea

se.

RR'

-

Cys25

His159

Gln19 C

O

NH

H

NH

H

CC

NC

NH

+

CH2S_

CO

NH2

Asn175

CO

NH

Cys25

His159

CO-

R'

R

Gln19 C

O

NH

H

H

CC

NC

NH

+

CH2S_

CO

NH2

Asn175

Gln19 C

O

NH

H

NH

CH2S_

Cys25

His159

CO

NH2

Asn175

CO

H

CC

NC

N

HR'

R

Gln19 C

O

NH

H CH2S_

Cys25

His159

CO

NH2

Asn175

CO

H

CC

NC

N

NHH

H2O

R'

R

Cys25

His159

OH

CO

-

R

Gln19 C

O

NH

H

H

CC

NC

NH

+

CH2S_

CO

NH2

Asn175

OH

Cys25

His159

CO-

R

Gln19 C

O

NH

H

H

CC

NC

NH

+

CH2S_

CO

NH2

Asn175

(A)

(B)

(C)

(D)

(E)

(F)

(N-T

er d

o su

bstr

ato)

(C-T

er d

o su

bstr

ato)

(Sub

stra

to p

eptíd

ico)

(i)

Eta

pade

acila

ção:

(A)↔

(B)↔

(C)↔

(D).

(A)

Form

ação

dopa

riô

nico

CY

S25−

···H

IS15

9+.

(B)

Form

ação

doIn

term

ediá

rio

tetr

aédr

ico

(est

ado

detr

ansi

ção)

.(C

)Rom

pim

ento

dopa

riôn

ico

eac

opla

men

todo

subs

trat

o.(D

)For

maç

ãodo

com

plex

oac

il-en

zim

a.(i

i)E

tapa

dede

saci

laçã

o:(D

)↔(E

)↔(F

).(E

)In

term

ediá

rio

tetr

aédr

ico

(est

ado

detr

ansi

ção)

.(F)

Lib

eraç

ãodo

prod

uto

cata

lític

oe

rest

abel

ecim

ento

dopa

riôn

ico.

Obs

erva

ção:

Os

amin

oáci

dos

repr

esen

tado

ses

tão

desc

rito

sde

acor

doco

ma

num

eraç

ãoda

papa

ína.

Font

e:R

epre

sent

ação

adap

tada

deD

arde

nne

(200

0).

28

1.3 Desenho Racional de Fármacos Baseado em Estrutura

A metodologia tradicional, usualmente chamada de triagem cega (blind scree-

ning), é responsável pela descoberta da maioria dos protótipos de fármacos disponíveis

hoje no mercado, e consiste no teste direto de compostos sintéticos ou produtos natu-

rais em ensaios in vitro e em células ou modelos animais. Os esforços em purificar,

caracterizar e sintetizar princípios ativos, além da necessidade de se ter uma grande

diversidade de material biológico para testes, tornam o processo inteiro bastante traba-

lhoso, ineficiente e cujo custo envolve investimentos, por parte de grandes companhias

farmacêuticas, que em 2001 chegavam a, aproximadamente, US$800 milhões (Rockey

e Elcock, 2002) e que hoje podem chegar a bilhões de dólares (Kola e Landis, 2004).

No entanto, mesmo quando um composto eficaz é descoberto, seu mecanismo de ação

quase sempre permanece desconhecido.

Atualmente, uma abordagem mais racional, denominada desenho racional de fár-

macos baseado em estrutura, visa a identificação e uma maior compreensão das intera-

ções moleculares entre receptor e ligante, envolvendo o uso de métodos computacionais

baseados nas estruturas tridimensionais das moléculas interagentes. No final do século

XX, Ohlstein et al (2000) chamaram a atenção para a importância de que mais pesqui-

sadores e indústrias farmacêuticas usufruíssem dos métodos computacionais aplicados

à descoberta de novos fármacos. O uso de estratégias que combinem ferramentas de

bioinformática e biologia computacional para a análise da seqüência de aminoácidos e

da estrutura protéica, pode desempenhar um importante papel na identificação de poten-

ciais alvos moleculares e na investigação das propriedades físico-químicas e caracterís-

ticas associadas às regiões de sítio ativo dos mesmos.

As ferramentas de bioinformática, visualização molecular, modelagem compa-

rativa, mecânica/dinâmica molecular e metodologias de docking receptor-ligante, são

algumas das possíveis ferramentas usadas no planejamento e descoberta de compostos

protótipos em estudos de grande escala (Goldsmith-Fischman e Honig, 2003). Estes

métodos vêm sendo aplicados em projetos de desenho racional de fármacos baseado em

estrutura de outros parasitas de alto impacto médico social como o Plasmodium falcipa-

29

rum e o Mycobacterium tuberculosis, agentes etiológicos da Malária e da Tuberculose,

respectivamente (Joachimiak et al, 2001; Goulding et al, 2003).

A publicação das informações do genoma de T. cruzi (El-Sayed et al, 2005),

abriu um caminho bastante promissor para o desenvolvimento de novos fármacos contra

a doença de Chagas que sejam mais efetivos e menos tóxicos ao hospedeiro. O estudo

correlato entre proteínas de T. cruzi e de humanos (Homo sapiens) (U.S. Department

of Energy Office of Science, 2003) constitui uma etapa crucial para o planejamento de

fármacos terapeuticamente úteis. Isto ocorre através do estudo teórico e computacional

das bases moleculares envolvidas no processo de reconhecimento e acoplamento entre

a região do sítio ativo das enzimas similares entre os dois organismos e seus potenciais

ligantes.

Seqüências e funções similares dentro de uma família gênica, geralmente, indicam

um tipo de conservação na arquitetura do sítio de ligação entre proteínas provenientes de

membros desta família. Isto pode sugerir que se uma proteína sintetizada a partir de um

destes membros é capaz de ligar-se à um fármaco, proteínas oriundas de outros mem-

bros desta mesma família, também, podem ser capazes de ligar-se à este composto com

propriedades físico-químicas parecidas (Galperin e Koonin, 1999; Hopkins e Groom,

2002). Através desta triagem inicial, seria possível identificar quais são as enzimas pos-

sivelmente similares entre T. cruzi e H. sapiens, de forma a se evitar a proposição de

alvos moleculares que desencadeiem prováveis reações cruzadas nos dois organismos,

evitando-se, assim, o agravamento da debilidade física dos pacientes.

1.4 Geração de Modelo Protéico via Modelagem Comparativa

Com o crescente número de projetos de seqüenciamento de genomas de orga-

nismos patogênicos, a predição experimental de estruturas protéicas tornou-se limitada

fazendo-se cada vez mais necessário métodos teóricos e preditivos capazes de analisar

estes dados em grande escala. Com a genômica estrutural tornou-se possível a deter-

minação teórica em grande escala da estrutura 3D de macromoléculas e sua análise

biológica (Goldsmith-Fischman e Honig, 2003).

30

As estratégias teóricas comumente aplicadas são (Rössle, 2004):

• Métodos Físicos: baseiam-se nas interações entre átomos e incluem métodos de

modelagem molecular, como a dinâmica molecular e a minimização de energia

(métodos ab initio).

• Métodos Empíricos: dependem de estruturas de proteínas que já foram determi-

nadas experimentalmente e depositadas em um banco de dados (Protein Data

Bank (PDB) - Westbrook et al (2002)).

A predição da estrutura 3D de uma proteína e seu padrão de enovelamento forne-

cem informações relevantes sobre sua provável função biológica e, conseqüentemente,

na identificação desta como um potencial alvo farmacológico. Já é bem estabelecido

que a evolução tende a conservar funções que dependem mais diretamente das estrutu-

ras tridimensionais que das similaridades entre as seqüências de aminoácidos das pro-

teínas (Sánchez et al, 2000; Cherkasov et al, 2004). O enovelamento protéico permite

que aminoácidos seqüencialmente distantes interajam em uma mesma região espacial

da proteína, formando distintos padrões conformacionais, dependendo das condições

físico-químicas do ambiente. Portanto, um alinhamento estrutural entre proteínas con-

sideradas de uma mesma família, mesmo que envolvendo apenas uma região associada

ao sítio ativo, pode ser um importante método para se inferir a função da seqüência em

estudo (Laskowski et al, 2003; Marsden et al, 2006).

A técnica de modelagem comparativa, também chamada de modelagem por ho-

mologia, é um método empírico que se baseia no alinhamento construído entre a seqüên-

cia que se deseja modelar e uma ou mais seqüências de proteínas evolutivamente relaci-

onadas que possuam uma estrutura tridimensionalmente resolvida (determinada experi-

mentalmente por técnicas de raios-X ou Ressonância Magnética Nuclear) e depositada

no PDB (Goldsmith-Fischman e Honig, 2003).

Os modelos 3D gerados pela técnica de modelagem comparativa podem ser apli-

cados não somente em predição funcional e em desenho racional de fármacos baseado

em estrutura mas, também, no desenho de experimentos de mutagênese sítio-dirigida

31

fornecendo possíveis mutações para testar hipóteses funcionais, modelar a especifici-

dade de um substrato, fazer a predição de epítopos antigênicos, possibilitar simulações

de interações entre proteínas por técnicas de modelagem/dinâmica molecular, auxiliar

no refinamento de estruturas resolvidas por cristalografia de raios-X e por experimentos

de ressonância magnética nuclear (RMN), dentre outras (Rössle, 2004).

A aplicabilidade do modelo está diretamente relacionada com a precisão com que

este foi gerado (Fig. 1.11), que é dada pelo grau de similaridade entre as estruturas 3D

da proteína predita e da proteína molde. Este grau de similaridade é determinado pelo

desvio médio quadrático (RMSD), que mede as distâncias interatômicas, em Angströms

(A), entre o modelo gerado e a estrutura molde, de acordo com a seguinte função:

RMSD =

√√√√ 1

N

N∑i=1

‖rAi − rB

i ‖2 (1.1)

ondeN é o número total de átomos pareados entre as duas estruturas, ri é o vetor posição

do átomo i, A é a estrutura modelo e B é a estrutura molde.

A modelagem comparativa consiste basicamente de quatro etapas descritas a se-

guir (Goldsmith-Fischman e Honig, 2003; Rössle, 2004) e resumidas na Fig. 1.13:

(1) Identificação de referências: tem por objetivo identificar seqüências de aminoá-

cidos que possuam similaridade com a proteína em estudo (seqüência alvo). A

determinação da seqüência de referência pode ser feita através de algoritmos

como o BLAST (Basic Local Alignment Search Tool) (Altschul et al, 1990)

que realiza o alinhamento entre a seqüência alvo e seqüências depositadas em

bancos de dados estruturais (e.g. Protein Data Bank - PDB), sendo selecionadas

as que possuírem similaridade suficiente para se inferir homologia entre elas.

Quando as seqüências de aminoácidos possuem pouca similaridade, aplica-se

o método de Threading (Miller et al, 1996) que realiza a comparação entre

a seqüência alvo e estruturas 3D de proteínas depositadas em banco de dados,

objetivando-se identificar proteínas remotamente relacionadas que possuam um

mesmo tipo de enovelamento.

32

Figura 1.11: Possíveis aplicações de modelos tridimensionais de acordo com os valores de RMSD.

Fonte: Esquema baseado em Baker e Sali (2001).

33

(2) Alinhamento entre seqüências: como a fase de identificação de referências tem

como objetivo encontrar relações evolutivas entre seqüências, os alinhamentos

construídos são apenas locais 2 e não globais 3 o que, por muitas vezes, faz

com que a referência escolhida não seja a melhor seqüência para a construção

do modelo. Nesta etapa, é realizado o alinhamento global entre a seqüência alvo

e a de referência no intuito de se verificar a cobertura do alinhamento. Desta

forma, um alinhamento global com mais de 40% de identidade é o suficiente

para gerar um modelo confiável, mesmo por métodos automatizados.

(3) Construção do modelo: baseia-se na informação contida no alinhamento entre

as seqüências alvo e molde. As técnicas mais aplicadas são a de construção

usando corpos rígidos e por satisfação de restrições espaciais, que é conceitu-

almente similar ao usado na determinação de estruturas por RMN.

• Construção usando corpos rígidos: constrói um modelo por partes basean-

do-se no fato de que proteínas homólogas possuem regiões estrutural-

mente conservadas como α-hélices e folhas β. As regiões estruturalmente

conservadas da seqüência em estudo são definidas através de uma predi-

ção de estruturas secundárias. Estas serão alinhadas considerando-se a

média das posições dos Cα das seqüências de aminoácidos das regiões

estruturalmente conservadas nas seqüências de referência. As regiões que

não satisfazem as exigências são chamadas de regiões variáveis e compre-

endem, geralmente, regiões de voltas que conectam as regiões conserva-

das. A cadeia principal destas regiões pode ser obtida em bancos de dados

de estruturas protéicas, que apresentam conjuntos de voltas determinados

através do número de aminoácidos e do tipo de estruturas secundárias que

conectam. Após a inserção das regiões de volta, um modelo inicial do

esqueleto peptídico estará pronto restando, apenas, a inserção das cadeias

2 Alinhamento Local: alinhamento entre regiões de seqüências com maior densidade de resíduosidênticos ou similares

3 Alinhamento Global: alinhamento entre seqüências em toda a sua extensão, de forma a coincidir omaior número de resíduos idênticos ou similares

34

laterais dos aminoácidos que o compõe, através de busca em bibliotecas

de rotâmeros (Lovell et al, 2000). Alguns programas como o SWISS-

MODEL (Guex e Peitsch, 1997) baseiam-se neste tipo de metodologia

para a construção de modelos protéicos.

• Construção por satisfação de restrições espaciais: inicia-se pelo alinha-

mento entre a seqüência em estudo e a de referência, extraindo-se deste

molde suas restrições espaciais (distâncias e ângulos) e transferindo-as

para o modelo. O tamanho das ligações bem como seus ângulos pre-

ferenciais são obtidos de campos de força (e.g. CHARMM) enquanto

que o dos átomos não ligados, são obtidos por análise estatística de um

grupo representativo de estruturas conhecidas (Sali e Overington, 1994).

Desta forma, é possível limitar o número de possíveis conformações que

o modelo pode assumir. A principal característica deste método é a obten-

ção empírica das restrições espaciais, expressas por funções densidade de

probabilidade (PDF’s), a partir de banco de dados contendo informações

sobre alinhamentos entre estruturas protéicas de alta resolução. As res-

trições espaciais e os termos de energia são combinados em uma função

objetivo, sendo submetida a métodos de otimização por gradiente conju-

gado e recozimento simulado, visando a minimização das violações das

restrições espaciais (Sánchez e Sali, 1997). Este método é o mesmo em-

pregado em programas como o Modeller (Sánchez e Sali, 1997).

(4) Validação do modelo: após a construção do modelo é necessário identificar

possíveis erros relacionados aos métodos empregados, à escolha das referên-

cias e ao alinhamento entre a seqüência alvo e a seqüência de referência. Caso

o modelo seja caracterizado de má qualidade, todo o protocolo anterior deve

ser revisto no intuito de se melhorar o alinhamento inicial ou decidir-se por

outros métodos. A qualidade de um modelo é determinada pelas ligações en-

tre os átomos, ângulos formados, ligações peptídicas, planaridade dos anéis e

ângulos de torção nas cadeias principal e laterais. Por ser baseado em uma

35

estrutura tridimensionalmente resolvida, o valor de RMSD obtido pela sobre-

posição do modelo gerado e da estrutura molde deve estar entre 1A e 2A, para

ser considerado de boa qualidade. Além disto, através da análise do gráfico

de Ramachandran (Ramakrishnan, 2001) é possível identificar, através da cor-

relação entre os ângulos φ e ψ, quais resíduos encontram-se fora das regiões

favoráveis, possibilitando uma melhora no modelo (Fig. 1.12).

Por ser dependente de uma estrutura protéica tridimensionalmente resolvida, a

técnica de modelagem comparativa possui certas limitações: (i) nem sempre se conse-

gue uma estrutura que sirva como molde para a seqüência que se deseja estudar; (ii) por

vezes, as seqüências que podem servir como molde possuem resolução acima de 3, 0A,

sendo consideradas estruturas de resolução não muito boa para a construção de um mo-

delo preciso; (iii) o grau de similaridade entre a seqüência de estudo e as seqüências das

estruturas molde pode ser pequeno (< 30% de identidade), mesmo em regiões do sítio

ativo. Nestes casos, informações como a identificação de regiões transmembranares,

predição de estruturas secundárias, reconhecimento do tipo de enovelamento e dados

experimentais podem ser fatores importantes no auxílio tanto na predição de modelos

tridimensionais como na análise funcional de seqüências (Chance et al, 2002; Rössle,

2004).

Quanto à qualidade do modelo, métodos de simulação de dinâmica molecular

têm sido empregados na melhora de modelos gerados tanto por técnicas baseadas em

homologia quanto por ab initio. Simulações em solvente explícito ajudam a acomodar

a estrutura 3D do modelo melhorando, principalmente, os ângulos φ e ψ de resíduos em

regiões desfavoráveis no gráfico de Ramachandran (Fan e Mark, 2004). Além disto, os

métodos de dinâmica molecular aplicados aos modelos, são empregados na pesquisa de

diferentes conformações protéicas para estudos de docking receptor-ligante bem como

em estudos envolvendo a interação de um ligante na região de sítio ativo da enzima em

estudo (Xiao et al, 2006).

36

Figura 1.12: Exemplo de gráfico de Ramachandran apresentando correlações entre os ângulos φ e ψ deuma cadeia polipeptídica.

(a) Determinação dos ângulos φ e ψ de uma cadeia polipeptídica.Fonte: http://employees.csbsju.edu/hjakubowski/classes/ch331/protstructure/olunderstandconfo.html.

B

A

L

b

a

l

p

~p

~b

~a

~l

b

~b

b~b

~b

-180 -135 -90 -45 0 45 90 135 180

-135

-90

-45

0

45

90

135

180

Ramachandran Plot1me4m

Phi (degrees)

Psi (

degr

ees)

CYS 101

THR 185

(b) Gráfico de Ramachandran gerado pelo programa Procheck (Laskowski et al, 1993), apre-sentando as regiões favoráveis do modelo estrutural da cruzipaína 2.

No gráfico de Ramachandran os resíduos de aminoácidos são representados por quadrados, sendo asglicinas representadas por triângulos.As áreas em vermelho compreendem as regiões muito favoráveis, em amarelo as favoráveis, em bege aspouco favoráveis e em branco as regiões desfavoráveis. Esta última região é desfavorável para todos osaminoácidos, com exceção a glicina.

37

Figura 1.13: Esquema geral das etapas de construção de um modelo protéico tridimensional por técnicade modelagem comparativa.

Fonte: Esquema baseado em Marti-Renom et al (2002).

38

1.5 Simulação por Dinâmica Molecular

A dinâmica molecular (DM) estuda os movimentos em um sistema de partícu-

las por simulação, através da evolução temporal das configurações dos constituintes do

sistema. A partir das seqüências de posições geradas, é possível determinar as pro-

priedades do sistema (Borin, 1999). Este método pode ser empregado tanto em siste-

mas de elétrons, átomos ou moléculas, como em sistemas biológicos mais complexos

(e.g. transporte de membrana), baseando-se no conhecimento do potencial de intera-

ção entre as partículas e nas equações de movimento que governam a dinâmica dessas

partículas (Pascutti, 2004), no intuito de se observar as propriedades termodinâmicas,

estruturais, espectroscópicas, de transporte, estruturas de solvatação e agregações inter-

moleculares (Borin, 1999).

Simulações de dinâmica molecular são amplamente usadas para se obter informa-

ções sobre as propriedades de proteínas em equilíbrio numa solução. Cada vez mais,

simulações são usadas no estudo de fenômenos tempo- e ambiente-dependentes como,

por exemplo, otimização estrutural de modelos 3D gerados por métodos ab initio ou por

homologia, no processo de enovelamento e desenovelamento de proteínas, as diferen-

tes conformações estruturais de uma proteína ao longo do tempo, a interação entre uma

proteína e um ligante, dentre outros (Walser et al, 2000).

Nos métodos de DM, partículas interagentes, inicialmente dispostas em uma de-

terminada configuração, movimentam-se sob a influência de potenciais intermolecula-

res (Borin, 1999). A representação física do sistema é dada por uma função poten-

cial empírica, usualmente chamada de Campo de Força Molecular Clássico, que de-

pende das coordenadas cartesianas dos átomos do sistema. Os campos de força mais

comumente empregados em simulações de DM são o GROMOS (van Gunsteren e Be-

rendsen, 1987), AMBER (Weiner et al, 1984; Cornell et al, 1995), CHARMM (Bro-

oks et al, 1983) e MMFF94 (Halgren, 1996a,b,c,d,e). A função energia potencial

V ({ri}) = V (r1, r2, . . . , rN) de um sistema molecular constituído de N átomos com

vetores posição ri, pode assumir a seguinte forma:

39

V ({ri}) =12

Nb∑n=1

Kbn(bn − b0n)2︸︷︷︸I

+12

Nθ∑n=1

Kθn(θn − θ0n)2︸︷︷︸II

+12

Nξ∑n=1

Kξn(ξn − ξ0n)2︸︷︷︸III

+

+Nφ∑n=1

Kφn[1 + cos(nnφn − δn)]︸︷︷︸IV

+Nátomos∑

i≤k

−(Aij

rij

)6

+(Bij

rij

)12

︸︷︷︸V

+Nátomos∑

i≤k

qiqj4πε0εrrij︸︷︷︸V I

(1.2)

Analisando em detalhes a Eq. (1.2), seus termos são descritos da seguinte forma:

O termo I representa o potencial harmônico linear que descreve as Nb ligações

químicas e seus movimentos vibracionais, sendo Kb a constante de Hooke, b o compri-

mento instantâneo de ligação e b0 o comprimento de equilíbrio.

O segundo termo, denotado por II , representa o potencial harmônico angular que

descreve osNθ ângulos formados por três átomos ligados consecutivamente na molécula

sendo Kθ a constante de Hooke, θ o ângulo entre as ligações e θ0 o ângulo de equilíbrio.

O termo denotado por III consiste no potencial diedral impróprio que descreve os

Nξ ângulos entre planos formados por quatro átomos, sendo Kξ a constante de Hooke,

ξ o ângulo entre os planos e ξ0 o ângulo de equilíbrio.

O quarto termo (IV ) se refere ao potencial diedral próprio que descreve as Nφ

rotações em torno das ligações químicas formadas, sendo Kφ uma constante que define

a altura da barreira de rotação, n é o número de mínimos da função, φ é a variação

angular e δ o ângulo de diferença de fase (0o ou 180o).

O termo V considera o tipo e a distância entre os átomos e é descrito pelo po-

tencial de Lennard-Jones, caracterizado por um termo atrativo(

Aij

rij

)6

(interação de van

der Waals) e um repulsivo(

Bij

rij

)12

, onde Aij e Bij dependem dos tipos de átomos i e j

interagentes, e sendo rij a distância entre os átomos i e j.

Finalmente, V I considera as cargas dos átomos e é descrito pelo potencial de

Coulomb, sendo qi a carga do átomo i, qj a carga do átomo j, ε0 a permissividade

elétrica do vácuo, εr a constante dielétrica do meio e rij a distância entre os átomos i e

j.

O protocolo associado a uma simulação de DM pode ser resumido, basicamente,

40

nas seguintes etapas (van der Spoel et al, 2004):

(1) Condições Iniciais do Sistema: as coordenadas espaciais iniciais obtidas de

uma estrutura experimentalmente resolvida ou de um modelo 3D gerado, bem

como as velocidades iniciais de cada átomo que constituem a molécula, servem

como parâmetros de entrada para o início de qualquer simulação de DM. Se as

velocidades iniciais de cada átomo não forem conhecidas, valores podem ser

atribuidos segundo a distribuição de Maxwell-Boltzmann:

p(vi,n) =

√mi

2πkBTexp

(−miv

2i,n

2kBT

), i = 1, . . . , N ; n = 1, 2, 3

(1.3)

onde vi,n é a n-ésima componente do vetor velocidade do átomo i,mi é a massa

de cada átomo i, kB é a constante de Boltzmann, T é a temperatura absoluta do

sistema dada em Kelvin e N é o número de átomos do sistema.

A partir do vetor posição ri de cada átomo i é possível calcular a função energia

potencial V ({ri}), apresentada na Eq. (1.2), que descreve a interação entre os

N átomos do sistema: (i) entre pares de átomos i e j não ligados (potencial

de Lennard-Jones e potencial de Coulomb); (ii) entre átomos ligados (poten-

cial harmônico linear e angular e potencial diedral próprio e impróprio); (iii)

possíveis forças externas e restrições ao sistema.

(2) Cálculo das Forças que Regem o Sistema: Inicialmente calcula-se o vetor força

Fi atuante em cada átomo i do sistema, de acordo com o negativo do gradiente

da função energia potencial V ({ri}):

Fi = −∇V ({ri}), i = 1, . . . , N (1.4)

Em seguida, a energia total do sistema é calculada com base na função energia

potencial V ({ri}) e energia cinética Ec, definida por

41

Ec =1

2

N∑i

miv2i , (1.5)

onde mi e v2i = (v2

x + v2y + v2

z) são, respectivamente, a massa e a velocidade

escalar de cada átomo i do sistema.

(3) Otimização do Sistema: ao calcular-se as forças iniciais atuantes em um sis-

tema contendo um modelo 3D ou mesmo uma estrutura obtida experimental-

mente, os valores obtidos podem ser demasiadamente altos, levando a grandes

acelerações durante os passos de integração da DM. Isto causaria ruídos cada

vez maiores e, assim, invalidaria a simulação. Desta forma, a etapa de mini-

mização do sistema é fundamental para que se possa corrigir a configuração

inicial do sistema e, com isso, eliminar as tensões locais ajustando distâncias

de ligações, espaços não preenchidos na solvatação do sistema, sobreposição

de átomos, dentre outros (Gomes, 2006).

Existem diferentes algoritmos empregados em simulações de DM para a mi-

nimização do sistema (e.g. Máximo Declive ou Steepest Descent, Gradien-

tes Conjugados e Newton-Raphson), sendo o algoritmo de Steepest Descent,

o mais comumente usado. Apesar deste não ser um dos métodos mais efici-

entes, é bastante robusto e de fácil implementação. É um método de primeira

derivada e converge vagarosamente nas proximidades do mínimo, porém, é po-

deroso para configurações distantes de um mínimo em energia (Pascutti, 2004).

Dado um deslocamento inicial h0 (e.g. ≈ 0.1A), o incremento nas coordenadas

de um átomo i, é dado na direção e sentido da força resultante sobre este átomo:

ri,n+1 = ri,n +Fi,n

‖Fn‖∞hn, i = 1, . . . , N (1.6)

onde Fi,n é o vetor força resultante no átomo i, na iteração n, e é obtida de

acordo com a Eq. (1.4), o escalar ‖Fn‖∞ = max(|F1,n|, . . . , |FN,n|), N é o

42

número de átomos do sistema e hn é um parâmetro escalar que é ajustado para

acelerar a minimização.

Os valores de hn são ajustados de acordo com as forças e energias recomputa-

das para as novas posições ri,n+1:

hn+1 =

1, 2hn, se Vn+1 < Vn

0, 2hn, caso contrário(1.7)

Neste método, a condição de parada geralmente é determinada pelo número de

passos mas, pode-se usar como critério de convergência um valor próximo de

zero para a norma do gradiente do potencial.

(4) Atualização da configuração: determinadas as condições iniciais, o próximo

passo consiste em se determinar as posições e velocidades a cada passo da

dinâmica. Se a energia total do sistema for constante e o passo de tempo for su-

ficientemente pequeno para se considerar que as posições variem suavemente,

dados os vetores posição ri e velocidade vi é possível se obter as trajetórias dos

átomos que constituem o sistema através da resolução numérica das equações

de movimento de Newton e na integração das mesmas passo-a-passo no tempo:

mid2ri

dt2= Fi, i = 1, . . . , N (1.8)

onde i representa os N átomos do sistema, mi é a massa de cada átomo i, ri é

o vetor posição de cada átomo i, t é o tempo e Fi o vetor força atuante em cada

átomo i.

Para a etapa de integração, diferentes algoritmos podem ser aplicados (e.g.

Verlet, Meio-Passo ou Leap-Frog, Velocity-Verlet e Beeman). O algoritmo de

Leap-Frog é uma modificação do algoritmo de Verlet e, atualmente, é o mais

usado por ser menos suscetível a erros numéricos e ser capaz de tornar o sis-

tema acoplável a um banho térmico através de correções nas velocidades (Bo-

rin, 1999). No método de Verlet (Verlett, 1967) os ri vetores posições dos i

43

átomos em um passo de tempo ∆t são dadas por uma expansão de Taylor em

torno de ri(t):

ri(t+ ∆t) = ri(t) + ri(t)∆t+1

2!ri(t)∆t

2 +1

3!

...ri(t)∆t

3 + . . . (1.9)

ri(t−∆t) = ri(t)− ri(t)∆t+1

2!ri(t)∆t

2 − 1

3!

...ri(t)∆t

3 + . . . (1.10)

Somando-se as Eqs. (1.9) e (1.10), e considerando a aceleração ri(t) obtida da

Eq. (1.8), obtém-se o algoritmo de Verlet para a propagação das posições:

ri(t+ ∆t) u 2ri(t)− ri(t−∆t) +Fi(t)

mi

∆t2 (1.11)

onde as novas posições ri(t+∆t) possuem um erro de ordem (∆t)4, apesar do

erro global do algoritmo ser da ordem de (∆t)2 (Schlick, 2000).

Uma das desvantagens do algoritmo de Verlet é que as novas posições são obti-

das pela adição de um termo pequeno (∆t2) à diferença entre dois termos muito

maiores, (2ri(t)) e (ri(t−∆t)), levando a perda de precisão do algoritmo (Le-

ach, 2001). Outra desvantagem dá-se pelo fato de as velocidades não aparecem

na Eq. (1.11), não desempenhando papel algum na determinação das trajetórias

neste algoritmo. No entanto, o cálculo das velocidades se faz necessário para a

determinação da energia cinética e, somada à energia potencial, para o cálculo

da energia total do sistema. Uma estimativa da velocidade das partículas pode

ser obtida se subtrairmos a Eq. (1.10) da Eq. (1.9) obtendo:

vi(t) = ri(t) u1

2∆t[ri(t+ ∆t)− ri(t−∆t)] (1.12)

onde as novas velocidades ri(t) possuem um erro de ordem (∆t)2.

44

No algoritmo de Leap-Frog (Hockney, 1970) a velocidade é incluída explicita-

mente na determinação das novas posições e possui uma maior precisão numé-

rica sendo as velocidades calculadas em(t± ∆t

2

)e as posições em (t ± ∆t).

As velocidades nos meio-passos podem ser definidas a partir da Eq. (1.12):

ri

(t+

∆t

2

)u

1

∆t[ri(t+ ∆t)− ri(t)] (1.13)

ri

(t− ∆t

2

)u

1

∆t[ri(t)− ri(t−∆t)] (1.14)

sendo ri(t+ ∆t) obtido por

ri(t+ ∆t) = ri(t) + vi

(t+

∆t

2

)∆t (1.15)

Subtraindo a Eq. (1.14) da Eq. (1.13) obtém-se a expressão geral para a deter-

minação da velocidade de cada átomo em t+ ∆t2

:

ri

(t+

∆t

2

)u ri

(t− ∆t

2

)+ ri(t)∆t (1.16)

considerando a aceleração ri(t) obtida da Eq. (1.8), obtém-se o algoritmo de

Leap-Frog para a propagação das velocidades:

vi

(t+

∆t

2

)= ri

(t+

∆t

2

)u ri

(t− ∆t

2

)+Fi(t)

mi

∆t (1.17)

(5) Dinâmica de Equilibração do Sistema: a dinâmica é continuada por um tempo

suficientemente grande (dependendo do tamanho do sistema em questão) para

se alcançar o equilíbrio do sistema, baseando-se nas médias temporais de, por

exemplo, temperatura, energia e pressão (van der Spoel et al, 2004). Usual-

mente, esta dinâmica é feita em duas etapas, sendo que na primeira aplica-se

45

restrições às posições dos átomos da macromolécula em estudo, deixando-se

os átomos do solvente livres para a acomodação dos mesmos em camadas de

solvatação em torno da molécula em questão. Desta forma, a energia potencial

considerando-se restrições nas posições atômicas é dada pela adição do termo

Vpr(ri) =1

2kpr‖ri −Ri‖2 i = 1 . . . N (1.18)

onde kpr é a constante de penalização associada as posições espaciais, ri é o

vetor posição calculado para o átomo i e Ri é o vetor posição original do átomo

i.

Na segunda etapa, nenhuma restrição é aplicada e todo o sistema pode acomodar-

se às condições físicas aplicadas ao sistema, como temperatura, volume e pres-

são.

(6) Análise dos Resultados: após a etapa de equilibração, são feitas simulações de

DM para a geração de arquivos de saída contendo as trajetórias do sistema em

função do tempo, informando as posições, velocidades e acelerações de cada

átomo. Dependendo do objetivo da simulação de DM, a partir destes arquivos

de saída pode-se analisar o comportamento da temperatura, energias e pressão

total do sistema bem como informações mais específicas como deformações

ocorridas em uma proteína, o monitoramento do número de ligações de hidro-

gênio estabelecidas, o grau de exposição dos resíduos da molécula ao solvente,

dentre outros.

Em geral os parâmetros são ajustados objetivando reproduzir algumas das propri-

edades que, geralmente, são a entalpia de vaporização e a densidade. Portanto, durante a

simulação, alguns parâmetros macroscópicos podem ser conjuntamente mantidos cons-

tantes como o número de partículas do sistema (N), a pressão (P), o volume (V) e a

temperatura (T). Cada um desses conjuntos de parâmetros caracterizam ensembles 4 di-4 Ensemble é um grande conjunto de réplicas de um sistema de interesse, em que cada réplica ocupa

uma região do espaço de fases. Assim, equações de movimento diferentes geram sucessões de estados deacordo com ensembles diferentes. (Borin, 1999).

46

ferentes, que definem diferentes equações de estado para o sistema, de modo a permitir

que diferentes funções termodinâmicas possam ser mais convenientemente calculadas

em um ou outro ensemble. Como exemplos de ensembles pode-se citar o canônico, em

que os estados de equilíbrio são caracterizados por serem mínimos na função energia

livre de Helmholtz (NVT constantes), e o ensemble isobárico-isotérmico no qual os es-

tados de equilíbrio são caracterizados por serem mínimos na função energia livre de

Gibbs (NPT constantes).

No método de simulação por dinâmica molecular, os átomos estão imersos em um

sistema finito sujeito a problemas em relação aos efeitos de fronteira, cuja minimização

pode ser resolvida através da aplicação de condições periódicas de contorno. Neste

método, os átomos do sistema são confinados em uma caixa tridimensional (célula de

simulação) circundada por réplicas transladadas, produzindo um sistema que tenda ao

limite termodinâmico (sistema pseudo-infinito), onde as partículas se movimentam de

maneira idêntica à movimentação na célula principal (Fig. 1.14).

Esse procedimento deve ser acompanhado por uma descrição de como as intera-

ções entre as imagens das partículas pertencentes a diferentes réplicas periódicas devem

ser manipuladas, desta forma, a natureza pseudo-infinita do sistema implica na necessi-

dade de algumas aproximações para o tratamento das interações intermoleculares. Para

as forças de curto alcance pode ser aplicada a aproximação da imagem mínima conjun-

tamente com as convenções do raio de corte esférico (Rc), dado por

Rc ≤1

2min(a, b, c) (1.19)

onde a, b e c são os comprimentos das arestas da caixa nas direções x, y e z.

Na aproximação da imagem mínima supõe-se que somente uma imagem (a mais

próxima) de cada partícula seja considerada nos termos de interações de curto alcance

para átomos não ligados. Isto implica que o raio de corte Rc, usado para truncar as inte-

rações não ligadas, esteja restrito a um valor menor ou igual que a metade da dimensão

da célula de simulação, evitando-se que um átomo interaja com sua própria imagem.

Para o cálculo das interações de longo alcance, o uso do raio de corte visando a

47

Figura 1.14: Representação esquemática bidimensional de condições periódicas de contorno para asimulação de um sistema pseudo-infinito.

A célula de simulação central é circundada por réplicas transladadas com comportamento idêntico. Nacélula central, as forças eletrostáticas são computadas através de aproximação da imagem mínima com ouso de raio de corte (Rc) para o truncamento de interações não ligadas.

diminuição do custo computacional, pode gerar ruídos ao sistema, através da introdução

de uma descontinuidade nas funções energia potencial e força, próximas ao valor Rc es-

colhido. Para o tratamento desta descontinuidade, são aplicadas funções como a switch

e shift. Se Rc for pequeno (< 10, 0 Å), a contribuição de um grande número de átomos

pode ser desconsiderada o que afetaria significativamente os cálculos da simulação de

dinâmica molecular (Leach, 2001). No potencial de Lennard-Jones o uso de raio de

corte provoca efeitos pequenos na energia embora provoque grandes efeitos na pressão.

Já no potencial de Coulomb, estes efeitos são mais significativos necessitando o uso de

Rc maiores e de métodos específicos para o tratamento das interações eletrostáticas (van

der Spoel et al, 1998).

Quando as forças de interação entre as partículas decaem vagarosamente com a

distância, pode-se substituir a força de interação simples entre duas partículas na célula

de simulação por uma força efetiva, obtida somando-se as interações entre todas as

imagens periódicas dessas partículas através do método da soma infinita (e.g. Soma de

Ewald, Particle-Mesh Ewald (PME) e Particle-Particle Particle-Mesh (PPPM)).

48

No método de Campo de Reação, o potencial de Coulomb, dado pelo termo V I da

Eq. (1.2), pode ser modificado para um sistema homogêneo, assumindo uma constante

dielétrica (εrf ) que simula o efeito da blindagem eletrostática causada pelo solvente,

além do uso de um raio de corte Rc que, dependente do valor, faz com que o potencial

tenda a zero (van der Spoel et al, 1998), como mostrado na Fig. 1.15. Desta forma, o

potencial de Coulomb com Campo de Reação entre dois átomos i e j é descrito por

Vcrf =qiqj

4πε0rij

[1 +

εrf − 1

2εrf + 1

r3ij

R3c

]− qiqj

4πε0Rc

3εrf

2εrf + 1(1.20)

onde qi é a carga do átomo i, qj a carga do átomo j, ε0 a permissividade elétrica do vácuo,

εrf a constante dielétrica para o Campo de Reação, rij a distância entre os átomos i e j

e Rc o raio de corte.

Figura 1.15: Representação do potencial de Coulomb com e sem a aplicação do Campo de Reação.

Para esta representação foram considerados átomos de mesma carga, constante dielétrica εrf igual a 54 eraio de corte Rc de 16, 0 Å.

49

Capítulo 2

Objetivos

2.1 Objetivo Geral

Aplicar técnicas de bioinformática, modelagem computacional e abordagens enzi-

máticas/evolutivas às proteínas preditas a partir da seqüência genômica de Trypanosoma

cruzi (cepa CL Brener),visando a construção de modelos protéicos estruturais para iden-

tificação de possíveis alvos moleculares para o tratamento da doença de Chagas, bem

como o estudo do comportamento dinâmico de alguns destes alvos, no caso, as cisteíno

proteases cruzipaína 1 e cruzipaína 2.

2.2 Objetivos Específicos

• Construir e qualificar modelos tridimensionais de proteínas de T. cruzi a partir

de técnicas de modelagem comparativa.

• Identificar quais destes modelos possuem perfil enzimático e propor uma pri-

meira lista de possíveis alvos moleculares para o tratamento da doença de Cha-

gas, dentro do contexto de desenho racional de fármacos baseado em estrutura.

• Investigar dentre as enzimas com estruturas tridimensionais geradas, quais pos-

suem similaridades (ortologias) com enzimas humanas.

• Analisar por técnicas de simulação de dinâmica molecular em solvente explí-

cito e nas temperaturas de 25◦C e 37◦C, as isoformas 1 e 2 da cruzipaína (alvos

moleculares de T. cruzi), tendo como controle a enzima papaína extraída da

Carica papaia.

50

Capítulo 3

Metodologia

3.1 Alinhamento de Seqüências

O alinhamento local de seqüências é uma das ferramentas importantes para pro-

cessos de busca em bancos de dados de nucleotídeos e aminoácidos. Ao comparar-se

seqüências, visa-se estabelecer parâmetros de semelhança entre elas respeitando-se cri-

térios específicos (Lesk, 2002). Portanto, no alinhamento de seqüências deseja-se iden-

tificar a correspondência resíduo a resíduo existente entre duas seqüências, tendo por

objetivos medir a similaridade entre elas, observar formas de conservação e variabili-

dade, e inferir relações evolutivas (Lesk, 2002).

Nas medidas de similaridade, tenta-se medir o grau de semelhança entre seqüên-

cias usando um sistema de pontuação, no qual quanto maior for a pontuação obtida

maior será a similaridade entre estas seqüências. As relações de como pontuar e como

penalizar podem variar de acordo com a aplicação do problema e do tipo de alinhamento

obtido, como apresentado na Tab. 3.1.

Uma das ferramentas comumente usada para a rápida comparação entre sequên-

cias é o BLAST (Basic Local Alignment Search Tool) (Altschul et al, 1990), um

grupo de programas elaborado para executar buscas por similaridade entre uma ou mais

seqüências alvos e seqüências depositadas nos diversos bancos de dados disponíveis

(nucleotídicos e protéicos). O BLAST tem por objetivo otimizar a medida de similari-

dade local e aumentar a velocidade de busca em bancos de dados de grandes proporções.

51

Tabela 3.1: Classificação dos tipos de alinhamentos entre seqüências.

Não informativo − − − − G C TA C T A C − −

Informativo sem Gaps† A C T G CA C C G C

Informativo com Gaps† A C T G − CA C − G T C

†Gaps são deslocamentos feitos em uma ou nas duas seqüências, de forma a se obter um melhor alinha-mento entre elas.

O BLAST usa um algoritmo desenvolvido pelo NCBI (National Center for Bio-

technology Information) que realiza alinhamentos locais usando matrizes de pontuação

próprias (Altschul et al, 1990). O padrão do BLAST é a matriz BLOSUM62 (Fig. 3.1),

uma matriz simétrica 20×20 apresentando todas as possíveis identidades e substituições

existentes entre os 20 aminoácidos mais comumente encontrados na natureza (Pertsem-

lidis e Fondon III, 2002; Eddy, 2004). A pontuação desta matriz é baseada nas freqüên-

cias observadas para a ocorrência de cada resíduo em alinhamentos, múltiplos e sem

gaps5 , entre seqüências de famílias de proteínas com até 62% de identidade, sendo que

(i) as identidades definem pontuações positivas de maiores índices, (ii) as substituições

freqüentemente observadas são dadas por pontuações positivas de menores índices e (iii)

as substituições menos freqüentes são pontuadas negativamente.

Uma busca em um banco de dados pode gerar de poucos a milhares de ali-

nhamentos, desta forma, é necessário conhecer quais alinhamentos representam uma

similaridade significativa. No BLAST, dadas duas seqüências A = {a1, . . . , am} e

B = {b1, . . . , bn} contendo m e n números de resíduos, a análise de significância do

alinhamento entre elas é feita por um conjunto de parâmetros exemplificados na Fig. 3.2

e descritos a seguir (Karlin e Altschul, 1990; Altschul et al, 1997; Korf et al, 2003):

5 Gaps são deslocamentos feitos em uma ou nas duas seqüências, de forma a se obter um melhoralinhamento entre elas.

52

Figura 3.1: Esquema apresentando parte da matriz BLOSUM62.

É uma matriz simétrica 20 × 20 contendo todas as possíveis identidades e substituições existentes entreos 20 aminoácidos mais comumente encontrados na natureza, observadas em alinhamentos múltiplos deseqüências de famílias protéicas com até 62% de identidade. A diagonal principal da matriz consiste nasidentidades residuais e possuem pontuações positivas de maiores índices, as substituições freqüentementeobservadas são dadas por pontuações positivas de menores índices e as substituições menos freqüentessão pontuadas negativamente.Fonte: http://folding.stanford.edu/education/s.html.

(1) Raw Score (S): é o somatório de cada pontuação sij obtida a partir do alinha-

mento entre os resíduos ai e bj . Este não é considerado o melhor índice de

comparação, uma vez que as matrizes de pontuação de cada alinhamento po-

dem apresentar grandezas diferentes. O raw score é calculado pela seguinte

equação:

S =∑ij

sij = logqijpipj

(3.1)

onde qij é a freqüência do pareamento entre o resíduo ai da seqüência de busca

A e o resíduo bj da seqüência B depositada no banco de dados, pi = p(ai) é a

probabilidade do resíduo ai e pj = p(bj) a probabilidade do resíduo bj .

(2) Bit Score (S ′): é a normalização do raw score S. Este índice pode ser compará-

vel uma vez que as pontuações são convertidas para uma mesma base, através

da equação

53

S ′ =λS − lnK

ln2(3.2)

onde λ e K são parâmetros calculados de acordo com o algoritmo proposto

por Karlin e Altschul (1990), considerando as probabilidades dos valores de

pontuação dependentes de sij .

(3) Esperança (E-value): é a chance de que uma pontuação tão boa quanto a do

alinhamento entre a seqüência alvo e uma seqüência do banco de dados, seja

encontrada ao acaso no alinhamento entre seqüências aleatórias. O E-value (E)

é dado por

E = mn2−S′(3.3)

onde m é o número de resíduos da seqüência de busca A e n o número de re-

síduos da seqüência B depositada no banco de dados. No caso do alinhamento

de uma seqüência de busca contra todas as seqüências depositadas no banco de

dados, n correponde ao número total de resíduos no banco de dados.

No entanto, mesmo considerando-se os alinhamentos de maior significância, os

resultados provenientes de buscas em bancos de dados grandes são consideravelmente

extensos, tornando-se impraticável a sua rápida inspeção manual. Como solução a este

inconveniente, foi desenvolvido pelo Laboratório de Genômica Funcional e Bioinfor-

mática (FIOCRUZ), o BioParser (Catanho et al, 2006), um programa em linguagem

de programação Perl, que usa o conjunto de ferramentas BioPerl (Stajich et al, 2002)

para analisar os resultados do BLAST, filtrá-los de acordo com atributos desejados e

armazená-los em arquivos de saída de fácil manuseio (Fig. 3.3).

Para a construção de uma primeira lista de possíveis alvos moleculares para o

tratamento da doença de Chagas, foram aplicadas ferramentas computacionais às pro-

teínas preditas a partir da seqüência genômica de Trypanosoma cruzi (cepa CL Brener),

54

Figura 3.2: Parte de um arquivo de saída apresentando o resultado de um BLASTP.---------------------------------------------------------------------------------------

BLASTP 2.2.10 [Oct-19-2004]

Query= 1ME4M ||cruzipain II by comparative modelling with 1ME4(214 letters)

Database: tcxtc_filter_i95_nonredundant.fasta20,679 sequences; 9,201,748 total letters

>8091.m00003 ||Tc00.1047053509401.30|cysteineproteinase|t_cruzi|chr_0|1047053509401|809Length = 500

Score = 366 bits (939), Expect = e-102Identities = 176/214 (82%), Positives = 188/214 (87%)

Query: 1 APAAKDWREEGAVTAVKNQGICGSCWAFAAIGNIEGQWFLAGNPLTRLSEQMLVSCDNTN 60APAAKDWREEGAVTAVKNQG+CGSCWAFAAIGNIE QWFLAGNPLTRLSEQMLVSCDNTN

Sbjct: 156 APAAKDWREEGAVTAVKNQGMCGSCWAFAAIGNIECQWFLAGNPLTRLSEQMLVSCDNTN 215

Query: 61 SGCGGGLSSKAFEWIVQENNGAVYTEDSYPYHSCIGIKLPCKDSDRTVGATITGHVELPQ 120SGCGGG AF+WIV NNG VYTE+SYPYHSCIGI PC S TVGATITG+V +P+

Sbjct: 216 SGCGGGWPLVAFKWIVDRNNGTVYTEESYPYHSCIGISPPCTTSGHTVGATITGYVTIPR 275

Query: 121 DEAQIAASGAVKGPLSVAVDASSWPPYTGGVLTNCVSKRLSHAVLLVGYNDSAAVPYWII 180DE IAA AV GP++V VDASSW YTGGV+T+CVSK+LSHAVLLVGYNDSA VP+WII

Sbjct: 276 DENGIAAWLAVNGPVAVVVDASSWIFYTGGVMTSCVSKQLSHAVLLVGYNDSATVPHWII 335

Query: 181 KNSWTTHWGEGGYIRIAKGSNQCLVKEEVSSAVV 214KNSWTTHWGE GYIRIAKGSNQCLVKE VSSAVV

Sbjct: 336 KNSWTTHWGEDGYIRIAKGSNQCLVKEGVSSAVV 369---------------------------------------------------------------------------------------

BLASTP é um programa que usa o algoritmo BLAST para comparar seqüências protéicas.O BLAST (Basic Local Alignment Search Tool) (Altschul et al, 1990), é um grupo de programas elabo-rado para executar buscas por similaridade entre uma ou mais seqüências alvos e seqüências depositadasem bancos de dados nucleotídicos e protéicos. A análise de significância é feita pelos seguintes parâme-tros apresentados nesta figura: Score que é o valor do Raw Score de acordo com a Eq. (3.1), bits queé o Bit Score dado pela Eq. (3.2) e Expect que é o E-value dado pela Eq. (3.3). O termo Identitiesequivale ao número de resíduos idênticos ao longo do alinhamento e Positives ao número de resíduosidênticos mais o número de resíduos similares ao longo do alinhamento.

visando determinar quais seqüências podem ter suas estruturas tridimensionais modela-

das por técnicas de modelagem comparativa, e destas quais apresentam características

enzimáticas.

Por tratar-se de um organismo diplóide, primeiramente, verificou-se possíveis re-

dundâncias de anotação através do programa BLASTP (usa o algoritmo BLAST para

comparar seqüências protéicas) (versão 2.2.10), alinhando-se todas contra todas as CDS

(Seqüência Codificante) de T. cruzi, obtidas do banco de dados público TcruziDB (http://

TcruziDB.org - versão TCA1.pep) (Luchtan et al, 2004). Foi usada a matriz de pon-

tuação padrão (BLOSUM62) e como corte de significância de alinhamento um E-value

55

Figura 3.3: Página de navegação on-line do BioParser.

Interface web do BioParser apresentando suas opções de filtro, dados de saída e campo para inserção debusca em formato SQL (Structured Query Language).Imagem retirada do endereço web http://www.dbbm.fiocruz.br/BioParser.html.

≤ 10e−5. O resultado deste alinhamento foi submetido ao BioParser (versão 1.2.3) que

filtrou os dados segundo os valores de identidade entre as seqüências (≤ 95%).

3.2 Construção de Modelos Protéicos Tridimensionais via MHOLline

Para a construção dos modelos estruturais de proteínas de T. cruzi, usou-se o

MHOLline (Rössle, 2004), um workflow6 científico desenvolvido em linguagem de

programação Perl, para automatizar os processos de predição de estruturas protéicas e

anotação funcional. Este programa é capaz de extrair informações sobre a estrutura de

uma proteína a partir da análise de sua seqüência, mesmo em projetos de anotações de

genomas em grande escala (Cavalcanti et al, 2005).

O MHOLline é composto por um conjunto de programas científicos de domínio

6 Workflow: de acordo com a WFMC (The Workflow Management Coalition), trata-se da automati-zação de parte ou de todo um processo computacional, no qual documentos, informações ou tarefas sãopassados de um participante do processo a outro, por meio de uma ação interligante que segue regraspré-estipuladas.

56

público, usados nas diferentes etapas de construção de modelos de estruturas protéi-

cas por modelagem comparativa, bem como em estudos de biologia computacional.

Parte destes programas estão organizados seqüencialmente de forma que a saída de um

programa serve como dado de entrada para o próximo, e assim sucessivamente, até a

obtenção do modelo final com sua análise de qualidade. É importante lembrar que o

processo pode ser interrompido em cada uma das etapas em função do tipo de análise

que se deseja realizar. A outra parte dos programas funciona independentemente de

forma a adicionar informações ao conjunto de dados em estudo, como a predição de

regiões transmembranares e de estruturas secundárias (Rössle, 2004).

Como descrito na subseção 1.4, o método de modelagem comparativa consiste

basicamente de quatro etapas: (i) identificação de referências, (ii) alinhamento entre

seqüências, (iii) construção do modelo e (iv) validação do modelo. No MHOLline estas

etapas estão integradas de forma automatizada, sendo executadas da seguinte maneira:

• No processo de identificação de estruturas de referência para a construção de

modelos, o MHOLline usa o algoritmo BLAST (versão 2.2.10) que efetua o

alinhamento local entre as seqüências alvos e seqüências protéicas resolvi-

das experimentalmente e depositadas no banco de dados PDB (Protein Data

Bank) (Berman et al, 2000; Westbrook et al, 2002). Como entrada para o

programa, usa-se um arquivo no formato FASTA (Fig. 3.4) que é composto por

uma linha contendo o identificador de uma nova seqüência, representado pelo

sinal “>”, seguido do nome da seqüência, e por demais linhas apresentando a

seqüência propriamente dita.

Figura 3.4: Exemplo de uma seqüência protéica no formato FASTA.

---------------------------------------------------------------------->1ME4M ||cruzipain II by comparative modelling with 1ME4APAAKDWREEGAVTAVKNQGICGSCWAFAAIGNIEGQWFLAGNPLTRLSEQMLVSCDNTNSGCGGGLSSKAFEWIVQENNGAVYTEDSYPYHSCIGIKLPCKDSDRTVGATITGHVELPQDEAQIAASGAVKGPLSVAVDASSWPPYTGGVLTNCVSKRLSHAVLLVGYNDSAAVPYWIIKNSWTTHWGEGGYIRIAKGSNQCLVKEEVSSAVV----------------------------------------------------------------------

A primeira linha é caracterizada como linha de identificação de seqüência sendo composta por um iden-tificador (o sinal “>”) e o nome da seqüência. As demais linhas representam a seqüência em questão.

57

• A construção dos alinhamentos globais e dos modelos 3D são feitos de forma

automatizada via programa Modeller (versão 8.0) (Sánchez e Sali, 1997). Este

programa constrói os modelos protéicos por modelagem comparativa, usando

o método de modelagem por satisfação de restrições espaciais. O Modeller

é executado em diferentes tarefas começando pelo alinhamento entre seqüên-

cias, geração de um modelo primário que terá sua geometria conformacional

otimizada segundo sua energia potencial, gerando, por fim, o modelo 3D final.

• A qualidade de cada modelo gerado é avaliada de acordo com o empacotamento

global da proteína, usando o programa Procheck (versão 3.4) (Laskowski et al,

1993). Ele gera gráficos de Ramachandran (Ramakrishnan, 2001) que possibi-

litam a análise dos ângulos φ e ψ de todos os resíduos, verificando quais deles

encontram-se fora das regiões energeticamente favoráveis. Além disto, é capaz

de identificar possíveis erros estereoquímicos locais, de acordo com a análise

do esqueleto peptídico e das cadeias laterais dos resíduos.

Conforme apresentado na Fig. 1.12, um gráfico de Ramachandran é divido em

regiões energeticamente muito favoráveis, favoráveis, pouco favoráveis e des-

favoráveis. Para que um modelo seja considerado de boa qualidade deve apre-

sentar mais de 85% de seus resíduos (excluindo as glicinas, prolinas e resíduos

de porções terminais) em regiões muito favoráveis, e a soma destes com os

das regiões favoráveis deve ser > 95%. A Fig. 3.5 exemplifica um resultado

fornecido pelo Procheck de um modelo considerado de boa qualidade estere-

oquímica.

3.2.1 Refinamento na Busca da Estrutura Molde

A busca da estrutura molde é considerada uma etapa chave para a construção de

um modelo protéico, desta forma, foi desenvolvido no MHOLline um programa cha-

mado BATS (BLAST Automatic Targeting for Structures) (Rössle, 2004). O BATS é

capaz de identificar seqüências às quais as técnicas de modelagem comparativa podem

ser aplicadas, escolhendo dentre estas qual é a melhor estrutura a ser usada como molde

58

Figura 3.5: Exemplo de análise do Procheck classificando um modelo 3D como de boa qualidade.

----------------------------------------------------------------------R A M A C H A N D R A N P L O T S T A T I S T I C S

Residues in most favoured regions [A,B,L] 155 86.6%Residues in additional allowed regions [a,b,l,p] 22 12.3%Residues in generously allowed regions [~a,~b,~l,~p] 0 0.0%Residues in disallowed regions [XX] 2 1.1%

--- ------Number of non-glycine and non-proline residues 179 100.0%

Number of end-residues (excl. Gly and Pro) 4

Number of glycine residues 23Number of proline residues 7

---Total number of residues 213

----------------------------------------------------------------------

A primeira linha descreve os resíduos em regiões muito favoráveis, a segunda linha os favoráveis, aterceira os pouco favoráveis e a quarta os resíduos em regiões desfavoráveis.

para a construção de um modelo. Esta escolha é feita através da análise de suas pon-

tuações, E-values e identidades e similaridades entre seqüências, obtidas dos resultados

fornecidos pelo BLAST. Além disto, o BATS constrói os arquivos de entrada para a

construção automática dos alinhamentos globais e dos modelos, via Modeller.

Como primeira etapa, o BATS filtra os resultados provenientes do BLAST e

deposita-os em um banco de dados próprio, o MHOLdb, conforme apresentado na

Tab. 3.2. As informações a serem armazenadas em cada coluna C são: (C1) o nome

da seqüência alvo, (C2) o número de aminoácidos desta seqüência, (C3) o código PDB

da seqüência similar, (C4) o número de resíduos da seqüência similar, (C5) número de

gaps produzidos pelo alinhamento, (C6) a porcentagem de identidade calculada pelo

BLAST, (C 7) a porcentagem de similaridade calculada pelo BLAST, (C8) o número de

aminoácidos alinhados e (C9) o E-value calculado pelo BLAST.

Após esta filtragem, o BATS inicia a etapa de pontuação das seqüências, que ser-

virá para determinar a melhor estrutura molde para a geração do modelo 3D. Esta pontu-

ação final é determinada pelos valores filtrados do BLAST para número de aminoácidos

alinhados, identidade e similaridade, e por mais dois índices calculados pelo BATS, o

LVI (Lenght Variation Index) e o GRSI (Gap Relative Strengh Index), exemplificados

na Tab. 3.3.

59

Tabela 3.2: Exemplo de resultado de BLAST filtrado pelo BATS e depositado no banco de dadosMHOLdb.

1a Etapa do BATSC1 C2 C3 C4 C5 C6 C7 C8 C9

ALVO NAaM PDB NAs

O GAPS %IDENT %SIMIL NAalnN E-VALUE

2194 1045 1S0J 648 43 33 49 617 1e-752194 1045 1MS5 648 43 33 48 617 4e-752194 1045 2AH2 648 43 33 48 617 5e-752194 1045 1N1Y 641 43 32 48 613 2e-742194 1045 1WCS 641 43 32 48 613 3e-742194 1045 1MZ6 638 43 32 47 613 2e-73

C# corresponde a uma coluna do banco de dados MHOLdbMNAa: Número de aminoácidos da seqüência alvoONAs: Número de aminoácidos da seqüência similar encontrada no PDBNNAaln: Número de aminoácidos alinhados entre as seqüências

O LVI, depositado na coluna 10 (C10) do MHOLdb, é usado para identificar

dentre as seqüências similares, a que possui um número de aminoácidos mais parecido

com o número de aminoácidos que constitui a seqüência alvo. O valor de LVI para o

alinhamento de duas seqüências a e s é dado por

LV I =NAa −NAs

NAa

(3.4)

sendo NAa o número de aminoácidos da seqüência alvo e NAs o número de aminoáci-

dos da seqüência similar encontrada no PDB.

O GRSI de cada alinhamento é depositado em (C11) no MHOLdb, e serve para

identificar dentre as seqüências similares, as que possuem o menor número de gaps

posicionados de forma pouco dispersa ao longo do alinhamento com a seqüência alvo.

O seu valor é dado por

GRSI =NGa +NGg

NAa

(3.5)

onde NGa é o número de gaps em que os vizinhos sejam aminoácidos e NGg o número

de gaps em que os vizinhos também sejam gaps.

Após os cálculos de LVI e GRSI para cada seqüência depositada no MHOLdb, o

BATS classifica cada seqüência similar, de acordo com a qualidade de seus valores. Os

60

Tabela 3.3: Exemplo de valores de LVI e GRSI calculados pelo BATS e depositados no banco de dadosMHOLdb.

2a Etapa do BATSC1 C3 C10 C11

ALVO PDB LVI† GRSI‡

2194 1S0J 0,3799 0,07752194 1MS5 0,3799 0,07752194 2AH2 0,3799 0,07752194 1N1Y 0,3866 0,06992194 1WCS 0,3866 0,06992194 1MZ6 0,3895 0,0699

C# corresponde a uma coluna do banco de dados MHOLdb†LVI: Lenght Variation Index dado pela Eq. (3.4)‡GRSI: Gap Relative Strengh Index dado pela Eq. (3.5)

valores de identidade, similaridade e número de aminoácidos alinhados são classifica-

dos de forma decrescente, sendo os maiores valores melhor classificados. Os valores de

LVI e GRSI são classificados em ordem crescente, recebendo melhor classificação os

menores valores calculados. Os 5 primeiros colocados de cada valor, assumindo empa-

tes, recebem uma pontuação decrescente P , de forma que o(s) primeiro(s) colocado(s)

receba(m) 5 pontos e o(s) quinto(s) colocado(s) apenas 1 ponto. Os demais colocados, a

partir da quinta posição, recebem 0 ponto. Cada um desses pontos será multiplicado por

um peso W de acordo com o tipo de valor associado. A pontuação final Sf é armaze-

nada na coluna 12 (C12) do MHOLdb, conforme apresentado na Tab. 3.4, e é calculada

pela seguinte expressão

Sf = WiPi +WsPs +WnPn +WlPl +WgPg (3.6)

ondeWi, Ws, Wn, Wl eWg são, respectivamente, os pesos de identidade, similaridade,

número de aminoácidos alinhados, LVI e GRSI, e Pi, Ps, Pn, Pl e Pg correspondem a

pontuação atribuída a identidade, similaridade, número de aminoácidos alinhados, LVI

e GRSI, respectivamente.

A terceira e última etapa, consiste em agrupar as seqüências similares em três

grupos e armazená-las em (C13) no MHOLdb, como apresentado na Tab. 3.5:

• G1: todas as seqüências alvos que não encontrarem seqüências similares no

61

Tabe

la3.

4:E

xem

plo

depo

ntua

ção

final

calc

ulad

ape

loB

AT

Spa

raos

tipos

deal

inha

men

tos

entr

ese

qüên

cias

.

2aE

tapa

doBA

TS

(con

tinua

ção)

C1

C3

C6

C7

C8

C10

C11

C12

ALV

OPD

B%

IDE

NT

Wi

Pi

%SI

MIL

Ws

Ps

NA

aln

NW

nP

nLV

I†W

lP

lG

RSI

‡W

gP

gS f

H

2194

1S0J

331,

05

491,

15

617

1,0

50,

3799

2,0

50,

0775

1,0

429

,521

941M

S533

1,0

548

1,1

461

71,

05

0,37

992,

05

0,07

751,

04

28,4

2194

2AH

233

1,0

548

1,1

461

71,

05

0,37

992,

05

0,07

751,

04

28,4

2194

1N1Y

321,

04

481,

14

613

1,0

40,

3866

2,0

40,

0699

1,0

525

,421

941W

CS

321,

04

481,

14

613

1,0

40,

3866

2,0

40,

0699

1,0

525

,421

941M

Z6

321,

04

471,

13

613

1,0

40,

3895

2,0

30,

0699

1,0

522

,3C

#co

rres

pond

ea

uma

colu

nado

banc

ode

dado

sM

HO

Ldb

NN

Aaln

:Núm

ero

deam

inoá

cido

sal

inha

dos

entr

eas

seqü

ênci

as† L

VI:

Leng

htVa

riat

ion

Inde

xda

dope

laE

q.(3

.4)

‡ GR

SI:G

apR

elat

ive

Stre

ngh

Inde

xda

dope

laE

q.(3

.5)

HS f

:Pon

tuaç

ãofin

alca

lcul

ada

pelo

BA

TS

deac

ordo

com

aE

q.(3

.6)

Weq

uiva

leao

peso

deca

dapo

ntua

çãoP

62

PDB. Estas seqüências não continuam no processamento do workflow.

• G2: seqüências alvos que apresentam similaridade > 25% e podem ter seus

modelos tridimensionais construídos via Modeller, continuando o processa-

mento seqüencial do workflow.

• G3: seqüências com baixa similaridade (< 25 − 30%) seguirão pelo proces-

samento idenpendente de forma a se obter informações sobre o seu tipo de

enovelamento e possíveis características funcionais.

Tabela 3.5: Exemplo de classificação do BATS para os tipos de alinhamentos entre seqüências.

3a Etapa do BATSC1 C3 C7 C13

ALVO PDB %SIMIL GRUPO2194 1S0J 49 G22194 1MS5 48 G22194 2AH2 48 G22194 1N1Y 48 G22194 1WCS 48 G22194 1MZ6 47 G2

C# corresponde a uma coluna do banco de dados MHOLdb

Ao final destas etapas, o BATS irá selecionar apenas um molde para a construção

do modelo de cada alvo, no caso o que tiver sido classificado como pertencente a G2

e que apresentar a melhor pontuação final Sf . Tomando-se como exemplo as Tabs. 3.4

e 3.5, a seqüência 1S0J seria selecionada como molde para a construção do modelo da

seqüência alvo 2194, uma vez que dentre as seqüência do grupo G2 é a que apresenta

maior pontuação final Sf = 29, 5. O melhor molde de cada seqüência e a seqüência a ser

modelada, são conjuntamente armazenados em um arquivo em formato FASTA, e então

submetido ao Modeller para a geração do modelo e subseqüentemente ao PROCHECK

para a avaliação da qualidade do modelo gerado.

Mesmo escolhendo-se apenas um molde para a construção do modelo de cada

alvo, o MHOLline fornece o alinhamento múltiplo entre as seqüências de todos os pos-

síveis moldes através do programa T-Coffee (versão 2.0) (Notredame et al, 2000). Em

63

alguns casos, o alinhamento múltiplo pode ser muito útil, principalmente, quando a agre-

gação das informações de vários moldes é usada para a construção de um modelo final

mais refinado, da mesma forma que é feita em análises funcionais de famílias protéicas.

No MHOLline, o processo de predição de estruturas secundárias é feito através

do programa PsiPred (versão 2.0) (McGuffin et al, 2000). enquanto a designação de

regiões transmembranares é feita através do programa HMMTOP (Hidden Markov Mo-

del for Topology Prediction) (versão 2.0) (Tusnady e Simon, 2001). Para as seqüências

em G3 que não possuam regiões transmembranares, é aplicado o programa THREA-

DER (versão 3.0) (Miller et al, 1996), que usa o banco de dados SCOP (versão 1.71),

para fazer a busca por tipos de enovelamentos que estas seqüências possam assumir,

objetivando inferir-lhes características funcionais.

Em resumo, para cada seqüência alvo submetida ao MHOLline, este consegue

gerar e agregar informações estruturais a partir de alinhamentos entre seqüências, ge-

rar um modelo tridimensional com suas coordenadas espaciais, fornecer o gráfico de

Ramachandran apontando a qualidade estereoquímica do modelo, gerar o alinhamento

múltiplo entre todos os candidatos a molde para um possível refinamento na estrutura do

modelo gerado, predizer sua estrutura secundária, além de detectar regiões transmem-

branares e inferir seus tipos de enovelamento. A Fig. 3.6 resume cada uma das etapas

do MHOLline de acordo com a participação de cada programa.

Desta forma, as seqüências não redundantes de T. cruzi foram submetidas ao

MHOLline, sendo alinhadas, via BLASTP, contra todas as seqüências protéicas depo-

sitadas no PDB até janeiro de 2006, usando como parâmetro de exclusão seqüências

com E-value ≤ 10e−5. Os alinhamentos foram analisados via BATS, calculando-se as

pontuações finais e determinando-se os grupos G1, G2 e G3 da seguinte forma:

• G1: seqüências com identidade < 15% e E-value > 10e−4.

• G2: seqüências cujos alinhamentos apresentaram identidade ≥ 25%, E-value

≤ 10e−5 e LVI ≥ 70%.

• G3: seqüências com identidade ≥ 15% e < 30% e E-value > 10e−4.

64

Figura 3.6: Esquema representando o fluxo de dados em todas as etapas de funcionamento do workflowMHOLline.

Dado um arquivo de entrada contendo as enzimas a serem modeladas (no formato FASTA),o MHOLline aciona diferentes programas para cada etapa de análise. Em quadrados azuisestão destacados o banco de dados SCOP e os programas de domínio público: BLAST, HMM-TOP, PsiPred, Modeller, Prochek, T-Coffee e Threader. O programa BATS, implementado noMHOLline, está representado em amarelo. Os losangos verdes representam os grupos definidospelo MHOLline, determinando os conjuntos enzimáticos que serão submetidos a cada etapa doworkflow‡. Os resultados de cada programa encontram-se em elipses laranjas.‡Workflow: de acordo com a WFMC (The Workflow Management Coalition), trata-se da auto-matização de parte ou de todo um processo computacional, no qual documentos, informaçõesou tarefas são passados de um participante do processo a outro, por meio de uma ação interli-gante que segue regras pré-estipuladas.Fonte: Fluxograma baseado em Rössle (2004).

65

O resultado do BATS foi submetido ao Modeller, para a geração dos modelos tri-

dimensionais, os quais foram agrupados de acordo com os critérios de qualidade apre-

sentados na tabela a seguir:

Tabela 3.6: Classificação dos modelos construídos via MHOLline, de acordo com os valores de identi-dade e cobertura† apresentados no alinhamento entre as seqüências alvo e molde.

Classificação (Qualidade) Identidade Cobertura†1. Muito Alta Qualidade ≥ 75% ≥ 90%2. Alta Qualidade ≥ 50% e < 75% ≥ 90%3. Boa Qualidade ≥ 50% ≥ 70% e < 90%4. Média a Boa Qualidade ≥ 35% e < 50% ≥ 70%5. Média a Baixa Qualidade ≥ 25% e < 35% ≥ 70%6. Baixa Qualidade ≥ 25% ≥ 50% e < 70%

†Cobertura: neste trabalho, foi usado o valor de LVI como definição de cobertura

3.3 Classificação Enzimática de Modelos Protéicos Tridimensionais de Trypa-

nosoma cruzi

Os 2.786 modelos construídos foram submetidos ao programa ECNGet, desenvol-

vido nesta dissertação, em linguagem de programação C. O ECNGet foi implementado

para detectar de forma automática o número que determina a classificação enzimática

(EC) de uma seqüência protéica, de acordo com o NC-IUBMB (Nomenclature Commit-

tee of the International Union of Biochemistry and Molecular Biology - disponível em

http://www.chem.qmul.ac.uk/iubmb/enzyme/).

Para isto, o programa usa o código PDB do molde como parâmetro de busca e as-

sociação a um número EC. Através do banco de dados pdb2sp.txt (ftp://beta.rcsb.org/pub/

pdb/uniformity/derived_data/ de fevereiro de 2006), o ECNGet correlaciona cada nú-

mero PDB com o respectivo código Swiss-Prot (Bairoch et al, 2004). Em seguida, asso-

cia o código Swiss-Prot ao respectivo número EC obtido do banco de dados enzyme.dat

(ftp://br.expasy.org/databases/enzyme/release_with_updates/ de fevereiro de 2006). O

ECNGet foi implementado de forma a detectar todo e qualquer EC associado a um có-

digo PDB, identificando inclusive enzimas multi-EC classificadas como sinônimas ou

como bi ou multifuncionais.

Um número EC é determinado por quatro dígitos da forma A.B.C.D, sendo os três

66

primeiros os que definem o tipo de reação catalítica: A é o número da classe enzimática

e refere-se a química da enzima, B e C são, respectivamente, os números da subclasse

e subsubclasse, e especificam os grupos químicos envolvidos na reação como doadores

e aceptores. O quarto dígito representado por D é o número de série que determina a

atividade catalítica em relação ao substrato.

As classes enzimáticas são definidas por seis categorias:

• Oxidorredutases (1. -. -.-): são enzimas que catalisam reações de oxidação-

redução, tendo como representantes as dehidrogenases e redutases.

• Transferases (2. -. -.-): são enzimas do tipo cinases, aminotransferases e tiola-

ses, que catalisam a transferência de grupos funcionais.

• Hidrolases (3. -. -.-): enzimas que catalisam reações de hidrólise, como as

peptidases, glicosidases, lipases e fosfatases.

• Liases (4. -. -.-): catalizam a eliminação ou adição de grupos funcionais com

o objetivo de formar ou quebrar duplas ligações, tendo como representantes

enzimas do tipo sintase, decarboxilase e dehidratase.

• Isomerases (5. -. -.-): são enzimas isomerases ou mutases, que catalisam re-

ações capazes de alterar uma estrutura, sem modificar sua composição ótica,

geométrica ou isomérica.

• Ligases (6. -. -.-): são enzimas que catalisam o acoplamento de dois compostos

com a hidrólise de uma ligação fosfoanidrido. Os principais representates são

enzimas do tipo sintetase, carboxilase e polimerase.

Na figura 3.7 é apresentada a classificação enzimática da cruzipaína, exemplifi-

cando uma numeração EC de acordo com o NC-IUBMB.

67

Figura 3.7: Classificação enzimática da cruzipaína apresentando sua numeração EC de acordo com oNC-IUBMB.---------------------------------------------------------------------------------------

3. -. -.- Hydrolases.3. 4. -.- Acting on peptide bonds (peptide hydrolases).3. 4.22.- Cysteine endopeptidases.ID 3.4.22.51DE Cruzipain.AN Congopain.AN Cruzain.AN Evansain.AN Trypanopain.CA Broad endopeptidase specificity similar to that of cathepsin L.CC -!- Is located in the digestive vacuoles of the parasitic trypanosomeCC and contributes to the nutrition of the organism by digestion ofCC host proteins.CC -!- Belongs to peptidase family C1.PR PROSITE; PDOC00126;DR P25779, CYSP_TRYCR ;

---------------------------------------------------------------------------------------

EC: Enzyme Commission.NC-IUBMB: Nomenclature Committee of the International Union of Biochemistry and Molecular Bio-logy - disponível em http://www.chem.qmul.ac.uk/iubmb/enzyme/.A primeira linha da figura apresenta a numeração da classe enzimática, a segunda se refere a subclassee a terceira a subsubclasse. A quarta linha apresenta a numeração completa composta de quatro dígi-tos, seguida por demais linhas informando a(s) enzima(s) que compõem este EC e o tipo de atividadeenzimática.

3.4 Determinação de Enzimas Análogas entre Trypanosoma cruzi e Homo sapi-

ens via AnEnπ

Como descrito na seção 1.3, o estudo de correlações entre as vias bioquímicas

codificadas no genoma de T. cruzi e no genoma humano é uma importante etapa no

planejamento de fármacos terapeuticamente úteis. Desta forma, os modelos estruturais

de T. cruzi que apresentaram uma classificação enzimática foram investigados quanto a

possíveis similaridades à enzimas de Homo sapiens (U.S. Department of Energy Office

of Science, 2003), visando se evitar a proposição de alvos moleculares que sofreriam

interferência quando tratados com inibidores, nos dois organismos.

Para esta análise, foi usado o AnEnπ (Analoguous Enzyme Pipeline) (Otto et

al, 2006), um programa desenvolvido pelo Laboratório de Genômica Funcional e Bi-

oinformática (FIOCRUZ), que usa o banco de dados KEGG (Kyoto Encyclopedia of

Genes and Genomes - disponível em ftp://ftp.genome.ad.jp/pub/kegg/) (Kanehisa et al,

2006) para a identificação de enzimas análogas entre dois organismos. Enzimas análo-

gas são proteínas capazes de catalisar uma mesma reação enzimática, porém, sem serem

68

ortólogos, nem parálogos. Apresentam estrutura primária sem similaridade, bem como

diferenças em suas estruturas terciárias (Otto et al, 2006). Estas enzimas são resultantes

de eventos evolutivos independentes, em vez de descenderem de uma enzima ancestral

comum (Galperin et al, 1998).

Inicialmente, o AnEnπ constrói um banco de dados de seqüências protéicas obti-

das a partir do banco de dados KEGG e, que tenham um número EC associado a alguma

das 2.314 diferentes classificações enzimáticas com representantes em diversos organis-

mos. Neste trabalho, foram usadas 224.707 seqüências com classificação enzimática,

depositadas no KEGG até fevereiro de 2006. Além disso, para este trabalho, foram

incorporadas ao banco do AnEnπ todas as seqüências protéicas de T. cruzi com mode-

los 3D gerados e associadas a um EC de pelo menos três dígitos (classificação até a

subsubclasse).

A seguir, o AnEnπ agrupa todas as enzimas pertencentes a um EC específico,

de acordo com o método de Galperin et al (1998), excluindo-se do banco todas as

seqüências com menos de 100 aminoácidos, por serem tipicamente fragmentos. Para

cada grupo de atividade enzimática é feito um alinhamento, via BLASTP, de todas con-

tra todas as seqüências integrantes. O resultado deste alinhamento é transformado em

um grafo onde cada enzima representa um nó, e a conexão entre dois nós é feita por

uma aresta não ponderada se as duas enzimas pertencerem a uma mesma classe enzimá-

tica e apresentarem pontuação ≥ 120. Todas as enzimas que estiverem conectadas são

consideradas como pertencentes a um mesmo grupo enzimático e, portanto, homólogas.

Seqüências não conectadas são consideradas como análogas.

Classificações enzimáticas com mais de 15 grupos, o que representa, conseqüen-

temente, 15 possíveis eventos de origem independente, foram consideradas como repre-

sentantes de enzimas multiméricas. Desta forma, as análises de analogia intragenômica

foram feitas excluindo-se tais seqüências (Guimarães, 2006).

Portanto, os modelos protéicos de Trypanosoma cruzi foram classificados da se-

guinte forma: (i) proteínas de T. cruzi e H. sapiens pertencentes a um mesmo grupo den-

tro de uma mesma subsubclasse enzimática, foram classificadas como enzimaticamente

69

similares; (ii) proteínas de T. cruzi e H. sapiens pertencentes a grupos diferentes dentro

de uma mesma subsubclasse enzimática, foram classificadas como possíveis análogas;

(iii) proteínas de T. cruzi integrantes de um ou mais grupos pertencentes a um mesmo

EC, no qual não foi encontrado nenhum representante de H. sapiens, foram classificadas

como possíveis específicas de T. cruzi em relação a humanos, o que não exclui sua simi-

laridade ou analogia com enzimas de outros organismos. Exemplos destas classificações

fornecidas pelo AnEnπ são apresentados na Tab. 3.7.

Tabela 3.7: Exemplo de resultado do AnEnπ mostrando seqüências de T. cruzi similares, possíveisanálogas e possíveis específicas a este organismo, em relação a enzimas humanas.

Homo sapiens Trypanosoma cruziNúmero Número Número Número Número Seqüência de

EC‡ do Grupo de Enzimas do Grupo de Enzimas T. cruzi1.11.1 1a 7 1a 4 TCR:7366.m00001

TCR:6148.m00006TCR:4808.m00011TCR:4808.m00013

2 6 - -3 1 - -- - 6b 1 TCR:8655.m00004- - 7b 2 TCR:4731.m00003

TCR:6846.m000068 4 - -

1.13.12 Not found in HSA 1c 3 TCR:4646.m00005TCR:4947.m00002TCR:7108.m00010

‡EC: Enzyme Commission. Classificação de acordo com NC-IUBMB (Nomencla-ture Committee International Union of Biochemistry and Molecular - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).aSimilares: proteínas de T. cruzi e H. sapiens pertencentes a um mesmo grupo (grupo 1) dentrode uma mesma subsubclasse enzimática (EC: 1.11.1).bPossíveis Análogas: enzimas de T. cruzi pertencentes a um grupo (grupos 6 e 7) sem repre-sentantes de H. sapiens, porém, com enzimas humanas pertencentes a outros grupos dentro deum mesmo EC (EC: 1.11.1).cPossíveis Específicas: enzimas de T. cruzi integrantes de um ou mais grupos (grupo 1) dentrode uma mesma classificação enzimática (EC: 1.13.12) que não possua qualquer representanteenzimático de H. sapiens.

Um resumo das metodologias aplicadas no estudo do genoma de T. cruzi para

a construção de seus modelos estruturais protéicos, caracterização dos modelos com

perfil enzimático e estudos evolutivos para a detecção de enzimas similares e análogas

em relação as enzimas humanas, está descrito na Fig. 3.8.

70

Figu

ra3.

8:E

sque

ma

apre

sent

ando

ore

sum

oda

sm

etod

olog

ias

aplic

adas

nael

abor

ação

deum

apr

imei

ralis

tade

poss

ívei

sal

vos

mol

ecul

ares

para

otr

atam

ento

dado

ença

deC

haga

s.

Fer

ram

enta

s de

Bio

info

rmát

ica

BL

AST

, Bio

Par

ser

Fer

ram

enta

s de

Mod

elag

em

Com

put

acio

nal

MH

OL

Lin

e

EC

NG

et

2. G

eraç

ão d

e M

odel

os 3

D:

• Seq

uênc

ias

não

redu

ndan

tes

de T

. cr

uzi s

ubm

etid

as a

o M

HO

LL

ine

e al

inha

das

cont

ra to

das

as s

equê

ncia

s pr

otéi

cas

do P

DB

(E

-val

ue 1

0e-5)

para

ge

raçã

o e

clas

sifi

caçã

o qu

alit

ativ

a de

m

odel

os.

3. C

lass

ific

ação

Enz

imát

ica:

• Mod

elos

ger

ados

sub

met

idos

ao

EC

NG

et p

ara

a as

soci

ação

aut

omát

ica

de u

ma

clas

sifi

caçã

o en

zim

átic

a (E

C):

ob

tenç

ão d

e m

odel

os p

roté

icos

com

ca

ract

erís

tica

s en

zim

átic

as

AnE

nπ

4. C

arac

teri

zaçã

o de

Enz

imas

Aná

loga

s a

part

ir d

e E

vent

os E

volu

tivo

s:

• Mod

elos

enz

imát

icos

de

T. c

ruzi

su

bmet

idos

ao

AnE

nπ p

ara

a de

tecç

ão d

e po

ssív

eis

enzi

mas

sim

ilar

es o

u an

álog

as e

m

rela

ção

a en

zim

as h

uman

as (

Hom

o sa

pien

s).

Abo

rdag

ens

Enz

imát

icas

/Evo

luti

vas

1. T

rata

men

to d

e R

edun

dânc

ias:

• BL

AS

TP

de to

das

cont

ra to

das

as

CD

S

(cod

ing

sequ

ence

) de

Try

pano

som

a cr

uzi

(E-v

alue

10e

-5).

• Res

ulta

do f

iltr

ado

pelo

Bio

Par

ser:

id

enti

dade

≤ 9

5% e

E-v

alue

= 1

0e-5.

71

Um dos objetivos deste trabalho é o estudo das isoformas 1 e 2 da cruzipaína

através da técnica de dinâmica molecular. Tratam-se de enzimas com perfil enzimático

bastante investigado experimentalmente, porém, vários aspectos (e.g. comportamentos

enzimáticos a diferentes temperaturas e estabilidade variada do sítio ativo e subsítios)

necessitam de maiores estudos em nível molecular, com o objetivo de auxiliar a eluci-

dação de resultados de complexa ou difícil interpretação.

3.5 Dinâmicas Moleculares da Papaína, Cruzipaína 1 e Cruzipaína 2

A cruzipaína é a cisteíno protease majoritária de T. cruzi, pertencente a família

da papaína. A estrutura cristalográfica da cruzipaína 1 foi resolvida experimental pela

primeira vez por McGrath et al (1995), ao contrário da cruzipaína 2 que ainda não teve

sua estrutura 3D resolvida. Neste trabalho, os estudos de simulação de dinâmica mo-

lecular (DM) da cruzipaína 2 serão feitos a partir do seu modelo tridimensional gerado

por modelagem comparativa, via Modeller (Sánchez e Sali, 1997).

Como controle para as análises do sítio catalítico, optou-se por realizar, também, o

estudo dinâmico da papaína estando sujeita ao mesmo protocolo aplicado às cruzipaínas

1 e 2.

3.5.1 Método de Simulação de Dinâmica Molecular

3.5.1.1 Escolha das Estruturas

As estruturas da papaína e da cruzipaína 1 foram obtidas do banco de dados

PDB (Berman et al, 2000; Westbrook et al, 2002), tomando-se como critérios a re-

solução da estrutura cristalográfica e a conformação usual da GLN19 (i.e conformação

da cadeia lateral necessária para polarizar o grupamento carbonila da ligação peptídica

a ser clivada) (Fig 1.10). Desta forma, foram escolhidas as estruturas 9PAP da papaína

(resolução de 1,65A) (Kamphuis et al, 1984), e 1ME4 da cruzipaína 1 (resolução de

1,20A) (Huang et al, 2003), desconsiderando-se as estruturas de seus ligantes.

O modelo da cruzipaína 2 (1ME4m) foi gerado a partir da seqüência alvo M90067

(Lima et al, 1994), depositada no GenBank (disponível em http://www.ncbi.nlm.nih.gov),

72

e como molde a estrutura 1ME4 da cruzipaína 1, considerando-se apenas a estrutura

protéica. No alinhamento entre as seqüências da M90067 e de diferentes estruturas da

cruzipaína 1 depositadas no PDB, verificou-se que a cruzipaína 2 e a 1ME4 possuem

86% de identidade. A alta similaridade entre estas seqüências associada a alta resolu-

ção da estrutura cristalográfica da 1ME4, permitiu a construção do modelo estrutural da

cruzipaína 2 baseando-se apenas na 1ME4 como molde.

3.5.1.2 Escolha dos Parâmetros

As simulações de dinâmica molecular foram realizadas usando-se o programa

GROMACS (versão 3.2) (van der Spoel et al, 2004) em dupla precisão, e assumindo

o campo de força GROMACS (van Gunsteren e Berendsen, 1987; van der Spoel et al,

2004). Considerando-se os estudos enzimáticos experimentais realizados com a cru-

zipaína, os quais mostram diferenças em sua eficiência enzimática de acordo com as

temperaturas encontradas em seu vetor invertebrado (25◦C = 298K) e em seu hospe-

deiro vertebrado (37◦C = 310K), optou-se por realizar as simulações de DM, para cada

uma das três enzimas, nestas duas temperaturas e com pressão de 1 atm.

O sistema foi simulado em uma caixa cúbica (com arestas de pelo menos 75A),

construída considerando-se uma camada de solvatação de no mínimo 10A em cada di-

mensão da macromolécula, usando-se o modelo de água SPC (Simple Point Charge) (Be-

rendsen et al, 1987). Deste modo, tem-se para a papaína um sistema (proteína + solvente

+ íons) composto por 47.590 átomos e para as cruzipaínas 1 e 2 sistemas com 61.029 e

40.463 átomos, respectivamente. As temperaturas e a pressão do sistema foram manti-

das constantes, aplicando-se o algoritmo de Berendsen (Berendsen et al, 1984). Usou-se

um passo de integração de 2 fs em conjunto com a imposição de restrições de distância

para todas as ligações químicas da macromolécula, via algoritmo LINCS (Hess et al,

1997). Para o tratamento das moléculas de água usou-se o método SETTLE (Miyamoto

e Kollman, 1992) de forma a considerar como fixas as distâncias e os ângulos intramo-

leculares. Maiores detalhes sobre os parâmetros usados nas simulações de DM podem

ser vistos no Apêndice A.

73

Para o tratamento do potencial de Coulomb, aplicou-se o método de Campo de

Reação usando raio de corte Rc = 16A e constante dielétrica εrf = 54, valores esco-

lhidos em função da temperatura e do modelo de água usados, de acordo com estudo

realizado por Smith e van Gunsteren (1994). Já para o potencial de Lennard-Jones, as

interações de van der Waals foram submetidas ao raio de corte Rc = 14A.

Por tratarem-se de enzimas atuantes em ambientes de pH ácido, os resíduos ácidos

(ASP e GLU) e básicos (ARG e LYS), bem como as histidinas, tiveram suas cargas tra-

tadas de forma a simular o ambiente biológico destas enzimas. Além disto, a cisteína do

sítio catalítico (CYS25) também sofreu tratamento de sua carga total, assumindo valor

de -1,0 (CB = -0,2 e SG = -0,8), simulando as condições de favorecimento da formação

do par iônico. As demais cisteínas não participantes de uma ligação dissulfídica foram

consideradas como tendo carga zero. Para neutralizar a carga total dos sistemas, foram

adicionados ao solvente íons cloro (Cl−) ou sódio (Na+), conforme a carga líquida apre-

sentada pela enzima em estudo. Os resíduos com tratamento de carga em cada enzima

são apresentados na Tab. 3.8 e as cisteínas que participam de ligações dissulfídicas estão

descritas na Tab. 3.9.

Em resumo, foram realizadas no total seis diferentes simulações de dinâmica mo-

lecular:

• Papaína (9PAP):

CYS25: carga total de -1,0 nas temperaturas

25◦C

37◦C

• Cruzipaína 1 (1ME4):


25◦C

37◦C

• Cruzipaína 2 (1ME4m):


25◦C

37◦C

74

Tabela 3.8: Cargas dos resíduos ácidos e básicos e resíduos de histidina e cisteína da papaína (9PAP),cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m).

Resíduos Carga 9PAP 1ME4 1ME4mÁcidos -1 ASP: 6, 55, 57, 108,

140 e 158GLU: 3, 35, 50, 52,89, 99 e 183

ASP: 6, 18, 57, 60,87, 121, 140, 161 e171GLU: 35, 50, 73, 78,86, 95, 117, 122, 158,190, 191, 207 e 208

ASP: 6, 57, 87, 103,105, 121, 140 e 171GLU: 9, 10, 35, 50,73, 78, 86, 117, 122,190, 207 e 208

Básicos +1 ARG: 8, 41, 58, 59,83, 93, 96, 98, 111,145, 188 e 191LYS: 10, 17, 39, 100,106, 139, 156, 174,190 e 211

ARG: 8, 10 e 195

LYS: 17, 58, 181,198 e 206

ARG: 8, 47, 106, 159e 195

LYS: 5, 17, 70,98, 102, 132, 158,181, 198 e 206

Histidinas +1 HIS: 81 e 159 HIS: 43, 106, 115 e162

HIS: 92, 115, 162 e187

Cisteínas 0 CYS: - CYS: 36 CYS: 94Carga Líquida +11 -10 -1Total com CYS25 -1 +10 -11 -2Íons adicionados +10 Cl− +11 Na+ +2 Na+

Tabela 3.9: Resíduos de cisteína que participam de ligações dissulfídicas (S-S) na papaína (9PAP),cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m).

Enzimas Resíduos de Cisteína (S-S)9PAP 22-63, 56-95, 153-2001ME4 22-63, 56-101, 155-2031ME4m 22-63, 56-101, 155-203

75

3.5.1.3 Otimização do Sistema

A minimização da energia potencial do sistema foi realizada aplicando-se o algo-

ritmo de Steepest Descent, em duas etapas:

(1) Tratamento do Solvente: para a acomodação das águas, realizou-se uma mini-

mização do solvente mantendo-se a proteína restrita.

(2) Tratamento do Sistema: nenhuma restrição foi aplicada, sendo todo o sistema

(proteína e solvente) submetido ao método de otimização.

3.5.1.4 Equilibração do Sistema

Para a equilibração do sistema foram executadas duas simulações de dinâmica

molecular:

(1) Equilibração do Solvente: restringiu-se a movimentação da proteína mantendo-

se as moléculas de água livres para a acomodação em camadas de solvatação

em torno da proteína. Esta dinâmica transcorreu por 0,5 ns.

(2) Equilibração do Sistema: nenhuma restrição foi aplicada ao sistema, permitindo-

se a acomodação de todos os átomos às condições físicas aplicadas ao sistema.

Esta simulação foi efetuada durante 1,0 ns.

3.5.1.5 Simulações de DM para análises

Após a otimização e equilibração dos sistemas, iniciaram-se as simulações de

dinâmica molecular usadas para as análises estruturais da papaína (9PAP), cruzipaína 1

(1ME4) e cruzipaína 2 (1ME4m). Cada uma das seis simulações de DM para análises,

transcorreram por 10 ns. Os tipos de análises e métodos empregados estão descritos a

seguir:

• Verificação da Estabilidade do Sistema: para o monitoramento da estabilidade

do sistema, acompanhou-se a variação média da energia total por átomo do

sistema (Kcal/mol/átomo), usando-se o comando g_energy_d do GROMACS.

76

• Análise de Alterações na Estrutura Secundária: a análise de possíveis perdas ou

ganhos de estruturas secundárias (hélices, folhas e voltas) foi realizada através

do monitoramento das porcentagens de cada um dos três tipos de estrutura ao

longo da DM. Para isto, usou-se o programa RIBBONS (versão 3.3) (Carson e

Bugg, 1986).

• Análise de Variações na Estrutura Protéica: para verificar possíveis alterações

conformacionais nas proteínas ao longo do tempo, foi calculado o desvio médio

quadrático (RMSD), de acordo com a Eq. (1.1), do esqueleto peptídico em re-

lação ao cristal/modelo, ao longo do tempo, usando-se o comando g_rms_d do

GROMACS. Além disso, foram analisadas possíveis flutuações de cada resíduo

da proteína, calculando-se a flutuação média quadrática (RMSF, i.e. desvio pa-

drão) dos Cα ao longo do tempo, através do comando g_rmsf_d do GROMACS.

• Análise da Superfície Acessível ao Solvente (SAS): para verificar possíveis

alterações na interface dielétrica proteína/solvente, foi feita a análise da super-

fície dos resíduos proteícos acessíveis a água ao longo da simulação de DM. A

SAS é definida como sendo a superfície traçada pelo centro de uma sonda es-

férica imaginária, representando uma molécula do solvente, ao ser rolada sobre

a parte exterior da superfície formada pela união das esferas de van der Waals

dos átomos da proteína (Lee e Richards, 1971).

Para o cálculo da superfície acessível ao solvente foi usado o algoritmo de

Connolly (Connolly, 1983) implementado no programa MDS (Molecular Dot

Surface) (Connolly, 1986). Dado um arquivo de entrada contendo as coorde-

nadas espaciais dos átomos que constituem a molécula de estudo, os raios de

van der Waals associados a estes átomos, o raio da sonda esférica e a densidade

desejada de pontos por A2 da SAS, o MDS gera um conjunto de pontos rela-

tivos à SAS e para cada ponto são geradas as coordenadas espaciais (x, y, z),

as coordenadas do vetor normal externo à superfície (nx, ny, nz) e uma área

aproximada da superfície associada a este ponto.

77

Neste trabalho foi desenvolvido o programa SASCalc, escrito em linguagem C,

que usa o MDS como rotina principal e como parâmetros de entrada um arquivo

no formato PDB (com hidrogênios polares já inclusos) e, os valores do raio da

sonda (Rs = 1,4 A) e da densidade de pontos desejados. Os raios de van der

Waals são associados aos respectivos átomos de forma automática, assumido-

se os valores calculados por Bondi (1964). Como o GROMACS considera

os hidrogênios apolares como átomos unidos, os valores dos raio de van der

Waals para estes casos foram obtidos de (Li e Nussinov, 1998) e tratados em

uma tabela diferenciada.

Para o estudo de possíveis alterações na conformação terciária das enzimas

papaína (9PAP), cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m), foram moni-

toradas as médias e desvios padrões da SAS de seus triptofanos (TRP). Estes

resíduos são usados em estudos por fluorescência, para a análise de alterações

na conformação estrutural de proteínas, verificando-se o aumento ou a dimi-

nuição de sua exposição ao solvente. Para a análise da região catalítica, foram

monitoradas as médias e os desvios padrões da SAS dos resíduos que com-

põem o sítio e os subsítios catalíticos. Todos os resíduos analisados quanto a

sua superfície acessível ao solvente estão descritos na Tab. 3.10.

Para a visualização e comparação de possíveis alterações estruturais na re-

gião catalítica das enzimas, nas duas temperaturas testadas, foram determi-

nadas as conformações preferencias de cada enzima, obtidas pelo comando

g_cluster_d do GROMACS, usando-se o método gromos (algoritmo desenvol-

vido de acordo com o descrito em Daura et al (1999)) e diferentes valores de

RMSD (1,0-2,0A) como critério de decisão de agrupamento.

• Estabilidade do Par Iônico: para a análise da manutenção do par iônico res-

ponsável pela atividade catalítica das enzimas, foram monitorados os posici-

onamentos das cadeias laterais dos seguintes resíduos: (i) papaína: CYS25,

ASP158, HIS159 e ASN175; (ii) cruzipaína 1: CYS25, ASP161, HIS162 e

ASN182; (iii) cruzipaína 2: CYS25, SER161, HIS162 e ASN182.

78

Tabela 3.10: Triptofanos e resíduos que compõem o sítio e os subsítios catalíticos da papaína (9PAP),cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m).

Resíduos 9PAP 1ME4 1ME4mTriptofanos TRP: 7, 26, 69, 177‡ e

181TRP: 7, 26, 38, 74, 128,144, 178, 184‡ e 188

TRP: 7, 26, 38, 74, 144,178, 184‡ e 188

Subsítio S2′ GLN19 e CYS22 GLN19 e CYS22 GLN19 e CYS22

Subsítio S1′ ALA136, ALA137,GLN142, ASP158 eTRP177

ALA141, SER142,MET145, ASP161 eTRP184

ALA141, SER142,PHE145, SER161 eTRP184

Subsítio S1 GLY23, SER24, ASN64,GLY65 e GLY66

GLY23, SER24, SER64,GLY65 e GLY66

GLY23, SER24, GLY64,GLY65 e GLY66

Subsítio S2 TYR67, PRO68,VAL133, VAL157,ALA160 e SER205

LEU67, MET68,ALA138, LEU160,GLY163 e GLU207

LEU67, SER68,ALA138, LEU160,ALA163 e GLU207

Subsítio S3 SER60 e TYR61 ASP60 e SER61 ASN60 e SER61

Sítio Catalítico CYS25, HIS159 eASN175

CYS25, HIS162 eASN182

CYS25, HIS162 eANS182

‡Triptofano constituinte do subsítio S1′.

79

Capítulo 4

Resultados e Discussão

Sendo o Trypanosoma cruzi um organismo diplóide, verificou-se possíveis redun-

dâncias de anotação através do programa BLASTP (usa o algoritmo BLAST para com-

parar seqüências protéicas), alinhando-se todas contra todas as 25.041 CDS (Seqüência

Codificante) de T. cruzi, obtidas do banco de dados público TcruziDB (http://TcruziDB.

org - versão TCA1.pep) (Luchtan et al, 2004). O resultado deste alinhamento foi sub-

metido ao BioParser que filtrou os dados segundo os valores de identidade (≤ 95%),

obtendo-se 20.679 seqüências não redundantes.

4.1 Modelos Protéicos Tridimensionais e Classificação Enzimática

Partindo de 20.679 CDS de T. cruzi não redundantes, o MHOLline produziu 2.786

modelos protéicos (aproximadamente 13,5% do total de seqüências analisadas), e iden-

tificou 4.719 seqüências com regiões transmembranares (próximo de 23% do total de

seqüências analisadas), o que indica que estas podem estar associadas a proteínas de

membrana. Este resultado apresenta-se condizente com valores encontrados em geno-

mas microbianos, nos quais as proteínas de membrana representam de 20-30% do total

protéico (Wallin e von Heijne, 1998). Informações sobre regiões transmembranares são

relevantes na inferência de características funcionais a seqüências.

Em seguida, o MHOLline classificou os 2.786 modelos gerados de acordo com

os critérios de qualidade apresentados na Tab. 3.6, obtendo os resultados apresentados

na Tab. 4.1. Os 2.786 modelos protéicos de T. cruzi foram submetidos ao ECNGet, que

80

associou um número correspondente a uma classificação enzimática a 1.888 seqüências,

obtendo-se 39 diferentes classificações (EC). As demais 898 seqüências não apresenta-

ram funções conhecidas ou foram associadas a funções não enzimáticas (e.g. fatores de

regulação celular). De acordo com a Tab. 4.1, do conjunto de modelos com classificação

enzimática (coluna 3), aproximadamente 20,5% foram classificados como de baixa qua-

lidade, 70% como de média qualidade e 9,5% como boa, alta ou muito alta qualidade. A

qualificação destes modelos é um indicativo de quais poderão ser submetidos a estudos

de desenho racional de fármacos baseado em estrutura e de docking receptor-ligante,

bem como outros tipos de estudos que envolvam modelos de menor qualidade.

Tabela 4.1: Número de modelos protéicos de T. cruzi com e sem classificação enzimática, classificadosde acordo com a qualidade de suas estruturas tridimensionais geradas pelo MHOLline.

Número de Modelos Número de Modelos TotalQualidade (sem EC‡) (com EC‡)Muito Alta 14 29 43Alta 63 97 160Boa 44 49 93Média a Boa 299 652 951Média a Baixa 258 674 932Baixa 220 387 607TOTAL 898 1.888 2.786

‡EC: Enzyme Commission. Classificação numérica de acordo com NC-IUBMB (NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).

Na Tab. 4.2 é apresentado o número de modelos protéicos de T. cruzi de acordo

com sua classe enzimática determinada pelo ECNGet, bem como as respectivas porcen-

tagens em relação ao número total de modelos construídos que apresentaram caracterís-

ticas enzimáticas. As classes enzimáticas mais representativas foram as das Hidrolases e

Transferases, compreendendo cerca de 84% do total de modelos de enzimas construídos.

Dos 1.888 modelos associados a algum EC, 25 seqüências apresentaram mais de

uma classificação enzimática: (i) 5 seqüências foram classificadas como bifuncionais

(e.g. GAL10 com EC: 5.1.3.2 e EC: 5.2.3.3) e 10 como sinônimas 8 (e.g. metileno-

tetrahidrofolato dehidrogenase (NADP+) com EC: 1.5.1.5 e considerada sinônima da

meteniltetrahidrofolato ciclohidrolase (EC: 3.5.4.9) e da formato-tetrahidrofolato ligase8 Enzimas sinônimas: enzimas que possuem EC diferentes mas descritas pelo NC-IUBMB (Nomen-

clature Committee of the International Union of Biochemistry and Molecular Biology) como númerossinônimos referentes a uma mesma função, ou apenas enzimas classificadas inicialmente com um EC eposteriormente reclassificadas com um novo número.

81

Tabela 4.2: Número e porcentagem de modelos protéicos de T. cruzi de acordo com a classe enzimáticapertencente.

Classe Enzimática Número de Modelos Porcentagem de Modelos(com EC‡) (com EC‡)

Oxidorredutase 144 7,63Transferase 462 24,47Hidrolase 1124 59,53Liase 41 2,17Isomerase 54 2,86Ligase 63 3,34TOTAL 1.888 100,00

‡EC: Enzyme Commission. Classificação numérica de acordo com NC-IUBMB (NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).

(EC: 6.3.4.3)); (ii) 5 apresentaram classificações enzimáticas pertencentes a uma mesma

classe funcional (e.g. fosfoproteína fosfatase (EC: 3.1.3.16) com função correlacionada

a da fosfotirosina fosfatase (EC: 3.1.3.48)); (iii) 5 foram indicadas como pertencentes

a diferentes classes, porém, com funções correlacionadas (e.g. 3-hidroxiacil-CoA dehi-

drogenase (EC: 1.1.1.35) com função correlacionada a da D-3-hidroxiacil-CoA dehidra-

tase (EC: 4.2.1.107)).

Os modelos associado a uma função enzimática foram agrupados na Tab. 4.3, de

acordo com as principais observações feitas em sua anotação genômica original:

(1) Anotação Coincidente: classificação enzimática do modelo coincide com a

anotação original da CDS.

(2) Proteína de Superfície: classificação enzimática do modelo gerado coincide

com a da CDS alvo, originalmente anotada como proteína de superfície ou

como gp63 (glicoproteína 63).

(3) Hipotética: modelo cuja seqüência alvo foi originalmente anotada como hipo-

tética.

(4) Anotação Discordante: modelo com classificação enzimática diferente da ano-

tação original da seqüência alvo.

Através dos resultados apresentados na Tab. 4.3, pode-se observar que 238 seqüên-

cias originalmente anotadas como proteínas hipotéticas, puderam através da metodolo-

82

gia empregada neste trabalho, ter suas estruturas tridimensionais modeladas e suas fun-

ções atribuídas através de uma classificação enzimática associada a um número EC. Na

Fig. 4.1 é apresentado um exemplo de seqüência genômica de T. cruzi anotada como

proteína hipotética, cujo modelo estrutural foi gerado pelo MHOLline usando como

molde a estrutura PDB 1U9Q. Este modelo foi considerado de Muito Alta qualidade e

teve sua classificação enzimática (EC: 3.4.22.51) determinada pelo ECNGet.

Tabela 4.3: Categorias dos modelos protéicos de T. cruzi de acordo com comparação entre sua classifi-cação enzimática e a anotação genômica de sua seqüência alvo.

Categorias TotalAnotação Coincidentea 695Hipotética 238Proteína de Superfície

- gp63 143- Sialidase 227- Transialidase 327

Anotação Discordanteb 258TOTAL 1.888

aModelos com classificação enzimática coincidente com a anotação genômicada seqüência alvo.bModelos cuja classificação enzimática não coincide com a anotação genômicada seqüência alvo.

Outro resultado importante a ressaltar é o fato de 258 modelos (aproximadamente

13, 67% do total de modelos de enzimas gerados) assumirem uma classificação enzimá-

tica discordante da anotação original apresentada pela CDS alvo correspondente. Duas

hipóteses podem ser levantadas, uma delas seria a possibilidade do BATS ter escolhido

como melhor molde para a construção do modelo final uma seqüência que, apesar de

apresentar uma melhor pontuação final, não seja a que melhor representa a função da-

quela enzima. Desta forma, seria necessário retornar ao MHOLline e revisar todas as

possíveis referências apontadas pelo programa para a geração do respectivo modelo, se

necessário analisar o alinhamento múltiplo destas e, então, verificar se há alguma que

melhor represente a seqüência alvo de acordo com a função proposta em sua anotação.

Outra hipótese seria de realmente ter havido algum erro na anotação da seqüência genô-

mica, podendo o MHOLline ser uma boa ferramenta para se propor uma reanotação

funcional.

83

Figura 4.1: Modelo estrutural de cruzipaína obtido de seqüência genômica de T. cruzi anotada comoproteína hipotética.

(a) Modelo de cruzipaína cuja seqüênciafoi originalmente anotada como hipoté-tica.

(b) Estrutura cristalográfica de cruzi-paína obtida do Protein Data Bank (PDB1U9Q).

4.2 Enzimas Análogas

Dos 1.888 modelos com classificação enzimática, foram excluídos 12 modelos

que apresentaram apenas o número da classe enzimática. As demais 1.876 seqüências

capazes de gerar um modelo com classificação enzimática, contendo pelo menos a nu-

meração referente a subsubclasse, foram submetidas ao AnEnπ (Otto et al, 2006) para

avaliar similaridades entre as seqüências de Trypanosoma cruzi e Homo sapiens.

O AnEnπ classificou 99 seqüências como possíveis análogas a enzimas humanas,

1.776 como similares (sendo 24 seqüências com mais de uma classificação enzimática)

e 1 bifuncional (modelo de GAL10 classificado como similar ao EC: 5.1.3 e análogo

ao EC: 3.4.24). Além disto, foi possível identificar 10 seqüências consideradas como

possivelmente específicas de T. cruzi em relação a humanos.

Na Tab. 4.4 é apresentado um resumo contendo a classificação geral das seqüên-

cias de acordo com a categoria de anotação genômica, analogia a seqüências de H.

sapiens detectada via AnEnπ, classificação enzimática obtida via ECNGet e qualidade

do modelo estrutural gerado via MHOLline.

Neste trabalho, foi possível identificar um total de 39 classificações enzimáti-

cas, sendo 26 (abrangendo 1185 modelos) associadas a uma via metabólica descrita no

KEGG. Das 13 demais classificações (compreendendo 691 modelos estruturais de T.

84

Tabe

la4.

4:M

odel

ospr

otéi

cos

deT.

cruz

i:ca

tego

ria

dean

otaç

ão,a

nalo

gia

aH

.sap

iens

via

AnE

nπ,c

lass

ifica

ção

enzi

mát

ica

equ

alid

ade

dom

odel

ovi

aM

HO

Llin

e.C

ateg

oria

sC

lass

eE

nzim

átic

aQ

ualid

ade

doM

odel

oTo

tal

12

34

56

Ano

taçã

oC

oinc

iden

tea

1.Si

mila

r†O

xido

rred

utas

e9

166

3615

789

(e.g

.deh

idro

gena

ses,

trip

anot

iona

-dis

ulfid

ere

duta

se)

Tran

sfer

ase

924

1288

8335

251

(e.g

.pro

teín

asci

nase

s,po

limer

ases

)H

idro

lase

212

975

5921

178

(e.g

.fos

fopr

oteí

na-f

osfa

tase

s,en

dope

ptid

ases

)L

iase

111

17

53

28(e

.g.h

idra

tase

s,en

donu

clea

ses)

Isom

eras

e-

75

246

446

(e.g

.pep

tidilp

rolil

isom

eras

e,ep

imer

ases

)L

igas

e-

72

336

856

(e.g

.glu

tatio

nasi

ntas

e,ub

iqui

tinas

,tR

NA

ligas

es)

2.Po

ssív

elA

nálo

ga‡

Oxi

dorr

edut

ase

--

-2

42

8(e

.g.d

ehid

roge

nase

s)Tr

ansf

eras

e-

--

4-

-4

(e.g

.ser

ino

acet

iltra

nsfe

rase

,cis

teín

osi

ntas

e)H

idro

lase

1-

114

75

28(e

.g.l

ipas

e,fa

ctor

deal

onga

men

toT

U)

Lia

se-

2-

-4

-6

(e.g

.UD

P-gl

ucur

onat

ode

carb

oxila

se1)

Prot

eína

deSu

perf

ície

b

1.Si

mila

r†

-gp6

3H

idro

lase

--

-60

3251

143

(e.g

.lei

shm

anol

isin

a)-S

ialid

ase

Hid

rola

se-

--

6792

6822

7-T

rans

ialid

ase

Hid

rola

se6

-4

8917

553

327

Hip

otét

icac

1.Si

mila

r†O

xido

rred

utas

e-

11

1-

-3

(e.g

.deh

idro

gena

ses)

Tran

sfer

ase

-3

-11

2012

46(e

.g.p

rote

ínas

cina

ses)

Hid

rola

se1

11

3644

7015

3(e

.g.c

ruzi

paín

a,pr

oteí

nas

desu

perf

ície

)L

iase

-1

-1

-1

3(e

.g.c

iste

íno

desu

lfur

ase,

dehi

drat

ase)

Isom

eras

e-

--

3-

-3

(e.g

.cic

lofil

ina)

Lig

ase

--

12

1-

4(e

.g.g

luta

min

a-tR

NA

ligas

e,ub

iqui

tinas

)

2.Po

ssív

elA

nálo

ga‡

Oxi

dorr

edut

ase

-1

-3

23

9(e

.g.d

ehid

roge

nase

s)Tr

ansf

eras

e-

--

15

17

(e.g

.pro

teín

asci

nase

s)H

idro

lase

--

-2

61

9(e

.g.f

osfa

tase

s)

Ano

taçã

oD

isco

rdan

ted

1.Si

mila

r†O

xido

rred

utas

e-

21

612

324

(e.g

.deh

idro

gena

ses,

redu

tase

s)Tr

ansf

eras

e-

43

5068

1614

1(e

.g.p

rote

ínas

cina

ses,

acet

iltra

nsfe

rase

hist

ônic

a)H

idro

lase

-2

116

1511

45(e

.g.d

eace

tilas

eN

AD

-dep

ende

nte,

fosf

opro

teín

afo

sfat

ase)

Lia

se-

1-

-1

13

(e.g

.cis

teín

ode

sulf

uras

e)Is

omer

ase

--

-3

-1

4(e

.g.p

eptid

ilpro

lilis

omer

ase)

Lig

ase

--

--

2-

2(e

.g.g

luta

tiona

sint

ase)

2.Po

ssív

elA

nálo

ga‡

Oxi

dorr

edut

ase

-1

-7

1-

9(e

.g.p

erox

idas

es)

Tran

sfer

ase

--

13

11

6(e

.g.a

cetil

em

etil

tran

sfer

ases

)H

idro

lase

-1

-4

15

11(e

.g.f

osfo

dies

tera

se)

Lia

se-

--

-1

-1

(e.g

.tR

NA

pseu

dour

idin

asi

ntas

eD

)L

igas

e-

--

1-

-1

(e.g

.Glu

tam

il-tR

NA

(Gln

)am

idot

rans

fera

se-s

ubun

idad

eD

)TO

TAL

2997

4964

966

838

31.

875

aM

odel

oco

mcl

assi

ficaç

ãoen

zim

átic

aco

inci

dent

eco

ma

anot

ação

genô

mic

ada

seqü

ênci

aal

vo.

bM

odel

oem

que

aan

otaç

ãoge

nôm

ica

dase

qüên

cia

alvo

ade

scre

veco

mo

prot

eína

desu

perf

ície

ouco

mo

gp63

.cM

odel

ocu

jase

qüên

cia

alvo

foia

nota

daco

mo

hipo

tétic

a.

dM

odel

ocu

jacl

assi

ficaç

ãoen

zim

átic

anã

oco

inci

deco

ma

anot

ação

genô

mic

ada

seqü

ênci

aal

vo.

† Seq

üênc

iacl

assi

ficad

aco

mo

sim

ilara

uma

enzi

ma

enco

ntra

daem

Hom

osa

pien

s.‡ S

eqüê

ncia

clas

sific

ada

com

opo

ssív

elan

álog

aa

algu

ma

enzi

ma

enco

ntra

daem

Hom

osa

pien

s.

85

cruzi), foi possível detectar 4 das 14 enzimas descritas na Tab. 1.1 como alvos molecu-

lares de interesse no combate à doença de Chagas. Como exemplo deste último caso,

pode-se citar a cruzipaína (EC: 3.4.22.51), cujo grupo determinado pelo AnEnπ apresen-

tou 11 seqüências de H. sapiens como similares. O alinhamento entre estas seqüências

é apresentado na Fig. 4.2.

Na Tab. 4.5 são listados alguns dos grupos enzimáticos, determinados pelo AnEnπ,

cuja relevância é apresentada de acordo com a relação entre o número de enzimas pre-

sentes em H. sapiens e T. cruzi, e pela presença de potenciais alvos moleculares de T.

cruzi descritos na Seção 1.2 e de alvos já em estudo, conforme apresentados na Tab. 1.1.

É importante notar que dos 14 alvos moleculares citados neste trabalho, foi possível

gerar o modelo estrutural de 8 destas enzimas, compreendendo no total 31 modelos.

Destes, pode-se destacar os 3 modelos gerados do alvo molecular NADH-fumarato re-

dutase que foram classificados pelo AnEnπ como possivelmente análogos a enzimas

humanas.

Das demais 6 enzimas de T. cruzi consideradas como alvos moleculares, ape-

nas 3 (esqualeno ciclase - EC: 2.5.1.21, farnesil pirofosfato sintase - EC: 2.5.1.10 e

Uracil-DNA glicosilase - EC: 3.2.2.3) possuem estrutura tridimensionalmente resolvida

e depositada no PDB. Para a investigação destas enzimas no genoma de T. cruzi foi re-

alizado um BLASTP entre as 20.679 CDS de T. cruzi não redundantes e as seguintes

estruturas 3D depositadas no PDB: 1EZF (EC: 2.5.1.21) e 1AKZ, 1UGH e 2HXM (EC:

3.2.2.3), enzimas de H. sapiens; 1YHK e 1YHM (EC: 2.5.1.10), enzimas de T. cruzi. O

BLAST não foi capaz de identificar nenhuma seqüência similar à estas enzimas dentro

do genoma de T. cruzi, nem mesmo das estruturas da farnesil pirofosfato sintase isoladas

deste parasita, sugerindo uma possível anotação incompleta deste genoma.

Um resumo dos resultados obtidos no estudo do genoma de T. cruzi para a cons-

trução de seus modelos estruturais protéicos, caracterização dos modelos com perfil

enzimático e estudos evolutivos para a detecção de enzimas similares e análogas em

relação as enzimas humanas, é apresentado na Fig. 4.3.

86

Figu

ra4.

2:A

linha

men

toen

tre

asse

qüên

cias

deci

steí

nopr

otea

ses

deT.

cruz

ieH

.sap

iens

clas

sific

adas

pelo

AnE

nπco

mo

sim

ilare

s.

6986.m00055 ---------------------------------------------------AATASLHAEETLASQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120

8294.m00001 ---------------------------------------------------AATASLHAEETLASQFAEFKQKHGRVYESAAEEAFRLSVFRANLFLARLHA---AANP-HATFGVTPFS 120

7376.m00001 ---------------------------------------------------AATASLHAEETLTSQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120




8096.m00032 ---------------------------------------------------AATASLHAEETLASQFAEFKQKHGRVYESAAEEAFRLSVFRENLFLARLHA---AANP-HATFGVTPFS 120

8091.m00002 ------------------------------------------------------------------------------------------------------------------------

8091.m00003 ---------------------------------------------------AATASLHAEETLASQFAEFKQKHGRVYGSAAEEAFRLSVFRANLFLARLHA---AANP-HATFGVTPFS 120

7289.m00001 ------------------------------------------------------------------------------------------------------------------------

hsa_8722 RKDCGPVDTKVPGAGEPKSAFTQGSAMISSLSQNHPDNRNETFSSVISLLNEDPLSQDLPVKMASIFKNFVITYNRTYESKEEARWRLSVFVNNMVRAQKIQ---ALDRGTAQYGVTKFS 237

hsa_1521 ---------------------------------------------------------PQPLELKEAFKLFQIQFNRSYLSPEEHAHRLDIFAHNLAQAQRLQ---EEDLGTAEFGVTPFS 92

hsa_1514 ------------------------------------------------------ATLTFDHSLEAQWTKWKAMHNRLYG-MNEEGWRRAVWEKNMKMIELHNQEYREGKHSFTMAMNAFG 81

hsa_441561 ------------------------------------------------------AALTRDHSLDAQWTKWKAKHKRLYD-MNGEGWRRAVXEKDVKMIEQHNQEYSQGKHSFTMAMNAFG 81

hsa_1515 ------------------------------------------------------AVPKFDQNLDTKWYQWKATHRRLYG-ANEEGWRRAVWEKNMKMIELHNGEYSQGKHGFTMAMNAFG 81

hsa_1520 ------------------------------------------------------AQLHKDPTLDHHWHLWKKTYGKQYKEKNEEAVRRLIWEKNLKFVMLHNLEHSMGMHSYDLGMNHLG 81

hsa_1513 ------------------------------------------------------FALYPEEILDTHWELWKKTHRKQYNNKVDEISRRLIWEKNLKYISIHNLEASLGVHTYELAMNHLG 79

hsa_1512 ------------------------------------------------------AELCVNSLEKFHFKSWMSKHRKTYS-TEEYHHRLQTFASNWRKINAHN----NGNHTFKMALNQFS 83

8422.m00010 ----------------------------------------------------------MRVYFSLSIALFLFLLYATAGHSFHAEDAPILTDEFLEHVNRLNG--GKWTAGRTSRTKHLT 60

8799.m00010 ----------------------------------------------------------MRAYFSLSIALFLFLLYATAGHSFHAEDAPILTDEFLELVNRLNG--GKWTAGRTSRTKHLT 60

hsa_1508 ----------------------------------------------------------MWQLWA-SLCCLLVLANARSRPSFHP-----LSDELVNYVNKRN---TTWQAGHNFYNVDMS 53

7624.m00011 ---------------------------------------------------AMTVTSDEDYLAQYTFEKYIADFGKRYADPEEHRKRAAIFKENLAKVRAFN---GALGRSYRLGINKFS 89

hsa_1519 ---------------------------------------------------------WLLWLLCRGGGDADSRAPFTPTWPRSREREAAAFRESLNRHRYLNSLFPSENSTAFYGINQFS 73

hsa_1522 -----------------------------------------------------------------------------------MARRGPGWRPLLLLVLLAG-----------AAQGGLY 26

6986.m00055 DLTREEFRSRYHNGAAHFAAAQERARVPVDVEVVGAPAAKDWR--KEGAVTAVKN----QGLCGSCWAFAAIGNVESQWFLAG---HPLTRLSEQMLVSCDDTN------FGCGGGWPLG 225

8294.m00001 DLTREEFRSRYRNGAAHFAAAQERARVPVDVEVVGAPAAKDWR--KEGAVTAVKN----QGLCGSCWAFAAIGNVESQWFLAG---NPLTRLSEQMLVSCDDTN------FGCGGGSSLK 225

7376.m00001 DLTREEFRSRYHNGAAHFAAAQERARVPVKVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------FGCSGGLMNN 225

7376.m00002 DLTREEFRSRYHNGAAHFAAAQERARVPVKVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------SGCSGGLMNN 225

7400.m00026 DLTREEFRSRYHNGAVHFAAAQERARVPVKVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------SGCSGGLMNN 225

7400.m00027 DLTREEFRSRYHNGAAHFAAAQERARVPVKVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------FGCSGGLMNN 225

8096.m00032 DLTREEFRSRYHNGAAHFAAAQERARVPVNVEVVGAPAAVDWR--ARGAVTAVKD----QGQCGSCWAFSAIGNVECQWFLAG---HPLTNLSEQMLVSCDKTD------SGCGGGLMNN 225

8091.m00002 -------------------------------------------------------------MCGSCWAFAAIGNIEGQWFLAG---NPLTRLSEQMLVSCDNTN------SGCGGGSSLK 50

8091.m00003 DLTREEFRSRYHNGAAHFAAAQERARVPVDVEFVGAPAAKDWR--EEGAVTAVKN----QGMCGSCWAFAAIGNIECQWFLAG---NPLTRLSEQMLVSCDNTN------SGCGGGWPLV 225

7289.m00001 -----------------------------------------------------------------------------------------------MLVSCDKTD------SGCGGGLMNN 19

hsa_8722 DLTEEEFRTIYLNTLLRKEPGNKMKQAKSVG--DLAPPEWDWR--SKGAVTKVKD----QGMCGSCWAFSVTGNVEGQWFLNQ---GTLLSLSEQELLDCDKMD------KACMGGLPSN 340

hsa_1521 DLTEEEFGQLYGYRRAAGGVPSMGREIRSEEPEESVPFSCDWRK-VAGAISPIKD----QKNCNCCWAMAAAGNIETLWRISF---WDFVDVSVQELLDCGRCG------DGCHGGFVWD 198

hsa_1514 DMTSEEFRQVMNGFQNRKPRKG---KVFQEPLFYEAPRSVDWRE-KG-YVTPVKN----QGQCGSCWAFSATGALEGQMFRKT---GRLISLSEQNLVDCSGPQ-GN---EGCNGGLMDY 185

hsa_441561 DMTNEEFRQVMNGFQHQKHRKG---KQFQERLLLEIPTSVDWRE-KG-YMTPMKD----QGQCGSCWAFSATGALEGQMFWKT---GKLISLNEQNLVDCSGPQ-GN---EGCNGGFMDN 185

hsa_1515 DMTNEEFRQMMGCFRNQKFRKG---KVFREPLFLDLPKSVDWRK-KG-YVTPVKN----QKQCGSCWAFSATGALEGQMFRKT---GKLVSLSEQNLVDCSRPQ-GN---QGCNGGFMAR 185

hsa_1520 DMTSEEVMSLMSSLRVPSQWQR--NITYKSNPNRILPDSVDWRE-KG-CVTEVKY----QGSCGACWAFSAVGALEAQLKLKT---GKLVSLSAQNLVDCSTEKYGN---KGCNGGFMTT 187

hsa_1513 DMTSEEVVQKMTGLKVPLSHSRSNDTLYIPEWEGRAPDSVDYRK-KG-YVTPVKN----QGQCGSCWAFSSVGALEGQLKKKT---GKLLNLSPQNLVDCVSE---N---DGCGGGYMTN 184

hsa_1512 DMSFAEIKHKYLWSEPQNCSAT---KSNYLRGTGPYPPSVDWRK-KGNFVSPVKN----QGACGSCWTFSTTGALESAIAIAT---GKMLSLAEQQLVDCAQDF-NN---HGCQGGLPSQ 188

8422.m00010 RRGASRMLGTFLRNTSILPPRQFSEEELRVPLQDRFDAGEAWP--ECPTVTEIRD----QSSCGSCWAVAAASAISDRYCTLG--GVRDLRISAGDLMSCC-DVCG----FGCNGGYPEV 167

8799.m00010 RRGASRLLGTFLRNTSILPPRQFSEEELREPLQDRFDAGEAWP--KCPTITEIRD----QSSCGSCWAVAAASAISDRYCTLG--GVRDLRISAGDLMSCC-DVCG----YGCNGGYPEV 167

hsa_1508 Y--LKRLCGTFLGGP-KPPQRVMFTEDLKLPAS--FDAREQWP--QCPTIKEIRD----QGSCGSCWAFGAVEAISDRICIHTN-AHVSVEVSAEDLLTCCGSMCG----DGCNGGYPAE 157

7624.m00011 DMTKEEFNAKFNGRVAAPQSTQSPQRAPYKRTKATFPEALNWQEAKNPVLTPVKD----QGSCGSCWAHAATESVESMYAISS---GKLLTLSTQQITSCVNNTRKCGGSGGCGGGTAQL 202

hsa_1519 YLFPEEFKAIYLRSKPSKFPRYS-AEVHMSIPNVSLPLRFDWRD--KQVVTQVRN----QQMCGGCWAFSVVGAVESAYAIKG---KPLEDLSVQQVIDCSYNN------YGCNGGSTLN 177

hsa_1522 FRRGQTCYRPLRGDGLAPLGRSTYPRPHEYLSPADLPKSWDWRNVDGVNYASITRNQHIPQYCGSCWAHASTSAMADRINIKRKGAWPSTLLSVQNVIDCGNAG-------SCEGGNDLS 139

* *oo> < < ooxx

>SÍTIO CATALÍTICO

*S2'

#S1'

oS1

xS2

<S3

Seqü

ênci

as#

.m#

:CD

S(S

eqüê

ncia

Cod

ifica

nte)

deTr

ypan

osom

acr

uzi.

Seqü

ênci

ashs

a_#

:CD

S(S

eqüê

ncia

Cod

ifica

nte)

deH

omo

sapi

ens.

87

6986.m00055 AFKWIVDRNNGTVY---------TEESYPYHSCIVIKLPCKDSDRTVGATVQDTVSSPQ----------------------DEAQIVAWLAVNGPHFAVIDIIGWMFYTR----GVFT-- 308

8294.m00001 AFKWIVDRNNGAVY---------TEESYPYHSCIGIKLPCKDSDRTVGATVQDTVSSPQ----------------------DEAQIVAWLAVNGPHFAVIDIIGWMFYTR----GVFT-- 308

7376.m00001 AFEWIVQENNGAVY---------TEDSYPYASGEGISPPCTTSGHTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVAVDASSWMTYTG----GVMTSC 310





8091.m00002 AFKWIVDRNNGAVY---------TEESYPYHSCIGIKLPCTTSGHTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVVVDASSWIFYTG----GVLTNC 135

8091.m00003 AFKWIVDRNNGTVY---------TEESYPYHSCIGISPPCTTSGHTVGATITGYVTIPR----------------------DENGIAAWLAVNGPVAVVVDASSWIFYTG----GVMTSC 310

7289.m00001 AFEWIVQENNGAVY---------TEDSYPYASGEGISPPCTTSGRTVGATITGHVELPQ----------------------DEAQIAAWLAVNGPVAVAVDASSWMTYTG----GVMTSC 104

hsa_8722 AYSAIKN--LGGLE---------TEDDYSYQG-HMQS--CNFSAEKAKVYINDSVELSQ----------------------NEQKLAAWLAKRGPISVAINAFGMQFYRHGISRPLRPLC 424

hsa_1521 AFITVLN--NSGLA---------SEKDYPFQG-KVRAHRCHPKKYQKVAWIQDFIMLQN----------------------NEHRIAQYLATYGPITVTINMKPLQLYRKGVIKATPTTC 284

hsa_1514 AFQYVQD--NGGLD---------SEESYPYEA---TEESCKYNPKYSVANDTGF-VDIPK---------------------QEKALMKAVATVGPISVAIDAGHESFLFYKEGIYFEPDC 269

hsa_441561 PFRYVQE--NGGLD---------SEASYPYEG---KVKTCRYNPKYSAANDTGF-VDIPS---------------------REKDLAKAVATVGPISVAVGASHVSFQFYKKGIYFEPRC 269

hsa_1515 AFQYVKE--NGGLD---------SEESYPYVA---VDEICKYRPENSVANDTGFTVVAPG---------------------KEKALMKAVATVGPISVAMDAGHSSFQFYKSGIYFEPDC 270

hsa_1520 AFQYIID--NKGID---------SDASYPYKA---MDQKCQYDSKYRAATCSKYTELPYG---------------------REDVLKEAVANKGPVSVGVDARHPSFFLYRSGVYYEPSC 272

hsa_1513 AFQYVQK--NRGID---------SEDAYPYVG---QEESCMYNPTGKAAKCRGYREIPEG---------------------NEKALKRAVARVGPVSVAIDASLTSFQFYSKGVYYDESC 269

hsa_1512 AFEYILY--NKGIM---------GEDTYPYQG---KDGYCKFQPGKAIGFVKDVANITIY---------------------DEEAMVEAVALYNPVSFAFEVTQD-FMMYRTGIYSSTSC 272

8422.m00010 AWEYYAVHGIVS----------EYCQPYPFPSCAHHVNSSDLSPCSGEYDTPTCNSTCTDKKIPLIK---YRGNTSYVLS-GEEPFKRELILNGPFEVSFSVYADFVAYTG---GVYKHV 270

8799.m00010 AWEYYAVHGIVS----------EYCQPYPFPSCAHHVNSSDLSPCSGEYDTPTCNSTCTDKKVPLIK---YRGNTSYLLS-GEESFKRELLLNGPFEVSFSVYADFLAYTG---GVYKHV 270

hsa_1508 AWNFWTRKGLVSGGLY---ESHVGCRPYSIPPCEHHVNGS-RPPCTGEGDTPKCSKICEPGYSPTYKQDKHYGYNSYSVSNSEKDIMAEIYKNGPVEGAFSVYSDFLLYKS---GVYQHV 270

7624.m00011 AWEYIMNTGGITLD---------AEYPYVSGETSVTGRCVLNRSMPRVVNVYGYASLPHN---------------------DYEAVIEALVQKGPLAVSVAASDWMFYTGGVFDGCGKDG 292

hsa_1519 ALNWLNKMQVKLVK----------DSEYPFKAQNGLCHYFSGSHSGFSIKGYSAYDFSD----------------------QEDEMAKALLTFGPLVVIVDAVSWQDYLGG---IIQHHC 262

hsa_1522 VWDYAHQHGIPDETCNNYQAKDQECDKFNQCGTCNEFKECHAIRNYTLWRVGDYGSLS-----------------------GREKMMAEIYANGPISCGIMATERLANYTG---GIYAEY 233

x ## #

6986.m00055 --------------VYFCMCV--------------------FSLWTFK------------------------------------------------------------------------

8294.m00001 --------------VYFRMCV--------------------FSLWTFK------------------------------------------------------------------------

7376.m00001 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTTQWGEDGYIRIAKGS-NQCLVKEEASSAVVGGPG---THSRANHHDN-HKCPRTVPIVLCADVLH--- 400

7376.m00002 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTTQWGEEGYIRIAKGL-NQCLVKEEASSAAKHGFFRIFSIVVVLVLVF-CVCGVFFCFFFFFDVFYFLL 406

7400.m00026 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTTQWGEEGYIRIAKGS-NQCLVKEEASSAVVGGPGPTPEPTTTTTTSAPGPSPSYFVQMSCTDAACIVG 407

7400.m00027 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTTQWGEEGYIRIAKGS-NQCLVKEEASSAVVGGPGPTPEPTTTTTTSAPGPSPSYFVQMSCTDAACIVG 407

8096.m00032 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTAQWGEDGYIRIAKGS-NQCLVKEEASSAVVGGPGPTPEPTTTTTTSAPGPSPSYFVQMSCTDAACIVG 407

8091.m00002 VS--KKLDHAVLLVGYNDSAT--------------------APYWIIKNSWTTQWGEDGYIRIAKGS-NQCLVKEEASSAVVGGPGATPEPTTTTTTSAPGPSPSCFVQMSCTDAACIVG 232

8091.m00003 VS--KQLSHAVLLVGYNDSAT--------------------VPHWIIKNSWTTHWGEDGYIRIAKGS-NQCLVKEGVSSAVVGGPGATPEPTTTTTTSAPGPSPSYFVQMSCTDDACIVG 407

7289.m00001 VS--EQLDHGVLLVGYNDSAA--------------------VPYWIIKNSWTAQWGEDGYIRIAKGS-NQCLVKEEASSAAQQGLLLFFVFRFVVFLVLVFCVCGIVFLVFFTFSWVFFL 201

hsa_8722 SP--WLIDHAVLLVGYGNRSD--------------------VPFWAIKNSWGTDWGEKGYYYLHRGS-GACGVNTMASSAVVD------------------------------------- 484

hsa_1521 DP--QLVDHSVLLVGFGSVKSEEGIWAETVSSQSQPQPPHPTPYWILKNSWGAQWGEKGYFRLHRGS-NTCGITKFPLTARVQKPDMKPRVSCPP------------------------- 376

hsa_1514 SS--EDMDHGVLVVGYGFESTES----------------DNNKYWLVKNSWGEEWGMGGYVKMAKDRRNHCGIASAASYPTV-------------------------------------- 333

hsa_441561 DP--EGLDHAMLVVGYSYEGADS----------------DNNKYWLVKNSWGKNWGMDGYIKMAKDRRNSCGIATAASYPTV-------------------------------------- 333

hsa_1515 SS--KNLDHGVLVVGYGFEGANS----------------NNSKYWLVKNSWGPEWGSNGYVKIAKDKNNHCGIATAASYPNV-------------------------------------- 334

hsa_1520 T---QNVNHGVLVVGYGDL--------------------NGKEYWLVKNSWGHNFGEEGYIRMARNKGNHCGIASFPSYPEI-------------------------------------- 331

hsa_1513 NS--DNLNHAVLAVGYGIQ--------------------KGNKHWIIKNSWGENWGNKGYILMARNKNNACGIANLASFPKM-------------------------------------- 329

hsa_1512 HKTPDKVNHAVLAVGYGEK--------------------NGIPYWIVKNSWGPQWGMNGYFLIERGK-NMCGLAACASYPIPLV------------------------------------ 335

8422.m00010 AG-IFLGGHAVRIVGWGELNG--------------------EPYWKIANSWNREWGMNGYFLIARGV-DECGIEGSGVAGTPRIP----------------------------------- 333

8799.m00010 AG-TFLGGHAVRIVGWGELNG--------------------EPYWKIANSWNREWGMNGYFLIARGV-DECGIEGSGVAGTPRIP----------------------------------- 333

hsa_1508 TG-EMMGGHAIRILGWGVENG--------------------TPYWLVANSWNTDWGDNGFFKILRGQ-DHCGIESEVVAGIPRTDQYWEKI----------------------------- 339

7624.m00011 EN--ITISHAVQLVGYGTDNKTN------------------QDYWVVRNSWGEGWGENGFIRLLRKKHNELCVFNNAWNTAGGGCADDPNITIVACGMCGILYDVAYPVVTKPPGRGRFL 392

hsa_1519 SS--GEANHAVLITGFDKTGS--------------------TPYWIVRNSWGSSWGVDGYAHVKMGS-NVCGIADSVSSIFV-------------------------------------- 321

hsa_1522 QD-TTYINHVVSVAGWGISDG--------------------TEYWIVRNSWGEPWGERGWLRIVTSTYKDGKGARYNLAIEEHCTFGDPIV----------------------------- 303

x#>x

> # x

>SÍTIO CATALÍTICO

*S2'

#S1'

oS1

xS2

<S3

Seqü

ênci

as#

.m#

:CD

S(S

eqüê

ncia

Cod

ifica

nte)

deTr

ypan

osom

acr

uzi.

Seqü

ênci

ashs

a_#

:CD

S(S

eqüê

ncia

Cod

ifica

nte)

deH

omo

sapi

ens.

88

Tabela 4.5: Exemplos de grupos enzimáticos classificados pelo AnEnπ, de acordo com a relação entreo número de enzimas presentes em H. sapiens e T. cruzi, e pela presença de alvos moleculares de T. cruzijá em estudo.

I. Enzimas associadas a uma via metabólica não descrita no KEGG‡

ECa Grupo Seqüências Seqüências Exemplode HSAb de TCRc

1.8.1 1 4 6 Tripanotiona redutase ≈ T[SH]21.14.13 2 11 2 Citocromo P450 = Lanosterol 14α-demetilase2.5.1 23 3 4 Farnesiltransferase2.7.1 1 412 266 Proteínas cinases3.1.2 2 37 5 Ubiquitina hidrolase

6 35 2 Proteína tirosina fofatase3.4.21 6 15 3 Prolil oligopeptidase3.4.22 5 11 13 Cisteíno proteases (e.g. cruzipaína)3.4.24 5 1 150 Leishmanolisina

II. Enzimas associadas a uma via metabólica descrita no KEGG‡

ECa Grupo Seqüências Seqüências Exemplode HSAb de TCRc

1.1.1 3 52 27 Dehidrogenases1.2.1 1 14 6 Aldeído dehidrogenase

3 3 10 Gliceraldeído-3-fosfo dehidrogenase1.3.99 2 - 3 NADH-fumarato redutase1.6.2 1 2 6 Citocromo-B5 redutase1.15.1 2 1 9 Superóxido dismutase2.1.1 2 25 11 Transferases

19 7 1 Transferases2.3.1 5 14 4 Acetiltransferase2.4.1 2 52 3 UDP-Transferase2.5.1 3 17 6 Glutationa transferase2.6.1 2 9 14 Transaminases2.7.2 2 2 6 3-fosfoglicerato cinase3.1.3 1 13 50 Fosfoproteína fosfatase2.7.3 2 4 1 Arginina cinase3.1.4 3 20 7 Nucleotídeo fosfodiesterase

13 9 1 Fosfoinositídeo fosfolipase C3.2.1 1 16 679 Sialidases3.5.1 1 1 6 Aminoacilases3.6.3 4 31 6 ATPases4.2.1 12 1 8 Cistationina β-sintase

30 14 1 Anidrase carbônica4.6.1 2 19 2 Adenilato ciclase5.4.99 13 1 2 Oxidoesqualeno–lanosterol ciclase6.2.1 1 11 4 Acetil CoA

Em bege estão destacadas as enzimas de T. cruzi consideradas alvos moleculares no combate à doençade Chagas, conforme listadas na Tab. 1.1.Em amarelo estão destacadas as enzimas de T. cruzi de grande importância biológica para o parasita,e consideradas como potenciais alvos moleculares para o tratamento da doença de Chagas, conformedescrito na Seção 1.2.‡ KEGG: Kyoto Encyclopedia of Genes and Genomes - disponível em ftp://ftp.genome.ad.jp/pub/kegg/aEC: Enzyme Commission. Classificação numérica de acordo com NC-IUBMB (NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology - disponível emhttp://www.chem.qmul.ac.uk/iubmb/enzyme/).bHSA: Homo sapiens.cTCR: Trypanosoma cruzi.

89

Figu

ra4.

3:E

sque

ma

apre

sent

ando

ore

sum

odo

sre

sulta

dos

obtid

osna

elab

oraç

ãode

uma

prim

eira

lista

depo

ssív

eis

alvo

sm

olec

ular

espa

rao

trat

amen

toda

doen

çade

Cha

gas.

Fer

ram

enta

s de

Bio

info

rmát

ica

BL

AST

, Bio

Par

ser

Fer

ram

enta

s de

Mod

elag

em

Com

put

acio

nal

MH

OL

Lin

e

EC

NG

et

1. T

rata

men

to d

e R

edun

dânc

ias:

• 25.

041

CD

S de

Try

pano

som

a cr

uzi.

• Fil

trag

em d

o B

LA

ST c

ruzi

X c

ruzi

=

20.6

79 C

DS

.

2. G

eraç

ão d

e M

odel

os 3

D:

• 2.7

86 m

odel

os p

roté

icos

de

T. c

ruzi

, ge

rado

s a

part

ir d

e cr

ista

is d

o P

DB

, co

m d

ifer

ente

s qu

alid

ades

.• 4

.719

seq

uênc

ias

asso

ciad

as a

pr

oteí

nas

de m

embr

ana.

3. C

lass

ific

ação

Enz

imát

ica:

• 1.8

88 m

odel

os p

roté

icos

de

T. c

ruzi

co

m c

arac

terí

stic

a en

zim

átic

a: O

xido

rred

utas

es (

144)

Tra

nsfe

rase

s (4

62)

Hid

rola

ses(

1124

) L

iase

s (4

1) I

som

eras

es (

54)

Lig

ases

(63

)

AnE

nπ

4. C

arac

teri

zaçã

o de

Enz

imas

Aná

loga

s a

part

ir d

e E

vent

os E

volu

tivo

s:

• 1.8

76 m

odel

os 3

D d

e T.

cru

zi a

ssoc

iado

s a

pelo

men

os u

ma

sub-

subc

lass

e en

zim

átic

a: 1

.776

mod

elos

cla

ssif

icad

os c

omo

sim

ilar

es a

alg

uma

enzi

ma

de H

omo

sapi

ens

99

com

o po

ssív

eis

anál

ogas

a H

. sap

iens

1 c

lass

ific

ada

com

o bi

func

iona

l

Abo

rdag

ens

Enz

imát

icas

/Evo

luti

vas

90

4.3 Dinâmicas Moleculares

A cruzipaína, cisteíno protease majoritária de T. cruzi e pertencente a família da

papaína, é uma das enzimas de T. cruzi com mecanismo de ação bastante investigado

experimentalmente (Lima et al, 1992; del Nery et al, 1997; Judice et al, 2001; Lima et

al, 2001; dos Reis et al, 2006). No entanto, vários aspectos de seu perfil enzimático

como, por exemplo, seu comportamento enzimático a diferentes temperaturas e a efici-

ência catalítica diferenciada entre as isoformas, necessitam de maiores estudos em nível

molecular, visando auxiliar na interpretação de resultados experimentais.

Neste trabalho foram investigadas as estruturas das enzimas cruzipaína 1 e cru-

zipaína 2, tendo-se como controle a enzima papaína (extraída da Carica papaia), que

representa a família C1 (família papaína) das cisteíno proteases. Foram escolhidas para

este trabalho, as estruturas cristalográficas da papaína (PDB: 9PAP) (Kamphuis et al,

1984) e da cruzipaína 1 (PDB: 1ME4) (Huang et al, 2003) provenientes do banco de

dados PDB (Berman et al, 2000; Westbrook et al, 2002). Foram tomados como crité-

rios de seleção a resolução cristalográfica das estruturas (9PAP: 1,65A e 1ME4: 1,20A)

e a conformação usual da GLN19 (i.e conformação da cadeia lateral necessária para

polarizar o grupamento carbonila da ligação peptídica a ser clivada) (Fig 1.10).

Para a construção do modelo estrutural da cruzipaína 2 (1ME4m), aplicou-se o

método de modelagem comparativa (via programa Modeller (Sánchez e Sali, 1997)),

usando-se a seqüência alvo M90067 (Lima et al, 1994), depositada no GenBank (dis-

ponível em http://www.ncbi.nlm.nih.gov). Como molde, foi selecionado o cristal 1ME4

da cruzipaína 1, não somente por apresentar uma boa resolução cristalográfica mas, tam-

bém, por apresentar alta similaridade com a seqüência da cruzipaína 2 (86% de identi-

dade) (ver alinhamento das seqüências no Apêndice B). A qualidade estereoquímica do

modelo gerado foi verificada com o programa Procheck (Laskowski et al, 1993), apre-

sentando como resultado mais de 95% dos resíduos em regiões favoráveis. O gráfico de

Ramachandran gerado e a análise feita pelo Procheck foram apresentadas nas Fig. 1.12

e Fig. 3.5, respectivamente.

As dinâmicas moleculares destinadas às análises das estruturas das enzimas pa-

91

paína (9PAP), cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m) foram realizadas por 10

ns, simulando-se as temperaturas encontradas no vetor invertebrado (25◦C = 298K) e

no hospedeiro vertebrado (37◦C = 310K) de T. cruzi.

Durante os 10 ns de dinâmica molecular, a energia total por átomo do sistema

manteve-se estável e sem alterações observáveis entre as duas temperaturas testadas,

como observado na Fig. 4.4. Os valores das médias e desvios padrões, em Kcal/mol/

átomo, ao longo de toda a simulação foram: (i) papaína: −2, 6837 ± 0, 0022 (25◦C) e

−2, 6052 ± 0, 0022 (37◦C); (ii) cruzipaína 1: −2, 6967 ± 0, 0020 (25◦C) e −2, 6177 ±

0, 0020 (37◦C); (iii) cruzipaína 2: −2, 6705 ± 0, 0024 (25◦C) e −2, 5917 ± 0, 0024

(37◦C).

De acordo com resultados experimentais realizados com a cruzipaína 1 nas tem-

peraturas de 25◦C e 37◦C (Lima et al, 1992; dos Reis, 2005), esta enzima tenderia

a diminuir sua porcentagem de estruturas secundárias quando incubada a 37◦C. Foi

proposto, também, que a atividade enzimática das isoformas da cruzipaína poderia ser

modulada por alterações conformacionais na região do sítio ativo bem como pela pre-

sença de um possível sítio alostérico (dos Reis, 2005). A regulação deste possível sítio

alostérico estaria condicionada a temperatura de forma que, a atividade enzimática seria

inibida pelo excesso de substrato a 25◦C (temperatura encontrada no vetor invertebrado),

desaparecendo a 37◦C (temperatura no hospedeiro vertebrado) (Lima et al, 1992).

De acordo com os resultados apresentados na Tab. 4.6, pode-se observar que não

houveram alterações significativas, em função da temperatura, nas porcentagens de es-

truturas secundárias das três enzimas estudadas. No entanto, pode-se notar no 10◦ ns

de simulação que há uma tendência de diminuição da porcentagem de hélices em cruzi-

paína 1, quando simulada a 37◦C, enquanto há uma tendência de aumento, tanto da por-

centagem de hélices quanto de folhas, em cruzipaína 2 simulada a 37◦C. As estruturas

secundárias médias de cada nanosegundo de simulação de DM, estão esquematicamente

representadas na Fig. 4.5 para a papaína, na Fig. 4.6 para a cruzipaína 1 e na Fig. 4.7

para a cruzipaína 2.

92

Figura 4.4: Média da energia total por átomo do sistema (Kcal/mol/átomo), ao longo de 10 ns desimulação de dinâmica molecular da papaína (9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m).

Número de átomos que constituem os sistemas: 9PAP = 47.592, 1ME4 = 61.027 e 1ME4m = 40.462.

93

Tabela 4.6: Porcentagem de estruturas secundárias em papaína (9PAP) e cruzipaínas 1 (1ME4) e 2(1ME4m), ao longo de 10 ns de simulação de dinâmica molecular.

Estruturas 9PAP 1ME4 1ME4m25◦C 37◦C 25◦C 37◦C 25◦C 37◦C

Hélices 1ns 23, 58 24, 53 25, 58 22, 33 21, 03 18, 222ns 23, 11 23, 59 21, 86 23, 26 21, 49 21, 033ns 26, 41 23, 59 23, 26 20, 93 19, 63 21, 964ns 23, 11 24, 06 25, 58 20, 47 20, 09 22, 905ns 27, 83 23, 11 24, 19 21, 39 21, 96 22, 436ns 22, 17 25, 47 25, 12 18, 60 21, 96 24, 307ns 25, 00 26, 42 26, 98 21, 86 19, 63 20, 098ns 22, 64 20, 76 22, 79 25, 12 19, 63 18, 699ns 24, 05 22, 17 23, 72 23, 72 20, 09 21, 9610ns 25, 00 25, 00 24, 19 21, 86 18, 22 22, 43

Folhas 1ns 13, 68 13, 21 21, 86 21, 39 19, 63 19, 632ns 14, 62 15, 09 21, 40 22, 32 19, 63 20, 093ns 16, 04 15, 09 20, 00 19, 53 19, 62 19, 634ns 14, 62 16, 04 17, 68 20, 93 18, 23 22, 435ns 15, 57 15, 57 19, 07 23, 26 16, 82 19, 166ns 14, 15 14, 15 20, 46 21, 86 17, 76 18, 697ns 15, 09 17, 92 20, 00 21, 86 16, 82 21, 968ns 16, 04 17, 92 22, 33 23, 72 19, 16 21, 509ns 15, 10 16, 04 18, 61 20, 93 18, 23 19, 1610ns 16, 04 17, 92 20, 00 20, 93 17, 76 20, 56

Voltas 1ns 62, 74 62, 26 52, 56 56, 28 59, 34 62, 152ns 62, 27 61, 32 56, 74 54, 42 58, 88 58, 883ns 57, 55 61, 32 56, 74 59, 54 60, 75 58, 414ns 62, 27 59, 90 56, 74 58, 60 61, 68 54, 675ns 56, 60 61, 32 56, 74 55, 35 61, 22 58, 416ns 63, 68 60, 38 54, 42 59, 54 60, 28 57, 017ns 59, 91 55, 66 53, 02 56, 28 63, 55 57, 958ns 61, 32 61, 32 54, 88 51, 16 61, 21 59, 819ns 60, 85 61, 79 57, 67 55, 35 61, 68 58, 8810ns 58, 96 57, 08 55, 81 57, 21 64, 02 57, 01

94

Figu

ra4.

5:E

stru

tura

secu

ndár

iada

papa

ína

(9pa

p),a

olo

ngo

de10

nsde

sim

ulaç

ãode

dinâ

mic

am

olec

ular

,con

side

rand

oC

YS2

5co

mca

rga

tota

ligu

ala

-1,0

.

25◦ C

37◦ C

As

estr

utur

asse

cund

ária

ses

tão

repr

esen

tada

sda

segu

inte

form

a:H

élic

es-a

mar

elo,

Folh

as-v

erm

elho

eVo

ltas

-bra

nco

95

Figu

ra4.

6:E

stru

tura

secu

ndár

iada

cruz

ipaí

na1

(1M

E4)

,ao

long

ode

10ns

desi

mul

ação

dedi

nâm

ica

mol

ecul

ar,c

onsi

dera

ndo

CY

S25

com

carg

ato

tali

gual

a-1

,0.

25◦ C

37◦ C

As

estr

utur

asse

cund

ária

ses

tão

repr

esen

tada

sda

segu

inte

form

a:H

élic

es-a

mar

elo,

Folh

as-v

erm

elho

eVo

ltas

-bra

nco

96

Figu

ra4.

7:E

stru

tura

secu

ndár

iada

cruz

ipaí

na2

(1M

E4m

),ao

long

ode

10ns

desi

mul

ação

dedi

nâm

ica

mol

ecul

ar,c

onsi

dera

ndo

CY

S25

com

carg

ato

tali

gual

a-1

,0.

25◦ C

37◦ C

As

estr

utur

asse

cund

ária

ses

tão

repr

esen

tada

sda

segu

inte

form

a:H

élic

es-a

mar

elo,

Folh

as-v

erm

elho

eVo

ltas

-bra

nco

97

Para verificar possíveis alterações conformacionais no esqueleto peptídico das en-

zimas ao longo do tempo, foram calculados os desvios médios quadráticos (RMSD), de

acordo com a Eq. (1.1), do esqueleto peptídico da papaína (9PAP), cruzipaína 1 (1ME4)

e cruzipaína 2 (1ME4m), em relação a conformação originalmente apresentada no cris-

tal/modelo. Desvios de 2,0-3,0 A no esqueleto peptídico, em relação a estrutura inicial,

são considerados normais (Smith et al, 2005). Desta forma, os resultados apresentados

na Tab. 4.7 e na Tab. 4.8 mostram que não houve alteração significativa na estrutura

global de nenhuma das três proteínas estudadas, em particular para os resíduos que

constituem os subsítios e o sítio catalítico (resíduos descritos na Tab. 3.10).

Tabela 4.7: RMSD médio (em A) do esqueleto peptídico da papaína (9PAP) e cruzipaínas 1 (1ME4)e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, em relação a estrutura originalapresentada no cristal/modelo.

Proteína 25◦C 37◦C9PAP 1, 21± 0, 12 1, 36± 0, 241ME4 1, 21± 0, 36 1, 14± 0, 291ME4m 1, 16± 0, 12 1, 52± 0, 29

Tabela 4.8: RMSD médio (em A) do esqueleto peptídico dos subsítios e tríade catalítica da papaína(9PAP) e cruzipaínas 1 (1ME4) e 2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, emrelação a estrutura original apresentada no cristal/modelo.

Sítios 9PAP 1ME4 1ME4m25◦C 37◦C 25◦C 37◦C 25◦C 37◦C

S2′ 0, 88± 0, 37 1, 40± 0, 42 0, 85± 0, 18 0, 53± 0, 21 0, 55± 0, 15 0, 91± 0, 16S1′ 1, 39± 0, 37 2, 28± 0, 75 1, 18± 0, 41 1, 42± 0, 40 1, 09± 0, 36 2, 19± 0, 60S1 1, 25± 0, 51 1, 07± 0, 29 1, 16± 0, 58 0, 72± 0, 28 0, 96± 0, 22 1, 14± 0, 23S2 1, 20± 0, 29 1, 07± 0, 39 1, 29± 0, 53 1, 57± 0, 52 1, 48± 0, 38 1, 13± 0, 19S3 1, 03± 0, 30 1, 35± 0, 38 1, 23± 0, 46 0, 75± 0, 26 1, 21± 0, 36 0, 96± 0, 59Catalítico 0, 55± 0, 09 0, 53± 0, 18 0, 89± 0, 21 0, 82± 0, 34 0, 55± 0, 10 0, 77± 0, 29

As flutuações, em torno da média (RMSF), dos Cα da papaína e cruzipaína 2,

permaneceram dentro dos valores considerados normais (até 2,0-3,0 A), não havendo

variações significativas entre as duas temperaturas simuladas. No entanto, para a cruzi-

paína 1 observou-se uma flutuação significativa nos resíduos 58 a 61, para a temperatura

de 25◦C. Os resíduos 60 e 61 constituem o subsítio catalítico S3, o qual apesar de apre-

sentar ao longo da DM uma conformação peptídica média bem próxima da descrita pela

estrutura cristalográfica, seus carbonos-α apresentaram altas flutuações ao longo de 10

ns de simulação a 25◦C.

98

Figura 4.8: RMSF (em nanômetros) dos carbonos-α da papaína (9PAP) e cruzipaínas 1 (1ME4) e2 (1ME4m), ao longo de 10 ns de simulação de dinâmica molecular, em relação a estrutura originalapresentada no cristal/modelo.

(a) RMSF dos Cα da papaína (9PAP): diferença entre as temperaturas de 37◦C e 25◦C

(b) RMSF dos Cα da cruzipaína 1 (1ME4): diferença entre as temperaturas de 37◦C e 25◦C

(c) RMSF dos Cα da cruzipaína 2 (1ME4m): diferença entre as temperaturas de 37◦C e 25◦C

99

Para a análise de possíveis alterações na interface dielétrica proteína/solvente, foi

realizado o estudo da superfície acessível ao solvente (SAS) dos resíduos protéicos das

enzimas papaína e cruzipaínas 1 e 2. Considerando-se como raio da sonda o valor de 1,4

A, variações na SAS são consideradas significativas quando são observadas flutuações

de 24 A2, área referente a superfície de contato de van der Waals de uma molécula de

água (Lu et al, 2007).

De acordo com estudos experimentais, a cruzipaína 1 tende a diminuir sua in-

tensidade de fluorescência quando incubada a 37◦C, sugerindo alterações na sua con-

formação terciária, o que levaria a uma menor exposição ao solvente de seus resíduos

aromáticos (dos Reis, 2005). Para a verificação de possíveis alterações na conformação

terciária das enzimas em estudo, foram monitoradas as médias e desvios padrões da SAS

de todos os seus resíduos de triptofano (TRP), apresentados na Tab. 4.9 e na Tab. 4.10.

Na papaína, apesar da tendência de diminuição na exposição dos resíduos de TRP

ao solvente, estas alterações não foram consideradas significativas, exceto pelo resíduo

TRP181 que tende a diminuir sua exposição ao solente a 37◦C. Este comportamento

persistiu no último nanossegundo de simulação.

Na cruzipaína 1, observou-se uma diminuição na exposição dos resíduos de TRP

ao solvente, com destaque para o TRP74 ao longo da simulação a 37◦C. A diminuição

da SAS dos triptofanos é bem expressiva nas duas temperaturas quando comparadas a

SAS apresentada pela estrutura cristalográfica desta enzima. É importante notar que

apesar da estrutura cristalográfica 1ME4 apresentar-se acomplada ao inibidor T10, as

simulações feitas neste trabalho desconsideraram a presença do inibidor.

Na cruzipaína 2, apesar do valor da SAS total dos resíduos de TRP não apresentar

uma diminuição significativa a 37◦C, pôde-se verificar uma diminuição expressiva na

SAS do TRP144, que é compensada pelo aumento significativo da SAS do TRP184,

resíduo pertencente ao subsítio catalítico S1′. Estas alterações são mais relevantes no

10◦ ns de DM, apesar do valor da SAS total passar a apresentar um aumento não signifi-

cativo a 37◦C. Observou-se, também, um aumento significativo na SAS total em ambas

as temperaturas simuladas, em relação ao valor apresentado pelo modelo.

100

Tabe

la4.

9:Su

perf

ície

aces

síve

lao

solv

ente

(áre

aem

A2)

dos

trip

tofa

nos

dapa

paín

a(9

PAP)

ecr

uzip

aína

s1

(1M

E4)

e2

(1M

E4m

),ao

long

ode

10ns

desi

mul

ação

dedi

nâm

ica

mol

ecul

ar.

9PA

P1M

E4

1ME

4mT

RP

Cri

stal

25◦ C

37◦ C

TR

PC

rist

al25

◦ C37

◦ CT

RP

Mod

elo

25◦ C

37◦ C

734

6,88

336,

02±

0,31

333,

81±

0,37

734

1,50

326,

93±

0,47

327,

49±

0,40

734

7,97

338,

42±

0,77

338,

51±

0,31

2610

7,72

113,

72±

0,78

114,

83±

0,67

2693,0

587,0

7±

0,89

80,7

4±

1,13

2610

1,37

95,7

3±

0,66

89,9

2±

0,93

-−

−−

3835

3,37

341,

21±

0,34

341,

87±

0,34

3834

2,30

339,

99±

0,51

339,

77±

0,34

6921

0,03

221,

72±

0,69

214,

71±

0,76

7432

1,47

317,

93±

1,70

301,

43±

1,41

7432

5,97

307,

33±

0,69

311,

30±

0,51

-−

−−

128

346,

3832

2,84±

2,18

322,

59±

2,48

-−

−-

−−

−14

415

7,01

139,

30±

0,49

142,

62±

0,49

144

137,

1819

9,69±

1,66

170,

13±

1,07

-−

−−

178

358,

9833

9,01±

0,61

340,

54±

0,46

178

350,

5433

8,28±

0,59

331,

85±

0,89

177‡

106,

3880,2

3±

1,30

83,6

6±

3,03

184‡

109,

9510

0,49±

1,97

99,2

1±

1,65

184‡

96,7

286,2

6±

1,07

121,

90±

3,58

181

203,

5821

9,82±

1,21

207,

26±

1,21

188

199,

7219

1,86±

1,62

201,

69±

1,38

188

193,

3418

6,89±

0,94

190,

45±

0,94

Tota

l97

4,59

971,

51±

18,3

195

4,26±

25,4

4To

tal

2281,4

321

66,6

5±

35,0

521

58,1

8±

28,1

6To

tal

1895,3

919

68,0

6±

32,2

219

59,2

4±

38,2

6‡ T

ript

ofan

oco

nstit

uint

edo

subs

ítioS

1′

Alte

raçõ

esna

SAS

são

cons

ider

adas

sign

ifica

tivas

quan

dooc

orre

mflu

tuaç

ões

de24A

2,á

rea

refe

rent

ea

supe

rfíc

iede

cont

ato

deva

nde

rWaa

lsde

uma

mol

écul

ade

água

(Lu

etal

,20

07).

Tabe

la4.

10:S

uper

fíci

eac

essí

vela

oso

lven

te(á

rea

emA

2)d

ostr

ipto

fano

sda

papa

ína

(9PA

P)e

cruz

ipaí

nas

1(1

ME

4)e

2(1

ME

4m),

no10

◦ns

desi

mul

ação

dedi

nâm

ica

mol

ecul

ar.

9PA

P1M

E4

1ME

4mT

RP

Cri

stal

25◦ C

37◦ C

TR

PC

rist

al25

◦ C37

◦ CT

RP

Mod

elo

25◦ C

37◦ C

734

6,88

337,

44±

1,09

332,

55±

0,93

734

1,50

327,

76±

1,14

327,

13±

1,80

734

7,97

340,

54±

1,06

339,

26±

1,10

2610

7,72

112,

44±

1,30

115,

51±

1,42

2693,0

586,2

1±

1,38

78,5

5±

1,07

2610

1,37

96,8

3±

1,34

87,9

4±

1,43

-−

−−

3835

3,37

342,

64±

0,98

342,

32±

0,93

3834

2,30

341,

37±

0,56

339,

16±

0,68

6921

0,03

224,

63±

1,62

211,

26±

2,09

7432

1,47

319,

39±

1,76

286,

20±

1,40

7432

5,97

309,

15±

2,02

313,

84±

1,48

-−

−−

128

346,

3832

2,28±

1,47

323,

41±

1,19

-−

−−

-−

−−

144

157,

0113

8,38±

2,36

145,

66±

1,46

144

137,

1821

0,34±

2,06

167,

80±

1,36

-−

−−

178

358,

9833

7,15±

1,00

340,

97±

1,84

178

350,

5433

9,99±

0,93

338,

30±

1,05

177‡

106,

3883,5

7±

1,70

99,5

0±

2,11

184‡

109,

9595,7

0±

2,72

95,6

7±

3,24

184‡

96,7

289,1

7±

1,86

157,

97±

2,45

181

203,

5822

3,86±

1,48

210,

42±

1,86

188

199,

7219

0,21±

1,53

199,

75±

2,35

188

193,

3418

5,87±

1,21

181,

62±

1,41

Tota

l97

4,59

981,

92±

14,0

296

9,33±

17,7

3To

tal

2281,4

321

59,6

9±

20,9

821

39,7

3±

26,7

3To

tal

1895,3

919

75,1

1±

22,1

819

93,8

8±

21,7

8‡ T

ript

ofan

oco

nstit

uint

edo

subs

ítioS

1′

Alte

raçõ

esna

SAS

são

cons

ider

adas

sign

ifica

tivas

quan

dooc

orre

mflu

tuaç

ões

de24A

2,á

rea

refe

rent

ea

supe

rfíc

iede

cont

ato

deva

nde

rWaa

lsde

uma

mol

écul

ade

água

(Lu

etal

,20

07).

101

Para a avaliação da região catalítica, foram monitoradas as médias e os desvios

padrões da SAS dos resíduos que compõem os subsítios e o sítio catalítico durante os 10

ns de simulação (Tab. 4.11) e em maiores detalhes no último nanosegundo (Tab. 4.12).

A análise dos resultados mostram que:

(i) A região catalítica da papaína se expõe menos ao solvente a 37◦C, sendo a al-

teração mais significativa apresentada pelo subsítio S2, subsítio caracterizado

pela especificidade enzimática em cisteíno proteases. Em relação a SAS apre-

sentada pela estrutura cristalográfica (PDB: 9PAP), observou-se um aumento

da exposição ao solvente do subsítio S3 em ambas as temperatura testadas,

enquanto o subsítio S1 tende a uma diminuição. O subsítio S2 e o sítio cata-

lítico apresentaram comportamentos diferenciados entre as duas temperaturas,

aumentando a SAS a 25◦C e diminuindo a 37◦C, em relação ao cristal. Es-

tes perfis de exposição ao solvente dos subsítios S1, S2 e S3 tornam-se mais

expressivos no último nanossegundo de simulação, enquanto a SAS do sítio

catalítico tende a assemelhar-se com a apresentada pelo cristal.

(ii) Assim como na papaína, a cruzipaína 1 expõe menos a sua região catalítica

ao solvente quando simulada a 37◦C, sendo as alterações mais significativas

apresentadas pelos subsítios S1 e S3. No entanto, o subsítio S2 apresenta uma

tendência de aumento da sua SAS. Quando comparados com a SAS apresentada

pela estrutura cristalográfica (PDB: 1ME4), a região catalítica tende a diminuir

sua exposição ao solvente em ambas temperaturas testadas, destacando-se o

subsítio S2, possivelmente, pelo caráter hidrofóbico de seus resíduos (Tab. 3.10).

Porém, observou-se um aumento da SAS do sítio catalítico e do subsítio S3, a

25◦C, em relação ao cristal. Todas as alterações observadas na SAS apresenta-

ram-se mais significativas durante o 10◦ ns de DM.

102

(iii) Ao contrário da papaína e da cruzipaína 1, a cruzipaína 2 apresenta um aumento

da SAS da região catalítica quando simulada a 37◦C, exceto pela tendência de

menor exposição ao solvente do subsítio S2 e do sítio catalítico. É importante

notar que apesar do subsítio S2 da cruzipaína 2 tender a uma diminuição da

SAS ao longo da simulação a 37◦C, como apresentada pela papaína, no último

nanosegundo ocorre uma inversão neste comportamento havendo um aumento

da sua SAS, semelhante à cruzipaína 1. Ao comparar as médias da SAS da re-

gião catalítica da cruzipaína 2 com o valor apresentado pelo modelo, observou-

se uma tendência de diminuição da SAS em ambas as temperaturas simuladas,

com exceção ao subsítio S3 que teve um aumento da SAS a 37◦C.

103

Tabe

la4.

11:S

uper

fíci

eac

essí

vela

oso

lven

te(á

rea

emA

2)d

ossu

bsíti

ose

tría

deca

talít

ica

dapa

paín

a(9

PAP)

ecr

uzip

aína

s1

(1M

E4)

e2

(1M

E4m

),ao

long

ode

10ns

desi

mul

ação

dedi

nâm

ica

mol

ecul

ar.

Sítio

s9P

AP

1ME

41M

E4m

Cri

stal

25◦ C

37◦ C

Cri

stal

25◦ C

37◦ C

Mod

elo

25◦ C

37◦ C

S2′

227,

7524

6,82±

11,2

122

9,07±

15,0

123

5,07

230,

36±

11,3

023

1,45±

11,0

524

7,10

215,

89±

9,43

217,

66±

13,1

3S

1′52

4,25

523,

23±

23,7

549

3,13±

32,7

553

7,50

460,

00±

30,7

844

5,64±

31,0

051

5,91

440,

65±

19,4

248

8,40±

25,0

9S

125

6,80

248,

40±

24,4

420

5,60±

25,5

523

9,79

252,

09±

27,2

518

9,05±

18,7

221

1,11

180,

66±

13,5

720

5,32±

15,9

4S

255

7,79

580,

12±

46,7

953

2,99±

46,6

573

3,62

672,

60±

47,6

068

6,39±

33,4

471

7,54

711,

46±

44,3

565

7,64±

24,2

6S

320

9,67

270,

12±

26,6

625

1,33±

16,5

817

9,49

303,

26±

54,7

118

7,18±

10,7

618

4,99

178,

71±

10,7

920

7,24±

17,3

7C

atal

ítico

170,

7818

2,79±

9,85

157,

76±

11,8

514

6,72

173,

88±

16,0

815

6,12±

11,3

214

8,36

150,

86±

12,9

613

8,31±

14,0

9

Alte

raçõ

esna

SAS

são

cons

ider

adas

sign

ifica

tivas

quan

dooc

orre

mflu

tuaç

ões

de24A

2,á

rea

refe

rent

ea

supe

rfíc

iede

cont

ato

deva

nde

rWaa

lsde

uma

mol

écul

ade

água

(Lu

etal

,20

07).

Tabe

la4.

12:

Supe

rfíc

ieac

essí

vela

oso

lven

te(á

rea

emA

2)

dos

subs

ítios

etr

íade

cata

lític

ada

papa

ína

(9PA

P)e

cruz

ipaí

nas

1(1

ME

4)e

2(1

ME

4m),

no10

◦ns

desi

mul

ação

dedi

nâm

ica

mol

ecul

ar.

Sítio

s9P

AP

1ME

41M

E4m

Cri

stal

25◦ C

37◦ C

Cri

stal

25◦ C

37◦ C

Mod

elo

25◦ C

37◦ C

S2′

227,

7525

1,25±

8,51

233,

60±

10,3

323

5,07

233,

02±

9,48

230,

24±

9,90

247,

1021

1,01±

9,64

212,

81±

11,0

3S

1′52

4,25

505,

73±

28,4

449

5,56±

24,5

553

7,50

447,

24±

16,0

442

2,92±

16,2

451

5,91

435,

27±

17,7

550

8,15±

26,0

8S

125

6,80

240,

26±

10,6

319

0,91±

17,1

623

9,79

271,

19±

13,4

417

6,45±

8,85

211,

1117

1,62±

14,8

721

5,49±

11,3

2S

255

7,79

649,

77±

18,8

450

1,03±

21,8

673

3,62

640,

92±

14,3

365

9,33±

17,9

171

7,54

625,

63±

15,5

566

9,14±

22,3

4S

320

9,67

300,

91±

9,50

257,

24±

10,2

517

9,49

348,

66±

14,3

519

0,83±

14,5

418

4,99

178,

46±

9,53

219,

85±

8,52

Cat

alíti

co17

0,78

175,

82±

9,22

153,

97±

9,24

146,

7217

4,95±

8,97

155,

49±

8,10

148,

3615

6,61±

7,30

132,

67±

11,9

2

Alte

raçõ

esna

SAS

são

cons

ider

adas

sign

ifica

tivas

quan

dooc

orre

mflu

tuaç

ões

de24A

2,á

rea

refe

rent

ea

supe

rfíc

iede

cont

ato

deva

nde

rWaa

lsde

uma

mol

écul

ade

água

(Lu

etal

,20

07).

104

Para a visualização e comparação destas alterações estruturais na região catalítica

da papaína (9PAP), cruzipaína 1 (1ME4) e cruzipaína 2 (1ME4m), em função da tempe-

ratura, foram determinadas as conformações preferencias de cada enzima, tomando-se

diferentes valores de RMSD (1,0-2,0 A) como critério de decisão para o agrupamento.

O número de conformações preferenciais para cada valor de RMSD aplicado, pode ser

observado na Tab 4.13.

Tabela 4.13: Número de grupos de conformações representativas da papaína (9PAP) e cruzipaínas1 (1ME4) e 2 (1ME4m), usando diferentes pontos de corte de RMSD (em A), ao longo de 10 ns desimulação de dinâmica molecular.

RMSD 9PAP 1ME4 1ME4m(cortes) 25◦C 37◦C 25◦C 37◦C 25◦C 37◦C1.00 212 332 157 216 171 2741.25 42 63 21 35 23 571.50 10 21 5 8 5 151.75 3 5 3 3 2 62.00 1 2 1 1 1 2

A representação estrutural da SAS das conformações preferencias obtidas com

RMSD = 1,75 A, estão representadas na Fig. 4.9 para a papaína (9PAP), na Fig. 4.10

para a cruzipaína 1 (1ME4) e na Fig. 4.11 para a cruzipaína 2 (1ME4m).

105

Figura 4.9: Grupo de conformações representativas de papaína (9PAP) usando como ponto de corteRMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular.

25◦C 37◦C

Os sítios estão representados da seguinte forma: S2′ - azul, S1′ - rosa, S1 - vermelho, S2 - verde, S3 -amarelo e Catalítico - laranja.

106

Figura 4.10: Grupo de conformações representativas de cruzipaína 1 (1ME4) usando como ponto decorte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular.

25◦C 37◦C


107

Figura 4.11: Grupo de conformações representativas de cruzipaína 2 (1ME4m) usando como ponto decorte RMSD =1,75 A, ao longo de 10 ns de simulação de dinâmica molecular.

25◦C 37◦C


108

25◦C 37◦C


109

A análise das propriedades eletrostáticas no sítio catalítico da cruzipaína (Dar-

denne, 2000) mostrou que a atividade catalítica desta enzima está particularmente li-

gada a formação e estabilização do par iônico CYS25− · · ·HIS162+, como apresentado

pela papaína (Dardenne et al, 2003). Resíduos situados a uma distância de até 5 A

em relação a porção sulfidrila (SG) da CYS25 e da porção imidazol (ND1) da HIS162,

são responsáveis pela formação de um campo elétrico intenso e alinhado na direção

SG−ND1 (Dardenne et al, 2003). Desta forma, alterações estruturais na região ca-

talítica das cisteíno proteases podem levar a uma desestabilização da formação do par

iônico.

Para a análise da manutenção do par iônico responsável pela atividade catalítica

destas enzimas, foram monitorados os posicionamentos das cadeias laterais dos seguin-

tes resíduos: (i) papaína: CYS25, ASP158 e HIS159; (ii) cruzipaína 1: CYS25, ASP161

e HIS162; (iii) cruzipaína 2: CYS25, SER161 e HIS162. Os resultados apresentados na

Fig. 4.12 mostram que:

(i) Papaína: a 37◦C ocorreu um "dobramento” no anel imidazol da HIS159 que,

apesar de alterar a organização estrutural da região catalítica, não levou a deses-

tabilização do par iônico. Este fenômeno de "dobramento"não foi observado a

25◦C.

(ii) Cruzipaína 1: em ambas as temperaturas simuladas, ocorreu este fenômeno de

"dobramento” do anel imidazol da HIS162, sem o enfraquecimento da intera-

ção eletrostática CYS25− · · ·HIS162+. No entanto, pôde-se notar que a 37◦C,

houve também uma rotação de 180◦ no anel imidazol, sugerindo uma momen-

tânea desestabilização do par iônico.

(iii) Cruzipaína 2: ao contrário da papaína e da cruzipaína 1, a estrutura do par

iônico da cruzipaína 2 manteve-se estável ao longo de toda a simulação de

DM, em ambas as temperaturas testadas.

110

Figu

ra4.

12:

Con

form

açõe

sas

sum

idas

pelo

sre

sídu

osda

papa

ína

(9PA

P)e

das

cruz

ipaí

nas

1(1

ME

4)e

2(1

ME

4m),

emre

laçã

oao

sse

uscr

ista

ise

mod

elo,

aolo

ngo

de10

nsde

sim

ulaç

ãode

dinâ

mic

am

olec

ular

.

9PA

P1M

E4

1ME

4mC

YS2

5/A

SP15

8/H

IS15

9C

YS2

5/A

SP16

1/H

IS16

2C

YS2

5/SE

R16

1/H

IS16

2

0ns

1ns

2ns

Os

cris

tais

dacr

uzip

aína

1(1

ME

4.pd

b)e

dapa

paín

a(9

PAP.

pdb)

,bem

com

oo

mod

elo

dacr

uzip

aína

2(1

ME

4m.p

db),

estã

ore

pres

enta

dos

emve

rde.

As

conf

orm

açõe

sas

sum

idas

a25

◦ Ce

a37

◦ Ces

tão

repr

esen

tada

spe

las

core

saz

ule

verm

elha

,res

pect

ivam

ente

.

111

9PA

P1M

E4

1ME

4mC

YS2

5/A

SP15

8/H

IS15

9C

YS2

5/A

SP16

1/H

IS16

2C

YS2

5/SE

R16

1/H

IS16

2

3ns

4ns

5ns

Os

cris

tais

dacr

uzip

aína

1(1

ME

4.pd

b)e

dapa

paín

a(9

PAP.

pdb)

,bem

com

oo

mod

elo

dacr

uzip

aína

2(1

ME

4m.p

db),

estã

ore

pres

enta

dos

emve

rde.

As

conf

orm

açõe

sas

sum

idas

a25

◦ Ce

a37

◦ Ces

tão

repr

esen

tada

spe

las

core

saz

ule

verm

elha

,res

pect

ivam

ente

.

112

9PA

P1M

E4

1ME

4mC

YS2

5/A

SP15

8/H

IS15

9C

YS2

5/A

SP16

1/H

IS16

2C

YS2

5/SE

R16

1/H

IS16

2

6ns

7ns

8ns

Os

cris

tais

dacr

uzip

aína

1(1

ME

4.pd

b)e

dapa

paín

a(9

PAP.

pdb)

,bem

com

oo

mod

elo

dacr

uzip

aína

2(1

ME

4m.p

db),

estã

ore

pres

enta

dos

emve

rde.

As

conf

orm

açõe

sas

sum

idas

a25

◦ Ce

a37

◦ Ces

tão

repr

esen

tada

spe

las

core

saz

ule

verm

elha

,res

pect

ivam

ente

.

113

9PA

P1M

E4

1ME

4mC

YS2

5/A

SP15

8/H

IS15

9C

YS2

5/A

SP16

1/H

IS16

2C

YS2

5/SE

R16

1/H

IS16

2

9ns

10ns

Os

cris

tais

dacr

uzip

aína

1(1

ME

4.pd

b)e

dapa

paín

a(9

PAP.

pdb)

,bem

com

oo

mod

elo

dacr

uzip

aína

2(1

ME

4m.p

db),

estã

ore

pres

enta

dos

emve

rde.

As

conf

orm

açõe

sas

sum

idas

a25

◦ Ce

a37

◦ Ces

tão

repr

esen

tada

spe

las

core

saz

ule

verm

elha

,res

pect

ivam

ente

.

114

Para uma análise mais detalhada desta mudança conformacional no sítio catalí-

tico, calculou-se a distância (em A) entre as cadeias laterais dos seguintes resíduos:

(i) papaína: CYS25, ASP158, HIS159 e ASN175; (ii) cruzipaína 1: CYS25, ASP161,

HIS162 e ASN182; (iii) cruzipaína 2: CYS25, SER161, HIS162 e ASN182. Os resul-

tados apresentados na Fig. 4.13 mostram que:

(i) Papaína: a 37◦C ocorreu o rompimento da ligação de hidrogênio HIS159:NE2

· · ·ASN175:OD1, permitindo a interação HIS159:NE2→ASP158:OD2, pro-

movendo o "dobramento” do anel imidazol da HIS159. Este evento favoreceu

a entrada de uma molécula de água na região catalítica, que estabeleceu uma

ligação de hidrogênio com a ASN175:OD1.

(ii) Cruzipaína 1: semelhante ao ocorrido na papaína, o rompimento da ligação de

hidrogênio HIS162:NE2· · ·ASN182:OD1 gerou uma reestruturação da tríade

catalítica, em ambas as temperaturas simuladas. No entanto, pôde-se notar

que a 37◦C, houve também uma rotação de 180◦ no anel imidazol, sugerindo

uma desestabilização momentânea na formação do par iônico, com posterior

restabelecimento através da interação CYS25:SG−HIS162:NE2 e da ligação

de hidrogênio HIS159:ND1· · ·ASP158:OD2.

(iii) Cruzipaína 2: as interações formadas entre os resíduos da tríade catalítica per-

maneceram estáveis tanto em 25◦C quanto em 37◦C, mantendo-se a organiza-

ção estrutural do sítio catalítico.

115

Figu

ra4.

13:D

istâ

ncia

sen

tre

osre

sídu

osdo

ssí

tios

cata

lític

osda

papa

ína

(9PA

P)e

das

cruz

ipaí

nas

1(1

ME

4)e

2(1

ME

4m),

no10

◦ns

desi

mul

ação

dedi

nâm

ica

mol

ecul

ar.

cris

tal/

mod

elo

25◦ C

37◦ C

9PA

P

1ME

4

1ME

4m

As

dist

ânci

asap

rese

ntad

asfo

ram

med

idas

emA

ngst

röm

s(A

).A

ság

uas

fora

mse

leci

onad

asco

mcr

itéri

ode

5,0A

dedi

stân

cia

emre

laçã

oa

ASP

158:

O/A

SP16

1:O

,ASN

175:

O/A

SN18

2:O

eA

SN17

5:O

D1/

ASN

182:

OD

1.

116

Capítulo 5

Conclusões e Perspectivas

O objetivo geral deste trabalho foi aplicar técnicas de bioinformática e modela-

gem computacional ao conjunto de seqüências protéicas preditas a partir de seqüências

genômicas de Trypanosoma cruzi (El-Sayed et al, 2005), visando inicialmente a cons-

trução de modelos protéicos tridimensionais a serem analisados por abordagens enzi-

máticas/evolutivas, com o intuito de identificar alvos moleculares para o tratamento da

doença de Chagas, dentro do contexto de desenho racional de fármacos baseado em es-

trutura. Além disto, objetivou-se estudar o comportamento dinâmico de alguns deste

alvos moleculares, no caso, as cisteíno proteases cruzipaína 1 e cruzipaína 2.

A partir dos objetivos específicos propostos neste trabalho podemos chegar às

seguintes conclusões:

(1) Modelos 3D de T. cruzi e suas classificações enzimáticas: De acordo com o

protocolo estabelecido ao MHOLline, foi possível obter 2.786 modelos estru-

turais protéicos, não redundantes, usando o conjunto de seqüências protéicas

preditas a partir de 25.041 CDS (Seqüência Codificante). O MHOLline tam-

bém foi capaz de identificar 4.719 seqüências que podem estar associadas a

proteínas de membrana.

Através do ECNGet, ferramenta desenvolvida neste trabalho, foi possível as-

sociar automaticamente uma classificação enzimática a 1.876 proteínas de T.

cruzi. Destes modelos, aproximadamente 74% coincidiram com a anotação

genômica de suas seqüências alvos, valor este considerado significativo para

117

a automação de processos classificatórios. Cerca de 12% dos modelos que

foram classificados enzimaticamente apresentaram seqüências alvos original-

mente anotadas como hipotéticas. Através deste resultado pode-se sugerir a

aplicação do MHOLline não somente para a construção de modelos protéicos

tridimensionais mas, também, como ferramenta para a reanotação de seqüên-

cias. Outro resultado que aponta para esta mesma conclusão é o fato de 14%

dos modelos apresentarem perfil enzimático discordante da anotação genômica

de suas seqüências alvos.

Quanto a qualidade dos modelos de enzimas gerados, cerca de 9,5% podem

ser “diretamente” aplicados em estudos de mecanismos catalíticos e no dese-

nho racional de fármacos baseado em estruturas, 34,5% podem ser usados em

estudos de docking receptor-ligante, 35,5% podem ter seus modelos refinados

e também aplicados em estudos de docking, e cerca de 20,5% podem ser ao

menos usados para inferir funções a seqüências protéicas a partir de análises de

alinhamentos estruturais.

(2) Relações de similaridade entre as enzimas de T. cruzi e enzimas humanas (Homo

sapiens): Para este propósito, foi aplicada a ferramenta AnEnπ que classificou

99 seqüências de T. cruzi como possíveis análogas a enzimas humanas, 1.776

como similares e 10 seqüências consideradas como possivelmente específicas

de T. cruzi em relação a humanos. Estes resultados indicam que o AnEnπ,

quando acoplado ao MHOLline, pode ser uma boa ferramenta a ser aplicada na

detecção de enzimas de interesse para estudos de desenho racional de fármacos

baseado em estrutura.

Por trabalhar com o banco de dados do KEGG, o AnEnπ também é capaz de

indicar quais enzimas estão associadas a uma via metabólica já descrita, de

forma a auxiliar estudos computacionais de mecanismos enzimáticos (e.g doc-

king receptor-ligante). Das 39 classificações enzimáticas detectadas neste tra-

balho, associadas a proteínas preditas a partir do genoma de T. cruzi, 26 classi-

ficações (abrangendo 1185 modelos) estão associadas a alguma via metabólica

118

descrita no KEGG, e dentro das 13 classificações associadas a uma via me-

tabólica não descrita (compreendendo 691 modelos enzimáticos de T. cruzi),

identificou-se algumas enzimas já caracterizadas como alvos moleculares de

interesse no combate à doença de Chagas (e. g. cruzipaína - EC: 3.4.22.51).

A partir desta primeira lista de possíveis alvos moleculares de T. cruzi, devem

ser feitos estudos mais detalhados dos modelos classificados como sendo ao

menos de boa qualidade e que sejam integrantes de alguma via metabólica des-

crita, verificando-se a sua importância biológica para o parasita, qual o número

de isoformas detectáveis, se existem possíveis vias enzimáticas alternativas, se

existem dados experimentais indicando sua eficiência catalítica a diferentes ini-

bidores, e demais informações que possam auxiliar no estudo das propriedades

físico-químicas de sua região catalítica.

Nos alvos moleculares descritos da Tab. 1.1 e cujas similaridades e possíveis

analogias com enzimas humanas foram apresentadas na Tab. 4.5, deve ser reali-

zada uma análise comparativa detalhada de suas regiões catalíticas, verificando-

se possíveis similaridades e diferenças de propriedades físico-químicas que su-

giram aspectos relevantes a serem explorados no desenvolvimento de inibido-

res específicos. Destes alvos, vale a pena destacar a enzima NADH-fumarato

redutase que foi classificada como possivelmente análoga a enzimas humanas.

Através destes estudos é possível se obter uma lista de potenciais alvos molecu-

lares de T. cruzi que possam ser cruzados contra bancos de ligantes ou aplicados

em estudos de desenho racional de fármacos baseado em estrutura, auxiliando

nos estudos experimentais de fármacos para o combate da doença de Chagas.

(3) Dinâmicas moleculares da papaína e das cruzipaínas 1 e 2: As simulações

de dinâmica molecular das estruturas da papaína (9PAP) e da cruzipaína 1

(1ME4), bem como do modelo estrutural da cruzipaína 2 (1ME4m), foram

feitas simulando-se as temperaturas encontradas no vetor invertebrado (25◦C

= 298K) e no hospedeiro vertebrado (37◦C = 310K) de T. cruzi. Os resultados

119

obtidos mostram que estas três cisteíno proteases tendem a manter estáveis as

suas estruturas secundárias bem como a organização de seu esqueleto peptídico.

Resultados experimentais realizados com a cruzipaína 1 nas temperaturas de

25◦C e 37◦C, sugerem que esta enzima tenda a diminuir sua porcentagem de

estruturas secundárias e a diminuir sua intensidade de fluorescência quando

incubada a 37◦C, sugerindo alterações, também, na sua conformação terciá-

ria (dos Reis, 2005). A análise da superfície acessível ao solvente (SAS) dos

resíduos de TRP da papaína e das cruzipaínas 1 e 2, mostra que os resíduos de

triptofano da papaína e da cruzipaína 1 tendem a diminuir sua exposição ao sol-

vente, quando simuladas em temperatura de 37◦C, sendo o resíduo TRP74 da

cruzipaína 1 o que apresentou uma redução mais significativa. Na cruzipaína

2, apesar de não se observar nenhuma alteração significativa na SAS, entre as

duas temperaturas testadas, a análise detalhada de cada um de seus resíduos de

TRP mostra que a 37◦C há um aumento significativo na SAS do TRP144, que

é compensado pela diminuição expressiva da SAS do TRP184 (resíduo perten-

cente ao subsítio catalítico S1′).

Nas análises da SAS dos resíduos pertencentes aos subsítios e ao sítio catalí-

tico, observou-se que a região do sítio ativo da papaína tende a ficar menos ex-

posta ao solvente a 37◦C, sendo a alteração mais significativa apresentada pelo

subsítio S2, o qual é responsável pela especificidade enzimática em cisteíno

proteases. Embora a cruzipaína 1 tenha apresentado comportamento global se-

melhante ao da papaína, observou-se uma tendência de aumento na SAS do

subsítio S2. Na cruzipaína 2 verificou-se um aumento da SAS da região cata-

lítica a 37◦C, com o subsítio S2 tendendo a uma menor exposição ao solvente,

como apresentado pela papaína. É importante notar que apesar do subsítio S2

da cruzipaína 2 tender a uma diminuição da SAS ao longo da simulação a 37◦C,

no último nanosegundo ocorreu uma inversão neste comportamento de forma a

haver um aumento da sua SAS, similar ao apresentado pela cruzipaína 1.

De acordo com a análise estrutural realizada neste trabalho, não foram obser-

120

vadas alterações em demais regiões da proteína, além das associadas a região

do sítio ativo, não sendo possível observar a existência de um sítio alostérico

em cruzipaína. Porém, a não observação deste sítio pode estar associada ao

pouco tempo de simulação computacional realizado (escala em nanosegundos

= 10−9), se comparado com o tempo aplicado em estudos experimentais (es-

cala em microssegundos = 10−6), ou ao fato das simulações de DM terem sido

realizadas sem considerar a presença de inibidores.

De acordo com Dardenne et al (2003), as análises das propriedades eletros-

táticas no sítio catalítico de cisteíno proteases, mostram que resíduos situa-

dos a uma distância de até 5 A em relação a porção CYS25:SG e a porção

HIS159:ND1 (numeração da papaína), são responsáveis pela formação de um

campo elétrico intenso e alinhado na direção SG−ND1. Portanto, alterações

estruturais na região catalítica das cisteíno proteases podem levar a uma de-

sestabilização da formação do par iônico. Neste trabalho, foi feita a análise da

manutenção do par iônico responsável pela atividade catalítica das cisteíno pro-

teases, monitorando-se os posicionamentos e distâncias entre as cadeias laterais

dos seguintes resíduos: (i) papaína: CYS25, ASP158, HIS159 e ASN175; (ii)

cruzipaína 1: CYS25, ASP161, HIS162 e ASN182; (iii) cruzipaína 2: CYS25,

SER161, HIS162 e ASN182.

Foram observadas alterações importantes na organização estrutural dos resí-

duos CYS25, HIS159 e ASN175 pertencentes a tríade catalítica e ao resíduo

situado na posição 158, de acordo com a numeração da papaína.

Na papaína, ocorreu um "dobramento” no anel imidazol da HIS159 quando si-

mulada a 37◦C. Este evento deve-se ao rompimento da ligação de hidrogênio

HIS159:NE2· · ·ASN175:OD1, permitindo a interação HIS159:NE2 · · · ASP

158:OD2, com a formação de uma ligação de hidrogênio. Esta alteração con-

formacional favorece a entrada de uma molécula de água na região catalítica,

estabelecendo uma ligação de hidrogênio com a ASN175:OD1. Apesar de al-

terar a organização estrutural da região catalítica, este evento não promove a

121

desestabilização do par iônico.

Na cruzipaína 1, este fenômeno de "dobramento” do anel imidazol da HIS162

ocorreu em ambas as temperaturas simuladas, sem haver o enfraquecimento

da interação eletrostática CYS25− · · ·HIS162+. No entanto, pôde-se notar

que a 37◦C houve também uma rotação de 180◦ no anel imidazol, sugerindo

uma desestabilização momentânea na formação do par iônico, com uma pos-

terior reestruturação deste, agora formado pela interação CYS25:SG−HIS162:

NE2 e com o estabelecimento da ligação de hidrogênio HIS159:ND1 · · · ASP

158:OD2 (numeração da papaína).

A estrutura do par iônico da cruzipaína 2 se manteve estável ao longo de toda a

simulação de DM, em ambas as temperaturas testadas. É importante observar

que na cruzipaína 2 ocorre a substituição do aminoácido negativamente carre-

gado ASP161 por um neutro polar SER161, o que proporcionaria uma esta-

bilização das interações CYS25:SG−HIS162:ND1 e HIS162:NE2−ASN182:

OD1. Desta forma, é possível propor que a desestabilização do anel imidazol

da HIS catalítica, observada na papaína e na cruzipaína 1, esteja associada a

uma forte influência do potencial elétrico negativo formado pelo resíduo ácido

ASP158/ 161, sendo suscetível a variações de temperatura.

Com relação a alterações estruturais apresentadas pela papaína e cruzipaína 1

durante as simulações de DM, se comparadas com suas respectivas estruturas

cristalográficas 9PAP e 1ME4, deve-se ressaltar que estas estruturas foram ob-

tidas por técnicas de raios-X a baixas temperaturas, sendo a 4◦C para a 9PAP e

a ≈17◦C para a 1ME4.

Os resultados deste trabalho indicam que, em cisteíno proteases da família da

papaína, haja uma possível associação entre a carga apresentada pelo resíduo na

posição 158 (na numeração da papaína) e a eficiência catalítica destas enzimas

em diferentes temperaturas. De acordo com revisão apresentada por Goldblum

(1997), o papel do resíduo 158 na estabilização do par iônico já foi alvo de es-

tudo de diferentes trabalhos que questionavam a importância da carga negativa

122

Figura 5.1: Conformação estrutural dos resíduos que compõem a tríade catalítica de serino proteasemutada (SER221CSO) e de cruzipaína 1 (1ME4) após simulação de DM a 37◦C.

Subtilisina BPN’† com mutação SER221CSOa Cruzipaína 1‡ simulada a 37◦C

As distâncias apresentadas foram medidas em Angströms (A).aCSO: S-hidroxicisteína.†PDB 1GNS (Almog et al, 2002). A tríade catalítica de serino protease da família S2 é composta porASP32, HIS64 e SER221.‡PDB 1ME4 (Huang et al, 2003). A tríade catalítica de cisteíno protease é composta por CYS25, HIS159e ASN175 (numeração da papaína).

nesta posição para a formação de conformações catalíticas duplas, estabeleci-

das pelas tríades CYS25/HIS159/ASN175 e CYS25/HIS159/ASP158 (numera-

ção da papaína). Esta última conformação foi observada neste trabalho para as

simulações da papaína e da cruzipaína 1 a 37◦C. Neste sentido é importante no-

tar que a conformação dos resíduos catalíticos da cruzipaína 1 simulada a 37◦C

assemelha-se a conformação apresentada pelos resíduos catalíticos de serino

proteases (ASP32, HIS64 e SER221), como apresentado na Fig. 1.6, principal-

mente quando observada a configuração de serino proteases mutadas na posição

221, alterando-se o resíduo serina por S-hidroxicisteína (CSO) (Fig. 5.1).

123

Referências Bibliográficas

Acosta-Serrano, A., Almeida, I. C., Freitas-Junior, L. H., Yoshida, N. e Schenkman, S.

(2001). The mucin-like glycoprotein super-family of Trypanosoma cruzi: structure

and biological roles. Molecular & Biochemical Parasitology, 114:143–150.

Almog, O., Gallagher, D. T., Ladner, J. E., Strausberg, S., Alexander, P., Bryan, P. e

Gilliland, G. L. (2002). Structural basis of thermostability. The Journal of Biological

Chemistry, 277(30):27553–27558.

Altschul, S. F., Gish, W., Miller, W., Meyers, E. W. e Lipman, D. J. (1990). Basic Local

Alignment Search Tool. Journal of Molecular Biology, 215(3):403–410.

Altschul, S. F., Madden, T. L., Schäffer, A. A., Zhang, J., Zhang, Z., Miller, W. e Lip-

man, D. J. (1997). Gapped BLAST and PSI-BLAST: a new generation of protein

database search programs. Nucleic Acids Research, 25(17):3389–3402.

Atwood III, J. A., Weatherly, D. B., Minning, T. A., Bundy, B., Cavola, C., Opper-

does, F. R., Orlando, R. e Tarleton, R. L. (2005). The Trypanosoma cruzi proteome.

Science, 309(15):473–476.

Bairoch, A., Boeckmann, B., Ferro, S. e Gasteiger, E. (2004). Swiss-prot: juggling

between evolution and stability. Briefings in Bioinformatics, 5(1):39–55.

Baker, D. e Sali, A. (2001). Protein structure prediction and structural genomics. Na-

ture, 294(93):93–96.

Barreiro, E. J. e Fraga, C. A. M. (2001). Química médica: As bases moleculares da

ação dos fármacos. Artmed Editora Ltda., 1a¯ edição.

124

Beard, C. B., Pye, G., Steurer, F. J., Rodriguez, R., Campman, R., Peterson, A. T.,

Ramsey, J., Wirtz, R. A. e Robinson, L. E. (2003). Chagas disease in a domestic

transmission cycle in southern texas, USA. Emerging Infectious Diseases, 9(1):103–

105.

Berendsen, H. J. C., Grigera, J. R. e Straatsma, T. P. (1987). The missing term in

effective pair potentials. The Journal of Physical Chemistry, 91:6269–6271.

Berendsen, H. J. C., Postma, J. P. M., van Gunsteren, W. F., DiNola, A. e Haak, J. R.

(1984). Molecular dynamics with coupling to an external bath. The Journal of

Chemical Physics, 81(8):3684–3690.

Berman, H. M., Westbrook, J., Feng, Z., Gilliland, G., Bhat, T. N., Weissig, H., Shindya-

lov, I. N. e Bourne, P. E. (2000). The Protein Data Bank. Nucleic Acids Research,

28(1):253–242.

Bond, C. S., Zhang, Y., Berriman, M., Cunningham, M. L., Fairlamb, A. H. e Hunter,

W. N. (1999). Crystal structure of Trypanosoma cruzi trypanothione reductase in

complex with trypanothione, and the structure-based discovery of new natural product

inhibitors. Structure, 7:81–89.

Bondi, A. (1964). van der Waals volumes and radii. The Journal of Physical Chemis-

try, 68(3):441–451.

Bonet, C., Branco, T. P., Larrubia, A. F. G., Teixeira, C. O., Teixeira, M. A. B. e Car-

valhal, S. S. (2003). Correlação anatomoclínica: Caso 1/03 - homem, 27 anos, com

sorologia reagente para doença de Chagas e antecedente de febre reumática há 11

anos (Pontifícia Universidade Católica - Campinas, SP). Arquivo Brasileiro de Car-

diologia, 80(2):220–223.

Bonse, S., Richards, J. M., Ross, S. A., Lowe, G. e Krauth-Siegel, R. L. (2000).

(2,2’:6’,2”-Terpyridine)platinum(ii) complexes are irreversible inhibitors of Trypano-

soma cruzi trypanothione reductase but not of human glutathione reductase. Journal

of Medicinal Chemistry, 43(25):4812–4821.

125

Borin, I. A. (1999). Propriedades estruturais e dinâmicas de misturas líquidas biná-

rias associativas. Tese de Doutorado, Instituto de Química - Universidade Estadual

de Campinas / Brasil.

Brooks, B. R., Bruccoreli, R. E., Olafson, B. D., States, D. J., Swaminathan, S. e Kar-

plus, M. (1983). CHARMM: a program for macromolecular energy minimization and

dynamics calculation. Journal of Computational Chemistry, 4(2):187–217.

Buckner, F., Yokoyama, K., Lockman, J., Aikenhead, K., Ohkanda, J., Sadilek, M.,

Sevti, S., Voorhis, W. V., Hamilton, A. e Gelb, M. H. (2003). A class of sterol 14-

demethylase inhibitors as anti-Trypanosoma cruzi agents. Proceedings of the Natio-

nal Academy of Sciences of the United States of America, 100(5):15149–15153.

Buckner, F. S., Griffin, J. H., Wilson, A. J. e van Voorhis, W. C. (2001). Potent anti-

Trypanosoma cruzi activities of oxidosqualene cyclase inhibitors. Antimicrobial

Agents and Chemotherapy, 45(4):1210–1215.

Buschiazzo, A., Tavares, G. A., Campetella, O., Spinelli, S., Cremona, M. L., París, G.,

Amaya, M. F., Frasch, A. C. C. e Alzari, P. M. (2000). Structural basis of sialyltrans-

ferase activity in trypanosomal sialidases. The EMBO Journal, 19(1):16–24.

Carson, M. e Bugg, C. E. (1986). Algorithm for ribbon models of proteins. Journal of

Molecular Graphics, 4:121–122.

Catanho, M., Mascarenhas, D., Degrave, W. e de Miranda, A. B. (2006). Bioparser: A

tool for processing of sequence similarity analysis reports. Applied Bioinformatics,

5(1):49–53.

Cavalcanti, M. C., Targino, R., Baião, F., Rössle, S. C., Bisch, P. M., Pires, P. F., Cam-

pos, M. L. M. e Mattoso, M. (2005). Managing structural genomic workflows using

web services. Data & Knowledge Engineering, 53:45–74.

Cazzulo, J. J., Stoka, V. e Turk, V. (2001). The major cysteine proteinase of Trypano-

soma cruzi: a valid target for chemotherapy of Chagas disease. Current Pharma-

ceutical Design, 7:1143–1156.

126

Chan, C., Yin, H., Garforth, J., McKie, J. H., Jaouhari, R., Speers, P., Douglas, K. T.,

Rock, P. J., Yardley, V., Croft, S. L. e Fairlamb, A. H. (1998). Phenothiazine inhibitors

of trypanothione reductase as potential antitrypanosomal and atileishmanial drugs.

Journal of Medicinal Chemistry, 41:148–156.

Chance, M. R., Bresnick, A. R., Burley, S. K., Jiang, J.-S., Lima, C. D., Sali, A., Almo,

S. C., Bonanno, J. B., Buglino, J. A., Boulton, S., Chen, H., Eswar, N. Y., He, G.,

Huang, R., Ilyin, V., McMahan, L., Pieper, U., Ray, S., Vidal, M. e Wang, L. K.

(2002). Strucutural genomics: a pipeline for providing structures for the biologist.

Protein Science, 11:723–738.

Cherkasov, A., Sui, S. J. H., Brunham, R. C. e Jones, S. J. (2004). Structural cha-

racterization of genomes by large scale sequence-structure threading: application of

reliability analysis in structural genomics. BMC Bioinformatics, 5(37):1–16.

Connolly, M. L. (1983). Solvent-accessible surfaces of proteins and cucleic acids. Sci-

ence, 221(4612):709–713.

Connolly, M. L. (1986). Mds molecular dot surface. Ported to Macintosh and Language

Systems Fortran in July, 1993.

Cornell, W. D., Cieplak, P., Bayly, C. I., Gould, I. R., Merz Jr., K. M., Ferguson, D. M.,

Spellmeyer, D. C., Fox, T., Caldwell, J. W. e Kollman, P. A. (1995). A second gene-

ration force field for the simulation of proteins, nucleic acids and organic molecules.

Journal of the American Chemical Society, 117:5179–5197.

Coura, J. R. e de Castro, S. L. (2002). A critical review on Chagas disease chemotherapy.

Memórias do Instituto Oswaldo Cruz, 97(1):3–24.

Cuevas, I. C., Cazzulo, J. J. e Sánchez, D. O. (2003). gp63 homologues in Trypanosoma

cruzi: surface antigens with metalloprotease activity and a possible role in host cell

infection. Infection and Immunity, 71(10):5397–5749.

127

Dardenne, L. E. (2000). Propriedades eletrostáticas do sítio ativo de cisteíno pro-

teinases da família da papaína. Tese de Doutorado, Instituto de Biofísica Carlos

Chagas Filho - Universidade Federal do Rio de Janeiro / Brasil.

Dardenne, L. E., Werneck, A. S., Neto, M. O. e Bisch, P. M. (2003). Eletrostatic proper-

ties in the catalytic site of papain: a possible regulatory mechanism for the reactivity

of the ion pair. PROTEINS: Structure, Function and Genetics, 52:236–253.

Daura, X., Gademann, K., Jaun, B., Seebach, D., van Gusteren, W. F. e Mark, A. E.

(1999). Peptide folding: When simulation meets experiment. Angewandte Chemie

International Edition, 38(1-2):236–240.

de Moura, K. C. G., Emery, F. S., Neves-Pinto, C., Pinto, M. C. F. R., Dantas, A. P.,

ao, K. S., de Castro, S. L. e Pinto, A. V. (2001). Trypanocidal activity of isolated

naphthoquinones from Tabebuia and some heterocyclic derivatives: A review from

an interdisciplinary study. J. Braz. Chem. Soc., 12(3):325–338.

del Nery, E., Juliano, M. A., Lima, A. P. C. A., Scharfstein, J. e Juliano, L. (1997). Ki-

ninogenase activity by the major cysteinyl proteinase (cruzipain) from Trypanosoma

cruzi. The Journal of Biological Chemistry, 272(41):25713–25718.

Devera, R. A. (2002). Caracterização biológica, bioquímica e molecular de cepas do

Trypanosoma cruzi, antes e após passagens em camundongos e em cultura. Tese

de Doutorado, Fundação Instituto Oswaldo Cruz / Brasil.

Dias, J. C. P. (1999). O tratamento específico da doença de Chagas. X Conferência

Nacional de Saúde On-Line. URL www.datasus.gov.br/cns

Dias, J. C. P. (2006). Notas sobre o Trypanosoma cruzi e suas características bio-

ecológicas, como agente de enfermidades transmitidas por alimentos. Revista da

Sociedade Brasileira de Medicina Tropical, 39(4):370–375.

dos Reis, F. C. G. (1999). Caracterização cinética de isoformas de cisteíno protease

do Trypanosoma cruzi. Dissertação de Mestrado, Instituto de Biofísica Carlos Chagas

Filho - Universidade Federal do Rio de Janeiro / Brasil.

128

dos Reis, F. C. G. (2005). Mecanismo de regulação da atividade de cisteíno proteases

do Trypanosoma cruzi. Tese de Doutorado, Instituto de Biofísica Carlos Chagas Filho

- Universidade Federal do Rio de Janeiro / Brasil.

dos Reis, F. C. G., Júdice, W. A. S., Juliano, M. A., Juliano, L., Scharfstein, J. e Lima,

A. P. C. A. (2006). The substrate specificit of cruzipain 2, a cysteine protease isoform

from Trypanosoma cruzi. FEMS Microbiology Letters, 259:215–220.

Drenth, J., Jansoniu, J. N., Koekoek, R., Swen, H. M. e Wolthers, B. G. (1968). Structure

of papain. Nature, 218:929–932.

Du, X., Hansell, E., Engel, J. C., Caffrey, C. R., Cohen, F. E. e McKerrow, J. H. (2000).

Aryl ureas represent a new class of anti-trypanosomal agents. Chemistry & Biology,

7:733–742.

Eddy, S. R. (2004). Where did the blosum62 alignment score matrix come from. Nature

Biotechnology, 22(8):1035–1036.

El-Sayed, N. M., Myler, P. J., Bartholomeu, D. C., Nilsson, D., Aggarwal, G., Tran,

A. N., Ghedin, E., Worthey, E. A., Delcher, A. L., Blandin, G., Westenberger, S. J.,

Caler, E., Cerqueira, G. C., Branche, C., Haas, B., Anupama, A., Arner, E., Aslund,

L., Attipoe, P., Bontempi, E., Bringaud, F., Burton, P., Cadag, E., Campbell, D. A.,

Carrington, M., Crabtree, J., Darban, H., da Silveira, J. F., de Jong, P., Edwards, K.,

Englund, P. T., Fazelina, G., Feldblyum, T., Ferella, M., Frasch, A. C., Gull, K., Horn,

D., Hou, L., Huang, Y., Kindlund, E., Klingbeil, M., Kluge, S., Koo, H., Lacerda, D.,

Levin, M. J., Lorenzi, H., Louie, T., Machado, C. R., McCulloch, R., an Y. Mizuno,

A. M., Mottran, J. C., Nelson, S., Ochaya, S., Osoegawa, K., Pai, G., Parsons, M.,

Pentony, M., Pettersson, U., Pop, M., Ramirez, J. L., Rinta, J., Robertson, L., Salz-

berg, S. L., Sanchez, D. O., Seyler, A., Sharma, R., Shetty, J., Simpson, A. J., Sisk, E.,

Tammi, M. T., Tarleton, R., Teixeira, S., Aken, S. V., Vogt, C., Ward, P. N., Wickstead,

B., Wortman, J., White, O., Fraser, C. M., Stuart, K. D. e Anderson, B. (2005). The

genome sequence of Trypanosoma cruzi, etiologic agent of Chagas disease. Science,

309(15):409–415.

129

Engel, J. C., Doyle, P. S., Palmer, J., Hsieh, I., Bainton, D. F. e McKerrow, J. H. (1999).

Cysteine protease inhibitors alter golgi complex ultrastructure and function in Trypa-

nosoma cruzi. Journal of Cell Science, 111:597–606.

Engman, D. M. e Leon, J. S. (2002). Pathogenesis of Chagas heart disease: role of

autoimmunity. Acta Tropica, 81:123–132.

Esteva, M. I., Kettler, K., Maidana, C., Fichera, L., Ruiz, A. M., Bontempo, W. J.,

Andersson, B., Dahse, H.-M., Haebel, P., Ortmann, R., Klebe, G. e Schlitzer, M.

(2006). Benzophenone-based farnesyltransferase inhibitors with hig activity against

Trypanosoma cruzi. Journal of Medicinal Chemistry, 48(23):7186–7191.

Faerman, C. H., Savvides, S. N., Strickland, C., Breidenbach, M. A., Ponasik, J. A.,

Ganem, B., Ripoll, D., Krauth-Siegel, R. L. e Karplus, P. A. (1996). Charge is the

major discriminating factor for glutathione reductase versus trypanothione reductase

inhibitors. Bioorganic & Medicinal Chemistry, 4(8):1247–1253.

Fan, H. e Mark, A. E. (2004). Refinement of homology-based protein structures by

molecular dynamics simulation techniques. Protein Science, 13:211–220.

Fitch, W. M. (2000). Homology: A personal view on some of the problems. Trends in

Genetics, 16(5):227–231.

Galperin, M. Y. e Koonin, E. V. (1999). Searching for drug targets in microbial genomes.

Current Opinion in Biotechnology, 10:571–578.

Galperin, M. Y., Walker, D. R. e Koonin, E. V. (1998). Analogous enzymes: Independent

inventions in enzyme evolution. Genome Research, 8:779–790.

Garcia, E. S. e Azambuja, P. (2000). Fisiologia de triatomíneos: desenvolvimento,

reprodução e interação com Trypanosoma cruzi. In: Brener, Z., Andrade, Z. A.

e Barral-Netto, M. (editores), Trypanosoma cruzi e Doença de Chagas, 2a¯ edição.

Capítulo 8, Guanabara Koogan.

130

Garg, N., Postan, M., Mensa-Wilmot, K. e Tarleton, R. L. (1997). Searching for drug

targets in microbial genomes. Infection and Immunity, 65(10):4055–4060.

Garzoni, L. R., Caldera, A., Meirelles, M. N. L., de Castro, S., Docampo, R., Meints,

G. A., Oldfield, E. e Urbina, J. A. (2004). Searching for drug targets in microbial

genomes. International Journal of Antimicrobial Agents, 23:273–285.

Gelb, M. H. e Hol, W. G. J. (2002). Drugs to combat tropical protozoan parasites.

Science, 297(19):343–344.

Gironès, N., Rodríguez, C. I., Crrasco-Marín, E., Hernáez, R. F., de Rego, J. L. e Fresno,

M. (2001). Dominant t- and b-cell epitopes in an autoantigem linked to Chagas’

disease. The Journal of Clinical Investigation, 107(8):985–983.

Goldblum, A. (1997). On the mechanisms of proteinases. In: Náray-Szabó, G. e

Warshel, A. (editores), Computational approaches to biochemical reativity, 1a¯ edi-

ção. Capítulo 7, Kluwer Academic Publishers.

Goldsmith-Fischman, S. e Honig, G. (2003). Structural genomics: Computational

methods for structure analysis. Protein Science, 12:1813–1821.

Gomes, D. E. B. (2006). Estudo da falcipaína-2 em complexo com ligantes por mo-

delagem e dinâmica molecular como suporte ao desenvolvimento racional de no-

vos fármacos antimaláricos. Dissertação de Mestrado, Instituto de Biofísica Carlos

Chagas Filho - Universidade Federal do Rio de Janeiro / Brasil.

Goulding, C. W., Perry, L. J., Anderson, D., Sawaya, M. R., Cascio, D., Apostol, M. I.,

Chan, S., Parseghian, A., an Y. Wu, S.-S. W., Cassano, V., Gill, H. S. e Eisenberg, D.

(2003). Structural genomics of Mycobacterium tuberculosis: a preliminary report of

progress at ucla. Biophysical Chemistry, 105:361–370.

Guex, N. e Peitsch, M. C. (1997). Swiss-model and swiss-pdb viewer: An environment

for comparative protein modeling. Electrophoresis, 18:2714.

131

Guimarães, A. C. R. (2006). Identificação, classificação e anotação de enzimas análo-

gas em tripanossomatídeos. Dissertação de Mestrado, Pós-Graduação em Biologia

Celular e Molecular - Instituto Oswaldo Cruz / Brasil.

Halgren, T. A. (1996a). Merck molecular force field. I. basis, form, scope, parame-

trization and performance of MMFF94. Journal of Computational Chemistry,

17(5&6):490–519.

Halgren, T. A. (1996b). Merck molecular force field. II. MMFF94 van der waals and

electrostatic parameters for intermolecular interactions. Journal of Computational

Chemistry, 17(5&6):520–552.

Halgren, T. A. (1996c). Merck molecular force field. III. molecular gemetries and

vibrational frequencies for MMFF94. Journal of Computational Chemistry,

17(5&6):553–586.

Halgren, T. A. (1996d). Merck molecular force field. IV. conformational energies and

geometries for MMFF94. Journal of Computational Chemistry, 17(5&6):587–615.

Halgren, T. A. (1996e). Merck molecular force field. V. extension of MMFF94 using

experimental data, additional computational data and empirical rules. Journal of

Computational Chemistry, 17(5&6):616–641.

Hess, B., Bekker, H., Berendsen, J. J. C. e Fraaije, J. G. E. M. (1997). Lincs: A linear

constraint solver for molecular simulations. Journal of Computational Chemistry,

18:1463–1472.

Hockney, R. W. (1970). The potential calculation and some applications. Methods in

Computational Physics, 9:136–211.

Hopkins, A. L. e Groom, C. R. (2002). The druggable genome. Nature Reviews,

1:727–730.

Huang, L., Brinen, L. S. e Ellman, J. A. (2003). Crystal structures of reversible ketone-

132

based inhibitors of the cysteine protease cruzain. Bioorganic & Medicinal Chemis-

try, 11:21–29.

Hucke, O., Gelb, M. H., Verlinde, C. L. M. J. e Buckner, F. S. (2005). Prediction

of binding affinities between the human amphiphysin-1 sh3 domain and its peptide

ligands using homology modeling, molecular dynamics and molecular field analysis.

Journal of Medicinal Chemistry, 48(17):5415–5418.

Huerta, M., Downing, G., Haseltine, F., Seto, B. e Liu, Y. (2000). NIH wor-

king definition of bioinformatics and computational biology. Biomedical Infor-

mation Science and Technology Initiative Consortium, National Institutes of He-

alth, Bethesda, USA. Disponível on-line, último acesso em: 20 abr 2007. URL

www.bisti.nih.gov/CompuBioDef.pdf

Jacoby, E. M., Schlichting, I., Lantwin, C. B., Kabsch, W. e Krauth-Siegel, R. L. (1996).

Crystal structure of the Trypanosoma cruzi trypanothione reductase-mepacrine com-

plex. PROTEINS: Structure, Function, and Genetics, 24:73–80.

Joachimiak, M. R., Chang, C., Rosenthal, P. J. e Cohen, F. E. (2001). The impact of

whole genome sequence data on drug discovery - a malaria case study. Molecular

Medicine, 7(10):698–710.

Judice, W. A. S., Cezari, M. H. S., Lima, A. P. C. A., Scharfstein, J., Chagas, J. R.,

Tersariol, I. L. S., Juliano, M. A. e Juliano, L. (2001). Comparison of the specificity,

stability and individual rate constants with respective activation parameters for the

peptidase activity of cruzipain and its recombinant form, cruzain, from Trypanosoma

cruzi. European Journal of Biochemistry, 268:6578–6586.

Kamphuis, I. G., Kalk, K. H., Swarte, M. B. A. e Drenth, J. (1984). Structure of papain

refined at 1.65 A resolution. Journal of Molecular Biology, 179(2):233–256.

Kanehisa, M., Goto, S., Hattori, M., Aoki-Hinoshita, K., Itoh, M., Kawashima, S., Ka-

tayama, T., Araki, M. e Hirakawa, M. (2006). From genomics to chemical genomics:

new developments in KEGG. Nucleic Acids Research, 34(D):354–357.

133

Karlin, S. e Altschul, S. F. (1990). Methods for assessing the statistical significance of

molecular sequence features by using general scoring schemes. Proceedings of the

National Academy of Sciences of the United States of America, 87:2264–2268.

Kirchhoff, L. V., Paredes, P., Lomeli-Guerrero, A., Paredes-Espinoza, M., Ron-

Guerrero, C. S., Delgado-Mejia, M. e Pena-Munoz, J. G. (2006). Transfusion-

associated Chagas disease (american trypanosomiasis) in mexico: implications for

transfusion medicine in the united states. Transfusion, 46(2):298–304.

Klemba, M. e Goldberg, D. E. (2002). Biological roles of proteases in parasitic protozoa.

Annual Review of Biochemistry, 71:275–305.

Kola, I. e Landis, J. (2004). Can the pharmaceutical industry reduce attrition rates?

Nature Reviews, 3:711–715.

Korf, I., Yandell, M. e Bedell, J. (2003). BLAST. O′Reilly, 1a¯ edição.

Laskowski, R. A., MacArthur, M. W., Moss, D. S. e Thornton, J. M. (1993). Procheck: a

program to check the stereochemical quality of protein structures. Journal of Applied

Crystallography, 26(2):283–291.

Laskowski, R. A., Watson, J. D. e Thornton, J. M. (2003). From protein structure to

biochemical function. Journal of Structural and Functional Genomics, 4:167–

177.

Leach, A. R. (2001). Molecular modelling: principles and applications. Pearson

Education Ltda, 2a¯ edição.

Lee, R. e Richards, F. M. (1971). The implementation of protein structures: Estimation

of static accessibility. Journal of Molecular Biology, 55:379–400.

Leiby, D. A., Herron, R. M., Read, E. J., Lenes, B. A. e Stumpf, R. J. (2002). Trypano-

soma cruzi in los angeles and miami blood donors: impact of evolving donor demo-

graphics on seroprevalence an d implications for transfusion transmission. Transfu-

sion, 42(5):549–555.

134

Lesk, A. M. (2002). Introduction to bioinformatics. Oxford University Press, 1a¯

edição.

Li, A. e Nussinov, R. (1998). A set of van der Waals and coulombic radii of protein

atoms for molecular and solvent-accessible surface calculation, packing evaluation,

and docking. Proteins: Structure Function and Genetics, 32:111–127.

Lima, A. P., Scharfstein, J., Storer, A. C. e Menard, R. (1992). Temperature-dependet

substrate inhibiton of the cysteine proteinase (gp57/51) from Trypanosoma cruzi. Mo-

lecular & Biochemical Parasitology, 56:335–338.

Lima, A. P., Tessier, D. C., Thomas, D. Y., Scharfstein, J., Storer, A. C. e Vernet, T.

(1994). Identification of new cysteine protease gene isoforms in Trypanosoma cruzi.

Molecular & Biochemical Parasitology, 67(2):333–338.

Lima, A. P. C. A., dos Reis, F. C. G., Serveau, C., Lalmanach, G., Juliano, L., Ménard,

R., Vernet, T., Thomas, D. Y., Storer, A. C. e Scharfstein, J. (2001). Cysteine protease

isoforms from Trypanosoma cruzi, cruzipain 2 and cruzain, present different substrate

preference and susceptibility to inhibitors. Molecular & Biochemical Parasitology,

114:41–52.

Lira, R., Contreras, L. M., Santa Rita, R. M. e Urbina, J. A. (2001). Mechanism of

action of anti-proiferative lysophospholipid analogues against the protozoan parasite

Trypanosoma cruzi: potentiation of in vitro activity by the sterol biosynthesis inhibitor

ketoconazole. Jounal of Antimicrobial Chemotherapy, 47:537–546.

Liñares, G. E. G., Ravaschino, E. L. e Rodriguez, J. B. (2006). Progresses in the field

of drug design to combat tropical protozoan parasitic diseases. Current Medicinal

Chemistry, 13:335–360.

Lo Presti, M. S., Rivarola, H. W., Bustamante, J. M., Fernández, A. R., Enders, J. E.,

Fretes, R., Gea, S. e Paglini-Oliva, P. A. (2004). Thioridazine treatment prevents

cardiopathy in Typanosoma cruzi infected mice. International Journal of Antimi-

crobial Agents, 23:634–636.

135

Lorente, S. O., Gómez, R., Jiménez, C., Cammerer, S., Yardley, V., de Luca-Fradley,

K., Croft, S. L., Perez, L. M. R., Urbina, J., Pacanowska, D. G. e Gilbert, I. H.

(2005a). Biphenylquimuclidines as inhibitors of squalene synthase and growth of

parasitic protozoa. Bioorganic & Medicinal Chemistry, 13:3519–3529.

Lorente, S. O., Jiménez, C. J., Gros, L., Yardley, V., de Luca-Fradley, K., Croft, S. L.,

Urbina, J. A., Ruiz-Perez, L. M., Pacanowska, D. G. e Gilbert, I. H. (2005b). Prepa-

ration of transition-state analogues of sterol 24-methyl transferase as potential anti-

parasitics. Bioorganic & Medicinal Chemistry, 13:5435–5453.

Lovell, S., Word, J., Richardson, J. e Richardson, D. (2000). The penultimate rotamer

library. Proteins: Structure Function and Genetics, 40:389–408.

Lu, Y., Wang, R., Yang, C. Y. e Wang, S. (2007). Analysis of ligand-bound water

molecules in high-resolution crystal structures of protein-ligand complexes. Journal

of Chemical Information and Modeling, page EST7.8.

Luchtan, M., Warade, C., Weatherly, D. B., Degrave, W. M., Tarleton, R. L. e Kissinger,

J. C. (2004). Tcruzidb: an integrated Trypanosoma cruzi genome resource. Nucleic

Acids Research, 32:D344–D346.

Luquetti, A. O. e Rassi, A. (2000). Diagnóstico laboratorial da infecção pelo Trypano-

soma cruzi. In: Brener, Z., Andrade, Z. A. e Barral-Netto, M. (editores), Trypanosoma

cruzi e Doença de Chagas, 2a¯ edição. Capítulo 8, Guanabara Koogan.

MacRae, J. I., Obado, S. O., Turnock, D. C., Roper, J. R., Kerans, M., Kelly, J. M.

e Ferguson, M. A. J. (2006). The suppression of galactose metabolism in Trypano-

soma cruzi epimastigotes causes changes in cell surface molecular architectue and

cell morphology. Molecular & Biochemical Parasitology, 147:126–136.

Magaraci, F., Jimenez, C. J., Rodrigues, C., Rodrigues, J. C. F., Braga, M. V., Yar-

dley, V., de Luca-Fradley, K., Croft, S. L., de Souza, W., Ruiz-Perez, L. M., Urbina,

J., Pacanowska, D. G. e Gilbert, I. H. (2003). Azasterol as inhibitors of sterol 24-

136

methyltransferase in Leishmania species and Trypanosoma cruzi. Journal of Medi-

cinal Chemistry, 46(22):4717–4727.

Marsden, R. L., Maibaum, D. L. M., Yeats, C. e Orengoe, C. A. (2006). Comprehensive

genome analysis of 203 genomes provides structural genomics with new insights into

protein family space. Nucleic Acids Research, 34(3):1066–1080.

Marti-Renom, M. A., Yerkovich, B. e Sali, A. (2002). Comparative protein structure

prediction. Current Protocols in Protein Science, 2.9(28):2.9.1–2.9.22.

Maya, J. D., Cassels, B. K., Iturriaga-Vásquez, P., Ferreira, J., Faúndez, M., Galanti,

N., Ferreira, A. e Morello, A. (2006). Mode of action of natural and synthetic drugs

against Trypanosoma cruzi and their interaction with the mammalian host [in press].

Comparative Biochemistry and Physiology, Part A.

McGrath, M. E. (1999). The lysosomal cysteine proteases. Annual Review of Biophy-

sics & Biomolecular Structure, 28:181–204.

McGrath, M. E., Eakin, A. E., Engel, J. C., McKerrow, J. H., Craik, C. S. e Fletterick,

R. J. (1995). The crystal structure of cruzain: a therapeutic target for Chagas’ disease.

Journal of Molecular Biology, 247:251–259.

McGuffin, L. J., Bryson, K. e Jones, D. T. (2000). The psipred protein structure predic-

tion server. Bioinformatics, 4:401–405.

Miller, R. T., Jones, D. T. e Thornton, J. M. (1996). Protein fold recognition by sequence

threading: tools and assessment techniques. FASEB Journal, 10(1):171–178.

Miyamoto, S. e Kollman, P. A. (1992). SETTLE: An analytical version of the SHAKE

and RATTLE algorithms for rigid water models. Journal of Computational Che-

mistry, 13:952–962.

Molina, J., Martins-Filho, O., Brener, Z., Romanha, A. J., Loebenberg, D. e Urbina,

J. A. (2000). Activities of the triazolde derivative SCH 56592 (posaconazole) against

drug-resistant strains of the protozoan parasite Trypanosoma (Schizotrypanum) cruzi

137

in immunocompetent and immunosuprressed murine hosts. Antimicrobial Agents

and Chemotherapy, 44(1):150–155.

Naula, C., Parsons, M. e Mottram, J. C. (2005). Protein kinases as drug targets in

trypanosomes and Leishmania. Biochimica et Biophysica Acta, 1754:151–159.

Notredame, C., Higgins, D. G. e Heringa, J. (2000). T-coffee: A novel method for

fast and accurate multiple sequence alignment. Journal of Molecular Biology,

302(1):205–217.

Nyame, A. K., Kawar, Z. S. e Cummings, R. D. (2004). Antigenic glycans in parasitic

infections: implications for vaccines and diagnostics. Archivs of Biochemistry and

Biophysics, 426:182–200.

Ohlstein, E. H., Ruffolo Jr., R. R. e Elliott, J. D. (2000). Drug discovery in the next

millennium. Annual Reviews on Pharmacology and Toxicology, 40:177–191.

Oliveira, D. A., Pereira, D. G., Fernandes, A. M. A. P., de Castro, S. L., Souza Brito,

A. R. M., de Souza, A. O. e Durán, N. (2005). Trypanocidal activity of 2-propen-

1-amine derivatives on trypomastigotes culture and in animal model. Parasitology

Research, 95:161–166.

Otto, T. D., Guimaraes, A. C. R., Lemos, M., Seibel, L. F. B., Macedo, J. A.,

Degrave, W. S. e Basílio, A. B. (2006). Anenπ: Identification and annota-

tion of analogous enzymes. Submited to Bioinformatics. AnEnΠ is available at

http://www.dbbm.fiocruz.br/AnEnPi for academic use.

Ouzounis, C. A. e Valencia, A. (2003). Early bioinformatics: the birth of a discipline –

a personal view. Bioinformatics, 19(17):2176–2190.

Pantoliano, M. W., Whitlow, M., Wood, J. F., Dodd, S. W., Hardman, K. D. e Rol-

lence, M. L. (1989). Large increases in general stability for subtilisin BPN´ through

incremental changes in the free energy of unfolding. Biochemistry, 28:7205–7213.

138

Paris, G., Ratier, L., Amaya, M. F., Nguyen, T., Alzari, P. M. e Frasch, A. C. C. (2005).

A sialidase mutant displaying trans-sialidase activity. Journal of Molecular Biology,

345:923–934.

Pascutti, P. G. (2004). Introdução à modelagem e dinâmica molecu-

lar. Disponível on-line, último acesso em: 20 mar 2007. URL

www.nacad.ufrj.br/˜amit/DinamicaMolecular.pdf

Paveto, C., Güida, M. C., Esteva, M. I., Martino, V., Coussio, J., Flawiá, M. M. e Tor-

res, H. N. (2004). Anti-Trypanosoma cruzi activity of green tea (Camellia sinensis)

catechins. Antimicrobial Agents and Chemotherapy, 48(1):69–74.

Pertsemlidis, A. e Fondon III, J. W. (2002). Having a blast with bioinformatics (and

avoiding blastphemy). Genome Biology, 2(10):1–10.

Pevsner, J. (2003). Bioinformatics and Functional Genomics. Wiley-Liss, 1a¯ edição.

Peña-Diaz, J., Akbari, M., Sundheim, O., Farez-Vidal, M. E., Andersen, S., Sneve, R.,

Gonzalez-Pacanowska, D., Krokan, H. E. e Slupphaug, G. (2004). Trypanosoma cruzi

contains a single detectable uracil-DNA glycosylase and repairs uracil exclusively via

short patch base excision repair. Journal of Molecular Biology, 342:787–799.

Ramakrishnan, C. (2001). Ramachandran and his map. Ressonance, Oct:48–56.

Ravaschino, E. L., Docampo, R. e Rodriguez, J. B. (2003). Synthesis and biological

evaluation of glutathione-like tripeptides against Trypanosoma cruzi. ARKIVOC,

x:298–313.

Ravaschino, E. L., Docampo, R. e Rodriguez, J. B. (2006). Design, synthesis and bi-

ological evaluation of phosphinopeptides against Trypanosoma cruzi targeting trypa-

nothione biosynthesis. Journal of Medicinal Chemistry, 49(1):426–435.

Rawlings, N. D. e Barret, A. J. (1993). Evolutionary families of peptidases. Biochemi-

cal Journal, 290:205–218.

139

Rawlings, N. D., Morton, F. R. e Barret, A. J. (2006). Merops: the peptidase database.

Nucleic Acids Research, 34:D270–D272.

Reesink, H. W. (2005). European strategies against the parasite transfusion risk. Trans-

fusion Clinique et Biologique, 12:1–4.

Rey, L. (1991). Trypanosoma cruzi e Doença de Chagas: Ecologia, Epidemiologia e

Controle. In: Rey, L. (editor), Parasitologia, 2a¯ edição. Guanabara Koogan.

Rivarola, H. W. e Paglini-Oliva, P. A. (2002). Trypanosoma cruzi trypanothione reduc-

tase inhibitors: phenothiazines and related compounds modify experimental Chagas’

disease evolution. Current Drug Targets & Haematological Disorders, 2:43–52.

Rockey, W. M. e Elcock, A. H. (2002). Progress toward virtual screening for drug side

effects. PROTEINS: Structure, Function, and Genetics, 48:664–671.

Rose, M. R. (2001). Infection, mimcs, and autoimmune disease. The Journal of Clini-

cal Investigation, 107(8):943–944.

Rössle, S. C. S. (2004). Desenvolvimento de um sistema computacional para mode-

lagem comparativa em genômica estrutural: Análise de seqüências do genama

da Gluconacetobacter diazotrophicus. Tese de Doutorado, Instituto de Biofísica Car-

los Chagas Filho - Universidade Federal do Rio de Janeiro / Brasil.

Sajid, M. e McKerrow, J. H. (2002). Cysteine proteases of parasitic organisms. Mole-

cular & Biochemical Parasitology, 120:1–21.

Sali, A. e Overington, J. P. (1994). Derivation of rules for comparative protein modeling

from a database of protein structure alignments. Protein Science, 3:1582–1596.

Salmon, D., do Aido-Machado, R., Diehl, A., Leidert, M., Schmetzer, O., Lima, A.

P. C. A., Scharfstein, J., Oschkinat, H. e Pires, J. R. (2006). Solution structure and

backbone dynamics of the Trypanosoma cruzi cysteine protease inhibitor chagasin.

Jounal of Molecular Biology, 357:1511–1521.

140

Salmon-Chemin, L., Buisine, E., Yardley, V., Kohler, S., Debreu, M.-A., Landry, V.,

Sergheraert, C., Croft, S. L. e adn E. Davioud-Charvet, R. L. K. (2001). 2- and

3-substituted 1,4-naphthoquinone derivatives as subversive substrates of trypanothi-

one reductase and lipoamide dehidrogenase from Trypanosoma cruzi: synthesis and

correlation between redox cycling activities and in vitro cytotoxicity. Journal of Me-

dicinal Chemistry, 44(4):548–565.

Santos, C. C., Sant’Anna, C., Terres, A., Cunha-e-Silva, N. L., Scharfstein, J. e Lima,

A. P. C. A. (2005). Chagasin, the endogenous cysteine-protease inhibitor of Trypa-

nosoma cruzi, modulates parasite differentiation and invasion of mammalian cells.

Journal of Cell Science, 118(5):901–915.

Scheidig, A. J., Hynes, T. R., Pelletier, L. A., Wells, J. A. e Kossiakoff, A. A. (1997).

Crystal structures of bovine chymotrypsin and trypsin complexed to the inhibitor do-

main of alzheimer’s amyloid {beta}-protein precursor (APPI) and basic pancreatic

trypsin inhibitor (BPTI): Engineering of inhibitors with altered specificities. Protein

Science, 6(9):1806–1824.

Schlick, T. (2000). Molecular modeling and simulation: An interdisciplinary guide.

Springer, 1a¯ edição.

Serveau, C., Lalmanach, G., Juliano, M. A., Scharfstein, J., Juliano, L. e Gauthier,

F. (1996). Investigation of the substrate specificity of cruzipain, the major cysteine

proteinase of Trypanosoma cruzi, through the use of cystatin-derived. Biochemical

Journal, 313(1):951–956.

Sigman, L., Sánchez, V. M. e Turjanski, A. G. (2006). Characterization of the farnesyl

pyrophosphate synthase of Trypanosoma cruzi by homology modeling and molecular

dynamics. Journal of Molecular Graphics and Modelling, 25:345–352.

Smith, G. R., Sternberg, M. J. E. e Bates, P. A. (2005). The relationship between the

flexibility of proteins and their conformational states on forming protein-protein com-

141

plexes with an application to protein-protein docking. Journal of Molecular Biology,

347:1077–1101.

Smith, P. E. e van Gunsteren, W. F. (1994). Consistent dielectric properties of the sim-

ple point charge and extended simple point charge water models at 277 and 300K.

Journal of Chemical Physics, 100(4):3169–3174.

Stajich, J. E., Block, D. e Boulez, K. (2002). The bioperl toolkit: perl modules for the

life sciences. Genome Research, 12:1611–1618.

Sánchez, R., Pieper, U., Melo, F., Eswar, N., Martí-Renom, M. A., Madhusudhan, M. S.,

Mirkovi, N. C. e Sali, A. (2000). Protein structure modeling for structural genomics.

Nature Structural Biology, 7:986–990.

Sánchez, R. e Sali, A. (1997). Evaluation of comparative protein structure modeling by

modeller-3. PROTEINS: Structure, Function, and Genetics, 29(S1):50–58.

Taranto, G. (1991). Doença de Chagas. In: Cotran, R. S., Kumar, V. Y. e Robbins, S. L.

(editores), Patologia Estrutural e Funcional, 4a¯ edição. Guanabara Koogan.

Turrens, J. F., Newton, C. L., Zhong, L., Hernandez, F. R., Whitfield, J. e Docampo, R.

(1999). Mercaptopyridine-n-oxide, an nadh-fumarate reductase inhibitor, blocks Try-

panosoma cruzi growth in culture and in infected myoblasts. FEMS Microbiology

Letters, 175:217–221.

Turrens, J. F., Watts Jr., B. P., Zhong, L. e Docampo, R. (1996). Inhibition of Trypano-

soma cruzi and T. brucei nadh-fumarate reductase by benzinidazole and anthelmintic

imidazole derivatives. Molecular and Biochemical Parasitology, 82:125–129.

Tusnady, G. E. e Simon, I. (2001). The hmmtop transmembrane topology prediction

server. Bioinformatics, 17(9):849–850.

Urbina, J. A., Comcepcion, J. L., Montalvetti, A., Rodriguez, J. B. e Docampo, R.

(2003). Mechanism of action of 4-phenoxyphenoxyethyl thiocyanate (WC-9) against

142

Trypanosoma cruzi, the causative agent of Chagas’ disease. Antimicrobial Agents

and Chemotherapy, 47(6):2047–2050.

Urbina, J. A., Comcepcion, J. L., Rangel, S., Visbal, G. e Lira, R. (2002). Squalene

synthase as a chemotherapeutic target in Trypanosoma cruzi and Leishmania mexi-

cana. Molecular & Biochemical Parasitology, 125:35–45.

Urbina, J. A., Lira, R., Visbal, G. e Bartrolí, J. (2000). In vitro antiproliferative ef-

fects and mechanism of action of the new triazole derivative ur-9825 against the pro-

tozoan parasite Trypanosoma (Schizotrypanum) cruzi. Antimicrobial Agents and

Chemotherapy, 44(9):2498–2502.

U.S. Department of Energy Office of Science (2003). Human genome pro-

ject information. Office of Biological and Environmental Research, Hu-

man Genome. Disponível on-line, último acesso em: 20 mar 2007. URL

http://www.ornl.gov/sci/techresources/Human_Genome/

home.shtml

van der Spoel, D., Lindahl, E., Hess, B., van Buuren, A. R., Apol, E., Meulenhoff, P. J.,

Tielenam, D. P., Sijbers, A. L. T. M., Feenstra, K. A., van Drunen, R. e Berendsen, H.

J. C. (2004). Gromacs user manual version 3.2. URL www.gromacs.org

van der Spoel, D., van Maaren, P. J. e Berendsen, H. J. C. (1998). A systematic study

of water models for molecular simulation: Derivation of water models optimized for

use with a reaction field. Journal of Chemical Physics, 108(24):10220–10230.

van Gunsteren, W. F. e Berendsen, H. J. C. (1987). Gromos-87 manual. Biomos BV

Nijenborgh 4, 9747 AG Groningen, The Netherlands.

Verlett, L. (1967). Computer ‘experiments‘ on classical fluids. I. Thermodynamical

properties of Lennard-Jones molecules. Physical Review, 159:98–103.

Wallin, E. e von Heijne, G. (1998). Genome-wide analysis of integral membrane

proteins from eubacterial, archaean, and eukaryotic organisms. Protein Science,

7(4):1029–1038.

143

Walser, R., Mark, A. E. e van Gunsteren, W. F. (2000). On the temperature and pressure

dependence of a range of properties of a type of water model commonly used in high-

temperature protein unfolding simulations. Biophysical Journal, 8:2752–2760.

Weiner, S. J., Kollman, P. A., Case, D. A., Singh, U. C., Ghio, C., Alagona, G., Profeta,

S. e Weiner, P. (1984). A new foce field for molecular mechanical simulation of

nucleic acids and proteins. Journal of the American Chemical Society, 106:765–

784.

Westbrook, J., Feng, Z., Jain, S., Bhat, T. N., Thanki, N., Ravichandran, V., Gilliland,

G. L., Bluhm, W. F., Weissig, H., Greer, D. S., Bourne, P. E. e Berman, H. M. (2002).

The protein data bank: unifying the archive. Nucleic Acids Research, 30(1):245–

248.

WHO, Expert e Committee (2002). Control of Chagas disease. Technical Report 905,

World Health Organization/ Geneva.

Xiao, J., Guo, Z., Guo, Y., Chu, F. e Sun, P. (2006). Computational study of human

phosphomannosi isomerase: insights from homology modeling and molecular dyna-

mics simulation of enzyme bound substrate. Jounal of Molecular Graphics and

Modelling, 25:289–295.

Yoshida, N. (2006). Molecular basis of mammalian cell invasion by Trypanosoma cruzi.

Annals of the Brazilian Academy of Sciences, 78(1):87–111.

Zingales, B., Pereira, M. E., Oliveira, R. P., Almeida, K. A., Umezawa, E. S., Souto,

R. P., Vargas, N., Cano, M. I., da Silveira, J. F., Nehme, N. S., Morel, C. M., Brener, Z.

e Macedo, A. (1997). Trypanosoma cruzi genome project: biological characteristics

and molecular typing of clone cl brener. Acta Tropica, 68(2):159–173.

144

Apêndice A

Arquivo.mdp usado em dinâmica molecular

com temperatura a 37◦C

; User Priscila Capriles

; Input file

; 9pap molecular dynamics

;

; PROCESSING

;

title = Molecular Dynamics - CALCULATION

cpp = /lib/cpp

define =

;

; RUN CONTROL

;

integrator = md

tinit = 0

dt = 0.002 ;ps=2fs

nsteps = 500000 ;steps=1000ps=1ns

init_step = 0

comm_mode = linear

nstcomm = 1

comm_grps =

;

; SHELL MOLECULAR DYNAMICS

;

145

emtol = 100.0 ;KJ.mol-1.nm-1

niter = 20

;

; OUTPUT CONTROL

;

nstxout = 2500 ;steps=5ps

nstvout = 2500 ;steps=5ps

nstfout = 2500 ;steps=5ps

nstlog = 2500 ;steps=5ps

nstenergy = 10

nstxtcout = 2500 ;steps=5ps

nstcheckpoint = 2500 ;steps=5ps

xtc_precision = 2500 ;precision to write to xtc trajectory(real)

xt_grps =

energygrps = Protein SOL VAL Cl

;

; NEIGHBOR SEARCHING

;

rlist = 1.4 ;nm=14A

domain-decomposition = no

;

; ELECTROSTATIC AND VdW

;

coulombtype = reaction-field

rcoulomb_switch = 0 ;nm

rcoulomb = 1.6 ;nm=16A

epsilon_r = 54 ;dieletric constant

vdwtype = cut-off

rvdw = 1.4 ;nm=14A

;

; TEMPERATURE COUPLING

;

tcoupl = berendsen

tc_grps = Protein SOL VAL Cl

tau_t = 0.1 0.1 0.1 0.1 ;ps

146

ref_t = 310 310 310 310 ;K (OBS: para DM a 25oC usou-se 298K)

;

; PRESSURE COUPLING

;

pcoupl = berendsen

pcoupltype = isotropic

tau_p = 0.5 ;ps

compressibility = 4.5e-5 ;bar-1

ref_p = 1.0

andersen_seed = 815131 ;random seed for Andersen thermostat

;

; VELOCITY GENERATION

;

gen_vel = yes

gen_temp = 310 ;K

gen_seed = 173529 ;interger

;

; BONDS

;

constraints = all-bonds

constraint_algorithm = lincs

unconstrained_start = no

shake_tol = 0.0001 ;relative tolerance for shake

lincs_order = 4

lincs_iter = 4

lincs_warnangle = 30 ;degrees

morse = no ;(bonds are represented by harmonic potential)

147

Apêndice B

Alinhamento entre as sequências de cruzipaína

1 e cruzipaína 2

Investigou-se dentre as sequências genômicas de T. cruzi (El-Sayed et al, 2005)

anotadas como cisteíno proteases, a presença da isoforma 2 da cruzipaína a partir da ve-

rificação da substituição do ASP161 no subsítio S2, comum entre as isoformas de cru-

zipaína, por SER161 presente na cruzipaína 2 (dos Reis et al, 2006). Do alinhamento

entre as 13 sequências de T. cruzi anotadas como pertencentes a família das cisteíno pro-

teases e o modelo gerado da cruzipaína 2, via programa BLAST (Altschul et al, 1990),

apenas duas sequências apresentaram a mutação ASP161SER sendo que somente uma

sequência (8091.m00003) apresentou alta similaridade (82% de identidade). O alinha-

mento múltiplo entre a sequência M90067 da cruzipáina 2, o molde 1ME4 da cruzipaína

1, o modelo gerada da cruzipaína 2 (1ME4m) e a sequência 8091.m00003 investigada

no genoma de T. cruzi, está representado na Fig. B.1, destacando-se as regiões do sítio

e subsítios catalíticos.

148

Figu

raB

.1:A

linha

men

tom

últip

loen

tre

cruz

ipaí

nas

1e

2.

1me4m.pdb ------------------------------------------------------------------------------------------------------------------------

M90067 ---------------------------------MSGWARALSLAAVLVVMACLVPAATASLHAEETLASQFAEFKQKHGRVYGSAAEEAFRLSVFRANLFLARLHAAANPHATFGVTPFS 87

8091.m00003 MLLLSTSTPAHHHSLKVTLLKAHKEGNTPTQAVMSGWARALSLAAVLVVMACLVPAATASLHAEETLASQFAEFKQKHGRVYGSAAEEAFRLSVFRANLFLARLHAAANPHATFGVTPFS 120

1me4.pdb ------------------------------------------------------------------------------------------------------------------------

1me4m.pdb -----------------------------------APAAKDWREEGAVTAVKNQGICGSCWAFAAIGNIEGQWFLAGNPLTRLSEQMLVSCDNTNSGCGGGLSSKAFEWIVQENNGAVYT 85

M90067 DLTREEFRSRYHNGAAHFAAAEERARVPVDVEVVGAPAAKDWREEGAVTAVKNQGICGSCWAFAAIGNIEGQWFLAGNPLTRLSEQMLVSCDNTNSGCGGGLSSKAFEWIVQENNGAVYT 207

8091.m00003 DLTREEFRSRYHNGAAHFAAAQERARVPVDVEFVGAPAAKDWREEGAVTAVKNQGMCGSCWAFAAIGNIECQWFLAGNPLTRLSEQMLVSCDNTNSGCGGGWPLVAFKWIVDRNNGTVYT 240

1me4.pdb -----------------------------------APAAVDWRARGAVTAVKDQGQCGSCWAFSAIGNVECQWFLAGHPLTNLSEQMLVSCDKTDSGCSGGLMNNAFEWIVQENNGAVYT 85

* *oo>

<< oooxx

1me4m.pdb EDSYPYHSCIGIKLPCKDSDRTVGATITGHVELPQDEAQIAASGAVKGPLSVAVDASSWFFYTGGVLTNCVSKRLSHAVLLVGYNDSAAVPYWIIKNSWTTHWGEGGYIRIAKGSNQCLV 205

M90067 EDSYPYHSCIGIKLPCKDSDRTVGATITGHVELPQDEAQIAASGAVKGPLSVAVDASSWFFYTGGVLTNCVSKRLSHAVLLVGYNDSAAVPYWIIKNSWTTHWGEGGYIRIAKGSNQCLV 327

8091.m00003 EESYPYHSCIGISPPCTTSGHTVGATITGYVTIPRDENGIAAWLAVNGPVAVVVDASSWIFYTGGVMTSCVSKQLSHAVLLVGYNDSATVPHWIIKNSWTTHWGEDGYIRIAKGSNQCLV 360

1me4.pdb EDSYPYASGEGISPPCTTSGHTVGATITGHVELPQDEAQIAAWLAVNGPVAVAVDASSWMTYTGGVMTSCVSEQLDHGVLLVGYNDSAAVPYWIIKNSWTTQWGEEGYIRIAKGSNQCLV 205

x ## # xo>x > #

1me4m.pdb KEEVSSAVV---------------------------------------------------------------------------------------------------------------

M90067 KEEVSSAVVGGPGTTPEPTTTTTTSAPGPSPSYFVQMSCTDAACSVGCENVTLPTGQCLLTTSGVSAIVTCGAETLTEEVFLTSTHCSGPSVRSSVPLNKCNRLIRGSVEFFRSSNSSGR 447

8091.m00003 KEGVSSAVVGGPGATPEPTTTTTTSAPGPSPSYFVQMSCTDDACIVGCENVTLPTGQCLLTTSGASAIVTCGAETLTEEVFLTSTHCSGPSVRSSVPLNKCNRLLRGSVEFFRGSSSSGR 480

1me4.pdb KEEASSAVVG--------------------------------------------------------------------------------------------------------------

x

1me4m.pdb --------------------

M90067 LADVDRQRRYQPYHSRHRRL 467

8091.m00003 LADVDRQRRYQPYHSRHRRL 500

1me4.pdb --------------------

>SÍTIO CATALÍTICO

*S2'

#S1'

oS1

xS2

<S3

1ME

4m.p

db:m

odel

oes

trut

ural

dacr

uzip

aína

2ge

rado

porm

odel

agem

com

para

tiva

via

MH

OL

line.

M90

067:

seqü

ênci

ada

cruz

ipaí

na2

mad

ura

(Lim

aet

al,1

994)

,dep

osita

dano

Gen

Ban

k(d

ispo

níve

lem

http

://w

ww

.ncb

i.nlm

.nih

.gov

).Se

qüên

cia

usad

aco

mo

alvo

naco

nstr

ução

dom

odel

oes

trut

ural

dacr

uzip

aína

2(1

ME

4m).

8091

.m00

003:

prov

ável

cruz

ipaí

na2

emT.

cruz

iobt

ida

doba

nco

deda

dos

públ

ico

Tcr

uziD

B(h

ttp://

Tcr

uziD

B.o

rg-v

ersã

oT

CA

1.pe

p)(L

ucht

anet

al,2

004)

.1M

E4.

pdb:

estr

utur

ada

cruz

ipaí

na1

obtid

ado

banc

ode

dado

sPD

B(P

rote

inD

ata

Ban

k)(B

erm

anet

al,2

000;

Wes

tbro

oket

al,2

002)

.Seq

üênc

iaus

ada

com

om

olde

naco

nstr

ução

dom

odel

oes

trut

ural

dacr

uzip

aína

2(1

ME

4m).

149

Glossário

• Alinhamento de seqüência: arranjo linear entre duas seqüências de forma a se

obter o maior número possível de regiões idênticas e/ou similares.

• Alinhamento estrutural: sobreposição de estruturas tridimensionais.

• Alinhamento local: alinhamento entre regiões de seqüências com maior densi-

dade de resíduos idênticos ou similares.

• Alinhamento global: alinhamento entre seqüências em toda a sua extensão, de

forma a coincidir o maior número de resíduos idênticos ou similares.

• Alinhamento múltiplo de seqüências: alinhamento entre três ou mais seqüên-

cias, de forma que porções evolutivamente relacionadas estejam alinhadas (Pevs-

ner, 2003).

• Alvo molecular: enzima que desempenhe papel importante na manutenção bi-

ológica de um organismo patogênicos, e que esteja intrinsicamente ligada com

a doença em questão.

• Alvo terapêutico: sítio receptor eleito (enzima ou biorreceptor) com bases far-

macológicas para a ação de um fármaco ou protótipo capaz de permitir um

determinado efeito terapêutico (Barreiro e Fraga, 2001).

• Biorreceptor: Estrutura complexa, geralmente de natureza protéica, capaz de

reconhecer esteroespecificamente um determinado ligante (vide Receptor).

• Enzima: proteína que atua como um catalisador, acelerando reações bioquími-

cas sem alterar a direção ou a natureza da reação (Pevsner, 2003).

• Enzimas análogas: são enzimas capazes de catalisar uma mesma reação enzi-

mática, porém, sem serem ortólogos, nem parálogos. Apresentam seqüência

150

primária sem similaridade, bem como diferenças em suas estruturas terciá-

rias (Otto et al, 2006). Estas enzimas são resultantes de eventos evolutivos

independentes, em vez de descenderem de uma enzima ancestral comum (Gal-

perin et al, 1998).

• Enzimas similares: enzimas que desempenham papéis biológicos relacionados,

devido possíveis relações evolutivas.

• Fármaco: substância útil para tratar, curar ou prevenir um estado patológico

em seres humanos ou outros animais. Considera-se um fármaco as substân-

cias ativas empregadas em diagnóstico clínico ou capazes de modificar funções

fisiológicas (Barreiro e Fraga, 2001).

• Gaps: são deslocamentos feitos em uma ou mais seqüências, de forma a com-

pensar eventos de inserção e/ou deleção, e se obter um melhor alinhamento

entre elas.

• Genômica: tecnologia de alto desempenho que estuda a organização e a com-

posição de genomas (Guimarães, 2006).

• Genômica Funcional: estudo de genes, de suas proteínas resultantes e o papel

desempenhado por estas em processos bioquímicos (Pevsner, 2003).

• Genoma: todo o material genético de um organismo.

• Hidrólise: é a clivagem de uma ligação química com o envolvimento de molé-

cula de água na formação do produto da reação catalítica.

• Homologia: similaridade atribuída a descendentes, usualmente divergentes, de

um ancestral comum (Fitch, 2000).

• Identidade: extensões invariantes entre seqüências alinhadas.

• in vitro: estudos laboratoriais realizados fora de organismos vivos.

• in vivo: estudos realizados em organismos vivos.

151

• Inibidor Enzimático: Substância capaz de diminuir ou suprimir a atividade de

uma determinada enzima (Barreiro e Fraga, 2001).

• Isoenzima: enzima que desempenha uma mesma função de outra enzima, po-

rém, apresentando diferenças na seqüência de aminoácidos (Pevsner, 2003).

• Proteases: grupo de enzimas capazes de hidrolisar seletivamente ligações pep-

tídicas (vide Hidrólise).

• Proteoma: proteínas expressas por uma célula ou organismo sob condições

específicas em determinado tempo (Pevsner, 2003).

• Proteômica: tecnologia de alto desempenho que estuda simultaneamente todo

o comportamento protéico de uma célula (Guimarães, 2006).

• Protótipo: primeiro tipo ou exemplar original, modelo. Diz-se do composto

originalmente identificado que apresenta atividade farmacológica in vivo (Bar-

reiro e Fraga, 2001).

• Quimioterapia: terapias baseadas no uso de substâncias químicas. No entanto,

este termo está condicionado a fármacos que apresentem toxicidez seletiva con-

tra microorganismos, protozoários, parasitas, helmintos, vírus e células cance-

rosas (Barreiro e Fraga, 2001).

• Receptor: é uma biomacromolécula presente em uma célula, de natureza mem-

brânica, trasmembrânica ou intracelular, que “reconhece” específicos bioligan-

tes ativos (e.g. neurotransmissores, hormônios e fármacos) (Barreiro e Fraga,

2001).

• Seqüências conservadas: seqüência de bases nucleotídicas do DNA ou de ami-

noácidos da proteína que permaneceram essencialmente inalteradas no decorrer

de eventos evolutivos (Pevsner, 2003).

• Similaridade seqüencial: extensões de seqüências ou protéicas relacionadas,

baseando-se em fenômenos de conservação (Pevsner, 2003).

152

• Similaridade estrutural: regiões da estrutura 3D que apresentam conformações

preservadas.

• Transcriptômica: tecnologia de alto desempenho que implica pesquisa na ex-

pressão dos genes em diferentes espécies e condições (Guimarães, 2006).

153