Upload
nguyenkien
View
216
Download
0
Embed Size (px)
Citation preview
Pró-Reitoria de Graduação Curso de Biomedicina
Trabalho de Conclusão de Curso
SEQUENCIAMENTO DO GENOMA COMPLETO DE UM
ISOLADO DE SAPOVIRUS NO DISTRITO FEDERAL, BRASIL
Autor: Karoline dos Anjos Orientador: Dr. PhD. Tatsuya Nagata
Brasília - DF 2010
KAROLINE DOS ANJOS
SEQUENCIAMENTO DO GENOMA COMPLETO DE UM ISOLADO DE SAPOVIRUS NO DISTRITO FEDERAL, BRASIL
Projeto apresentado ao curso de
graduação em Biomedicina da
Universidade Católica de Brasília como
trabalho de conclusão de curso
apresentado à disciplina TCC II.
Orientador: Dr. PhD. Tatsuya Nagata.
Brasília 2010
Monografia de autoria de Karoline dos Anjos, intitulada “Sequenciamento do
genoma completo de um isolado de Sapovirus no Distrito Federal, Brasil”,
apresentado como requisito parcial para a obtenção do grau de Bacharel em
Biomedicina da Universidade Católica de Brasília, em 14 de junho de 2010,
aprovada pela banca examinadora abaixo assinada:
____________________________________________________
Prof. Dr. PhD Tatsuya Nagata
Orientador
Curso de Biologia Molecular – UnB
_____________________________________________________
Prof. Msc. Lidia Maria Pinto de Lima
Curso de Biomedicina – UCB
____________________________________________________
Prof. Dr.ª PhD Paula Andréia Silva
Curso de Biomedicina – UCB
Brasília
2010
ii
RESUMO
REFERÊNCIA: ANJOS, Karoline dos. Sequenciamento do genoma completo de um isolado de Sapovirus no Distrito Federal, Brasil. 2010. Trabalho de conclusão de curso de Bacharel em Biomedicina – Universidade Católica de Brasília, Brasília, 2010.
Sapporo virus é um membro do gênero Sapovirus da família Caliciviridae, é um agente causador de gastrenterite aguda. Seu genoma é linear, de senso positivo, ssRNA, com tamanho de cerca de 7,5 kb, poliadenilado na região terminal 3 '. Sapporo virus é dividido atualmente em cinco genogrupos (GI-GV), sendo que um genogrupo específico de suínos (GIII). No Brasil, sabe-se que os vírus que mais causam gastrenterites são os rotavírus e norovírus, ao passo que a ocorrência de sapovírus parece ser esporádica. No Distrito Federal, um sapovírus foi encontrado recentemente por RT-PCR de uma amostra fecal, visando amplificar parte do gene da proteína do capsídeo. A fim de identificar o genótipo do sapovírus isolado, o fragmento de DNA amplificado por RT-PCR foi sequenciado utilizando primers específicos para sapovírus na Plataforma de Sequenciamento da Universidade Católica de Brasília. O sapovírus isolado do DF foi identificado como genótipo 2 de genogrupo I. A análise filogenética foi realizada com esta região. Decidiu-se então sequenciar o genoma completo por clonagem dividindo em duas regiões genômicas. Primeiro a região 5’ e segundo a região 3’. Após o sequenciamento utilizando a técnica de primer walking, comparou-se os resultados com todas as sequências de genoma completo de Sapporo virus encontradas no GenBank, encontrando uma semelhança de 72% entre o sapovírus do DF com um sapovírus japonês (número de acesso HM002617). Palavras-chave: sapovírus, calicivírus, epidemiologia molecular.
iii
ABSTRACT
Sapporo virus is a member of the genus Sapovirus within Caliciviridae family, and a causative agent of acute gastroenteritis. The Sapporo virus genome is linear, positive-sense, single-strand RNA, of approximately 7,5kb that is polyadenylated at the 3’ terminus. Sapporo virus is divided in at least five genogroups, whereas GIII is a porcine infecting one. In Brazil it is known that the most causative gastroenteritis viruses are rotavirus and norovirus, whereas the occurrence of sapovirus seems sporadic. In the Federal District, a sapovirus was found recently by RT-PCR targeting partial capsid protein gene from stool sample. In order to identify the genotype of this sapovirus isolate, the amplified DNA fragment by RT-PCR was projected to direct-sequencing using specific primers to sapovirus at Sequence Platform of Catholic University of Brasília. The DF sapovirus isolate was identified as genotype 2 of Genogroup I. The phylogenetic analysis was done using this genomic region. Then it has been decided to sequence the complete genome by cloning in divided two genomic regions. First 5’ region and second 3’ region. After sequencing using primer walking the results were compared with all human Sapporo virus complete genome sequences deposited in GenBank, it has been founded 72% of similarity between DF sapovirus and one Japanese (access number HM002617). Key-words: sapovirus, calicivirus, molecular epidemiology.
iv
LISTA DE ILUSTRAÇÕES
Figura 1 – Partículas de sapovírus de extrato fecal. Evidência da conformação em estrela de Davi.
9
Figura 2 – Alinhamento múltiplo de genoma dos sapovírus e estratégia de escolha de sequenciamento de oligonucleotídeos.
15
Figura 3 – Árvore filogenética baseada na sequência da região do capsídeo de Sapovirus utilizando neighbor-joining, para a determinação do genogrupo encontrado no DF.
18
Figura 4 – Resultado da PCR da região 5’ do isolado de sapovírus encontrado no DF. O resultado da amplificação é de 3500pb.
19
Figura 5 – Resultado da PCR da região 3’ do isolado de sapovírus encontrado no DF. O resultado da amplificação é de 3900pb.
19
Figura 6 – Árvore filogenética comparando a sequência encontrada no Distrito Federal com onze sequências de genoma completo depositadas no GenBank seguidas de alinhamento pelo ClustalW Mega4.
21
Figura 7 – Análise entre as sequências utilizando o software RDP3Beta42, com o intuito de avaliar possíveis recombinações.
22
v
LISTA DE TABELAS
Tabela 1 – Análise de semelhança (distance pairwise) entre sequências de genoma completo de Sapovirus e o genoma sequenciado no Distrito Federal.
20
vi
SUMÁRIO
RESUMO ii
ABSTRACT iii
LISTA DE ILUSTRAÇÕES iv
LISTA DE TABELAS v
INTRODUÇÃO 7
JUSTIFICATIVA E PERSPECTIVAS 11
OBJETIVOS 13
Objetivos específicos 13
MATERIAL E MÉTODOS 14
Isolado 14
Genotipagem 14
RT-PCR para Sapovirus 15
Clonagem 16
Sequenciamento do genoma completo do Sapovirus 17
Análise do sequenciamento 17
RESULTADOS 18
DISCUSSÃO 23
CONCLUSÃO 24
PERSPECTIVA 24
REFERÊNCIAS BIBLIOGRÁFICAS 25
ANEXOS 27
7
INTRODUÇÃO
A diarréia é um dos sintomas mais comuns de doenças que acometem
crianças nos primeiros anos de vida, sendo causa significante de morbidade e
mortalidade infantil mundialmente [18, 19]. A diarréia em crianças com menos de
cinco anos pode ser considerada grave devido à possibilidade da perda de
fluídos e eletrólitos levá-las mais rapidamente a um estado de desidratação [10].
Mundialmente é estimado que doenças diarréicas resultem em
aproximadamente 1,87 milhões de mortes entre crianças menores de cinco
anos de idade. A maioria dessas mortes ocorre em países emergentes da
África e sudeste da Ásia[16]. A etiologia das diarréias pode envolver vários
agentes como vírus, bactérias e parasitas[7].
Recentemente com melhoria nas condições higiênicas, sanitárias e de
suprimento de água em países emergentes, tem havido uma redução
significativa no número de patógenos bacterianos, e um aumento proporcional
de diarréia em pacientes hospitalizados, que são atribuídas a agentes virais [16,
18].
No Brasil de acordo com o Ministério da Saúde houve óbito de 3,9% de
crianças menores de 5 anos que apresentavam doenças diarréicas no ano
2008, sendo no Distrito Federal a proporção de óbitos de 1,5% [3].
A morbidade associada à diarréia é importante devido ao fato de que
crianças apresentam entre 1 e 10 episódios de diarréia anualmente. Em países
desenvolvidos, assim como no Brasil, sua importância está relacionada ao
impacto da doença na população, traduzido pelos seus danos à saúde,
afetando o desenvolvimento infantil, bem como à sociedade pelos custos
gerados pela demanda aos serviços médicos, atendimento ambulatorial, pronto
atendimento, hospitalizações (custos diretos) e as perdas de dias de trabalho,
de escola, gastos com medicamentos, transportes, etc. (custos indiretos)[7].
Novos organismos têm sido identificados e associados com doenças
diarréicas e outras doenças do trato gastrintestinal. Entre os vírus o Sapovirus
tem sido reconhecido como agente causador desse tipo de patologia,
especialmente em crianças, assim como entre as bactérias, uma cepa
bacteriana de Clostridium difficille tem causado epidemias em diversos países
[18].
8
Os cinco gêneros virais entéricos mais comuns são o Rotavirus (Família
Reoviridae), Norovirus e Sapovirus (Família Caliciviridade), Mastadenovirus
(Adenoviridae) e Mamastrovirus (Astroviridae). Sendo o rotavírus descrito
mundialmente como o principal agente viral causador de gastrenterites [16].
Com o aprimoramento das técnicas de diagnóstico molecular, a
importância dos calicivírus humanos e outros patógenos não descritos
anteriormente, estão se tornando, aparentemente, um grande número de
agentes associados a gastrenterites [18].
Partindo desse ponto sabe-se que a primeira descrição dos calicivírus
entéricos surgiu em 1972, quando amostras envolvidas em surto de diarréia,
numa escola primária nos Estados Unidos foram analisadas em
Imunoeletromicroscopia. O primeiro agente viral isolado foi o Norwalk virus
(Gênero Norovirus). Em 1977, ocorreu outro surto de gastrenterite, porém na
cidade de Sapporo no Japão, onde foi demonstrada, também por microscopia
eletrônica a presença de um vírus morfologicamente semelhante ao Norwalk
virus, que foi denominada Sapporo virus (Gênero Sapovirus) [17].
Os calicivírus são vírus esféricos, pequenos, com um diâmetro de 27 a
40 nm. Seu capsídeo é composto por um único tipo de proteína, a qual exibe
uma simetria icosaédrica com 180 moléculas organizadas em 90 dímeros, que
formam dois domínios: o domínio S e o domínio P. O domínio S forma a parte
interna do capsídeo que envolve o genoma RNA; o domínio P, subdividido nos
domínios P1 e P2, assume, por intermédio deles, uma arquitetura
característica: é visto em forma de cálice pela microscopia eletrônica (ME).
Essa arquitetura é mais aparente nos Sapovirus, conferindo-lhes a aparência
de estrela-de-davi (Figura 1) [1].
9
Figura 1: Partículas de sapovírus de extrato fecal. Evidência da conformação em estrela de Davi
[4].
Os calicivírus são classificados em quatro principais gêneros, Sapovirus,
Norovirus, Lagovirus e Vesivirus, baseados na estrutura e diversidade do
genoma viral. A família Caliciviridae é formada por vírus não envelopados de
RNA, fita simples, senso-positivo, poliadenilados, de tamanho genômico de
aproximadamente 7,3 - 8,3 kb com duas ou três janelas de leitura abertas (ORF
– open reading frame) [14].
Uma importante característica do RNA genômico desses vírus é a
codificação da protease cisteína, “3C-like protease”, na ORF1. A protease é
inicialmente sintetizada como parte da ORF1 e cliva a poliproteína codificada
pela ORF em múltiplas proteínas não estruturais [14]. A proteólise da
poliproteína não estrutural dá origem a uma proteína associada ao genoma
(VPg), a uma helicase, a uma protease e a uma RNA polimerase RNA
dependente [17]. A proteína estrutural que forma o capsídeo é traduzida a partir
de um RNA mensageiro subgenômico codificada pela ORF2.
Dentre os quatro gêneros dos calicivírus, os sapovírus e norovírus, são
os agentes etiológicos de gastrenterites em humanos mais estudados [6].
10
Os norovírus são associados com gastrenterites em todas as idades,
com sazonalidade precisa ligada aos meses de inverno. A maioria dos surtos
de gastrenterites não bacterianas e não causados por rotavírus descritos são
causados por esse gênero [12]. As infecções por sapovírus, tanto em casos
epidêmicos como esporádicos, ocorrem menos frequentemente [16].
Os sapovírus infectam crianças e adultos, têm sido também encontrados
em surtos de gastrenterites em creches, hospitais e escolas primárias. As
informações sobre a epidemiologia e a variabilidade genética desses
patógenos são limitadas, no entanto, sabe-se que infecções por sapovírus em
humanos causam uma gastrenterite de período relativamente curto o que nos
leva a crer que pacientes com breve crise entérica não procuram por atenção
médica. Consequentemente, o estudo destas infecções não tem prioridade [8].
O genoma do sapovírus pode conter tanto duas como três ORFs. As
principais características funcionais da 2C-like NTPase (NTPase), VPg, 3C-like
protease (Pro), 3D-like RNA dependente de RNA polimerase, e a proteína do
capsídeo (VP1) são codificadas na ORF1, que posteriormente é clivada em
proteínas estruturais e não estruturais [13]. A ORF2 (VP2) e ORF3 codificam
proteínas de função ainda desconhecida. Com base na sequência de
nucleotídeos de VP1, os sapovírus foram divididos em cinco genogrupos (GI –
GV), sendo GI, GII, GIV e GV genogrupos que infectam humanos, enquanto
que GIII infecta espécies suínas [11, 20]. Esses genogrupos podem ainda se
subdividirem em genótipos. Recentemente foram identificados diversos
genótipos recombinantes [6]. Isso porque os sapovírus humanos são
geneticamente variáveis, tendo identificados pelo menos 13 “clusters”
genéticos ou genótipos (GI.1 a GI.5, GII.1 a GII.6, GIV.1 e GV.1)[11].
Os métodos de detecção incluem a transcrição reversa e a reação em
cadeia da polimerase (RT-PCR), RT-PCR em tempo real, ensaios
imunoenzimáticos e ELISA [6].
11
JUSTIFICATIVAS E PERSPECTIVAS
Doenças diarréicas são uma importante causa de morbidade e
mortalidade mundialmente, e ocorrem mais frequentemente em crianças
menores de cinco anos de idade. Patógenos virais são os causadores mais
comuns de gastrenterites em comunidades e outros locais, incluindo hospitais.
Os vírus associados a gastrenterites são o grupo rotativírus (espécie A),
calicivírus, astrovírus, e adenovírus. Estes vírus em sua maioria afetam
crianças nos primeiros anos de vida e têm sido descritos como causa comum
de gastrenterites, especialmente em países onde há grandes diferenças sociais
em termos de qualidade da água, higiene, comida e saneamento [20].
Os dois gêneros dos calicivírus, Norovirus e Sapovirus, são relevantes,
sendo o norovírus o segundo agente viral mais associado a gastrenterites
mundiais, e assim possui uma gama de estudos a seu respeito, incluindo a
tentativa ainda não bem sucedida de replicá-lo em células in vitro para o estudo
de seu mecanismo de infecção[5]. Em contrapartida o sapovírus por ser
observado em surtos de forma esporádica, principalmente, em países
desenvolvidos, possui pouca descrição científica a respeito de sua
fisiopatologia.
Atualmente a detecção de agentes virais realizadas no Laboratório
Central de Saúde Pública do Distrito Federal (LACEN-DF) ocorre por meio de
testes rápidos (ELISA) com pesquisa de antígenos em amostras fecais. No
entanto, o teste inserido no processamento de rotina dessas amostras é
específico, apenas, para a identificação de rotavírus.
Com o intuito de ampliar a identificação dos agentes virais causadores
de diarréias no Distrito Federal, foi estudada a possibilidade de inserir a técnica
de RT-PCR Multiplex como método diagnóstico na rotina laboratorial. Por meio
dessa técnica foi possível a detecção de um genótipo de sapovírus.
Após uma breve análise literária sobre o agente viral detectado concluiu-
se que não há estudos específicos na América Latina, ressaltando, assim, a
importância do achado. Partindo desse princípio a realização do
sequenciamento do genoma completo desse genótipo torna-se relevante
cientificamente, pois o conhecimento da mesma possibilitará a comparação
com os isolados dos demais continentes, e consequentemente a sugestão de
12
possíveis recombinações genômicas. O depósito dessa sequência no GenBank
pode ainda favorecer futuras pesquisas sobre a patogenia viral, e identificação
de trechos do genoma associados à antigenicidade, auxiliando no
desenvolvimento de vacinas e conjunto diagnósticos.
13
OBJETIVOS
O presente trabalho tem como objetivo principal o sequenciamento do
genoma completo do sorotipo do Sapporo virus identificado em uma amostra
de fezes diarréica.
Objetivos específicos
1. Desenhar oligonucleotídeos específicos para a amplificação das
regiões 5’ e 3’ do genoma.
2. Amplificar as duas regiões.
3. Ligar o inserto com vetor (pCR 4TOPO) e transformar em bactéria E.
coli (DH5α).
4. Clonar.
5. Confirmar o sequenciamento utilizando o sequenciador automático
ABI377 da Universidade Católica de Brasília.
6. Sequenciar o genoma completo usando a técnica de primer walking.
7. Alinhar a sequência com as demais sequências completas
depositadas no GenBank.
8. Construir árvore filogenética.
9. Analisar possível recombinação gênica.
14
MATERIAL E MÉTODOS
Isolado
Para a detecção da amostra de sapovirus descrita nesse estudo, foi
utilizado inicialmente um protocolo de RT-PCR Multiplex descrito por Yan et al.
(2003)[21], o qual utiliza amostras fecais diarréicas para a detecção de agentes
virais de gastroenterites.
Amostras fecais negativas para rotavírus selecionadas no Laboratório
Central de Saúde Pública do Distrito Federal (LACEN) foram testadas com o
protocolo de RT-PCR Multiplex, sendo uma amostra positiva para o Sapovirus.
Genotipagem
A amostra identificada como positiva para sapovírus foi tratada com
ExoSAP, 6µL do produto de PCR adicionado de 0,5µL de Exonuclease I
(Fermentas) (10U), 1µL Shrinp Alkaline Phosphatase (Fermentas) (1U).
Incubou-se a reação a 37°C 15min em seguida a 85°C 15min. A 2,5µL dessa
reação foi adicionado 1,5µL de oligonucleotídeo SAPO FOR (2µM) (5’-
CTCGCCACCTACRAWGCBTGGTT-3’) foi completado com água MiliQ para
um volume final de 8µL. Essa mistura foi submetida ao sequenciamento com kit
de sequenciamento DYEnamic DNA terminal sequencing kit (GE Lifesciences)
utilizando sequenciador automático de ABI377.
A análise da sequência obtida foi lançada no BLAST
(http://blast.ncbi.nlm.nih.gov/Blast.cgi). Vinte e cinco sequências 15 de
sapovírus foram utilizadas para o alinhamento da amostra detectada.
O resultado do sequenciamento foi analisado com os softwares Staden
Package (http://staden.sourceforge.net/), CLUSTAL-W (http://www.clustal.org/)
e MEGA4 (http://www.megasoftware.net/) com o método neighbor-joining.
15
RT-PCR para Sapovirus
Após essas análises, um novo RT-PCR foi realizado utilizando
oligonucleotídeos específicos para o sapovírus, para que desta forma fosse
sequenciado o genoma completo do vírus.
As sequências de genoma completo do sapovírus foram alinhadas com
o intuito de identificar as regiões mais conservadas. Baseados nesta análise,
oligonucleotídeos foram desenhados para recuperar o genoma inteiro do
sapovírus isolado no DF por RT-PCR.
3’-For 5'- TTT GAA ACT CCM AAC ATC AC -3' gi|51950963|ref|NC_006269.1| AGGGGACATTTGAAACTCCAAACATCACTGTGAATGGGTTCCATGTCAGA 3483
gi|51895344|gb|AY694184.2| AGGGGACATTTGAAACTCCAAACATCACTGTGAATGGGTTCCATGTCAGA 3483
gi|190634644|gb|AY237422.3| AGGGAACGTTTGAAACTCCAAACATCACTGTGAATGGGTTCCATGTCAGA 3483
gi|70799531|gb|DQ058829.1| AAGGAACATATGAAACACCCAACATCACAGTCCAGGGGTACCATCTCAGG 3490
* ** ** * ****** ** ******** ** * **** **** ****
gi|51950963|ref|NC_006269.1| ATAATGAATGGTTACCCAACCAAGAAAGGTGACTGCGGGCTGCCCTATTT 3533
gi|51895344|gb|AY694184.2| ATAATGAATGGTTACCCAACCAAGAAAGGTGACTGCGGGCTGCCCTATTT 3533
gi|190634644|gb|AY237422.3| ATTGTGAATGGTTACCCAACTAAGAAGGGAGACTGTGGACTGCCCTATTT 3533
gi|70799531|gb|DQ058829.1| ATCCTTAATGGTTACCCAACCAAGCGCGGGGATTGCGGGACGCCATATTT 3540
** * ************** *** ** ** ** ** *** *****
5’ Rev 5'- TTC TTR GTT GGG TAA CCA TT -3' gi|51950963|ref|NC_006269.1| CAATTCCAACCGCCAGTTAGTGGCGTTGCACGCCGGCACGGATACACAAG 3583
gi|51895344|gb|AY694184.2| CAATTCCAACCGCCAGTTAGTGGCGTTGCACGCCGGCACGGATACACAAG 3583
gi|190634644|gb|AY237422.3| CAACTCCAACCGCCAGTTGGTGGCGTTGCACGCCGGCACGGACACACAAG 3583
gi|70799531|gb|DQ058829.1| CGACGCCTGCCGCAGACTGGTGGGTTTGCACGCCGCGACTTCCACCAACG 3590
* * ** **** * **** ********** ** ** * *
Figura 2. Alinhamento múltiplo de genoma dos sapovírus e estratégia de escolha de sequenciamento de oligonucleotídeo.
Uma nova extração foi realizada seguida de uma RT para cada região a
ser amplificada. Para a amplificação da extremidade 3’ foram utilizados 10µL
de amostras mais 1µL de oligo DT50 e 1µL de dNTP. Para a extremidade 5’
foram utilizados 10µL de amostras mais 1µL de oligonucleotídeo Sapo 5’ Rev
(5’-TTCTTRGTTGGGTAACCATT-3’) e 1µL de dNTP. As reações foram
incubadas a 75°C 5min, seguidas da adição de 4µL de buffer 10x de
Superscrip III (Invitrogen), 2µL de DTT, 1µL de RNaseOut (Invitrogen) e 1µL de
Superscript III. Ambas as reações foram incubadas a 45°C 60min. Em seguida
foi acrescentado 1µL de RNase H (New England Biolabs, NEB) e novamente
37°C 20min seguida de uma incubação a 75°C 15min.
Para a execução da PCR cada produto de RT foi amplificado com um
par de oligonucleotídeos específicos. A extremidade 3’ foi amplificada utilizando
16
o par de oligonucleotídeos Sapo 3’ For (5'- CAG TGG TGA CTA TCA CGG
AAG -3') / M4. A extremidade 5’ foi amplificada utilizando-se o par de
oligonucleotídeos Sapo 5’ Rev / Sapo 5’ For (nomenclatura sugerida
independente da sequência de primers).
Os produto de RT para PCR foram utilizados da seguinte forma, 1µL de
cDNA, 5µL de buffer 5x LongAmp (NEB), 4µL dNTP 2,5mM, 1µL de cada
oligonucleotídeo (forward, Sapo 5’ For e Sapo 3’ For, e reverse, Sapo 5’ Rev e
M4), 1µL de LongAmp, e adição de água MiliQ para completar um volume final
de 25µL.
Os produtos de PCR foram confirmados com eletroforese em gel de
agarose a 1%, corado com brometo de etídio.
Clonagem
Com o objetivo de aumentar as moléculas do produto de PCR com “A-
overhang”, a cada produto de PCR foi adicionado 0,1µL de Taq Polimerase
(NEB) seguido de uma incubação a 70°C 30min. O volume total dessa reação
foi submetido a uma eletroforese em gel de agarose a 1%, corado com violeta
cristal (40µg/mL de água destilada) seguido de eluição e purificação das
bandas positivas presentes no gel.
A purificação do DNA foi realizada utilizando o conjunto comercial (GFX
PCR DNA and Gel Band Purification Kit – GE Healthcare). Em seguida foi feita
a ligação de cada inserto (3’ e 5’) no vetor pCR4 TOPO (Invitrogen). Após a
ligação os resultados da ligação foram transformados em células E. coli cepa
DH5α, por meio de eletroporação.
Foram plaqueados 200µL de cada transformado em meio LB Agar (uma
placa para cada ligação) com canamicina e IPTG. As placas foram incubadas a
37°C overnight.
Após a seleção de quatro clones de cada placa se realizou uma mini
preparação do DNA de acordo com o protocolo de coluna caseira descrito por
Borodina et al (2003)[2] (Anexo 1).
17
Sequenciamento do genoma completo do Sapovirus
Os clones selecionados foram enviados para o sequenciamento no
laboratório da Macrogen (Coreia do Sul).
As amostras enviadas eram o produto de uma mini-preparação por meio
de conjunto comercial (plasmidPrep Mini Spin Kit - GE Healthcare).
O sequenciamento foi realizado na Macrogen utilizando a técnica de
primer walking, na qual um par de oligonucleotídeos é desenhado de acordo
com o resultado da sequência específica do plasmídeo, nesse estudo, para que
dessa forma possa se amplificar regiões posteriores a sequência já
identificada.
Análise do sequenciamento
A análise do genoma completo do isolado de Sapovirus do Distrito
Federal foi realizada por meio de alinhamento múltiplo com doze sequências
depositadas no GenBank. Número de acesso das sequências entre parênteses
Thailand-NongKhai-24 (AY646856.2); Japan-C12 ( AY603425.1); Germany-
Dresden01 (AY694184.2); Thailand-Mc10 (NC_010624.1); Japan-Mc114
(AY237422.3); Japan-Ehime1107 (DQ058829.1); Thailand-SaKaeo-15
(AY646855.2); Thailand-Mc2 (AY237419.2); Japan-Hu1982 (HM002617);
China-Pig-Sav1 (FJ387164.1); Vietnan-norwalk (AF504671); Thailand
(AY237415.2); US-porcine (AF182760.1). Em seguida foi construída uma
árvore filogenética usando o método de neighbor-joinig e por fim uma análise
de recombinação e “distance plot” foi realizada utilizando o software
RDP3Beta42[12].
18
RESULTADOS
Genotipagem
O alinhamento da sequência de parte do gene do capsídeo (434pb) do
isolado de Sapovirus encontrado no Distrito Federal com 24 sequências da
região do capsídeo [15] demonstrou que o isolado pertence ao genogrupo I e
possui o genótipo tipo 2 (Figura 3).
Figura 3: Árvore filogenética baseada na sequência da região do capsídeo de Sapovirus
utilizando o método neighbor-joining, para a determinação do genogrupo encontrado no DF.
19
RT-PCR para Sapovirus
A amplificação de ambas as regiões 3’ e 5’, para a realização da
clonagem, apresentou os resultados de 3950pb e 3500pb, sendo notória a
presença de amplificações inespecíficas na PCR da região 5’, respectivamente
(Figuras 4 e 5).
Figura 4: Resultado da PCR da região 5’ do isolado de sapovírus encontrado no DF. O resultado da amplificação é de 3500pb.
Figura 5: Resultado da PCR da região 3’ do isolado de sapovírus encontrado no DF. O resultado da amplificação é de 3900pb.
20
Sequenciamento do genoma completo
Tabela 1: Análise de distância (distance pairwise) entre sequências de genoma completo de Sapovirus e o genoma sequenciado no Distrito Federal.
Sequências 1 2 3 4 5 6 7 8 9 10 11 1.HM002617
2.FJ387164 0.88480
3.AY646856 0.69666 0.86051
4.AY603425 0.56581 0.83338 0.72632
5.AF182760 0.89963 0.13638 0.87249 .085856
6.AY694184 0.08400 0.88570 0.69388 0.57392 0.90172
7.NC010624 0.57104 0.82436 0.71289 0.16696 0.85042 0.57366
8.AY237422 0.08984 0.88990 0.69542 0.56504 0.90039 0.09722 0.57122
9.DQ058829 0.58074 0.83646 0.71206 0.37192 0.86224 0.58232 0.37006 0.56954
10.AY646855 0.57458 0.83278 0.71793 0.24663 0.85555 0.58061 0.25696 0.58202 0.36840
11.AY237419 0.56903 0.83406 0.72763 0.31242 0.83423 0.57622 0.31642 0.57572 0.41849 0.32947
12.Sapo BR-
DF01
0.35963 0.86460 0.70924 0.59341 0.88836 0.36194 0.59135 0.36250 0.58357 0.59522 0.58825
Foram obtidos os resultados do sequenciamento completo da região 5’,
enquanto que da região 3’ houve amplificação de 3803pb, ou seja, não foi
obtida a sequência da extremidade 3’ somada a cauda adenilada do genoma.
Total de 7403 nt do isolado BR-DF01 foi sequenciado no trabalho. O genoma
possui dois quadros de leitura aberta (ORF) preditos. Uma ORF (ORF1) que
começa em posição 13nt e termina em 6882nt de acordo com a análise do
genoma completo utilizando o software ORF finder
(http://www.ncbi.nlm.nih.gov/projects/gorf/). A segunda ORF começa ainda
dentro de códon de terminação de ORF1 (em 6882nt) e termina 7371nt. Ainda
menos provável ORF (ORF3) também foi detectada no Frame 2 em posição
5180nt a 5669nt. Este sequenciamento obtido foi comparado com os genomas
completos depositados no GenBank, sendo encontradas 15 sequências de
genoma completo e utilizadas apenas onze pela avaliação de semelhança. A
21
partir do alinhamento múltiplo com essas novas sequências uma nova árvore
filogenética foi construída (Figura 6), sendo o Sapo BR-DF01 distante do
isolado HM002617 (Japonês) em 0.35963 (Tabela 1) e enquanto que do
isolado AY694184 (Alemão) em 0.36194. A identidade “pairwise” do isolado
brasileiro com o isolado japonês (HM002617) ou o alemão (AY694184)
mostrou-se em 72%. Entre os isolados HM002617 e AY694184 Há uma
identidade de 92%, o que demonstra que o isolado BR-DF01 é geneticamente
distante de outros.
Figura 6: Árvore filogenética comparando a sequência encontrada no Distrito Federal com doze sequências depositadas no GenBank seguidas de alinhamento pelo ClustalW Mega4.
Com o intuito de se avaliar possíveis recombinações foi utilizado o
software RDP3Beta42[12], utilizando também onze sequências de genoma
completo de Sapovirus e a sequência do Sapovirus isolado do DF com
ausência de 147pb finais da região 3’ (Figura 7). Nessa análise é possível
caracterizar a sequência do DF como similar as sequências japonesa e alemã
em quase toda a região genômica. Pelo padrão de gráfico, a possível
recombinação não foi detectada entre os isolados analisados utilizando o
programa RDP3 Beta42[12].
22
Figura 6: Análise entre as sequências utilizando o software RDP3Beta42, com o intuito de avaliar possíveis recombinações.
23
DISCUSSÃO
A classificação dos calicivírus foi baseada na sequência parcial ou
completa do gene do capsídeo, principalmente pela ausência de um sistema
celular capaz de isolar e diferenciá-los. Esta limitação no cultivo de calicivírus
tem dificultado os estudos sobre as estratégias de replicação desses
importantes patógenos humanos e animais. Uma abordagem alternativa aos
estudos baseados em células baseou-se na caracterização estrutural e
funcional in vitro das enzimas virais supostamente envolvidos na replicação,
como a polimerase, a protease, ou a NTPase viral[5].
Para que se obtenham as sequências específicas das enzimas virais, no
entanto, inicialmente, são necessários estudos básicos a partir da sequência do
genoma. Avaliando-se as ORFs e seu sistema de clivagem em proteínas
estruturais e não estruturais.
Sendo assim, o objetivo desse trabalho era realizar o sequenciamento
do genoma completo do Sapovirus isolado no Distrito Federal, com o intuito de
determinar o possível genogrupo circulante a partir de análises comparativas
com os demais genomas completos depositados no GenBank, e
posteriormente avaliar as regiões específicas deste.
A primeira análise realizada utilizou parte da sequência do gene do
capsídeo do isolado do DF (434pb), a comparação com 24 sequências desse
gene[15] deu origem a uma árvore filogenética (Figura 3) na qual se pode
observar o sapovírus do DF como pertencente ao genogrupo I (GI) genótipo 2,
e ainda pode se dizer que há uma proximidade entre esse isolado e um isolado
americano (número de acesso U73124).
Os resultados obtidos e descritos neste trabalho, quanto a análise
genômica, são referentes à sequência do genoma quase completo de 7403 nt,
com ausência apenas da região não traduzida (UTR) pela analogia com outras
sequências de genoma completo de sapovírus. De acordo com os resultados
obtidos a partir desta sequência (7403pb) pode se observar uma semelhança
com um isolado japonês e um isolado alemão, entretanto, a identidade com
estes dois isolados é apenas 71%. Isso mostra que o isolado BR-DF01 é
geneticamente muito diferente destes. Pela análise de genotipagem, estes dois
isolados pertencem ao genogrupo I e genótipo1. O isolado BR-DF01 pertence
24
ao GenogrupoI genótipo 2. Sendo essa a primeira sequência de genoma
completo deste genogrupo. A análise para detectar recombinação genômica
viral utilizando o programa RDP3Beta42 não mostrou sinal de existência de
recombinação entre as doze sequências analisadas. Entretanto com o
norovírus, a recombinação já foi demonstrada [9]. Com o aumento de
informação genômica de sapovírus, o possível evento de recombinação
poderia ser detectado.
Conclusão
O genoma quase completo de isolado brasiliense de sapovírus (BR-
DF01) foi sequenciado com tamanho de 7403nt. Esta sequência mostra duas
ORFs, que correspondem as ORF1 e ORF2 do sapovírus. O vírus pertence o
genogrupo I, genotipo2 e representa o primeiro sequenciamento de genoma
completo do sapovírus GI-2. Com a análise do genoma do sapovírus BR-DF01
pode se concluir uma identidade maior com as sequências japonesa e alemã,
porem num nível muito baixo de 72%.
Perspectiva
Espera-se com esse trabalho poder iniciar um estudo básico de
caracterização desse agente patogênico emergente no país, com o intuito
posterior de expressão de proteínas virais para o desenvolvimento de conjunto
diagnóstico para uso comercial em rotinas laboratoriais.
25
REFERÊNCIAS BIBLIOGRÁFICAS 1. Borges AMT, Cardoso DdDdP (2005) Calicivírus Humano. Revista de Patologia
Tropical 34: 10
2. Borodina TA, Lehrach H, Soldatov A (2003) DNA purification on homemade
silica spin-columns,. Analytical Biochemistry 321: 3
3. BRASIL (2008) Ministério da Saúde. Indicadores e Dados Básicos - Brasil.
DATASUS
4. Chiba S, Nakata S, Numata-Kinoshita K, Honma S (2000) Sapporo virus:
history and recent findings. The Journal of Infectious Diseases 181 Suppl 2:
S303-308-S303-308
5. Fullerton SWB, Blaschke M, Coutard B, Gebhardt J, Gorbalenya A, Canard B,
Tucker PA, Rohayem J (2007) Structural and functional characterization of
sapovirus RNA-dependent RNA polymerase. Journal of Virology 81: 1858-1871
6. Hansman GS, Oka T, Sakon N, Takeda N (2007) Antigenic diversity of human
sapoviruses. Emerg Infect Dis 13: 1519-1525
7. Instituto Adolf Lutz (2004) Diarréia e rotavírus. Rev Saúde Pública 38: 2
8. Johnsen CK, Midgley S, Böttiger B (2009) Genetic diversity of sapovirus
infections in Danish children 2005-2007. Journal of Clinical Virology: The
Official Publication of the Pan American Society for Clinical Virology 46: 265-
269
9. Katayama K, Shirato-Horikoshi H, Kojima S, Kageyama T, Oka T, Hoshino F,
Fukushi S, Shinohara M, Uchida K, Suzuki Y, Gojobori T, Takeda N (2002)
Phylogenetic analysis of the complete genome of 18 Norwalk-like viruses.
Virology 299: 225-239
10. Koletzko S, Osterrieder S (2009) Acute infectious diarrhea in children. Dtsch
Arztebl Int 106: 539-547; quiz 548
11. Martella V, Lorusso E, Banyai K, Decaro N, Corrente M, Elia G, Cavalli A,
Radogna A, Costantini V, Saif LJ, Lavazza A, Di Trani L, Buonavoglia C
(2008) Identification of a porcine calicivirus related genetically to human
sapoviruses. J Clin Microbiol 46: 1907-1913
12. Martin DP (2009) Recombination detection and analysis using RDP3. Methods
Mol Biol 537: 185-205
13. Oka T, Katayama K, Ogawa S, Hansman GS, Kageyama T, Ushijima H,
Miyamura T, Takeda N (2005) Proteolytic processing of sapovirus ORF1
polyprotein. Journal of Virology 79: 7283-7290
14. Oka T, Yokoyama M, Katayama K, Tsunemitsu H, Yamamoto M, Miyashita K,
Ogawa S, Motomura K, Mori H, Nakamura H, Wakita T, Takeda N, Sato H
(2009) Structural and biological constraints on diversity of regions immediately
upstream of cleavage sites in calicivirus precursor proteins. Virology 394: 119-
129
15. Okada M, Yamashita Y, Oseto M, Ogawa T, Kaiho I, Shinozaki K (2006)
Genetic variability in the sapovirus capsid protein. Virus Genes 33: 157-161
16. Ramani S, Kang G (2009) Viruses causing childhood diarrhoea in the
developing world. Curr Opin Infect Dis 22: 477-482
17. Santos NSO, Romanos MTV, WiGG MD (2002) Introdução à virologia humana.
Guanabara Koogan, Rio de Janeiro
18. Schlenker C, Surawicz CM (2009) Emerging infections of the gastrointestinal
tract. Best Practice & Research Clinical Gastroenterology 23: 89-99
26
19. Vernacchio L, Vezina RM, Mitchell AA, Lesko SM, Plaut AG, Acheson DWK
(2006) Diarrhea in American Infants and Young Children in the Community
Setting. The Pediatric Infectious Disease Journal 25: 2-7
20. Xavier MPTP, Oliveira SA, Ferreira MSR, Victoria M, Miranda V, Silva MFM,
Strina A, Barreto ML, Miagostovicht MP, Leite JPG (2009) Detection of
caliciviruses associated with acute infantile gastroenteritis in Salvador, an urban
center in Northeast Brazil. Brazilian Journal of Medical and Biological Research
= Revista Brasileira De Pesquisas Médicas E Biológicas / Sociedade Brasileira
De Biofísica [et Al 42: 438-444
21. Yan H, Yagyu F, Okitsu S, Nishio O, Ushijima H (2003) Detection of norovirus
(GI, GII), Sapovirus and astrovirus in fecal samples using reverse transcription
single-round multiplex PCR. Journal of Virological Methods 114: 37-44
27
Anexo I
Protocolo de Mini preparação caseira de coluna 1. Preparar o inóculo de bactéria com três ml de meio LB e antibiótico
especifico. 2. Repassar dois ml do inoculo para micro tubo. 3. Centrifugar a 12000 g por um minuto. Descartar sobrenadante. 4. Adicionar 150 µl de PB1 e ressuspender o pellet na estante ou
vórtex. PB1 – 50 mM glucose; 35 mM EDTA pH 8.0 (mantém a pressão osmótica da célula, evitando a lise no momento de ressuspender).
5. Adicionar 150 µl de PB2 e misturar invertendo de 5 a 10 vezes. PB2 – 0,2 M NaOH; SDS 1% (lisa a parede celular bacteriana, liberando o DNA).
6. Adicionar 210 µl de PB3 (preparado na hora) e misturar por um minuto invertendo o micro tubo. PB3 – 400 µl de guanidina (GuHCl) mais 100 µl de EDTA pH 8.0 (essa solução mantém as nucleases inativadas e equilibra o pH, fazendo com que o DNA se ligue à membrana da coluna).
7. Centrifugar a 12000 g por cinco minutos. 8. Transferir o sobrenadante para a coluna (confeccionada com fibra de
vidro Whatman) e incubar por um minuto em temperatura ambiente. 9. Centrifugar a 12000g por um minuto e descartar o sobrenadante. 10. Lavar a coluna com 400 µl de PB4. Centrifugar a 12000 g por um
minuto. PB4 – 5M de tiocianato de guanidina (GuSCN); 100 mM EDTA pH 8.0 (mantém o pH equilibrado e o DNA ligado a membrana).
11. Lavar duas vezes com 400 µl de tampão de lavagem e centrifugar a 12000 g por um minuto. Tampão de lavagem – 10 mM de Tris-HCl, pH7,5; etanol 80% (retira os sais da amostra).
12. Descartar o líquido e centrifugar novamente a 12000 g por dois minutos (para retirar completamente o tampão de lavagem). Transferir a coluna para um novo micro tubo.
13. Adicionar 50 µl de tampão de eluição e incubar por dois minutos em temperatura ambiente. Tampão de eluição – 10 mM Tris-HCl, pH 8,5 (retira o DNA da membrana).
14. Centrifugar a 12000 g por dois minutos. Guardar a amostra em freezer -20°C.
28
Anexo II
Normas de Referência Bibliográfica de acordo com a revista Archives of Virology
Citation
Reference citations in the text should be identified by numbers in square brackets. Some examples: 1. Negotiation research spans many disciplines [3]. 2. This result was later contradicted by Becker and Seligman [5]. 3. This effect has been widely studied [1-3, 7].
Reference list
The list of references should only include works that are cited in the text and that have been published or accepted for publication. Personal communications and unpublished works should only be mentioned in the text. Do not use footnotes or endnotes as a substitute for a reference list. The entries in the list should be numbered consecutively.
Journal article
Gamelin FX, Baquet G, Berthoin S, Thevenet D, Nourry C, Nottin S, Bosquet L (2009) Effect of high intensity intermittent training on heart rate variability in prepubescent children. Eur J Appl Physiol 105:731-738. doi: 10.1007/s00421-008-0955-8
Ideally, the names of all authors should be provided, but the usage of “et al” in long author lists will also be accepted:
Smith J, Jones M Jr, Houghton L et al (1999) Future of health insurance. N Engl J Med 965:325–329
Article by DOI
Slifka MK, Whitton JL (2000) Clinical implications of dysregulated cytokine production. J Mol Med. doi:10.1007/s001090000086
Book
South J, Blass B (2001) The future of modern genomics. Blackwell, London
Book chapter
Brown B, Aaron M (2001) The politics of nature. In: Smith J (ed) The rise of modern genomics, 3rd edn. Wiley, New York, pp 230-257
29
Online document
Cartwright J (2007) Big stars have weather too. IOP Publishing PhysicsWeb. http://physicsweb.org/articles/news/11/6/16/1. Accessed 26 June 2007
Dissertation
Trent JW (1975) Experimental acute renal failure. Dissertation, University of California
Always use the standard abbreviation of a journal’s name according to the ISSN List of Title Word Abbreviations, see
www.issn.org/2-22661-LTWA-online.php
30
Anexo III
Sequência do sapovírus BR-DF01
1 GTGATTGGTT AGATGGTTTC CAAGCCATAC AGGCCAATAT CCCTCGACCC
51 CACTTTCGAG TGGGTCGTTT TCCGTCGCTG CTACCTCAGG GTAGCACCTC
101 GGGAAACATT TGTAGAGGAT TTCAAAGAAT TAGAATATTA TTTCACCACG
151 CGCTTGTGCG CGTGGTTAAA GCGTGTCACT AGGACCCTCC CTAGGAGGGA
201 GTTTGTGGAG GAGGGTCTCC TTGACGCGTT TAACAGCAAG CCAGTGGTTG
251 AACCTAATGA GGACATTCTC TTTAGAGAAC TCTTTGGGGT GGACTTGCAG
301 GAACAGTTCC CAATGTCAAT TCACGACCTC GCCAAATTAC AAGGTGAGGC
351 GGTGGATGCC TTGCGTAATC CTGGACATCA ATTACGTAGG AAGTATACAA
401 CACAAACCCT AAAGAAACTG GTTACCAAAA TCACAAGGGT GGTACCTGTC
451 CAGGCCACCC TACAAGACAT GCATGAGCGG CGCGATTTTG AAAGGGAACG
501 TGCCGACTTG TTTAAAGAAC TACCCCTGTT AGATGAAGAG ATAACACAAA
551 AACCCAAGAC ATATTTTTAT TCAATGTGGC GTCAAGTTGT GAAGAAAGGT
601 AAGACCTACT TCATGCCACT CGTAAAGACA AATGGATGGG TTAGTAAAAT
651 CACAAAAATC ACTGACCCCA TCAAAGATTT CATCATAGCT TTTTGCCAGG
701 CAGTCCAACA AGAGATGGGG ACGGATCCAC GGTATTTGCA GCTGGCTTGG
751 ATTCAAAAGC TAAAGCCAAC CGTGCTCACC ATCATCCTAC AACAACACAA
801 AAACACCGTG TCAGGGTGGT TGGCGACACT AACAGCTCTA GTGGAAGTTT
851 ACTCCAACCT TTTTGATGAT TTGCGCAAGT CTGCCGTTAC CATCATATCG
901 GCACTAAGTG CTTTCTTCGA TGTGTGTAAA GACTTCATTG CTAGTGTTGT
951 TGACTTGATT AAAACCACAT TCACACCTCA GGGCCCCACT GATCTTGGAT
1001 GGACCGCAGT TGCGGCTGGA GCAGTCATGA TTCTACTAAA GGCTTCTGGT
1051 TGCCCTGGTG TGTCGGGCAT GTGGGGTAAA ATACTCAAGG TGTGCGGGGG
1101 CATTACAACC ATAACCGCTG CCATACGGGG TATCAAGTGG CTCAGAGAAC
1151 TGTATGAAGA GGCTGAAAGT AAAAGGCTCG CCAAGATGTA CATGGCTAGG
1201 GCAGCAGCCC TAATTGAGTT GGCAGCAAGC AGGGAAGTGA CTGGGGTTAA
1251 GGAACTGAAG GAGCTCCTCA GTTGCTTCAC CGTCCTCATA GAGGAGGGTG
1301 CTGAACTTCT ACAAAAGTTT GGCACAAGCC CCCTTTCTGG CCTCATACGC
1351 ACATATGTGT CAGAATTGGA AACCCAAGCA AACAACATCA GATCTACCAT
1401 CATGCTAGAC ACACCTCGTG AGGTTCCAGT AGTCATCATC TTGACTGGAC
1451 CACCAGGTAT TGGTAAGACA CGGTTGGCTC AGTTTATAGG GGAAAAATTT
1501 GGTAAAGTGT TCAACTTCAG TGTTGCAGTA GATCACCATG ATGGTTACAC
1551 AGGCAACCCA GTGTGCATAT GGGATGAGTT TGATGTGGAC GCAAAAGGTA
1601 GTTTCGTGGA AACAATGATT GGTATTGCCA ATACAGCACC GTTCCCACTT
1651 AATTGTGACC GTGTGGAGAA CAAAGGTAGG GTGTTTACTT CAAATTATGT
1701 TATTTGCACA TCAAACTACC CCACGTCTGT CATTCCAGAG AACCCACGTG
1751 CCCCAGCCTT TTACCGTCGA GTCATCATCT TGGATGTTTC ATCTCCAGAA
1801 CTTGATGAGT GGAAGAAGAA GAACCCTGGA AAGAAGCCCC CATCTGACTT
1851 GTATAAACAA GACTTTTCAC ACCTGAAGTT GATGCTCCGC CCCTACCTTG
1901 GGTACAATCC CGAAGGGGAC ACACTTGACG GCACTAGAGT CAAACCCACC
1951 CAGATATCCA TCCCAAGTTT GATCTCACTC ATGCAAAAGA GGTTTAAGGA
2001 GCAATCAGGG GAAAACCAGA ACCTATGGAT GCAAGTCCCT AGGGGAGCTG
2051 TTGATCAAGC ATCTAATATG ATAAAGACCT TTGTCTATGC TAACCGTGGT
2101 GTGTGTGACG TTCTCCCAAA CCCTGCCTCC CGTGACATCA CAGAGACATC
2151 TGTATCAAAA ATCTTTGTCT CCTCAACAGC CCCACCACCA GAGTTCTTAG
2201 GCCGCCATGT GATCATCACT GGGTTTGAAC TTGGGGATGC ATCCATAGCA
2251 AACTCTTTGT TATCCATGTT TTCCACAAGC ACACGTCTCA CTGCTGGTGC
2301 ACAGCGAGAG TATATGTATA GAATTTGGAA TCCCATCATC CACATCCAAG
2351 AGAGGTCCAT CAACACACAA AATCTGCCAT ATGTTAACCG CGTGATCCCA
2401 GTCACATCTC ACTGGGATTT CTTACGTGGT TTAAGACACC ACCTTGGTTT
2451 GGTGTCCATC CCTGGAATGT GGCGGGCTTT CCAGGGGTGG CGATCGTCCC
2501 AAGGTATCAT TGACTTTGTT GCAAATCACA TGAATGAAGT CACATTCCCC
31
2551 AGTAACCCAG AATGCACTGT CTTCCGCACT GGGGATGGGG ACGTTGTCTT
2601 TTACACGTAT GGGTCATACG CGTGCCTTGC GTCCCCTGCC CGCGTGCCCT
2651 ATGTTGGAAA TCCACCATCC ACCATCCATT CAAATGTCCC GAGATGCATG
2701 ACGTGGGGTG AAACCATTGG GTATCTTTGT GAGGTGGTGG CAGAATTTGC
2751 CCTACATTTT GGTCCATTAA TCTTGGCAGC AACCAACATA GCTTACCTGT
2801 GCTCAAGAGG CAATCGGGAT GAGGAAGCCA AAGGGAAGTC AAAACATGGC
2851 AGAGGAGCCA AACACGCACA TCGTGGCGGA ACCAGCCTGT CGGACGATGA
2901 GTATGATGAG TGGCGAGATC TTGTCCGCGA CTGGCGTAAA GACATGACAG
2951 TCAATGACTT CCTCATGCTA CGGGAGCGCA GCGCTCTCGG TACGGATGAC
3001 GAAGACGTGG CACGCTATAG AGCATGGCTA GAAATCCGTG CCATGCGGTT
3051 AGCAGGTGGT GCTTACACCC ACGCCACAGT AATCGGCAAA GGTGGTGTGC
3101 GAGAAGAGAT CATTAGAACA GCCCCTCGCC GTGCCCCCAT GAGTGCACGG
3151 CGCGCCAATT ATGAAGAGGA AGCCCCCACT GCCATTGTTG AGTTCACCCA
3201 TGAAGGCGAC CACATAGGGT ATGGAGTCCA TCTTGGCAAT GGTAGAGTGG
3251 TCACCGTCAC CCATGTAGCA TCATCATCAG ATAGTGTTGA GGGAGCACCT
3301 TTTAAGGTAC AAAGAACTGT TGGTGAAACC ACTTGGGTTG AAACACAGCT
3351 TCCCAACTAC CCCCATTTGC AAATTGGCTC AGGAAGGCCC GTGTATTACA
3401 CGATGCGATT GCATCCAGTG GTGACTATCA CGGAAGGCAC TTTTGAGACC
3451 CCAAATATCA CTGTTCATGG TTTCCATGTT CGCATCACAA ATGGGTACCA
3501 AACCAGGAAA GGTGATTGTG GATTGCCTTA CTTGAATGCC AACAGGCAGG
3551 TGGTGGGATT GCATGCTGGT ACCGATGTTC AAGGGGAAAC CAAATTGGCA
3601 CAGAAGGTAG TTAAAGAGCT GCCTGTGGAG AGTGAATTTC ACTGGAAGGG
3651 CCTCCCAGTT ATCAAATCTG ACCTGGATGT TGGGGGGATG CCAACCGGCA
3701 CACGGTACCA TCGATCACCT GCATGGCCAG AGCAACTCCC CGAGGAAACT
3751 TATGCCCCCG CCCCCTTTGG TGCCGGTGAC AAACGCTATC ACTTCACCCA
3801 GACTGAGATG TTAGTGAACG CCCTTAAGCC CTACACTGAG ACTACACCTG
3851 GCATCCCCCC TTCCTTGCTA TCACGGGCTA CAACTCACGT GCGTGCTTAC
3901 CTTGAAACAA TTATTGGTAC ACACCGTTCT CCTGTGCTCA CTTTCACCCA
3951 GGCAGTTGAG TTGCTTGAAA AATCCACCTC ATGTGGCCCG TTCATACAAG
4001 GACTAAAAGG AGACTATTGG GATGATGAAA CACAACAATA CACTGGGGCC
4051 CTACGTGAAC ATTTAGACAG AGCATGGGAT CATGCTGTCA GGGGCATTGC
4101 ACCAGGGAAC TCCTACAAAT TGGCACTTAA GGATGAACTC CGTCCTGAGG
4151 AAAAGAATAA AGAAGGGAAG AGGCGGCTGC TGTGGGGCTG TGACGCCGCA
4201 ACAACTCTAA TTGCAGTGGC GGCGTTTAAG CCAGTGGCCG CACGCTTACA
4251 AGTAGTGACA CCAATGACTC CAATTTCCGT TGGTATCAAC ATGGACTCAA
4301 TGCAAATGCA AGTGATGAAT GATTCTTTGA GGGGTGGTGT ACTTTACTGC
4351 CTAGACTACT CCAAATGGGA CTCCACACAA AACCCAGCTG TCACTGCAGC
4401 TAGCCTGTCC ATTTTAGAGA GATTTATGGA AAGCAGCCCA TTGGTGTCCT
4451 GTGCAATAGA GTCCCTGTCC TCACCAGCAA TTGGCTATCT CAATGACATT
4501 AAATTTGTAA CCAAAGGGGG TCTCCCATCA GGAATGCCCT TCACCTCAGT
4551 CATCAACTCG GTGAACCACA TGATATACTT TGCAGCGGGT GTGCTCAAAG
4601 CTTATGAGGA CCACCACGTC CCATACACTG GCAATGTATT TCAGATAGAG
4651 ACTGTCCACA CCTATGGTGA TGACTGTATT TATAGTGTTT GTCCTGCCAC
4701 CGCTTCTATC TTTGGTTCTG TTCTCGCCAA CCTGTCCTCC TTCGGTCTCA
4751 GGCCCACTGC CGCTGACAAA ACTGCAGAAA TCAAGCCCAC CCAAACACCA
4801 GTTTTTCTGA AAAGAACATT CACACAGACG CCCTATGGGG TGAGGGCACT
4851 ATTGGACATC AATTCCATCA TTCGGCAGTT CTACTGGGTT AAGGCGAACC
4901 GCACTAGTGA CCCATCTAGC CCCCCTGCAT TTGATCGCAC TGCCCGCAGT
4951 GCCCAGTTGG AAGCAGCCCT AGCCTATGCA TCACAACATG GACCTTTAGT
5001 GTTTGACAAG GTGCGTGACA TTGCCATCAA AACGGCCGAA GGAGAGGGTG
5051 TGGTGCTTGT GAATACAAAC TTTGATTTGG CCCTCGCCAC CTACAATGCC
5101 TGGTTCATAG GTGGTACAGC TCCAGATCCA GAGCGCCCCA CTGAAGGTGC
5151 ACCCAAATTA GTGTTTGAGA TGGAGGGCAA TGGCTCCCAG TTGCCAACCA
5201 ATCAAAATGG TGGCCATGTT GGCCAGGATG TTGACCCGCC TGGCGCGACT
5251 GGTCCGACCA CATCCCATGT TGTTGTGTCT AATCCAGAAC AACCCAATGG
5301 GCCCGCACAA CGCCTGGAAA TGGCTGTTGC TACTGGTTCC ATCCAATCAA
5351 ATGTCCCTGA AGCGATACGC AACTGCTTTG CAGTCTGTCG TACTTTTGCT
5401 TGGAATGACA GAATGCCCAC TGGAACTTTC CTGGGATCTT TATCGCTTCA
32
5451 TCCCAACATT AATCCATACA CATCCCATCT TTCAGGCATG TGGGCAGGGT
5501 GGGGAGGTAG CTTTGAGGCC CGCATCTCAA TTTCTGGGTC TGGCATGTTT
5551 GCTGGGAGGA TCATTGCTTC TGTCATACCA CCTGGGGTTG ACCCCACGTC
5601 GATCAGGGAT CCGGGCGTGC TCCCTCACGC TTTCGTTGAT GCTCGTATCA
5651 CTGATCCAGT ATCATTTATG ATCCCTGATG TGAGAAACGT TGATTACCAT
5701 AGGATGGACA TCACTGAACC CACTTGCTCC CTTGGATTCT GGGTCTATCA
5751 ACCACTGCTA AATCCATTTT CCACCACAGC AGTCACAACA TGCTGGGTAT
5801 CCATAGAAAC CAAGCCTGGT GGTGATTTTG ATTTTTGCCT CTTGAGGCCC
5851 CCTGGTCAAC AGATGGAGAA TGGTGTGTCA CCTGAGGGTC TCCTCCCACG
5901 CCGCTTGGGC TACACCCGGG GTAACCGGGT TGGGGGGTTA GTAGTTGGTA
5951 TGGTTTTGGT TGCTGACCAC CGCCAGGTGA ACAGGCACTT TAATGCACAG
6001 TCTATCACTT ATGGATGGTC TACTGCACCA GTCAACCCAA TGGCAGCGGC
6051 AATTCAAACA AATCATGTCC ACACTGGAAA CAACAATTCC AACAAAAGGA
6101 ACGCTTGGTT ATCACTTAGT GCAGAAAACA AGGGTCCACT GTTCCCAGGC
6151 ATCCCAAACC ACTTCCCCGA CTCCTGTGCT TCCACGGTAA TGGGCGCTAT
6201 GGACACAGAC CGCCACATGC CATCCACAGG AATCTGTGGC CCAGCAATTG
6251 GCTTCCAAAA CAATGGAGAT GCCTATGAAA ATGAGACTCC TGCAGTCATG
6301 TTTGCCACTC TAAACCCCCT GACTGGTGGT ACTAATGAGA ATCCTGTAGC
6351 CCTCTTTGGT TCAATCAATC TGGCCTCTTT AGCTGTGGTT CGCACTCAAC
6401 AGGATGTGGA CTTCACAACC ACCGGTTTTG CCAACAACAT GAACGTGGTT
6451 GTGGAAATGT CCTGGGAAAT GTACTCAGGA TCACAACAGA TACAGGGGCG
6501 TGTGACACCT ATGGATGGCA CTAACTTTGT TTTCACTTCT TCAGGCGCCA
6551 ACACCCTGGT GCTCTGGGAG GAGCAATTAC TCAGTTATGA TGGAACCCCA
6601 GCAATCTTGT ACTCATCTCA GTTGGAGCGC ACTGCGGAGT ACTTCCAAAA
6651 TGACAATGTC AACATACCCC CAGGTTCAAT GGCTGTTTTT AATGTTGAAA
6701 CAAATTCTGC CTCTTTCCAA GTTGGCATTC GGCATGATGG ATACGTGGTG
6751 ACTGGTGGTA CGGTTGGAAC TCATGTTGCT CTGGATGCGG AAACACGATT
6801 TCAATTTGTT GGTATTCTCC CCCTCACAGC CACACTGGCT GGGCCCAATG
6851 GGAACTCAGG AAGGGCCAGG CGTCTGTTCC AATGAGTTGG TTAGTTGGCG
6901 CCTTGCAGAC AACTGGGTCA CTCGTTGACC TTGCAGGAAC TGTTTCAGAT
6951 ATAGTTTACA AACAAAGGCA AGTGGCACAA CTGGAGAAAC AAAACCAGCT
7001 CATGGAGCAA TGGATGTACA AACAGGAAGC CTTGCAAAAG TCCCAAATGG
7051 ATCTCACACG TGACTTGGCA GTGAACACCC CTGTGTATCG TGTCCAGGCT
7101 GCACTAGATG CTGGGTTTGA CCCAATCAGC GCGCGACGCT TGGCTGGTTC
7151 CAGCGAGCGC GTTATCTATG GCAACTTGGA TAGACCAATA ATGCATGCAG
7201 GCACCATGGA AGGGATTAGG CAAACTAACC ACTTGAATGC CATCAGTTCA
7251 GCAATGGCTA CATTTAAGAA CGGTACACAA TTTGGAAAAC CAGCTCCTCC
7301 AAAAATTCAA ACTGGGACAC CAACCAAACC CTCAATCAAT CTTAATCACC
7351 AACCTGGATC ATCCAGTGCT TGATTCTAAA TTTTCTTTCA ATTTTCTTTT
7401 CTA