1

Banche dati biologiche - PERCORSI ABILITANTI SPECIALI · -utilizzare la strategia didattia ... - Le proteine: composizione ... Translate is a tool which allows the translation of

Embed Size (px)

Citation preview

Attività didattica

Banche dati biologiche

TEMPI: durata totale dell’attività 3 ore di lezione + 1 ora di attività a casa

(1 ora di lezione nell'ambito del corso “laboratorio didattico di biologia e scienze della vita” del 22 maggio 2014)

CLASSE DI RIFERIMENTO: 24 insegnanti frequentanti il percorso PAS

Obiettivi acquisiti dall'alunno mediante l’attività: -utilizzare la strategia didattica “webquest”;

- consultare e analizzare informazioni contenute in banche dati biologiche (ricerca bibliografica mediante l’uso di PubMed, elaborazione di sequenze nucleotidiche e proteiche mediante softwares dedicati);

-comprendere le numerose informazioni reperite in lingua inglese, idioma ufficiale della cultura scientifica internazionale;

-saper relazionare per iscritto su quanto ottenuto in seguito alla consultazione di siti opportuni, inserendo nella relazione tutte le informazioni utili per risolvere un quesito scientifico.

PREREQUISITI:

- Struttura e funzione degli acidi nucleici (DNA ed RNA).

- Il dogma della biologia: trascrizione e traduzione genica.

- Il codice genetico e la sintesi proteica.

- Rudimenti di biotecnologie: estrazione del DNA cellulare e tecniche di

sequenziamento.

- Le proteine: composizione, struttura e funzioni principali, con alcuni

esempi specifici (struttura, luogo di produzione, funzioni dell’ormone

proteico insulina ed interazione con il suo recettore).

- Le mutazioni geniche e le malattie che possono derivarne.

- Le principali macromolecole organiche (lipidi, glucidi, acidi nucleici e

proteine) ed il ruolo centrale del glucosio nel metabolismo umano.

- Struttura testuale e argomentazione di un articolo scientifico

Materiali richiesti: - Libro di testo - Fotocopie con il percorso didattico proposto - Accesso ad internet per la consultazione online di opportuni siti web con softwares dedicati alla ricerca bibliografica (PubMed) e all’elaborazione delle sequenze nucleotidiche ed amminoacidiche - Chiavetta USB per salvare i risultati ottenuti - Dizionario enciclopedico scientifico di lingua inglese.

STRATEGIA DIDATTICA: webquest

L'alunno viene guidato in una serie di attività

predefinite

Attività di ricerca su uno specifico

argomento, finalizzata a svolgere un

determinato compito

Le informazioni utilizzate dagli studenti provengono da risorse disponibili in Internet

L’ambiente di apprendimento è costituito da uno scenario, dalla descrizione dei compiti e dalle risorse; le finalità sono quelle di far acquisire capacità di ricerca in rete, di selezione del materiale e della sua utilizzazione finalizzata allo svolgimento di un compito.

Ruolo accompagnato da un piano d'azione (richiede l’osservazione di un protocollo)

L'attività di progettazione di un webquest dev'essere preceduta da una ricognizione attenta delle risorse disponibili nella rete relativamente ad un certo argomento

Consente un buon uso di Internet

Presuppone un ambiente strutturato in cui interagiscono gruppi di studenti che cooperano per un obiettivo comune

Efficace il tempo speso dagli allievi nella loro attività di navigazione in internet. La rete, per la quantità di informazioni in essa depositata può infatti essere assai dispersiva quando non viene utilizzata avendo chiari gli scopi per i quali ci si rivolge.

FASI DI LAVORO

NOTA: Il percorso proposto in maniera guidata individua una precisa e serrata

serie di passaggi per la consultazione di internet e di opportuni siti dedicati

alla bioinformatica ottimizzando i tempi di ricerca, senza troppe dispersioni.

Fornisce, inoltre, agli studenti suggerimenti sulle informazioni chiave che

possono essere estrapolate dal gran numero di risultati che a volte si

ottengono dalla consultazione di questi siti, stimolando il senso critico e

soprattutto la selezione dei risultati utili, soprattutto in relazione alle proprie

conoscenze di base ed alla programmazione didattica affrontata in classe.

FASE 1 – LANCIO EMOTIVO COGNITIVO

[Tempo: 20 minuti]

L’insegnante

-descrive lo scenario dell'attività in modo da introdurre gli alunni al compito che li attende (presentazione del quesito scientifico – allegato n.1)

- suddivide gli alunni in gruppi di lavoro (3 alunni per gruppo)

Gli allievi

- assumono il ruolo di genetisti (cercano informazioni su 2 sequenze nucleotidiche che hanno ricavato in seguito all’estrazione del DNA da un campione di cellule umane ed al successivo sequenziamento di tale DNA).

FASE 2 – RIORGANIZZAZIONE DEI SAPERI

[Tempo: 30 minuti]

L’insegnante, attraverso una presentazione ppt (allegato n. 2), fornisce le seguenti informazioni di base necessarie agli alunni per svolgere il compito:

la bioinformatica come ambito multidisciplinare e le sue potenzialità

le principali banche dati accessibili online (es. PubMed, EMBL, GenBank,

DDBJ);

i principali softwares per l’elaborazione delle sequenze nucleotidiche e

proteiche (Prosite, Blast, Smart, Ensembl….), come accedervi e quali

informazioni poter ottenere da ciascuno di essi (query)

FASE 3 – INIZIO [Tempo: 10 minuti]

Tutti gli alunni ricevono:

una copia del quesito scientifico di partenza (allegato n. 1);

un foglio con gli aspetti pratici dell’esercitazione (protocollo) in cui sono

indicati i passaggi attraverso i quali gli studenti portano a termine il

compito (allegato 3);

un file nel quale sono riportate le 2 sequenze nucleotidiche ignote,

denominate DNA 1 e DNA 2 (allegato 4).

FASE 4 [Tempo: 50 minuti]

Gli studenti: - studiano il quesito scientifico ricevuto; - sulla base del protocollo ricevuto, effettuano la ricerca relativa al DNA 1 e salvano tutti i dati ottenuti. L’insegnante: - svolge la funzione di consulente e di mediatore in quanto l’attività è affidata agli allievi. LUOGO: laboratorio di informatica dotato di computer individuali e connessione ad internet.

FASE 5 [Tempo: 50 minuti]

Gli studenti, in laboratorio di informatica, ripetono il

percorso proposto per la sequenza ignota DNA 2 e

rispondono ai medesimi quesiti posti nei punti precedenti.

FASE 6 [Tempo: 60 minuti]

Lavoro a casa per rielaborare i risultati ottenuti in laboratorio di

bioinformatica e produrre la relazione finale.

FASE 6 – CHIUSURA [Tempo: 30 minuti]

Confronto e discussione in classe sui risultati ottenuti dal lavoro di ricerca

Compilazione scheda riflessione metacognitiva

Consegna al docente delle relazioni per una valutazione del lavoro svolto

allegato n.1: quesito scientifico

Avete a disposizione 2 sequenze nucleotidiche che vi siete ricavati in seguito all’estrazione del DNA da un campione di cellule umane ed al successivo sequenziamento di tale DNA affidandovi alle tecniche appropriate. Avete salvato la successione di basi di tali sequenze in un file opportuno. Non conoscete nulla dei frammenti di DNA che avete in mano: non sapete se è DNA codificante, se è DNA “spazzatura”, se gli eventuali prodotti genici hanno un ruolo fondamentale nelle attività metaboliche dell’uomo, se esistono patologie gravi dovute al mancato funzionamento di questi geni. Come procedere per cercare di comprendere la funzione di tale DNA? Avete a disposizione: -i databases di sequenze nucleotidiche ed amminoacidiche studiate in altri laboratori e depositate per la comunità scientifica mondiale. Opportuni softwares per l’analisi ed il confronto tra le sequenze vi supporteranno nel vostro percorso. - PubMed , la banca dati per eccellenza della letteratura medica e biologica.

QUESITO SCIENTIFICO

allegato n.2: ppt bioinformatica

Bioinformatica Banche dati biologiche

La bioinformatica

è una disciplina scientifica

dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici

Nasce alla fine degli anni 70 quando vennero sequenziati i genomi di centinaia di organismi e cominciò a nascere l’esigenza di avere a disposizione sistemi informatici per l’archiviazione e l’analisi di dati di sequenza

Ob. organizzare le conoscenze acquisite a livello globale (in rete, su scala mondiale) su genoma (= insieme dei geni di un organismo) e proteoma (= insieme di proteine prodotte dalle cellule di un organismo)

in banche dati (o database)

al fine di rendere tali dati accessibili, rapidamente e gratuitamente, a tutti.

Tra i compiti della bioinformatica…

mettere a punto dei sistemi idonei per collezionare ed interrogare l’enorme mole di dati biologici

La bioinformatica include: - database che raccolgono dati sperimentali prodotti nei laboratori di ricerca

- software per la navigazione in banche dati

Banche dati biologiche

= insieme organizzato di informazioni e dati che provengono da

studi in laboratori di ricerca,

centri di bioinformatica,

pubblicazioni scientifiche strutturati e organizzati in modo da essere consultabili e

utilizzabili nel miglior modo possibile

Ogni banca dati biologica è caratterizzata da un elemento biologico centrale che costituisce l’oggetto principale intorno al quale viene costruita la entry della banca dati.

Es. di elemento centrale:

1) la sequenza nucleotidica di DNA nelle banche dati di acidi nucleici

2) promotore nelle banche dati di promotori eucariotici.

Ciascuna entry raccoglie tutte le informazioni che caratterizzano l’elemento centrale.

I Database di primo livello raccolgono sequenze nucleotidiche (DNA, RNA) o proteiche e rendono disponibili informazioni per identificare le specie da cui hanno origine le sequenze e le loro funzioni.

I Database specializzati raccolgono informazioni più specifiche sulla tassonomia, le funzioni, le pubblicazioni scientifiche, le malattie correlate alle mutazioni…

Tipi di banche dati:

• Banche dati di letteratura scientifica (PubMed)

• Banche dati di sequenze nucleotidiche (EMBL, GenBank, DDBJ)

• Banche dati di geni (LocusLink, GeneCards, RefSeq, UniGene)

• Banche dati di genomi (Ensembl)

• Banche dati di prodotti di trascrizione (dbEST, UniGene)

• Banche dati di polimorfismi e mutazioni (dbSNPs, HGMD)

• Banche dati di sequenze proteiche (SwissProt, UniProt, PIR)

• Banche dati di motivi e domini proteici (PROSITE, Pfam)

• Banche dati di strutture proteiche (PDB, CATH e SCOP)

• Banche dati di pathways metabolici (ENZYME, PATHWAYS)

• Banche dati mitocondriali (MITOMAP)

• Banche dati di malattie genetiche (OMIM)

• …

(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?DB=pubmed)

• E’ considerata la banca dati per eccellenza della letteratura medica e biologica.

• E’ consultabile in modo gratuito e permette il link diretto ai siti delle riviste per visionare o scaricare l’articolo (gratuitamente o a pagamento a seconda della policy della rivista).

• Le ricerche in PubMed possono essere effettuate tramite diverse opzioni:

1. Autore 2. Rivista 3. Parole chiave

How do I search PubMed?

1.Identify the key concepts for your search.

2.Enter the terms (or key concepts) in the search box.

3.Click Search.

Anatomy of the Summary Results

Esempio PUBMED

Esempio risultato ricerca (maggio 2014)

Un ulteriore esempio…

Be PubMed proficient. Take the PubMed Tutorial

= è di fondamentale utilità la costruzione di una “rete” di sapere, di conoscenze e di dati, prodotti dai ricercatori di tutto il mondo, al fine di

costruire un bagaglio comune, accreditato da comitati scientifici, consultabile online, per evitare di duplicare gli esperimenti

per poter usufruire di quanto già pubblicato da altri ricercatori per poter proseguire al meglio e finalizzare le proprie linee di ricerca, ottimizzando costi e tempi.

NCBI – National Center for Biotechnology Information. Gestisce un gran numero di DB tra i quali: Gene

– Contiene dati inerenti i geni di tutte le specie caratterizzate, quali la struttura genica ed il contesto genomico, le interazioni con altri geni ed i link alle sequenze ed alla relative pubblicazioni scientifiche.

Nucleotide – Contiene le sequenze nucleotidiche di tutte le specie caratterizzate,

siano esse codificanti o meno. Protein

– Ha la stessa struttura di Nucleotide ma è relativo alle sequenze aminoacidiche.

Pubmed – E’ il database delle pubblicazioni scientifiche di carattere biologico e

biomedico. Per ogni articolo è disponibile l’abstract. Pubmed Central contiene articoli completi scaricabili gratuitamente.

Taxonomy – Contiene la classificazione dei vari organismi;

NCBI - http://www.ncbi.nlm.nih.gov/

http://www.expasy.org/tools/

portale di risorse bioinformatiche gestito dall'Istituto svizzero di bioinformatica (SIB)

dispone di una funzione di ricerca attraverso risorse selezionate.

consente di accedere a molte risorse scientifiche , database e strumenti software in diverse aree delle scienze della vita (proteomica, genomica , filogenesi ed evoluzione, genetica di popolazione, trascrittomica , ecc.)

contiene numerosissimi tools per lavorare, elaborare e confrontare sequenze di proteine ed acidi nucleici.

DNA -> Protein

TRANSLATE Translate is a tool which allows the translation of a nucleotide (DNA/RNA)

sequence to a protein sequence.

Similarity searches

BLAST at NCBI> protein BLAST

Dalla finestra Expasy Tools iniziale

BLASTP programs search protein databases using a protein query.

allegato n.3: protocollo esercitazione

Nota: rielaborazione di materiale didattico disponibile in rete http://www.premioinnovascuola.it/wp-content/uploads/piscuola/trashbin/RATD01000G_441.doc.

Aspetti pratici dell’esercitazione: NB: Per la stesura della relazione si consiglia di copiare, incollare e salvare su un documento word i risultati salienti della ricerca nei vari database che ci hanno suggerito importanti informazioni sulla probabile struttura e funzione delle sequenze di DNA a nostra disposizione. 1) Aprite il file con le 2 sequenze nucleotidiche ignote, denominate DNA 1 e DNA 2. 2) Aprite in un’altra finestra il sito: http://www.expasy.ch/tools/ Notate che in questo sito trovate numerosissimi tools (letteralmente “arnese” o “attrezzo”!) per lavorare, elaborare e confrontare sequenze di proteine ed acidi nucleici. 3) Nella sezione denominata “DNA PROTEIN” aprite il tool “Traslate”: questa opzione vi permetterà di tradurre la vostra sequenza di DNA in proteina.

4) Copiate ed incollate nell’apposito riquadro la sequenza DNA 1. Selezionate nel menù a tendina l’opzione “Verbose (Met, Stop, spaces between residues)”, infine cliccate su TRANSLATE SEQUENCE. Si ottiene così la struttura primaria della proteina in studio. Tra le 6 cornici di lettura proposte, se ne trovate una che origina una proteina intera, cioè senza interruzioni e codoni di stop intermedie, che inizi con una Metionina (Met, il codone corrispondente all’amminoacido che dà lo start alla sintesi proteica sul ribosoma) e termini con un codone di Stop, significa che la sequenza che avete in mano codifica per un prodotto genico = proteina presumibilmente funzionale e non è DNA “spazzatura”. In alternativa, se tutte le cornici di lettura sono inframezzate da numerosi codoni di stop, cioè arresto della traduzione, la sequenza di DNA non è codificante. La sequenza DNA 1 è un gene codificante o DNA spazzatura? __________________________________________________________

5) Copiate l’ipotetica sequenza proteica ignota (senza le eventuali X iniziali e senza il codone di Stop finale) ed incollatela nel documento word con le sequenze ignote, chiamandola >PROTEINA 1. Salvate il documento modificato per non perdere il lavoro fatto. 6) Tornate indietro alla pagina principale degli Expasy Tools per cercare qualche programma che possa aiutarvi a comprendere struttura e funzione della Proteina 1 ignota. Tra le numerosissime possibilità, scegliete di utilizzare: Similarity searches>BLAST at NCBI> protein BLAST (circa a metà pagina): questo tool vi fornisce la comparazione tra la vostra proteina ignota e le sequenze proteiche presenti nel database. Copiate ed incollate la sequenza >PROTEINA 1 nell’apposito box e non cambiate alcuna opzione tra quelle selezionabili nella pagina. Cliccate su BLAST ed attendere il risultato. A quale proteina risulta omologa quella che state studiando? ___________________________________________________________ 7) Ripetete il percorso proposto per la sequenza ignota DNA 2 e rispondete ai medesimi quesiti posti nei punti precedenti.

8) Adesso che avete compreso le funzioni del DNA 1 e del DNA 2 provate ad accedete alla home page della rivista PubMed (http://www.ncbi.nlm.nih.gov/pubmed) Inserire nel campo di ricerca il nome della vostra proteina 1 . Quanti articoli si ottengono? Sono presenti articoli pubblicati sulla rivista "Science"? Quanti? Se effettuate la ricerca con una query più ristretta (ad esempio "……………………….."), quanti articoli trovate? _______________________________________________________________ Cercate nel database PubMed un articolo di vostro interesse sulla proteina Riportate nel vostro file la query effettuata ed il titolo dell'articolo che, dalla lista dei risultati, vi sembra più interessante. _______________________________________________________________ Potete cercare qualche altro dato (ad esempio riguardo la struttura della proteina, la funzione e la modalità di azione) su comuni motori di ricerca di Internet oppure consultando il seguente sito: http://darimar.altervista.org/diabete/insulina.htm

9) Ciascun componente del gruppo, attraverso una relazione, - esponga e interpreti le informazioni raccolte studiando le 2 proteine

ignote;

- tragga le proprie conclusioni sull’utilità di softwares bioinformatici e banche dati.

Nota: Lunghezza massima del testo: 1 cartella (30 righe) Margine: 3 cm ogni lato Interlinea: 1,5 Carattere: Arial 11 Intestazione: nome, cognome, classe, data Puoi inserire eventuali allegati.

allegato n.4: sequenze nucleotidiche ignote

>DNA 1 (333 nt) atggccctgtggatgcgcctcctgcccctgctggcgctgctggccctctggggacctgacccagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacctagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacctgcaggtggggcaggtggagctgggcgggggccctggtgcaggcagcctgcagcccttggccctggaggggtccctgcagaagcgtggcattgtggaacaatgctgtaccagcatctgctccctctaccagctggagaactactgcaactag

>DNA 2 (4149 nt)

atgggcaccggcggccgccgcggcgcggcggcggcgccgctgctggtggcggtggcggcgctgctgctgggcgcggcgggccatctgtatccgggcgaagtgtgcccgggcatggatattcgcaacaacctgacccgcctgcatgaactggaaaactgcagcgtgattgaaggccatctgcagattctgctgatgtttaaaacccgcccggaagattttcgcgatctgagctttccgaaactgattatgattaccgattatctgctgctgtttcgcgtgtatggcctggaaagcctgaaagatctgtttccgaacctgaccgtgattcgcggcagccgcctgttttttaactatgcgctggtgatttttgaaatggtgcatctgaaagaactgggcctgtataacctgatgaacattacccgcggcagcgtgcgcattgaaaaaaacaacgaactgtgctatctggcgaccattgattggagccgcattctggatagcgtggaagataactatattgtgctgaacaaagatgataacgaagaatgcggcgatatttgcccgggcaccgcgaaaggcaaaaccaactgcccggcgaccgtgattaacggccagtttgtggaacgctgctggacccatagccattgccagaaagtgtgcccgaccatttgcaaaagccatggctgcaccgcggaaggcctgtgctgccatagcgaatgcctgggcaactgcagccagccggatgatccgaccaaatgcgtggcgtgccgcaacttttatctggatggccgctgcgtggaaacctgcccgccgccgtattatcattttcaggattggcgctgcgtgaactttagcttttgccaggatctgcatcataaatgcaaaaacagccgccgccagggctgccatcagtatgtgattcataacaacaaatgcattccggaatgcccgagcggctataccatgaacagcagcaacctgctgtgcaccccgtgcctgggcccgtgcccgaaagtgtgccatctgctggaaggcgaaaaaaccattgatagcgtgaccagcgcgcaggaactgcgcggctgcaccgtgattaacggcagcctgattattaacattcgcggcggcaacaacctggcggcggaactggaagcgaacctgggcctgattgaagaaattagcggctatctgaaaattcgccgcagctatgcgctggtgagcctgagcttttttcgcaaactgcgcctgattcgcggcgaaaccctggaaattggcaactatagcttttatgcgctggataaccagaacctgcgccagctgtgggattggagcaaacataacctgaccaccacccagggcaaactgttttttcattataacccgaaactgtgcctgagcgaaattcataaaatggaagaagtgagcggcaccaaaggccgccaggaacgcaacgatattgcgctgaaaaccaacggcgataaagcgagctgcgaaaacgaactgctgaaatttagctatattcgcaccagctttgataaaattctgctgcgctgggaaccgtattggccgccggattttcgcgatctgctgggctttatgctgttttataaagaagcgccgtatcagaacgtgaccgaatttgatggccaggatgcgtgcggcagcaacagctggaccgtggtggatattgatccgccgctgcgcagcaacgatccgaaaagccagaaccatccgggctggctgatgcgcggcctgaaaccgtggacccagtatgcgatttttgtgaaaaccctggtgacctttagcgatgaacgccgcacctatggcgcgaaaagcgatattatttatgtgcagaccgatgcgaccaacccgagcgtgccgctggatccgattagcgtgagcaacagcagcagccagattattctgaaatggaaaccgccgagcgatccgaacggcaacattacccattatctggtgttttgggaacgccaggcggaagatagcgaactgtttgaactggattattgcctgaaaggcctgaaactgccgagccgcacctggagcccgccgtttgaaagcgaagatagccagaaacataaccagagcgaatatgaagatagcgcgggcgaatgctgcagctgcccgaaaaccgatagccagattctgaaagaactggaagaaagcagctttcgcaaaacctttgaagattatctgcataacgtggtgtttgtgccgcgcaaaaccagcagcggcaccggcgcggaagatccgcgcccgagccgcaaacgccgcagcctgggcgatgtgggcaacgtgaccgtggcggtgccgaccgtggcggcgtttccgaacaccagcagcaccagcgtgccgaccagcccggaagaacatcgcccgtttgaaaaagtggtgaacaaagaaagcctggtgattagcggcctgcgccattttaccggctatcgcattgaactgcaggcgtgcaaccaggataccccggaagaacgctgcagcgtggcggcgtatgtgagcgcgcgcaccatgccggaagcgaaagcggatgatattgtgggcccggtgacccatgaaatttttgaaaacaacgtggtgcatctgatgtggcaggaaccgaaagaaccgaacggcctgattgtgctgtatgaagtgagctatcgccgctatggcgatgaagaactgcatctgtgcgtgagccgcaaacattttgcgctggaacgcggctgccgcctgcgcggcctgagcccgggcaactatagcgtgcgcattcgcgcgaccagcctggcgggcaacggcagctggaccgaaccgacctatttttatgtgaccgattatctggatgtgccgagcaacattgcgaaaattattattggcccgctgatttttgtgtttctgtttagcgtggtgattggcagcatttatctgtttctgcgcaaacgccagccggatggcccgctgggcccgctgtatgcgagcagcaacccggaatatctgagcgcgagcgatgtgtttccgtgcagcgtgtatgtgccggatgaatgggaagtgagccgcgaaaaaattaccctgctgcgcgaactgggccagggcagctttggcatggtgtatgaaggcaacgcgcgcgatattattaaaggcgaagcggaaacccgcgtggcggtgaaaaccgtgaacgaaagcgcgagcctgcgcgaacgcattgaatttctgaacgaagcgagcgtgatgaaaggctttacctgccatcatgtggtgcgcctgctgggcgtggtgagcaaaggccagccgaccctggtggtgatggaactgatggcgcatggcgatctgaaaagctatctgcgcagcctgcgcccggaagcggaaaacaacccgggccgcccgccgccgaccctgcaggaaatgattcagatggcggcggaaattgcggatggcatggcgtatctgaacgcgaaaaaatttgtgcatcgcgatctggcggcgcgcaactgcatggtggcgcatgattttaccgtgaaaattggcgattttggcatgacccgcgatatttatgaaaccgattattatcgcaaaggcggcaaaggcctgctgccggtgcgctggatggcgccggaaagcctgaaagatggcgtgtttaccaccagcagcgatatgtggagctttggcgtggtgctgtgggaaattaccagcctggcggaacagccgtatcagggcctgagcaacgaacaggtgctgaaatttgtgatggatggcggctatctggatcagccggataactgcccggaacgcgtgaccgatctgatgcgcatgtgctggcagtttaacccgaaaatgcgcccgacctttctggaaattgtgaacctgctgaaagatgatctgcatccgagctttccggaagtgagcttttttcatagcgaagaaaacaaagcgccggaaagcgaagaactggaaatggaatttgaagatatggaaaacgtgccgctggatcgcagcagccattgccagcgcgaagaagcgggcggccgcgatggcggcagcagcctgggctttaaacgcagctatgaagaacatattccgtatacccatatgaacggcggcaaaaaaaacggccgcattctgaccctgccgcgcagcaacccgagctga