65
Organização e Evolução de Genomas Juliana de Oliveira

Organização e Evolução de Genomas

Embed Size (px)

DESCRIPTION

Artigo

Citation preview

  • Organizao e Evoluo de Genomas

    Juliana de Oliveira

  • Roteiro

    Dogmas: central e perifrico

    Genomas e proteomas

    Espionando a transmisso da informao gentica

    Selecionando genes e genomas

    Genomas de procariotos

    Genomas de eucariotos

    O genoma do Homo sapiens

    Polimorfismos de um nico nucleotdeo (SNPs)

    Diversidade gentica na antropologia

    Evoluo de genomas

  • Dogmas: central e perifrico

    O arquivo de informaes em cada organismo o material gentico

    A replicao quase perfeita do DNA essencial para estabilidade da herdabilidade As imperfeies tambm so necessrias, gerando

    informaes evolutivas

    A implementao da informao gentica ocorre inicialmente com a sntese de RNA e protenas

  • Dogmas: central e perifrico

    O cdigo gentico de fato uma codificao

    Tripletos de letras sucessivas da sequncia do DNA especificam aminocidos consecutivos

    Poro de sequncias de DNA codificam sequncias de aminocidos de protenas

    Protenas so compostas de 200 a 400 aminocidos, o que exige de 600 a 1.200 letras de mensagens de DNA expresso para especific-las

    RNA ribossomal tambm determinado pelo DNA

  • Dogmas: central e perifrico

    Nem todo DNA expresso em protenas ou RNA estrutural

    Muitos genes a serem transcritos apresentam sequncias chamadas ntrons (sequncias no traduzidas)

    Algumas regies do DNA atuam como mecanismos de controle

    Uma poro substancial do genoma dos organismos superiores aparenta ser suprflua (ainda no compreendemos sua funo)

  • Dogmas: central e perifrico

    Nomenclatura e estrutura molecular

    Os quatro nucleotdeos de ocorrncia natural no DNA (RNA)

    a adenina

    g guanina

    c citosina

    t timina

    (u uracila)

    1. As molculas de DNA so quimicamente similares, e a estrutura do DNA uniforme (embora algumas interaes DNA protena causam distores na estrutura do DNA

    2. Protenas e RNAs estruturais apresentam ampla variedade de conformaes tridimensional, necessrias para garantir o desempenho de diversos papis funcionais

  • Dogmas: central e perifrico

    Aminocidos

    No-polares G glicina (Gli)

    I isoleucina (Ile)

    A alanina (Ala)

    P prolina (Pro)

    V valina (Val)

    L leucina (Leu)

    F fenilalanina (Phe)

    M metionina (Met)

    Polares S serina (Ser) C cistena (Cis) T treonina (ter) N asparigina

    (Asn) Q glutamina

    (Gln) H histidina (His) Y tirosina (Tir) W triptofano

    (Trp)

    Carregados D c. Asprtico

    (Asp) E c. Glutmico

    (Glu) K lisina (Lis) R arginina (Arg)

  • Dogmas: central e perifrico

    ttt Phe

    ttc Phe

    tta Leu

    ttg Leu

    tct Ser

    tcc Ser

    tca Ser

    tcg Ser

    tat Tir

    tac Tir

    taa Parada

    tag Parada

    tgt Cis

    tgc Cis

    tga Parada

    tgg Trp

    ctt Leu

    ctc Leu

    cta Leu

    ctg Leu

    cct Pro

    ccc Pro

    cca Pro

    ccg Pro

    cat His

    cac His

    caa Gln

    cag Gln

    cgt Arg

    cgc Arg

    cga Arg

    cgg Arg

    att Ile

    atc Ile

    ata Ile

    atg Met

    act Tre

    acc Tre

    aca Tre

    acg Tre

    aat Asn

    aac Asn

    aaa Lis

    aag Lis

    agt Ser

    agc Ser

    aga Arg

    agg Arg

    gtt Val

    gtc Val

    gta Val

    gtg Val

    gct Ala

    gcc Ala

    gca Ala

    gcg Ala

    gat Asp

    gac Asp

    gaa Glu

    gag Glu

    ggt Gli

    ggc Gli

    gga Gli

    ggg Gli

    O cdigo gentico padro

  • Dogmas: central e perifrico

    Nomenclatura dos aminocidos Histidina, fenilalanina, tirosina e triptofano so

    aromticos e desempenham papis estruturais especiais em protenas de membrana

    Os nomes dos aminocidos so abreviados com as suas trs primeiras letras Exceto: isoleucina (Ile), asparagina (Asn), glutamina (Gln),

    triptofano (Trp), selenocsteina (Sec)

    Conveno: escreve-se nucleotdeos com letras minsculas (atg = adenina-timina-

    guanina) Aminocidos em letras maisculas (ATG = alanina-treonina-

    glicina)

  • Dogmas: central e perifrico

    A sequncia de aminocidos de uma protena determina sua estrutura tridimensional

    Para cada sequncia de aminocidos natural, h um nico estado nativo estvel, o qual sob condies adequadas estabelecida sem alteraes

    Para leitura de uma protena preciso desenovelar em uma estrutura desordenada e inativa

    Quando as condies normais so restauradas, as molculas de protenas geralmente reassumem a sua estrutura nativa

    As funes das protenas dependem de elas adotarem a estrutura tridimensional do seu estado nativo

  • Dogmas: central e perifrico

  • Dogmas: central e perifrico

    O enovelamento espontneo de protenas para formar seu estado nativo o ponto em que a natureza realiza o grande salto do mundo unidimensional em sequncias dos genes e sequncias de protenas para o mundo tridimensional em que vivemos

    Paradoxo

    A traduo de sequncias de DNA em sequncias de aminocidos muito simples de descrever de maneira lgica cdigo gentico

  • Dogmas: central e perifrico

    O enovelamento de uma cadeia polipeptdica em uma estrutura tridimensional precisa muito difcil de explicar de maneira lgica

    A traduo exige mecanismos moleculares complicados do ribossomos, dos tRNAs e molculas associadas

    Entretanto, o enovelamento ocorre espontaneamente

  • Dogmas: central e perifrico

    Caractersticas dos aminocidos

    Dependem dos componentes de suas cadeias laterais, fazem com que possam ser reunidos em grupos especficos, como hidrofbicos, hidroflicos, aromticos, alifticos, entre outros

    Um somatrio de caractersticas, como grau de hidrofobicidade, presena de enxofre, tamanho, determinam que tipo de estrutura secundria, terciria e quaternria uma determinada sequncia de aminocidos ir formar

    Sequncias contendo vrias diferenas em relao aos aminocidos, podem formar protenas semelhantes, bastando conter aminocidos com caractersticas semelhantes em posio anlogas nas sequncias

  • Dogmas: central e perifrico

    Paradigma molecular

    A sequncia de DNA determina a sequncia de protena

    A sequncia de protena determina a estrutura da protena

    A estrutura da protena determina a funo da protena

    Mecanismos reguladores, incluindo mas no limitado ao controle de padres de expresso, fornecem as quantidades corretas das funes corretas, nos momentos e nos locais corretos

  • Dogmas: central e perifrico

    Grande parte da atividade organizada da bioinformtica est focalizada na analise de dados relacionados a esses processos do paradigma

    Esse paradigma no inclui nveis maiores do que o da estrutura e organizao molecular

  • Genomas e proteomas

    O Projeto Genoma um trabalho que visa desvendar o cdigo gentico de um organismo (animal, vegetal, fungos, bactrias ou vrus) atravs do seu mapeamento

    O genoma de uma bactria se apresenta como uma nica molcula de DNA

    O DNA de organismos superiores est organizado em cromossomos

    Clulas humanas contm 23 pares de cromossomos

  • Genomas e proteomas

    A quantidade total de informao gentica por clula, ou seja, a sequncia de nucleotdeos de DNA, aproximadamente constante para todos os membros de uma espcie, mas varia bastante entre espcies

  • Genomas e proteomas

    Organismo Nmero de pares de bases

    Nmero de genes Comentrio

    X-174 5.386 10 Vrus que infecta E. coli

    H. influenzae 1.830.138 1.738 Bactria causadora de infeces do ouvido mdio

    E. coli 4.639.221 4.377 Organismo predileto dos bilogos moleculares

    C. elegans 103.006.709 20.598 Verme

    D. melanogaster 128.343.463 13.525 Mosca-das-frutas

    Humanos 3.223 x 106 36000?

    Trigo 16 x 109 30.000

    Tamanhos de alguns genomas

  • Genomas e proteomas

    Nem todo o DNA codifica protenas

    Alguns genes existe em mltiplas cpias

    A quantidade de informao sobre sequncias de protenas em uma clula no pode ser facilmente estimada a partir do tamanho do genoma

    Um gene que codifica uma determinada protena corresponde a uma sequncia de nucleotdeos ao longo de uma ou mais regies de uma molcula de DNA

  • Genomas e proteomas

    http://www.accessexcellence.org/RC/VL/GG/ecb/gene_to_protein.php

    http://www.accessexcellence.org/RC/VL/GG/ecb/gene_to_protein.php

  • Genomas e proteomas

    O gene seria definido ento como um segmento do DNA contendo o cdigo para uma determinada protena

    J se sabia antes de completado o genoma, que seus elementos significativos ou regio codificadora (xons) aparecem interrompidos na longa cadeia de DNA por sequncias aparentemente inteis ou no codificadoras (ntrons)

    O cdigo para a fabricao da protena s ser montado na hora, num processo conhecido como unio (splice)

  • Genomas e proteomas

  • Genomas e proteomas

  • Genomas e proteomas

    O controle da informao organiza a expresso de genes

    Mecanismos de controle podem ligar ou desligar genes

    Muitas regies do DNA esto localizadas prximas a segmentos de DNA que codificam protenas

    Que contm sequncias sinalizadoras que servem de stio de ligao para as molculas reguladoras que podem bloquear a transcrio

  • Genomas e proteomas

    O Projeto proteoma um programa em larga escala que lida de forma integral com o padres de expresso de protenas em sistemas biolgicos, de modo complementar e suplementar aos projetos genoma

    O objetivo principal a descrio espao-temporal da distribuio de protenas no organismo

  • Genomas e proteomas

    O sequenciamento dos aminocidos das protenas pode ser realizado

    A partir da traduo do DNA Uma protena inferida a partir da sequncia de um genoma

    apenas um objeto hipottico at que experimentos comprovem a sua existncia

    Diretamente a partir do sequenciamento de protenas

  • Espionando a transmisso da informao gentica

    Como a informao hereditria armazenada, transmitida e implementada talvez seja o problema fundamental da biologia

    Existem trs tipos essenciais de mapas

    Mapas de ligaes de genes

    Padres de bandeamento de cromossomos

    Sequncias de DNA

    Esses mapas representam tipos bastante diferentes de dados

  • Espionando a transmisso da informao gentica

    Mapas de ligaes de genes

    determinado classicamente pela observao de padres de hereditariedade

    Mapas de padres de bandeamento de cromossomos

    Os cromossomos so objetos fsicos

    Padres de bandas so suas caractersticas visveis

  • Espionando a transmisso da informao gentica

    A sequncia de DNA

    Fisicamente, constitui-se da sequncia de nucleotdeos em uma molcula

    Computacionalmente, um conjunto de caracteres A, T, G e C

    Os genes so regies da sequncia, em muitos casos, interrompida por regies no-codificadoras

  • Espionando a transmisso da informao gentica

    Fazer conexes entre esses trs tipos de dados foi a grande conquista da biologia do sculo passado

    As relaes entre cromossomos, genes e sequncias de DNA foram essenciais na identificao das deficincias moleculares responsveis pelas doenas hereditrias

    O sequenciamento do genoma humano modificou esta situao

  • Espionando a transmisso da informao gentica

    Dada uma doena ocasionada por uma protena defeituosa Se soubermos qual a protena envolvida, podemos

    desenvolver terapias por meio de mtodos racionais

    Se soubermos qual o gene envolvido, podemos desenvolver testes para identificar indivduos doentes e portadores

    Em muitos casos, o conhecimento da localizao cromossmica do gene no necessrio para a terapia nem para a deteco necessrio apenas para a identificao do gene, criando uma

    ponte entre os padres de hereditariedade e a sequncia de DNA

  • Selecionando genes em genomas

    Programas de computadores para a anlise de genomas identificam fases de leitura aberta ou ORFs (open reading frame)

    Uma ORF uma regio da sequncia de DNA que comea com um cdon iniciador (ATG) e termina com um cdon de parada

    Uma ORF uma regio codificadora de protena em potencial

  • Selecionando genes em genomas

    Tcnicas para a identificao de regies codificadoras de protenas combinam ou escolhem entre duas abordagens possveis

    Deteco de regies similares a regies codificadoras conhecidas de outros organismos

    Mtodos ab initio (deste o incio) que procuram identificar genes a partir de propriedades intrnsecas das sequncias de DNA

  • Selecionando genes em genomas

    O NCBI mantm um programa de busca de ORFs

    O Finder ORF (Open Reading Frame Finder) uma ferramenta de anlise grfica que encontra todos os quadros de leitura aberta de um tamanho mnimo selecionvel em sequncia de um usurio ou em uma sequncia j no banco de dados

    http://www.ncbi.nlm.nih.gov/gorf/gorf.html

    Sequncia pesquisada Gene da fibrose cstica CFTR (cystic fibrosis transmembrane

    conductance regulator

    Gene ID: 1080

    http://www.ncbi.nlm.nih.gov/gorf/gorf.htmlhttp://www.ncbi.nlm.nih.gov/gorf/gorf.html

  • Selecionando genes em genomas

  • Selecionando genes em genomas

  • Genomas de procariotos

    A maioria das clulas procariticas contm seu material gentico na forma de uma nica molcula de DNA dupla fita circular grande

    As regies codificadoras de protenas nos genomas bacterianos no contm ntrons

    Em muitos genomas procariticos, tais regies esto parcialmente organizadas em perons genes adjacentes que so transcritos em uma nica molcula de mRNA, sob o controle transcricional

  • Genomas de procariotos

    Em bactrias, os genes de muitos perons codificam protenas com funes correlatas

    Um genoma procaritico tpico contm apenas uma quantidade relativamente pequena de DNA no-codificador

    Exemplos Mycoplasma genitalium (NC_000908.2) (1995)

    0,58x106pb, 524 genes e 475 protenas

    Methanococcus jannaschii (NC_000909.1) (1996) 1,74x106pb, 1.823 genes e 1.771 protenas

    Escherichia coli K-12 MG1655 (NC_000913.2) (1997) 4,64x106pb, 4.496 genes e 4.146 protenas Gene ID: 3654480

  • Genomas de eucariotos

    Em clulas eucariticas, a maior parte do DNA est no ncleo, separado em feixes de nucleoprotenas, os cromossomos

    Cada cromossomo contm uma nica molcula de DNA fita dupla

    Quantidades menores de DNA so observadas em organelas mitocndrias e cloroplastos

  • Genomas de eucariotos

    As espcies eucariticas variam quanto ao

    Contedo de DNA

    Ao nmero de cromossomos

    Distribuio de genes entre eles

    Exemplo

    Os humanos possuem 23 pares de cromossomos e os chimpanzs tm 24

    O cromossomo 2 humano corresponde a uma fuso dos cromossomos 12 e 13 dos chimpanzs

  • Genomas de eucariotos

    Exemplos

    Saccharomyces cerevisiae (fermento de padeiro) (1996) 16 cromossomos, 12,16x106pb, 6.352 genes e 5907 protenas

    Caenorhabditis elegans (verme) (1998) 6 cromossomos, 100,28x106pb, 21.187 genes e 23.906 protenas

    Drosophila melanogaster (mosca-das-frutas) (1999) 6 cromossomos, 149,78x106pb, 15.581 genes e 24.161 protenas

    Arabidopsis thaliana (planta florfera) (2000) 5 cromossomos, 119,67x106pb, 33.583 genes e 35.378 protenas

  • O genoma do Homo sapiens

    Homo sapiens (homem) (2003)

    22 pares de cromossomos, mais os cromossomos X e Y,

    3.095,69x106pb

    36.073 genes

    32.143 protenas

  • O genoma do Homo sapiens

    A anlise do repertrio de protenas humanas derivadas de sequncia do genoma tem se mostrado bastante complicada pelos problemas de confiabilidade na deteco de genes

    Principais categorias de protenas, em uma classificao funcional, num total de 39 classes (subclasses), totalizando 15.683 protenas Ligao a cido nuclicos (2.207) Enzima (3.242) Transduo de sinal (1.790) Protena estrutural (714) Transporte (682) Supressor de tumor (5) No classificadas (4.813)

  • O genoma do Homo sapiens

    Uma classificao baseada na estrutura revelou os tipos mais comuns de protenas num total de 30 tipos

    Imunoglobulina e domnio do complexo de histocompatibilidade principal (591)

    Dedo de zinco tipo C2H2 (499)

    Protena cnase eucaritica (459)

    Superfamlia GPCR tipo rodopsina (346)

    Stio ativo da famlia de protenas serina/treonina cnase (285)

  • O genoma do Homo sapiens

    Sequncias de repeties compreendem mais de 50% do genoma

    Elementos de transposio, ou repeties intercaladas

    Psedogenes retropostos (cpias danificadas no-funcionais de genes)

    Simples repeties de pequenos oligmeros (fragmentos curtos de DNA)

    Duplicao de segmentos de blocos de ~10 a ~300 kpb

  • O genoma do Homo sapiens

    Genes de RNA no genoma humano incluem:

    497 genes de RNA transportador

    Genes de RNAs ribossomais

    RNAs nucleolares

    snRNAs (RNAs pequenos)

  • Polimorfismos de um nico nucleotdeo (SNPs)

    Um polimorfismo de um nico nucleotdeo ou SNP uma variao gentica entre indivduos, limitada a um nico par de bases, o qual pode ser substitudo, inserido ou removido

    Os SNPs esto distribudos ao longo de todo o genoma, ocorrendo em mdia a cada 5.000 pb

    Muitos dos SNPs se encontram em regies no-funcionais do genoma

    Exemplo Anemia falciforme (mutao AT) Os alelos A, B e O dos genes para os tipos sanguneos

  • Polimorfismos de um nico nucleotdeo (SNPs)

    Tratamentos de doenas causadas por protenas defeituosas ou ausentes incluem Proviso da protena funcional

    Ajuste ao estilo de vida que tornem a protena desnecessria

    Terapia gnica para a substituio da protena ausente ou mutante

  • Diversidade gentica na antropologia

    Antropologia a cincia que tem como objeto o estudo sobre o homem e a humanidade de maneira totalizante, ou seja, abrangendo todas as suas dimenses

    As informaes obtidas com os SNPs so de grande utilidade na antropologia, fornecendo dados sobre variaes histricas no tamanho da populao e padres de migrao

  • Diversidade gentica na antropologia

    Os graus de diversidade gentica so interpretveis em termos do tamanho da populao fundadora

    Fundadores so o conjunto original de indivduos dos quais uma populao inteira descende

    Exemplo Extrapolaes da variao do DNA mitocondrial ( um organelo,

    notavelmente mvel e plstico, presente no citoplasma de clulas eucariticas - O contedo mitocondrial das nossas clulas herdado apenas por via materna) do homem contemporneo sugerem um nico ancestral materno, o qual viveu entre 14.000 e 200.000 anos atrs

  • Diversidade gentica na antropologia

    Os SNPs especficos de uma populao podem fornecer informaes sobre migraes

    Sequncias mitocondriais fornecem informaes sobre ancestrais femininos e sequncias do cromossomo Y fornecem informaes sobre ancestrais masculinos

    Exemplo Foi sugerido que a populao da Islndia descende de homens

    oriundos da Escandinvia e de mulheres oriundas tanto da Escandinvia quanto das Ilhas Britnicas

    O que se comprovou atravs de escritos medievais islandeses

  • Diversidade gentica na antropologia

    Na descoberta de populaes isoladas, a gentica antropolgica fornece informaes teis na medicina, pois o mapeamento de genes relacionados com doenas se torna fcil se as variaes espontneas forem baixas

    Populaes europeias geneticamente isoladas: bascos, finlandeses, islandeses, galeses e lapes

  • Diversidade gentica na antropologia

    Variaes em nossa sequncia de DNA nos conferem marcas individuais, como se fosse uma impresso digital gentica

    Nossas sequncias de DNA mitocondrial so geneticamente idnticas (homoplasmia)

    Porm alguns indivduos contm mitocndrias com sequncias diferentes de DNA (heteroplasmia)

    O que pode contribuir para a identificao pessoal

  • Diversidade gentica na antropologia

    Anlise gentica animal os recursos animais so um aspecto integral e essencial da cultura humana

    Anlises das sequncias de DNA esclareceram alguns aspectos do seu desenvolvimento histrico e das variedades genticas que caracterizam as populaes modernas Exemplo

    Anlises de sequncias de DNA mitocondrial do gado europeu, africano e asitico sugerem que todas as raas europeias e africanas esto mais relacionadas entre si do que cada uma delas com as raas indianas e que estes dois grupos divergiram h cerca de 200.000 anos

  • Evoluo de genomas

    A disponibilidade de informaes completas sobre sequncias de genomas alterou o rumo das pesquisas

    Um desafio comum na anlise de genomas identificar algum evento interessante

    A genmica comparativa uma nova rea de pesquisa que lida com questes tais como

    Quais genes so compartilhados por filos diferentes?

    Quais protenas homlogas so compartilhadas por filos diferentes?

    Quais funes bioqumicas so compartilhadas por diferentes filos?

  • Evoluo de genomas

    Pesquisas da genmica comparativa entre trs espcies (H. influenzae (bactria), M. jannaschii (arqueobactria) e S. crerevisiae (levedura)) levaram a uma lista de classes de funes gerais e a responderem a pergunta existem protenas comuns com funes comuns? Sim existem

    E anlises das funes compartilhadas pelos trs domnios levaram os cientistas a se perguntarem se seria possvel definir um organismo mnimo Isto , um organismo com o menor genoma possvel que fosse

    consistente com uma forma de vida independente e baseada no dogma central DNARNAprotena (ou seja, excluindo-se as formas de vida livres de protenas e baseadas apenas em RNA)

  • Evoluo de genomas

    Concluses A viabilidade de um organismo com estas protenas no foi

    demonstrada

    Mas a pesquisa identificou uma srie de funes necessariamente comuns a todas as formas de vida

    O que levou a uma questo At que ponto diferentes formas de vida desempenham essas funes

    da mesma maneira?

    O desafio continua sendo o de mapear funes comuns e protenas comuns Ou seja, um conjunto de protenas comuns executa um conjunto

    de funes comuns?

  • Evoluo de genomas

    A evoluo explorou, em propores variadas, o vasto potencial das protenas para diferentes tipos de funes

    Esta variao foi mais conservadora na rea de sntese de protenas

  • Evoluo de genomas

    Ainda na genmica comparativa, mas de eucariotos

    A comparao dos genomas de levedura, mosca, verme e do homem revelou 1.308 grupos de protenas que so comuns aos quatro organismos

    Esses grupos formam um conjunto central de protenas conservadas para funes bsicas, incluindo metabolismo, replicao e reparo do DNA e traduo

  • Evoluo de genomas

    A duplicao gnica seguida de divergncia um mecanismo de criao de famlias de protenas

    Exemplo Existem 906 genes e pseudogenes para receptores olfativos no

    genoma humano

    Foram encontrados homlogos em levedura e outros fungos

    Mas a necessidade dos vertebrados de terem um olfato altamente desenvolvido que levou esta famlia de genes a este nvel de multiplicao e especializao

  • Evoluo de genomas

    Outra rea de pesquisa a transmisso horizontal de genes

    Em geral, a transferncia horizontal de genes a aquisio de material gentico de um organismo por outro organismo, por meios naturais e no por procedimentos, atravs de mecanismos que no incluam a descendncia direta durante a replicao ou reproduo

  • Evoluo de genomas

    Evidncias de transferncia horizontal incluem

    Discrepncias entre rvores evolucionrias construdas a partir de genes diferentes

    Comparaes diretas entre genes de espcies distintas

    Exemplo

    Pelo menos oito genes humanos so observados no genoma M. tuberculosis

  • Referncias

    LESK, A. M. Introduo a Bioinformtica. 2 Ed. Porto Alegre: Editora Artmed, 2008 GIBAS, C., JAMBECK, P., Desenvolvendo Bioinformtica. Rio de Janeiro: Campus,

    2001 NCBI. National Center for Biotechnology Information. Disponvel em:

    . Acesso em: 09 Ago. 2012 BLAST. Basic Local Alignment Search Tool. Disponvel em:

    . Acesso em: 09 Ago. 2012