Upload
wiviane-wieser
View
37
Download
1
Embed Size (px)
DESCRIPTION
Artigo
Citation preview
Organizao e Evoluo de Genomas
Juliana de Oliveira
Roteiro
Dogmas: central e perifrico
Genomas e proteomas
Espionando a transmisso da informao gentica
Selecionando genes e genomas
Genomas de procariotos
Genomas de eucariotos
O genoma do Homo sapiens
Polimorfismos de um nico nucleotdeo (SNPs)
Diversidade gentica na antropologia
Evoluo de genomas
Dogmas: central e perifrico
O arquivo de informaes em cada organismo o material gentico
A replicao quase perfeita do DNA essencial para estabilidade da herdabilidade As imperfeies tambm so necessrias, gerando
informaes evolutivas
A implementao da informao gentica ocorre inicialmente com a sntese de RNA e protenas
Dogmas: central e perifrico
O cdigo gentico de fato uma codificao
Tripletos de letras sucessivas da sequncia do DNA especificam aminocidos consecutivos
Poro de sequncias de DNA codificam sequncias de aminocidos de protenas
Protenas so compostas de 200 a 400 aminocidos, o que exige de 600 a 1.200 letras de mensagens de DNA expresso para especific-las
RNA ribossomal tambm determinado pelo DNA
Dogmas: central e perifrico
Nem todo DNA expresso em protenas ou RNA estrutural
Muitos genes a serem transcritos apresentam sequncias chamadas ntrons (sequncias no traduzidas)
Algumas regies do DNA atuam como mecanismos de controle
Uma poro substancial do genoma dos organismos superiores aparenta ser suprflua (ainda no compreendemos sua funo)
Dogmas: central e perifrico
Nomenclatura e estrutura molecular
Os quatro nucleotdeos de ocorrncia natural no DNA (RNA)
a adenina
g guanina
c citosina
t timina
(u uracila)
1. As molculas de DNA so quimicamente similares, e a estrutura do DNA uniforme (embora algumas interaes DNA protena causam distores na estrutura do DNA
2. Protenas e RNAs estruturais apresentam ampla variedade de conformaes tridimensional, necessrias para garantir o desempenho de diversos papis funcionais
Dogmas: central e perifrico
Aminocidos
No-polares G glicina (Gli)
I isoleucina (Ile)
A alanina (Ala)
P prolina (Pro)
V valina (Val)
L leucina (Leu)
F fenilalanina (Phe)
M metionina (Met)
Polares S serina (Ser) C cistena (Cis) T treonina (ter) N asparigina
(Asn) Q glutamina
(Gln) H histidina (His) Y tirosina (Tir) W triptofano
(Trp)
Carregados D c. Asprtico
(Asp) E c. Glutmico
(Glu) K lisina (Lis) R arginina (Arg)
Dogmas: central e perifrico
ttt Phe
ttc Phe
tta Leu
ttg Leu
tct Ser
tcc Ser
tca Ser
tcg Ser
tat Tir
tac Tir
taa Parada
tag Parada
tgt Cis
tgc Cis
tga Parada
tgg Trp
ctt Leu
ctc Leu
cta Leu
ctg Leu
cct Pro
ccc Pro
cca Pro
ccg Pro
cat His
cac His
caa Gln
cag Gln
cgt Arg
cgc Arg
cga Arg
cgg Arg
att Ile
atc Ile
ata Ile
atg Met
act Tre
acc Tre
aca Tre
acg Tre
aat Asn
aac Asn
aaa Lis
aag Lis
agt Ser
agc Ser
aga Arg
agg Arg
gtt Val
gtc Val
gta Val
gtg Val
gct Ala
gcc Ala
gca Ala
gcg Ala
gat Asp
gac Asp
gaa Glu
gag Glu
ggt Gli
ggc Gli
gga Gli
ggg Gli
O cdigo gentico padro
Dogmas: central e perifrico
Nomenclatura dos aminocidos Histidina, fenilalanina, tirosina e triptofano so
aromticos e desempenham papis estruturais especiais em protenas de membrana
Os nomes dos aminocidos so abreviados com as suas trs primeiras letras Exceto: isoleucina (Ile), asparagina (Asn), glutamina (Gln),
triptofano (Trp), selenocsteina (Sec)
Conveno: escreve-se nucleotdeos com letras minsculas (atg = adenina-timina-
guanina) Aminocidos em letras maisculas (ATG = alanina-treonina-
glicina)
Dogmas: central e perifrico
A sequncia de aminocidos de uma protena determina sua estrutura tridimensional
Para cada sequncia de aminocidos natural, h um nico estado nativo estvel, o qual sob condies adequadas estabelecida sem alteraes
Para leitura de uma protena preciso desenovelar em uma estrutura desordenada e inativa
Quando as condies normais so restauradas, as molculas de protenas geralmente reassumem a sua estrutura nativa
As funes das protenas dependem de elas adotarem a estrutura tridimensional do seu estado nativo
Dogmas: central e perifrico
Dogmas: central e perifrico
O enovelamento espontneo de protenas para formar seu estado nativo o ponto em que a natureza realiza o grande salto do mundo unidimensional em sequncias dos genes e sequncias de protenas para o mundo tridimensional em que vivemos
Paradoxo
A traduo de sequncias de DNA em sequncias de aminocidos muito simples de descrever de maneira lgica cdigo gentico
Dogmas: central e perifrico
O enovelamento de uma cadeia polipeptdica em uma estrutura tridimensional precisa muito difcil de explicar de maneira lgica
A traduo exige mecanismos moleculares complicados do ribossomos, dos tRNAs e molculas associadas
Entretanto, o enovelamento ocorre espontaneamente
Dogmas: central e perifrico
Caractersticas dos aminocidos
Dependem dos componentes de suas cadeias laterais, fazem com que possam ser reunidos em grupos especficos, como hidrofbicos, hidroflicos, aromticos, alifticos, entre outros
Um somatrio de caractersticas, como grau de hidrofobicidade, presena de enxofre, tamanho, determinam que tipo de estrutura secundria, terciria e quaternria uma determinada sequncia de aminocidos ir formar
Sequncias contendo vrias diferenas em relao aos aminocidos, podem formar protenas semelhantes, bastando conter aminocidos com caractersticas semelhantes em posio anlogas nas sequncias
Dogmas: central e perifrico
Paradigma molecular
A sequncia de DNA determina a sequncia de protena
A sequncia de protena determina a estrutura da protena
A estrutura da protena determina a funo da protena
Mecanismos reguladores, incluindo mas no limitado ao controle de padres de expresso, fornecem as quantidades corretas das funes corretas, nos momentos e nos locais corretos
Dogmas: central e perifrico
Grande parte da atividade organizada da bioinformtica est focalizada na analise de dados relacionados a esses processos do paradigma
Esse paradigma no inclui nveis maiores do que o da estrutura e organizao molecular
Genomas e proteomas
O Projeto Genoma um trabalho que visa desvendar o cdigo gentico de um organismo (animal, vegetal, fungos, bactrias ou vrus) atravs do seu mapeamento
O genoma de uma bactria se apresenta como uma nica molcula de DNA
O DNA de organismos superiores est organizado em cromossomos
Clulas humanas contm 23 pares de cromossomos
Genomas e proteomas
A quantidade total de informao gentica por clula, ou seja, a sequncia de nucleotdeos de DNA, aproximadamente constante para todos os membros de uma espcie, mas varia bastante entre espcies
Genomas e proteomas
Organismo Nmero de pares de bases
Nmero de genes Comentrio
X-174 5.386 10 Vrus que infecta E. coli
H. influenzae 1.830.138 1.738 Bactria causadora de infeces do ouvido mdio
E. coli 4.639.221 4.377 Organismo predileto dos bilogos moleculares
C. elegans 103.006.709 20.598 Verme
D. melanogaster 128.343.463 13.525 Mosca-das-frutas
Humanos 3.223 x 106 36000?
Trigo 16 x 109 30.000
Tamanhos de alguns genomas
Genomas e proteomas
Nem todo o DNA codifica protenas
Alguns genes existe em mltiplas cpias
A quantidade de informao sobre sequncias de protenas em uma clula no pode ser facilmente estimada a partir do tamanho do genoma
Um gene que codifica uma determinada protena corresponde a uma sequncia de nucleotdeos ao longo de uma ou mais regies de uma molcula de DNA
Genomas e proteomas
http://www.accessexcellence.org/RC/VL/GG/ecb/gene_to_protein.php
http://www.accessexcellence.org/RC/VL/GG/ecb/gene_to_protein.php
Genomas e proteomas
O gene seria definido ento como um segmento do DNA contendo o cdigo para uma determinada protena
J se sabia antes de completado o genoma, que seus elementos significativos ou regio codificadora (xons) aparecem interrompidos na longa cadeia de DNA por sequncias aparentemente inteis ou no codificadoras (ntrons)
O cdigo para a fabricao da protena s ser montado na hora, num processo conhecido como unio (splice)
Genomas e proteomas
Genomas e proteomas
Genomas e proteomas
O controle da informao organiza a expresso de genes
Mecanismos de controle podem ligar ou desligar genes
Muitas regies do DNA esto localizadas prximas a segmentos de DNA que codificam protenas
Que contm sequncias sinalizadoras que servem de stio de ligao para as molculas reguladoras que podem bloquear a transcrio
Genomas e proteomas
O Projeto proteoma um programa em larga escala que lida de forma integral com o padres de expresso de protenas em sistemas biolgicos, de modo complementar e suplementar aos projetos genoma
O objetivo principal a descrio espao-temporal da distribuio de protenas no organismo
Genomas e proteomas
O sequenciamento dos aminocidos das protenas pode ser realizado
A partir da traduo do DNA Uma protena inferida a partir da sequncia de um genoma
apenas um objeto hipottico at que experimentos comprovem a sua existncia
Diretamente a partir do sequenciamento de protenas
Espionando a transmisso da informao gentica
Como a informao hereditria armazenada, transmitida e implementada talvez seja o problema fundamental da biologia
Existem trs tipos essenciais de mapas
Mapas de ligaes de genes
Padres de bandeamento de cromossomos
Sequncias de DNA
Esses mapas representam tipos bastante diferentes de dados
Espionando a transmisso da informao gentica
Mapas de ligaes de genes
determinado classicamente pela observao de padres de hereditariedade
Mapas de padres de bandeamento de cromossomos
Os cromossomos so objetos fsicos
Padres de bandas so suas caractersticas visveis
Espionando a transmisso da informao gentica
A sequncia de DNA
Fisicamente, constitui-se da sequncia de nucleotdeos em uma molcula
Computacionalmente, um conjunto de caracteres A, T, G e C
Os genes so regies da sequncia, em muitos casos, interrompida por regies no-codificadoras
Espionando a transmisso da informao gentica
Fazer conexes entre esses trs tipos de dados foi a grande conquista da biologia do sculo passado
As relaes entre cromossomos, genes e sequncias de DNA foram essenciais na identificao das deficincias moleculares responsveis pelas doenas hereditrias
O sequenciamento do genoma humano modificou esta situao
Espionando a transmisso da informao gentica
Dada uma doena ocasionada por uma protena defeituosa Se soubermos qual a protena envolvida, podemos
desenvolver terapias por meio de mtodos racionais
Se soubermos qual o gene envolvido, podemos desenvolver testes para identificar indivduos doentes e portadores
Em muitos casos, o conhecimento da localizao cromossmica do gene no necessrio para a terapia nem para a deteco necessrio apenas para a identificao do gene, criando uma
ponte entre os padres de hereditariedade e a sequncia de DNA
Selecionando genes em genomas
Programas de computadores para a anlise de genomas identificam fases de leitura aberta ou ORFs (open reading frame)
Uma ORF uma regio da sequncia de DNA que comea com um cdon iniciador (ATG) e termina com um cdon de parada
Uma ORF uma regio codificadora de protena em potencial
Selecionando genes em genomas
Tcnicas para a identificao de regies codificadoras de protenas combinam ou escolhem entre duas abordagens possveis
Deteco de regies similares a regies codificadoras conhecidas de outros organismos
Mtodos ab initio (deste o incio) que procuram identificar genes a partir de propriedades intrnsecas das sequncias de DNA
Selecionando genes em genomas
O NCBI mantm um programa de busca de ORFs
O Finder ORF (Open Reading Frame Finder) uma ferramenta de anlise grfica que encontra todos os quadros de leitura aberta de um tamanho mnimo selecionvel em sequncia de um usurio ou em uma sequncia j no banco de dados
http://www.ncbi.nlm.nih.gov/gorf/gorf.html
Sequncia pesquisada Gene da fibrose cstica CFTR (cystic fibrosis transmembrane
conductance regulator
Gene ID: 1080
http://www.ncbi.nlm.nih.gov/gorf/gorf.htmlhttp://www.ncbi.nlm.nih.gov/gorf/gorf.html
Selecionando genes em genomas
Selecionando genes em genomas
Genomas de procariotos
A maioria das clulas procariticas contm seu material gentico na forma de uma nica molcula de DNA dupla fita circular grande
As regies codificadoras de protenas nos genomas bacterianos no contm ntrons
Em muitos genomas procariticos, tais regies esto parcialmente organizadas em perons genes adjacentes que so transcritos em uma nica molcula de mRNA, sob o controle transcricional
Genomas de procariotos
Em bactrias, os genes de muitos perons codificam protenas com funes correlatas
Um genoma procaritico tpico contm apenas uma quantidade relativamente pequena de DNA no-codificador
Exemplos Mycoplasma genitalium (NC_000908.2) (1995)
0,58x106pb, 524 genes e 475 protenas
Methanococcus jannaschii (NC_000909.1) (1996) 1,74x106pb, 1.823 genes e 1.771 protenas
Escherichia coli K-12 MG1655 (NC_000913.2) (1997) 4,64x106pb, 4.496 genes e 4.146 protenas Gene ID: 3654480
Genomas de eucariotos
Em clulas eucariticas, a maior parte do DNA est no ncleo, separado em feixes de nucleoprotenas, os cromossomos
Cada cromossomo contm uma nica molcula de DNA fita dupla
Quantidades menores de DNA so observadas em organelas mitocndrias e cloroplastos
Genomas de eucariotos
As espcies eucariticas variam quanto ao
Contedo de DNA
Ao nmero de cromossomos
Distribuio de genes entre eles
Exemplo
Os humanos possuem 23 pares de cromossomos e os chimpanzs tm 24
O cromossomo 2 humano corresponde a uma fuso dos cromossomos 12 e 13 dos chimpanzs
Genomas de eucariotos
Exemplos
Saccharomyces cerevisiae (fermento de padeiro) (1996) 16 cromossomos, 12,16x106pb, 6.352 genes e 5907 protenas
Caenorhabditis elegans (verme) (1998) 6 cromossomos, 100,28x106pb, 21.187 genes e 23.906 protenas
Drosophila melanogaster (mosca-das-frutas) (1999) 6 cromossomos, 149,78x106pb, 15.581 genes e 24.161 protenas
Arabidopsis thaliana (planta florfera) (2000) 5 cromossomos, 119,67x106pb, 33.583 genes e 35.378 protenas
O genoma do Homo sapiens
Homo sapiens (homem) (2003)
22 pares de cromossomos, mais os cromossomos X e Y,
3.095,69x106pb
36.073 genes
32.143 protenas
O genoma do Homo sapiens
A anlise do repertrio de protenas humanas derivadas de sequncia do genoma tem se mostrado bastante complicada pelos problemas de confiabilidade na deteco de genes
Principais categorias de protenas, em uma classificao funcional, num total de 39 classes (subclasses), totalizando 15.683 protenas Ligao a cido nuclicos (2.207) Enzima (3.242) Transduo de sinal (1.790) Protena estrutural (714) Transporte (682) Supressor de tumor (5) No classificadas (4.813)
O genoma do Homo sapiens
Uma classificao baseada na estrutura revelou os tipos mais comuns de protenas num total de 30 tipos
Imunoglobulina e domnio do complexo de histocompatibilidade principal (591)
Dedo de zinco tipo C2H2 (499)
Protena cnase eucaritica (459)
Superfamlia GPCR tipo rodopsina (346)
Stio ativo da famlia de protenas serina/treonina cnase (285)
O genoma do Homo sapiens
Sequncias de repeties compreendem mais de 50% do genoma
Elementos de transposio, ou repeties intercaladas
Psedogenes retropostos (cpias danificadas no-funcionais de genes)
Simples repeties de pequenos oligmeros (fragmentos curtos de DNA)
Duplicao de segmentos de blocos de ~10 a ~300 kpb
O genoma do Homo sapiens
Genes de RNA no genoma humano incluem:
497 genes de RNA transportador
Genes de RNAs ribossomais
RNAs nucleolares
snRNAs (RNAs pequenos)
Polimorfismos de um nico nucleotdeo (SNPs)
Um polimorfismo de um nico nucleotdeo ou SNP uma variao gentica entre indivduos, limitada a um nico par de bases, o qual pode ser substitudo, inserido ou removido
Os SNPs esto distribudos ao longo de todo o genoma, ocorrendo em mdia a cada 5.000 pb
Muitos dos SNPs se encontram em regies no-funcionais do genoma
Exemplo Anemia falciforme (mutao AT) Os alelos A, B e O dos genes para os tipos sanguneos
Polimorfismos de um nico nucleotdeo (SNPs)
Tratamentos de doenas causadas por protenas defeituosas ou ausentes incluem Proviso da protena funcional
Ajuste ao estilo de vida que tornem a protena desnecessria
Terapia gnica para a substituio da protena ausente ou mutante
Diversidade gentica na antropologia
Antropologia a cincia que tem como objeto o estudo sobre o homem e a humanidade de maneira totalizante, ou seja, abrangendo todas as suas dimenses
As informaes obtidas com os SNPs so de grande utilidade na antropologia, fornecendo dados sobre variaes histricas no tamanho da populao e padres de migrao
Diversidade gentica na antropologia
Os graus de diversidade gentica so interpretveis em termos do tamanho da populao fundadora
Fundadores so o conjunto original de indivduos dos quais uma populao inteira descende
Exemplo Extrapolaes da variao do DNA mitocondrial ( um organelo,
notavelmente mvel e plstico, presente no citoplasma de clulas eucariticas - O contedo mitocondrial das nossas clulas herdado apenas por via materna) do homem contemporneo sugerem um nico ancestral materno, o qual viveu entre 14.000 e 200.000 anos atrs
Diversidade gentica na antropologia
Os SNPs especficos de uma populao podem fornecer informaes sobre migraes
Sequncias mitocondriais fornecem informaes sobre ancestrais femininos e sequncias do cromossomo Y fornecem informaes sobre ancestrais masculinos
Exemplo Foi sugerido que a populao da Islndia descende de homens
oriundos da Escandinvia e de mulheres oriundas tanto da Escandinvia quanto das Ilhas Britnicas
O que se comprovou atravs de escritos medievais islandeses
Diversidade gentica na antropologia
Na descoberta de populaes isoladas, a gentica antropolgica fornece informaes teis na medicina, pois o mapeamento de genes relacionados com doenas se torna fcil se as variaes espontneas forem baixas
Populaes europeias geneticamente isoladas: bascos, finlandeses, islandeses, galeses e lapes
Diversidade gentica na antropologia
Variaes em nossa sequncia de DNA nos conferem marcas individuais, como se fosse uma impresso digital gentica
Nossas sequncias de DNA mitocondrial so geneticamente idnticas (homoplasmia)
Porm alguns indivduos contm mitocndrias com sequncias diferentes de DNA (heteroplasmia)
O que pode contribuir para a identificao pessoal
Diversidade gentica na antropologia
Anlise gentica animal os recursos animais so um aspecto integral e essencial da cultura humana
Anlises das sequncias de DNA esclareceram alguns aspectos do seu desenvolvimento histrico e das variedades genticas que caracterizam as populaes modernas Exemplo
Anlises de sequncias de DNA mitocondrial do gado europeu, africano e asitico sugerem que todas as raas europeias e africanas esto mais relacionadas entre si do que cada uma delas com as raas indianas e que estes dois grupos divergiram h cerca de 200.000 anos
Evoluo de genomas
A disponibilidade de informaes completas sobre sequncias de genomas alterou o rumo das pesquisas
Um desafio comum na anlise de genomas identificar algum evento interessante
A genmica comparativa uma nova rea de pesquisa que lida com questes tais como
Quais genes so compartilhados por filos diferentes?
Quais protenas homlogas so compartilhadas por filos diferentes?
Quais funes bioqumicas so compartilhadas por diferentes filos?
Evoluo de genomas
Pesquisas da genmica comparativa entre trs espcies (H. influenzae (bactria), M. jannaschii (arqueobactria) e S. crerevisiae (levedura)) levaram a uma lista de classes de funes gerais e a responderem a pergunta existem protenas comuns com funes comuns? Sim existem
E anlises das funes compartilhadas pelos trs domnios levaram os cientistas a se perguntarem se seria possvel definir um organismo mnimo Isto , um organismo com o menor genoma possvel que fosse
consistente com uma forma de vida independente e baseada no dogma central DNARNAprotena (ou seja, excluindo-se as formas de vida livres de protenas e baseadas apenas em RNA)
Evoluo de genomas
Concluses A viabilidade de um organismo com estas protenas no foi
demonstrada
Mas a pesquisa identificou uma srie de funes necessariamente comuns a todas as formas de vida
O que levou a uma questo At que ponto diferentes formas de vida desempenham essas funes
da mesma maneira?
O desafio continua sendo o de mapear funes comuns e protenas comuns Ou seja, um conjunto de protenas comuns executa um conjunto
de funes comuns?
Evoluo de genomas
A evoluo explorou, em propores variadas, o vasto potencial das protenas para diferentes tipos de funes
Esta variao foi mais conservadora na rea de sntese de protenas
Evoluo de genomas
Ainda na genmica comparativa, mas de eucariotos
A comparao dos genomas de levedura, mosca, verme e do homem revelou 1.308 grupos de protenas que so comuns aos quatro organismos
Esses grupos formam um conjunto central de protenas conservadas para funes bsicas, incluindo metabolismo, replicao e reparo do DNA e traduo
Evoluo de genomas
A duplicao gnica seguida de divergncia um mecanismo de criao de famlias de protenas
Exemplo Existem 906 genes e pseudogenes para receptores olfativos no
genoma humano
Foram encontrados homlogos em levedura e outros fungos
Mas a necessidade dos vertebrados de terem um olfato altamente desenvolvido que levou esta famlia de genes a este nvel de multiplicao e especializao
Evoluo de genomas
Outra rea de pesquisa a transmisso horizontal de genes
Em geral, a transferncia horizontal de genes a aquisio de material gentico de um organismo por outro organismo, por meios naturais e no por procedimentos, atravs de mecanismos que no incluam a descendncia direta durante a replicao ou reproduo
Evoluo de genomas
Evidncias de transferncia horizontal incluem
Discrepncias entre rvores evolucionrias construdas a partir de genes diferentes
Comparaes diretas entre genes de espcies distintas
Exemplo
Pelo menos oito genes humanos so observados no genoma M. tuberculosis
Referncias
LESK, A. M. Introduo a Bioinformtica. 2 Ed. Porto Alegre: Editora Artmed, 2008 GIBAS, C., JAMBECK, P., Desenvolvendo Bioinformtica. Rio de Janeiro: Campus,
2001 NCBI. National Center for Biotechnology Information. Disponvel em:
. Acesso em: 09 Ago. 2012 BLAST. Basic Local Alignment Search Tool. Disponvel em:
. Acesso em: 09 Ago. 2012