21
MEDICINA NO SÉCULO XXI MONOGRAFIA - I Genética Molecular - Conceitos Gerais Iuri D. Louro, MD. PhD. & Sandra Galeotti, MS Introdução O rápido acúmulo de novos conhecimentos no campo da Genética e a crescente ênfase nos aspectos moleculares envolvidos na etiologia e etologia de diversas doenças, assim como no desen- volvimento de novas abordagens terapêu- ticas e diagnósticas, exige que o médico e o estudante de Medicina atualizem-se rapidamente, para acompanhar os desen- volvimentos da Medicina do século XXI. Contribuir para que isso aconteça, é nosso objetivo. Independente da especialidade de atuação ou interesse do leitor, certos conhecimentos e conceitos são indis- pensáveis à compreensão da medicina contemporânea. Esta primeira monografia abordará, portanto, os conceitos gerais da Genética Molecular, com o objetivo de facilitar a leitura das monografias que se seguem. A genética mendeliana ocupou-se do estudo de características herdadas e do comportamento de transmissão das mes- mas, determinando os conceitos de traços dominantes e recessivos. Mas somente no início do século XX a Genética Mende- liana foi redescoberta, estabelecendo-se assim a idéia de genes como unidades de herança. A seguir, os vários anos de pesquisa da molécula de DNA realizados por Rosalind E. Franklin, no King’s College, possibilitou a Watson e Crick, auxiliados por Jerry Donahue, o desenvolvimento do esboço estrutural, em 1953, de duplo filamento da molécula de DNA, dispostos em forma helicoidal ou dupla hélice. A partir de então, o gene passou a ser visto como um sítio codi- ficante da molécula de DNA, responsável pela síntese de uma única proteína, dando origem ao postulado “um gene, uma enzima”. Dessa forma, os genes passaram a ser considerados unidades invioláveis de processamento de informação genética – exceto pelos casos de mutações oca- sionais. Acreditava-se também haver uma quase completa incompatibilidade entre os genomas de diferentes espécies. No entanto, o crescente número de descobertas da Biologia Molecular, apoiada por novas técnicas e novos recursos tecnológicos, gradualmente desafiou esse modelo, através de novas evidências que não se enquadravam no postulado vigente: o genoma parecia cada vez menos estável e menos inviolável. A descoberta dos transposons, que promo- vem a recombinação gênica, por Barbara McClintock, representou um dos princi- pais desafios à idéia de gene estável. Em 1988, Elizabeth Blackburn e Carol Greider descobriram a enzima telomerase, ao mesmo tempo em que outros pesqui- sadores constataram a impossibilidade de se estabelecer limites definidos para os sítios onde um gene termina, devido às bordas sobrepostas de muitos genes (sliding edges), aumentando o desafio à validade do postulado genético clássico. Os íntrons, segmentos aparen- temente não codificantes do DNA, que se acreditava não possuírem nenhuma fun- ção fisiológica importante, em contra- posição aos éxons (segmentos codifi- cantes), também desafiaram o modelo vigente, revelando-se como agentes controladores do splicing de éxons no pré-RNA mensageiro e, possivelmente, servindo como sítio de amortização mutacional. Curiosamente e à excessão da regra, um sítio de transcrição ativa, identificado no homem e no camun- dongo como U22, revelou-se como um gene pelo avesso, pois demonstra

Monograph Molecular Genetics

  • Upload
    sandra

  • View
    2.962

  • Download
    3

Embed Size (px)

DESCRIPTION

Introduction to Molecular Genetics, General Concepts

Citation preview

Page 1: Monograph Molecular Genetics

MEDICINA NO SÉCULO XXI

MONOGRAFIA - I

Genética Molecular - Conceitos Gerais Iuri D. Louro, MD. PhD. & Sandra Galeotti, MS

Introdução

O rápido acúmulo de novos conhecimentos no campo da Genética e a crescente ênfase nos aspectos moleculares envolvidos na etiologia e etologia de diversas doenças, assim como no desen-volvimento de novas abordagens terapêu-ticas e diagnósticas, exige que o médico e o estudante de Medicina atualizem-se rapidamente, para acompanhar os desen-volvimentos da Medicina do século XXI. Contribuir para que isso aconteça, é nosso objetivo. Independente da especialidade de atuação ou interesse do leitor, certos conhecimentos e conceitos são indis-pensáveis à compreensão da medicina contemporânea. Esta primeira monografia abordará, portanto, os conceitos gerais da Genética Molecular, com o objetivo de facilitar a leitura das monografias que se seguem.

A genética mendeliana ocupou-se do estudo de características herdadas e do comportamento de transmissão das mes-mas, determinando os conceitos de traços dominantes e recessivos. Mas somente no início do século XX a Genética Mende-liana foi redescoberta, estabelecendo-se assim a idéia de genes como unidades de herança. A seguir, os vários anos de pesquisa da molécula de DNA realizados por Rosalind E. Franklin, no King’s College, possibilitou a Watson e Crick, auxiliados por Jerry Donahue, o desenvolvimento do esboço estrutural, em 1953, de duplo filamento da molécula de DNA, dispostos em forma helicoidal ou dupla hélice. A partir de então, o gene passou a ser visto como um sítio codi-

ficante da molécula de DNA, responsável pela síntese de uma única proteína, dando origem ao postulado “um gene, uma enzima”. Dessa forma, os genes passaram a ser considerados unidades invioláveis de processamento de informação genética – exceto pelos casos de mutações oca-sionais. Acreditava-se também haver uma quase completa incompatibilidade entre os genomas de diferentes espécies.

No entanto, o crescente número de descobertas da Biologia Molecular, apoiada por novas técnicas e novos recursos tecnológicos, gradualmente desafiou esse modelo, através de novas evidências que não se enquadravam no postulado vigente: o genoma parecia cada vez menos estável e menos inviolável. A descoberta dos transposons, que promo-vem a recombinação gênica, por Barbara McClintock, representou um dos princi-pais desafios à idéia de gene estável. Em 1988, Elizabeth Blackburn e Carol Greider descobriram a enzima telomerase, ao mesmo tempo em que outros pesqui-sadores constataram a impossibilidade de se estabelecer limites definidos para os sítios onde um gene termina, devido às bordas sobrepostas de muitos genes (sliding edges), aumentando o desafio à validade do postulado genético clássico.

Os íntrons, segmentos aparen-temente não codificantes do DNA, que se acreditava não possuírem nenhuma fun-ção fisiológica importante, em contra-posição aos éxons (segmentos codifi-cantes), também desafiaram o modelo vigente, revelando-se como agentes controladores do splicing de éxons no pré-RNA mensageiro e, possivelmente, servindo como sítio de amortização mutacional. Curiosamente e à excessão da regra, um sítio de transcrição ativa, identificado no homem e no camun-dongo como U22, revelou-se como um gene pelo avesso, pois demonstra

Page 2: Monograph Molecular Genetics

inatividade traducional de seus éxons no RNA maduro, enquanto seus íntrons traduzem o transcrito snoRNA, cons-tituinte do RNA de nucléolos. No caso do U22, portanto, os éxons são inativos e os íntrons proces-sados durante o splicing são codificantes ativos

O postulado “um gene, uma enzima”, acabou por perder sentido, frente à descoberta do processo de splicing ou arranjo alternativo, que permite a síntese de mais de uma versão protéica (isoformas de uma mesma proteína), com funções às vezes com-plementares e às vezes antagônicas às demais isoformas. A grande variância na expressão e intensidade fenotípica da doença em diferentes portadores de uma mesma síndrome monogênica, indica o provável papel da interação gene - meio ambiente, assim como a participação de outros genes ou de diferenças poli-mórficas.

Estes poucos exemplos podem dar uma idéia das diferenças marcantes entre a visão da Genética Mendeliana Clássica e da Genética Molecular. O gene mole-cular é melhor descrito como um sítio ou locus transcricional ativo - que atua por meio da transcrição de produtos sob a forma de RNA que podem ser traduzidos em proteínas ou não. Assim como o conceito da Física Clássica de tempo e espaço foi mudado pela introdução da inseparabilidade do continuum tempo-espacial da Teoria da Relatividade e pelas descobertas da Física Quântica, a noção de estrutura e função, uma vez vistas na Biologia como entidades separadas, tornaram-se praticamente sinônimos na visão da Biologia Molecular, podendo ser expressas como uma unidade estrutura-função. A noção de que cada proteína ou enzima possuía uma função específica única, foi também transformada pela descoberta de um amplo pleiotropismo e

pela redundância funcional de diversas enzimas. Em outras palavras, além de uma certa proteína estar envolvida em diversas funções diferentes (pleiotro-pismo), um grande número de proteínas pode também executar uma mesma função (redundância).

Descobertas recentes modificaram também a visão que tínhamos das proteí-nas, através da constatação da habilidade de certas proteínas não enzimáticas em reconhecer sítios específicos no DNA e/ou em outras proteínas. A identificação da estrutura modular das proteínas, com cada módulo constituindo um domínio diferente e com funções específicas, facilitou a compreensão da função dos receptores transmembrana, bem como de proteínas citoplasmáticas estratégica-mente localizadas em regiões específicas do citosol. O citoplasma celular, uma vez já considerado um “saco amorfo de enzimas”, revelou-se ao final do século XX um microambiente altamente estru-turado de organelas e vias de sinalização, conduzindo sinais que viajam em direção ao núcleo, através da mediação de diversas proteínas amplificadoras de sinal.

Uma vez pincelado esse pano-rama, vamos passar a uma revisão dos conceitos hoje conhecidos através da Genética e Biologia Moleculares, sob o enfoque de suas implicações para o clínico na Medicina do Século XXI. Genes - Transcrição e Tradução de Produtos Gênicos

A unidade básica da molécula de DNA são os nucleotídeos, constituídos por uma base nitrogenada, um açúcar (ose) e um grupo fosfato. As bases nitrogenadas incluem duas purinas – guanina e adenina (G e A) – e duas pirimidinas – timina e citosina (T e C) -

Page 3: Monograph Molecular Genetics

que formam pares complementares A-T e C-G. Na molécula de RNA, a base timina é substituída por outra base nitrogenada, a uracila (U). Os dois filamentos da molécula de DNA são pareados de forma complementar através de pares de núcleo-tídeos formados entre os dois filamentos e ligados por pontes de hidrogênio. Duas pontes de hidrogênio ligam os pares adenina-timina (A-T) e três pontes de hidrogênio ligam os pares citosina-guanina (C-G).

Os sítios ou loci codificantes da molécula de DNA constituem os genes, que são formados por pares de bases (pb) ou seqüências nucleotídicas, em quanti-dades que variam de algumas centenas a milhares de bases (Kb). As regiões codificantes de um gene são transcritas para o RNA mensageiro. Elas são formadas por seqüências de três pares de base chamadas códons, e constituem os éxons; enquanto as regiões que são excisadas durante a transcrição são chamadas íntrons. Os íntrons ainda são uma grande incógnita, podendo, em alguns casos, possuir funções reguladoras da transcrição ou, como no já citado gene pelo avesso U22, serem eles próprios as seqüências codificantes. Por outro lado, segmentos do DNA que funcionam como íntrons em um determinado gene podem agir como éxons em outros genes adja-centes durante o splicing. Alguns autores consideram a possibilidade dos íntrons serem sítios de amortização mutacional, protegendo assim os genes da maioria das alterações genéticas. A identificação de um gene é tarefa difícil e atualmente feita por algorítimos de computadores. É necessária a localização de elementos característicos como um promotor, um códon iniciador presente no quadro de leitura, com um códon de término, assim como sítios doadores e aceptores de splice. Promotores são regiões do DNA

às quais a enzima polimerase se liga para iniciar a transcrição gênica.

Quando a expressão de um gene é ativada, seus éxons são transcritos para um molde (template) de pré-RNA e este processo - conhecido como splicing (do Inglês, to splice = unir pontas soltas) - é responsável pela eliminação dos íntrons. No RNAm (RNA mensageiro) ocorre a substituição das timinas por uracilas (Figura 1). Este processo acontece no núcleo celular, sendo a seguir o RNAm transportado para o citoplasma, onde os ribossomas processam a tradução do produto gênico em uma proteína. Cada códon é traduzido como um aminoácido específico que fará parte da cadeia poli-peptídica que está sendo polimerizada. Muitas proteínas passam por um proces-samento pós-tradução, com o acréscimo de outros grupos à molécula, assim como cortes na sequência de aminoácidos, de forma a promover sua conformação final e funcional. Em muitos casos, a forma final da proteína apresenta propriedades físicoquímicas bem diferentes do produto inicialmente traduzido. A transcrição gênica é realizada no sentido 5’ ! 3’ de cada filamento de DNA, os quais estão pareados de forma antiparalela; i.e., um filamento 5’ ! 3’ está pareado a um filamento 3’ ! 5’. Figura 1. Transcrição – Acontece dentro do núcleo celular DNA ➜ 5’… AGG TCC TAG TAA ...3’ (sentido da transcrição) " Pré-RNA ➜ 3’… TCC AGG ATC ATT …5’ (transcrito de éxons na cadeia molde) " RNAm ➜ 5’… AGG UCC UAG UAA …3’ (seqüência de códons prontos para tradução)

As isoformas das proteínas são

geralmente resultantes do splicing alter-nativo que ocorre durante a transcrição, mas também podem ser fruto de modifi-cações pós-tradução. No splicing alterna-tivo, um evento até hoje observado

Page 4: Monograph Molecular Genetics

apenas em células eucariótas, uma sequência diferente de códons é formada no RNAm, determinando a tradução de uma cadeia polipeptídica alternativa.

A tradução de proteínas é rea-lizada no citoplasma pelos ribossomas, que são pequenas organelas concentradas no retículo endoplasmático rugoso - ou sob forma de polissomas no citoplasma das células eucariótas. Ribossomas são compostos por 2 subunidades de RNA ribossômico (RNAr), uma pequena e a outra grande (em humanos, 18S e 28S, respectivamente) e várias proteínas espe-cíficas a cada subunidade ribossômico. O RNA mensageiro é processado através de um fenda entre as duas subunidades de RNAr, enquanto o RNA transportador (RNAt) atua como adaptador, posi-cionando os aminoácidos em alinhamento com seus códons correspondentes no RNAm. O RNAt associa-se ao RNAm formando um anticódon complementar, que promove a correta ligação seqüencial dos aminoácidos, segundo a ordem estabelecida no RNAm. Tal correspon-dência entre códons e anticódons é deno-minada colinearidade. O processo de tradução é iniciado por um códon iniciador (AUG) e finalizado por um dos três códons de terminação (UAG, UAA, UGA). Além dos códons de iniciação e terminação da tradução, o RNAm apre-senta uma sequência líder que antecede o códon de iniciação e uma sequência final (trailer sequence) após o códon de terminação. Uma vez terminada a tradu-ção do polipeptídeo, a proteína é dês-ligada do complexo ribossoma/RNAm e passa a ser processada através de diversos processos bioquímicos para assumir sua conformação funcional.

Estados Gênicos, Genes e Pseudogenes

O esforço internacional do Consórcio Projeto Genoma Humano,

para o seqüenciamento do genoma humano, levou à diversos desafios e a um aumento exponencial de novos termos técnicos, hoje utilizados nos textos cientí-ficos de Biologia e Medicina. É nosso objetivo esclarecer o conceito subjacente a esses novos termos, para facilitar a leitura da literatura atual e a compreenção de conferências e seminários. A análise de elementos promotores de transcrição é um recurso utilizado na identificação de novos genes, em associação com a detecção da presença de códons de ini-ciação e de terminação in frame, assim como os sítios doadores e aceptores de splicing. As seqüências potencialmente codificadoras encontradas em tal região são denominadas ORFs (Open Reading Frames ou quadros de leitura abertos).

Por meio da reação de trans-criptase reversa e PCR (Polymerization Chain-Reaction), foi possível criar uma biblioteca de genes compostos apenas por éxons, denominados DNAc. O DNAc é o DNA obtido a partir de RNAm, após a conversão pela transcriptase reversa. Tal biblioteca permite o estudo da expressão gênica, auxilia na identificação de novos genes e serve como base de dados para o estudo comparativo da função de novos genes identificados.

Através da clonagem e sequen-ciamento das bibliotecas de DNAc é possivel identificar a sequência de partes de genes expressos por um grupo celular, mesmo que muitos dos genes sejam ainda desconhecidos. Esta idéia inspirou um projeto do governo americano que gerou um banco de dados de ESTs (Expressed Sequence Tags ou rótulos de seqüências expressas). Existem ESTs derivadas de populações de células específicas – tais como um determinado tecido, órgão, estágio de desenvolvimento embrionário, tumores e de linhagens celulares. Os resultados atuais da análise seqüencial do

Page 5: Monograph Molecular Genetics

genoma dividiram os genes em cinco categorias: Categoria 1: Genes já identificados anteriormente e divulgados através da literatura ou de bancos de dados públicos. • Subcategoria 1.1: Genes comple-

tamente identificados, com função definida (i.e., fator de crescimento, fator transcricional, GAPDH, cinase, citocinas, etc.).

• Subcategoria 1.2: Genes com identi-

ficação completa em um DNAc, porém com função desconhecida.

Categoria 2: Novos genes apresentando semelhanças ao DNAc de qualquer organismo. • Subcategoria 2.1: Genes similares ou

apresentando homologia a um outro já caracterizado de qualquer outro orga-nismo, com uma identidade na seqüência de aminoácidos entre 25 e 100%. Esta subcategoria define novos membros de famílias de genes huma-nos, bem como ortólogos ou homo-logos humanos de genes da levedura Caernorhabditis elegans, camun-dongo, Droso-phila melanogaster e de outros organismos.

• Subcategoria 2.2: Genes apresen-tando semelhanças com uma ORF hipoteticamente predita em uma seqüência genômica de um outro organismo, mas que ainda aguarda validação experimental.

Categoria 3: Esta categoria reúne os genes com similaridades com a seqüência de aminoácidos confinada a uma região de uma proteína conhecida. • Subcategoria 3.1: Genes com uma

seqüência de aminoácidos similar a

um domínio funcional de uma proteína conhecida e que determina uma função específica, tal como domínios de imunoglobulinas, SH2, tirosina, zinc fingers (i.e., proteínas com dedos de zinco), etc.

• Subcategoria 3.2: Genes com amino-

ácidos semelhantes a domínios de uma proteína conhecida, porém com a função de tais domínios ainda desco-nhecida.

Categoria 4: Novos genes definidos apenas através de técnicas preditivas de bioinformática, denominados genes su-postos ou preditos, sem nenhuma semelhança com proteínas ou motivos protéicos conhecidos. • Subcategoria 4.1: Genes putativos

constituídos por dois ou mais éxons localizados dentro de uma região com menos do que 20.000 bases (< 20 Kb) que demonstram similaridade com éxons de ESTs. Esta subcategoria possui maior potencial codificante do que as categorias seguintes.

• Subcategoria 4.2: Genes supostos que

mostram grande semelhança a ESTs mas não são preditos pelos programas de predição de éxons.

• Subcategoria 4.3: Genes supostos

preditos através de padrões con-sistentes de éxons sem nenhuma semelhança a ESTs.

Categoria 5: Pseudogenes - Seqüências que perderam sua capacidade trans-cricional ou apresentam níveis insigni-ficantes de transcrição, por razões como: a), ausência de íntrons b), presença de códons de terminaçào no interior da ORF; e c), inserções ou deleções de seqüências que interrompem a ORF.

Page 6: Monograph Molecular Genetics

Características Gerais do DNA de Mamíferos

Ao contrário do que se pensava, o sequenciamento de todo o genoma mostrou que os genes não se encontram aleatoreamente distribuídos pelo geno-ma, mas parecem estar agrupados em determinados locais. Estes grupos encontram-se separados por longos trechos de DNA sem conteúdo gênico. Ainda mais claro está o agrupamento de alguns aglomerados de genes perten-centes à mesma família, como por exemplo, os genes da família HOX. Os genes podem ter um número variado de cópias, desde uma única cópia por genoma haplóide a milhares de cópias, dependendo do gene. Por exemplo, genes codificando RNAr apresentam entre 150 e 200 cópias, enquanto os genes codifi-cantes de histonas possuem até 1.000 cópias. No entanto, a maioria dos genes humanos apresenta apenas uma única cópia em cada alelo.

Várias seqüências altamente repetidas estão presentes no DNA de mamíferos, tais como SINES (Short Interspersed Sequences), LINES (Long Interspersed Sequences), elementos ALU (um tipo de SINES), LTR (Long Terminal Repeats). De fato, essas seqüências repetidas ocupam aproxi-madamente 50% do DNA humano e, quando somadas às seqüências não codi-ficantes, constituem cerca de 98% da molécula. Em outras palavras, apenas 2% do DNA humano codifica produtos funcionais. Os resultados das pesquisas do Projeto Genoma Humano, publicadas em fevereiro de 2001, revelam que as estimativas anteriores sobre o número de genes em humanos foi superestimada (70.000 a 100.000 genes). A estimativa atual oscila entre 35.000 e 55.000 genes.

Embora nosso DNA seja 1.000 vezes maior do que o DNA da bactéria E.

coli, o DNA humano contém apenas 10 vezes mais genes do que o DNA desta bactéria. Isto provavelmente se explica pelo fato de grande parte da molécula humana não conter genes, mas sim seqüências repetidas e segmentos não codificantes, como supra mencionado, além daquelas que constituem os telo-meros, nas extremidades de cada cromossoma. Os telômeros conferem estabilidade ao cromossoma e protegem o material genético contra eventuais fusões cromossômicas aberrantes durante a replicação do DNA.

Muitas das seqüências repetidas encontradas no DNA humano são repetições simples, do tipo ACACACAC ou CGCGCGCG e supõe-se que sejam formadas por erros durante a replicação do DNA. Elas podem ser encontradas nos centrômeros e telômeros ou espalhadas pelo genoma. Com excessão dos telo-meros, cujas seqüências curtas, repetidas até 10.000 vezes, estabilizam a molécula de DNA e preservam a integridade de genes funcionais, as demais repetições não possuem função conhecida, embora repetições longas possam ativar ou desativar genes e causar doenças, como a LTR denominada L1, envolvida na inativação de genes em vários tumores.

Repetições moderadas, geralmente constituídas por fragmentos de DNA viral e não mais codificantes, representam cerca de 45% do DNA humano. Seqüências Retrovirais Endógenas (SRE ou ERVs – Endogenous Retroviral Sequences) que codificam uma enzima transcriptase reversa funcional também são encontradas com freqüência. Esta enzima converte RNA em DNA, permitindo assim a integração de se-qüências retrovirais ao genoma humano. Como exemplo, podemos citar os retransposons, ERVs, LTRs, e LINES. Alguns

Page 7: Monograph Molecular Genetics

transposons parecem ser herança de infecções bacterianas, promovendo a acumulação gradual desses elementos no DNA, ao longo da evolução dos mamí-feros, devido a múltiplos episódios infec-ciosos.

Os elementos ALU são SINES

com um comprimento aproximado de 300 pb e são denominadas ALU por possuí-rem sítios para a enzima de restrição ALU em ambas as extremidades. As enzimas de restrição são endonucleases que reco-nhecem seqüências palindrômicas (i.e., recorrentes) curtas de nucleotídeos e cortam a fita de DNA geralmente dentro deste palíndromo. Uma região palindrô-mica caracteriza-se por uma cadeia polinucleotídica onde uma seqüência de bases é seguida por uma série de bases que permite o pareamento complementar das duas fitas, quando a nova molécula de DNA é novamente enrolada. As LTRs constituem seqüências repetidas em tandem (i.e., enfileiradas, uma atrás da outra) nas extremidades do genoma dos retrovírus e seqüências similares, encon-tradas no genoma humano – provavel-mente resultantes da integração de seqüências virais. Classificação Funcional de Genes

Uma outra classificação de genes refere-se às funções por eles desempe-nhadas. No entanto, diversos genes apresentam diferentes graus de pleio-tropia e/ou de redundância funcional. A pleiotropia diz respeito à observação de mais de um efeito causado por um dado produto gênico. Tal efeito pleiotrópico pode variar em diferentes circunstâncias do microambiente celular ou pode se expressar como efeitos diferentes em diferentes tecidos, indicando, assim, a especificidade tecidual de cada efeito. A redundância funcional define a capaci-dade de produtos derivados de genes

diferentes executarem a mesma função. A redundância funcional não deve ser confundida com a homologia gênica. Genes homólogos são aqueles que possuem, em diferentes espécies, grande similaridade entre si, na sequência de seus nucleotídeos. Por exemplo, os genes Homeobox, que controlam a embriogê-nese e são uma seqüência evolucio-nariamente conservada em vários mamí-feros, inclusive no homem. Alguns genes são responsáveis por funções essenciais à manutenção de quase todos os tipos celulares, sendo, portanto, denominados genes zeladores (house-keeping genes), como por exemplo a actina gama, o citocromo p450, as ATPases, a glutationa-S-transferase e a N-acetil-transferase.

Outra classe de genes, essencial à preservação da integridade do genoma, codifica produtos envolvidos na detecção de alterações no DNA, constituindo o sistema intra-celular de reparo a danos ao DNA. O DNA está sujeito a danos tanto de natureza exógena (mutágenos químicos ambientais, radiação UVA e UVB, infecções, inflamações crônicas, etc.), quanto endógena (metabólitos genotóxicos resultantes da ação natural do metabolismo enzimático, deficiências nutricionais, radicais livres etc).

Os genes de receptores de membrana codificam dois tipos de receptores: os receptores catalíticos e os não-catalíticos. A maioria dos receptores de membrana não é catalítica, mediando o sinal químico regulador da atividade de várias proteínas em uma seqüência de eventos que termina por produzir um sinal intracelular como o Ca2+ ou o AMP cíclico. Os receptores catalíticos são glicoproteínas transmembranas que pos-suem uma estrutura protéica modular complexa, com uma “cauda” que penetra

Page 8: Monograph Molecular Genetics

no citosol. Na superfície, possuem um sítio de ligação específico para um determinado ligante extracelular, tal como um fator de crescimento ou um hormônio. Na porção imersa no citosol, apresentam um domínio contendo enzi-ma, além de outros domínios de ligação proteína–proteína, que podem servir para amplificar o sinal. Uma vez que o ligante ocupe o receptor, pode ocorrer a dimerização de dois receptores catalí-ticos, ativando o domínio enzimático e apresentando sua enzima a outras proteí-nas alvo, presentes no citosol. A ativação do receptor desencadeia, portanto, uma série de respostas intracelulares que são mediadas por proteínas não catalíticas, cujo objetivo é a transdução do sinal para o núcleo celular; i.e., um sítio específico do DNA a ser ativado. Em outras palavras, a cascata de sinais desencadeada por um receptor ativado visa ou a ativação de um gene (ou de um aglomerado de genes da mesma família) no DNA nuclear ou, ainda, a indução do processo de replicação do DNA – dependendo do tipo de receptor ativado. Figura 3. Ação de proteínas modulares de ligação p-p em receptores catalíticos ativados

Os genes que codificam fatores transcricionais têm como produto proteínas necessárias para a iniciação da transcrição, que não sejam da família das enzimas polimerase. Os fatores de trans-crição atuam de diversas formas durante a iniciação da transcrição, podendo intera-gir com a RNA polimerase ou com o complexo iniciador inteiro, ou ainda, com outras moléculas ativadoras ou com o próprio DNA. Fatores transcricionais são classificados de acordo com sua atividade em três grupos: 1, Fatores Gerais de Transcrição, 2, Ativadores de Transcrição e 3, Co-ativadores.

Os Genes Repressores de Expressão Gênica são codificadores de uma classe especial de fatores de não-transcrição. Em vez de estimularem a transcrição, atuam negativamente, ini-bindo-a. Alguns fatores de transcrição podem fazer as duas coisas - estimular ou inibir - dependendo das circunstâncias ou da presença de outras determinantes pre-sentes no microambiente celular.

Por fim, fatores de transcrição alterados por mutações podem perder a capacidade estimulatória, ligando-se ao DNA com eficiência, mas sem executar sua função indutora de transcrição. Freqüentemente nestes casos, uma cópia alterada de um fator de transcrição é capaz de inibir a função da cópia intacta, por competir pelo mesmo sítio de ligação.

Os Genes de Fatores de Crescimento codificam polipeptídeos que promovem o crescimento celular através da interação com receptores celulares específicos e são geralmente produzidos por genes ativamente expressos em outras células ou órgãos, sendo por isso denominados ligantes extra-celulares. Por exemplo, os hormônios hipofisários, tal como o hormônio tireotrófico - que ocupa receptores catalíticos em células da

Page 9: Monograph Molecular Genetics

tireóide, estimulando a proliferação celular - e o hormônio de crescimento, responsável pelo crescimento ósseo e pela síntese protéica em diversos tecidos, durante a infância e puberdade – além de atuar na reparação de tecidos, durante toda a vida do organismo.

Outros exemplos de fatores de crescimento são: Fator de Crescimento Epidérmico (Epidermal Growth Factor - EGF), Fator de Crescimento de Fibro-blasto (Fibroblast Growth Factor - FGF), Fator de Crescimento Derivado de Plaquetas (Plaquette-Derived Growth Factor - PDGF), Fator de Crescimento Semelhante à Insulina (Insulin-like Growth Factor - IGF).

Os assim chamados genes estruturais codificam a estrutura primária de proteí-nas de membrana, enzimas, actina do citoesquelesto, colágeno, elastina e outros produtos necessários à morfologia estrutural/funcional de células, tecidos e órgãos.

Os Genes de Controle do Ciclo Celular são de duas diferentes classes e estão envolvidos diretamente no processo de proliferação celular: a. Genes Supressores de Tumor: atuam

no controle da divisão celular, prevenindo a proliferação celular excessiva, evitando assim a formação de displasias e tumores. A perda de função desses genes ou a inibição de seus produtos por onco-proteínas mutadas leva à desregulação da

proliferação celular, com o conse-qüente crescimento descontrolado de células em um dado tecido ou órgão, o que resultará em displasias e/ou tumores malignos.

b. Oncogenes: Genes cujos produtos

respondem aos estímulos enviados por receptores ativados por hormônios ou por fatores de crescimento - promovendo o crescimento e a progressão do ciclo celular em direção à mitose. São também considerados oncogenes aqueles cujos produtos possuem a função de amplificar e sustentar o estímulo pró-mitótico, necessário para que uma das fases do ciclo celular se complete.

Inicialmente, os oncogenes eram

considerados formas mutadas de proto-oncogenes, mas são atualmente reco-nhecidos como qualquer gene – mutado ou não, super expresso ou não – capaz de induzir a formação de tumores, alterar os padrões de expressão gênica ou inibir outros genes de regulação da proliferação. Essas alterações podem incluir as seguintes mudanças nos padrões de expressão gênica: 1, aumento anormal dos níveis de seus produtos na célula; 2, a expressão do oncogene em tecidos nos quais não deveria ser expresso; 3, aumento do número de cópias do oncogene (amplificação gênica); 4, mutações estruturais no próprio oncogene, causando ganho de função.

Qualquer gene que venha a causar

morte, quando a perda de heterozigose ocorre é denominado gene letal. São também chamados genes letais zigóticos e podem estar expressos de forma homozigótica mesmo no décimo ciclo celular da formação do blastoderma,

como é o caso do gene gap Krupple e do gene fushi tarazu (ftz).

Os genes associados com a regulação do ciclo circadiano e outros ciclos bio-lógicos em muitos organismos são denominados genes relógio (Clock Genes). A identificação de um gene relógio é feita através do estudo de

Page 10: Monograph Molecular Genetics

células em culturas e de embriões que perderam os ritmos circadianos normais. A inserção de um gene no DNA dessas linhagens ou embriões que restaure o ciclo normal, identifica-o como um gene relógio

Os genes associados a Sexo (Sex-linked Genes) são genes localizados nos cro-mossomas sexuais, X ou Y, com uma função específica na regulação de outros genes desses cromossomas, tal como o gene SRY, encontrado no cromossoma Y. O produto de SRY é um fator transcricional de ligação ao DNA com função crucial no desenvolvimento dos testículos e na determinação do gênero masculino. Mutação neste gene dá origem a fêmeas XY, com disgênese gonádica.

Elementos Reguladores da Expressão Gênica

Relembrando, expressão gênica significa a produção de RNA pelo gene correspondente. O sítio no DNA ao qual a enzima RNA-polimerase irá ligar-se para dar início à transcrição de um deter-minado produto gênico é denominado seqüência promotora ou promotor. Tal região promotora é geralmente de difícil caracterização, podendo estar localizada próxima ou distante do gene em questão, na maioria das vezes a montante do início da sequência gênica (upstream).

Durante a embriogênese, genes denominados genes mestres (master genes) controlam a expressão ordenada de aglo-merados inteiros de genes e/ou grupos de genes, que atuam em cascata em uma determinada via de desen-volvimento. Geralmente, um grupo de genes contíguos ou pertencentes à mesma família, que se encontram organizados em uma única unidade transcricional, são

ativados pela mesma seqüência regula-dora. Genes mestres são também denominados genes selecionadores, pois “escolhem” entre duas vias embrio-gênicas de desenvolvimento, através da repressão e ativação seletiva de grupos de genes.

Exemplos de genes controlados pelos genes mestres são os genes HOX, primeiramente estudados na Drosophila melanogaster sob o nome de genes Homeóticos Seletores. Estes genes são responsáveis pela morfologia de mem-bros, órgãos, tecidos e pela diferenciação célular. Genes HOX são encontrados em todas as espécies animais e guardam uma alta homologia, ao longo da cadeia evolutiva. Esta homologia é caracterizada por uma seqüência de nucleotídeos altamente conservada em todas as espécies (peixes, lesmas, Drosophila melanogaster e mamíferos) conhecida como homeobox. Genes HOX ocorrem em aglomerados nos diversos segmentos do embrião e, quando ativados, guiam o desenvolvimento morfogenético de um determinado membro ou órgão. São também indispensáveis durante a Reno-vação celular e na manutenção da diferenciação das células em cada tecido ao longo da vida do animal, assegurando a correta diferenciação funcional e maturação de células recém replicadas, de acordo com a fisiologia específica do tecido que constituem.

Os produtos de certos genes modificam a função de outros genes, sendo conhecidos como genes modifica-dores (modifier genes), os quais parecem ser responsáveis pela variância feno-típica de certas doenças monogênicas, tais como a hemofilia, cardiomiopatias, fibrose cística e displasias. Tal variância fenotípica não deve ser confundida com a penetrância de doenças hereditárias. Enquanto a variância fenotípica descreve níveis de gravidade da doença, a pene-

Page 11: Monograph Molecular Genetics

trância define o percentual de indivíduos portadores de uma mutação que manifes-tam a doença.

Outro elemento regulador da expressão gênica são os genes amplifi-cadores (enhancers). Os amplificadores encon-tram-se em uma posição-cis (mesmo cromossoma) do gene que amplificam e aumentam os níveis de transcrição basal. Ainda mais diver-sificados que os promotores, os genes amplificadores podem estar localizados praticamente em qualquer local do cromossoma: - acima, abaixo, próximo ou distante do gene alvo. Quando um gene recebe influência de outro gene localizado em outro cromossoma, diz-se que tal elemento de influência encontra-se em posição-trans. Figura 4. Elementos àcima ou a montante (upstream) e abaixo (downstream) de um dado gene.

Elemento àcima ⇒ Gene ⇐ Elemento abaixo 5’..!!!……"""""""""…888..3’ Sentido da Transcrição: 5’⇒ 3’

O óperon é um grupo de genes que forma um conjunto regulador da expressão de genes estruturais, que foi primeiramente estudado por Jacob e Monod na bactéria Escherichia coli. Eles demonstraram que a produção de lactato ocorre apenas na presença das enzimas beta-galactose, lacpermease e transacetilase - o que é uma exemplo de indução enzimática – pois a oferta de lactose induz a expressão dos genes codificadores dessas três enzimas. O modelo óperon Jacob-Monod é composto por um gene regulador, uma região promotora e uma região operadora, além de pelo menos um gene estrutural codificador da estrutura primária de uma enzima. O modelo sugere a presença de um gene regulador sintetizando um pro-duto com atividade repressora que se liga

ao operador, impedindo a transcrição de genes estruturais.

Quando a repressão enzimática ocorre, o óperon inativa o gene estrutural; porém, a introdução de uma substância indutora, como a lactose, que no caso da E. coli, é o substrato alvo do produto dos três genes estruturais (enzimas), o locus do operador (ou óperon) é ativado, produzindo um RNAm policistrônico, que leva à síntese das três enzimas necessárias à metabolização da lactose. Quando os níveis de lactose baixam, a expressão do operador é novamente supressa. Na E. coli, este conjunto operador foi denominado LAC-Operon. O RNAm policistrônico é um RNAm bastante comum em procariotos, contendo informações para a tradução de mais de uma proteína, originadas de transcritos de diferentes genes funcionais (i.e., genes funcionais = cístrons). Embora o modelo óperon tenha sido desenvolvido com base no estudo de procariotos, a idéia geral foi incorporada ao processo de diferenciação celular de células eucariótas, no qual a repressão seletiva de alguns genes e a indução alternada da expressão de outros genes leva ao desenvolvimento embrionário ordenado. Famílias de Genes

Famílias gênicas são formadas por genes que exibem seqüências nucleotídicas semelhantes. Tais genes podem derivar de um gene ancestral comum e ter adquirido suas características atuais por meio dos processos de divergência e recombinação gênicas.

As principais causas de diver-gência gênica são as mutações espon-tâneas, que levam à variabilidade genética entre as espécies e em diferentes

Page 12: Monograph Molecular Genetics

populações de uma mesma espécie. A divergência gênica pode também resultar da migração dessas mutações em uma população, por meio do fluxo genético ou da transdução de material gênico viral ou bacteriano no DNA de seus hospedeiros.

A recombinação gênica pode ser homologa ou não-homóloga (i.e., heteróloga), promovendo a migração de genes nos organismos eucariotos. A recombinação gênica ocorre nas primeiras horas da embriogênese entre os alelos maternos e paternos herdados pelo embrião.

Exemplos de famílias gênicas são as histonas, genes HOX, Citocromo P450, oncogene ras, receptores de proteínas G, receptores de Fatores de Crescimento, entre outros.

Em 1999 foi descoberta uma nova família de genes, primeiramente identi-ficada em camundongos e posteriormente em nematódios, plantas, mofo e peixe zebra, o que indica uma alta conservação evolucionária. Em camundongos, esta família de genes denominada MORC, regula a produção e maturação de espermatozóides. O papel desempenhado pelos genes MORC em outras espécies ainda não está esclarecido. Genes Envolvidos no Controle do Ciclo Celular

Os dois principais grupos de genes envolvidos no controle do ciclo celular são aqueles que estimulam e os que inibem o ciclo celular: - os oncogenes e os genes supressores de tumor, anterior-mente descritos. Estas duas classes de genes controlam redes de sinalização intracelulares e modulam a expressão de outros genes durante a progressão do ciclo celular.

Outra família de genes importantes no controle do ciclo celular são os Genes de Reparo do DNA que codificam enzimas que atuam em várias fases do ciclo celular (G1, S e G2), interrompendo a transcrição da nova fita quando encontram adutos químicos, erros de pareamento de bases, etc, retirando-os da fita e substituindo-os por seqüências corretas.

Durante a intérfase (fases G0, G1, S, G2) as células que não se encontram em processo proliferativo, permanecem em G0 (por ex., a maioria dos neurônios), enquanto as que devem se dividir passam pelas fases G1, S e G2, entrando a seguir em mitose. Os tecidos de renovação rápida permanecem menos tempo em G1 do que os de renovação lenta, ao passo que as fases S e G2 parecem ter durações semelhantes, independente da velocidade proliferativa tecidual.

No final da fase G1, o ciclo é interrompido para verificação e reparo de possíveis erros de transcrição ou na presença de adutos químicos em bases nucleotídicas, o que é conhecido como ponto de restrição (R). Uma vez realizados os reparos necessários, o ciclo prossegue para a fase S, iniciando a síntese do DNA. No caso de danos irreparáveis, a via que induz a apoptose ou morte celular programada é ativada, evitando a formação de clones mutados nas gerações seguintes de células. Ao final de cada fase, os produtos gênicos que a regularam são degradados ou inativados, de forma que, uma vez feita a transição para a fase seguinte, torna-se impossível regredir à fase anterior. Uma vez ultrapassado o ponto de restrição, o ciclo celular progredirá pelas fases S e G2 em direção à mitose.

No final da fase G2 o ciclo será novamente pausado para nova verifi-

Page 13: Monograph Molecular Genetics

cação das recém sintetizadas seqüências que constituirão as novas fitas de DNA, realização de reparos e nova tomada de decisão (mitose ou apoptose?), através da regulação de expressão do gene p21. A enzima topoisomerase III confere as seqüências de nucleotídeos recém sinte-tizadas, elimina as incorretamente transcritas e permite reparos no ponto de verificação do final da G2, antes que os diversos segmentos sintetizados sejam ligados entre si pela enzima DNA-ligase, para formar a nova fita de DNA.

Uma vez duplicado o DNA, com

cada fita recém sintetizada e pareada a uma das duas fitas de DNA parental complementar (replicação semi-conser-vadora), o ciclo progride para mitose, dando origem aos núcleos das duas células-filhas idênticas, que serão for-madas através da citocinese (divisão do citoplasma). Genes Experimentais

Na busca de soluções terapêuticas ou de novas estratégias de identificação de genes, vários genes e cromossomas modificados foram desenvolvidos, como ilustram os exemplos a seguir. Gene Reporter: Genes utilizados em laboratório para avaliar a expressão de outros. São geralmente utilizados de uma maneira artificial. Por exemplo, ao se clonar o promotor do gene X justaposto ao gene da beta-galactosidase, pode-se avaliar a ativação do gene X, sob diferentes condições - ou até mesmo durante o desenvolvimento embrionário - através da presença de cor azul nas células, gerada pelo “gene reporter” beta-galactosidase. Gene Suicida: Uma estratégia tera-pêutica que visa tornar o tumor mais vulnerável à quimioterapia, ou a uma outra droga, como o ganciclovir. Geral-

mente isto é possibilitado pela expressão de uma enzima específica, não expressa em mamíferos, ligada a um promotor ativo nas células tumorais, desta forma convertendo dentro da célula tumoral um substrato inofensivo em um molécula tóxica para a célula. A transfecção de células tumorais com o gene tirosina-cinase do vírus Herpes Simplex (HSVtk) torna-as sensíveis à droga antiviral, ganciclovir. A expressão do gene HSVtk na célula tumoral induz a fosforilação do ganciclovir em monofosfato que, seguida pela fosforilação mediada por cinases celulares a trifosfato, leva à inibição da DNA polimerase em células tumorais em proliferação, induzindo a apoptose. Um efeito residual potente persiste, induzindo também as células adjacentes à apoptose. Testes realizados em tumores ovarianos irradiados, demonstraram que o efeito residual é eficaz. Células expressando HSVtk foram injetadas na cavidade peritoneal das pacientes, as quais receberam a seguir ganciclovir. Através do efeito residual, as células que sobrevi-veram à radiação gama foram induzidas à apoptose. Em camundongos murinos transgênicos com tumores cerebrais, o efeito residual induziu a apoptose de 30 a 60% das células tumorais e o efeito residual levou à remissão completa em 80% dos animais testados. YAC (Yeast Artificial Chromosome): Um dos organismos utilizados como modelo para o estudo do ciclo celular são os fungos utilizados em fermentos, tal como o Saccharomyces, pertencente à classe dos Hemascomycetes. YAC é um cromossoma artificial de levedura, que permite a clonagem de fragmentos de DNA humano nele inseridos de até um milhão de pb (pares de base). Este cromossoma auto replicante inclui três seqüências de DNA e dois sítios de reconhecimento para enzimas de res-trição que permitem a replicação e

Page 14: Monograph Molecular Genetics

transmissão do genoma às células filhas. Essas três seqüências e os sítios de restrição são descritos abaixo: • Telômeros – localizados em cada

extremidade do cromossoma, prote-gendo o DNA contra a degradação por nucleases;

• Centrômero – o local de ligação do fuso mitótico que segrega cada cópia de cromossoma para um polo celular oposto;

• Seqüências promotoras na origem de cada forquilha de replicação, que promovem a replicação de seqüências específicas de DNA

• Sítio de reconhecimento para duas enzimas de restrição: EcoRI e BamHI.

Marcadores selecionáveis são também inseridos, o que permite que as células que incorporaram o vetor contendo o fragmento de DNA humano sejam facilmente isoladas das demais células da cultura. A clonagem de DNA humano em YAC tornou possível a análise de longas seqüências, tais como as encontradas em genes humanos. A clonagem de material genético de mamíferos pode ser também feita através da inserção dessas seqüên-cias em plasmídeos bacterianos. Porém, o plasmídeo não comporta mais do que 10.000 pb, tornando evidente a vantagem do YAC. A clonagem de DNA humano em YAC tem início com a digestão parcial do DNA pela enzima de restrição EcoRI, obtendo-se assim fragmentos muito grandes. Por sua vez, um plasmídeo bacteriano circular é modificado, recebendo centrômero e elementos promotores de replicação, de forma a permitir a replicação do material a ser clonado pelas células de levedura. A seguir, o plasmídeo é digerido pelas

enzimas de restrição EcoRI e BamHI, recebendo telômeros em cada extremidade, for-mando assim um cromossoma linear. O fragmento de DNA humano é então recombinado com este cromossoma linear nos sítios de EcoRI, sendo ambos covalentemente unidos pela enzima DNA ligase. Desta forma, um vetor YAC é produzido e pode ser utilizado para infectar células de levedura em cultura, produzindo um número ilimitado de cópias. Mutações Gênicas, Mutações Cromos-sômicas e Impressão Epigenética As mutações gênicas e as recombinações são as principais fontes de variabilidade genética, proporcionando a diversidade de características individuais em cada espécie, bem como a multiplicidade de espécies, ao longo da evolução biológica.

A diversidade genética permite a evolução da espécie, visto que indiví-duos que herdaram diferentes variações gênicas respondem diferentemente às mudanças ambientais, tais como mudan-ças climáticas, poluição, aumento de radiação UV, etc. Tais diferenças de resposta às pressões ambientais favore-cerão a adaptabilidade e sobrevivência de certos grupos de indivíduos daquela mesma espécie em detrimento de outros, aumentando, porém, a chance de sobre-vivência da espécie em si. Este é o conceito moderno de seleção natural.

Mutações podem ocorrer em dois diferentes níveis: cromossomas ou genes. As mutações cromossômicas são carac-terizadas por alterações suficientemente grandes para serem detectadas pelas técnicas de citogenética clássica (cariotipagem), incluindo cópias extras ou faltantes de um cromossoma; deleção de fragmentos grandes; translocações; duplicações e inversões. Quando um

Page 15: Monograph Molecular Genetics

cromossoma perde seu centrômero, não pode ser copiado para as células-filhas, causando a perda de todos os alelos localizados naquele cromossoma. A presença de uma terceira cópia de um cromosoma constitui uma trissomia, como no caso da síndrome de Down (trissomia do cromossoma 21).

As mutações gênicas são peque-nas e passam despercebidas durante a cariotipagem, consistindo de adições, perdas ou substituições de nucleotídeos. Mutações em células germinativas (game-tas) são transmitidas aos descendentes, enquanto as que ocorrem em células somáticas podem causar doença ou morte apenas no próprio indivíduo que as adquiriu. Portanto, as mutações podem ser herdadas ou adquiridas (esporádicas).

Além disso, durante a fertilização ou a embriogênese, mutações de novo podem ocorrer, principalmente durante a recombinação gênica, as quais, embora presentes ao nascimento, não são encontradas nos genomas materno e paterno.

A metilação de histonas é um dos processos de controle da expressão gênica, denominados controles epige-néticos, possuindo um papel crucial no desenvolvimento ordenado do embrião. Ela é também essencial na diferenciação celular, mantendo silenciados os genes que não devem ser expressos em um determinado tecido. Outro controle epigenético é a acetilação de histonas, que induz a expressão de genes da região acetilada.

O silenciamento de um gene por

metilação ou por desacetilação é denominado impressão epigenética (imprinting). Portanto, a impressão epi-genética anormal de um gene ou a perda de uma impressão epigenética normal

(Loss Of Imprinting - LOI), podem ambas causar doença, dependendo do tecido e das circuntâncias. Um número crescente de doenças, até hoje atribuído a mutações hereditárias, tem recentemente revelado evidências que apontam para a desregulação de processos de impressão epigenética. Exemplos são as síndromes de Prader-Willi (PWS), síndrome de Angelman (AS), síndrome de Beckwith-Wiedemann, Tumor de Wilms, mola hidatiforme, teratoma ovariano completo, hepatoblastoma e rabdo-miossarcoma.

Mutações gênicas autossômicas dominantes são as que apresentam um fenótipo patológico dominante a nível celular, sendo a causa de diversas doenças monogênicas. Um caso intrigante é o câncer hereditário, onde a mutação autossômica é na maioria das vezes recessiva a nível celular, mas o fenótipo é herdado de maneira dominante. A mutação de um dos alelos parentais é herdada em todas as células do indivíduo, mas somente as que sofrem alteração do segundo alelo desencadearão o processo de tumorigênese. Contudo, devido ao fator temporal e ao grande número de células com uma alteração de base, o fenótipo "câncer" é herdado de maneira dominante, visto que estes indivíduos desenvolvem tumores com freqüência, geralmente múltiplos e em idade precoce.

Em tumores malignos e benignos são comuns os rearranjos cromossô-micos, tais como a translocação, recom-binações promovidas por transposons, inversões e deleções, que podem alterar a taxa de expressão de um gene ou inibir/abolir a função de sua proteína. Tipos de Mutações Gênicas Single Nucleotide Polymorphisms -(SNPs): mutações de ponto, que ocorrem em um único nucleotídeo, através da

Page 16: Monograph Molecular Genetics

substituição de uma base. Polimorfismos em genes envolvidos no biometabolismo celular são responsáveis pelas variações individuais na taxa metabólica de res-posta a medicamentos e pelos diferentes graus de susceptibilidade a poluentes e efeitos adversos a medicamentos. SNPs podem ocorrer das seguintes formas: • Transição: uma purina (A ou G)

substitui outra purina; ou uma piri-midina (C ou T) substitui outra pirimidina;

• Transversão: uma purina substitui uma pirimidina ou vice-versa;

Assim, a mutação de ponto pode produ-zir os seguintes resultados: a) redundância de bases (AA ou GG;

CC ou TT), que leva a uma mutação silenciosa de mesmo sentido (samesense);

b) bases diferentes produzindo a subs-tituição do códon de um aminoácido por outro, produzem uma mutação missense ou de sentido errôneo. Se o novo aminoácido possui proprie-dades semelhantes ao original (wild type), a mutação pode ser neutra; caso contrário, pode originar uma proteína mutante e modificar o fenótipo;

c) a mutação de ponto pode originar um códon de terminação da tradução no meio do quadro de leitura, causando uma mutação sem sentido, com a tradução protéica terminando preco-cemente e dando assim origem a um produto truncado.

Mutação por Inserção: adiciona nucleo-tídeos durante a replicação do DNA, o que resulta em uma mutação frameshift ou mudança na matriz ou quadro de leitura. Por exemplo, Wild type ou seqüência original: AGC TTA CCG TTA GCC #

ACg CTT ACC GTT AGC C (mutação) UAG Este tipo de mutação pode causar uma das seguintes alterações: perda de função, truncagem de leitura, perda de códon de terminação com possível fusão de duas proteínas, efeito polar (no caso de grandes inserções). Mutação por Deleção: uma parte do DNA é perdida, causando também mudança no quadro de leitura, com as mesmas conseqüências da inserção. Geralmente, as mutações de ponto e as inserções podem ser revertidas; as deleções, porém, não são reversíveis. Inserção ou Deleção de 3 Nucleotídeos (ou mais): não modifica o quadro de leitura, embora a perda de função do produto traduzido seja comum.

Grandes inserções ou deleções podem ocorrer e geralmente resultam em mutações sem sentido, até que um códon de terminação seja encontrado nas adja-cências do locus. Grandes inserções podem também resultar no efeito polar, onde um gene mutado passa a afetar outros genes abaixo e costuma ocorrer com genes operons. Supressão Intragênica: Ocorre quando uma segunda mutação mascara a presença da primeira, sendo, portanto, uma mutação compensadora, que preserva desta forma a função da proteína. Supressão Intergênica: é observada quando duas proteínas devem interagir e a mutação em uma delas impede a interação. A mutação supressora, pode então ocorrer no gene codificador da outra proteína, restabelecendo a intera-tividade dos dois produtos. Pode também ocorrer entre duas vias biometabólicas interdependentes. Neste segundo caso,

Page 17: Monograph Molecular Genetics

dois eventos distintos podem ocorrer: 1), a mutação da segunda via metabólica pode permitir que a primeira via mutada passe a ser ignorada; ou 2), a mutação pode ocorrer em uma via metabólica alternativa, aumentando a função perdida na outra, de forma compensatória. Se por outro lado o locus afetado pela primeira mutação deu origem a um novo códon de terminação, o RNA transportador (RNAt) responsável pelo reconhecimento de códons durante a tradução, pode sofrer uma mutação supressora, que lhe permita não reconhecer o códon de terminação (originado pela primeira mutação) como um UAG, permitindo que a tradução continue. Por exemplo, o RNAt mutado pode interpretar o códon mutado UAG como sendo o códon AAG da lisina originalmente presente, adicionando este aminoácido.

Além das mutações espontâneas endó-genas, supra descritas, o genoma está também sujeito à ação de mutágenos ambientais, cujos metabólitos se inserem no DNA sob a forma de adutos químicos, causando mutações exógenas i.e., induzidas por agentes xenobióticos. A radiação por raios X, por exemplo, causa quebras cromossômicas que levam a deleções, enquanto a radiação UV induz a dimerização de pirimidinas. Quando não corrigidas, essas alterações levam à transformação celular e ao câncer. Alguns mutágenos químicos modificam as ligações entre as bases, causando ligações cruzadas entre elas, enquanto outros inserem nucleotídeos de pares adjacentes que resultam em mudanças do quadro de leitura.

A inserção de genoma viral e bacteriano, durante infecções é também um outro fator indutor de mutações, como as induzidas pelos vírus da hepatite e pela bactéria gástrica Helicobacter pilori. Processos inflamatórios crônicos ou

recorrentes podem também induzir mutação genética, levando a perdas funcionais ou ao câncer. DNA Mitocondrial e Herança Materna Extra-Nuclear Os mitocôndrias possuem DNA circular, com comprimento de 16 Kb no ser humano, contendo cerca de 20 genes expressos e o restante da molécula constituída por seqüências repetidas. Os primeiros estudos que demonstraram que o DNA mitocondriano (DNAmt) é her-dado da fêmea, foram realizados em plantas, com o DNA de cloroplastos (no caso dos cloroplastos, nem sempre isso é verdade). Em mamíferos, os camun-dongos Mus domesticus e Mus spretus serviram de modelo animal para os estudos que demonstraram que o DNAmt é herdado exclusivamente da mãe. Estudos posteriores demonstraram que o mesmo acontece em outras espécies, inclusive a humana. Este padrão de herança genética é denominado herança materna. O DNAmt contém RNAr, RNAt, genes estruturais e subunidades enzimáticas.

Os processos bioquímicos realizados por mitocôndrias durante a produção de energia, (cadeia respiratória mitocon-driana) têm lugar em cinco complexos protéicos: I, II, III, IV e V. Dos 80 genes necessários para a síntese das proteínas componentes desses complexos, alguns se encontram no próprio DNAmt, enquanto os demais estão localizados no DNA nuclear. Os genes do DNAmt sofrem uma taxa de mutação 5 a 10 vezes superior a dos genes do DNA nuclear, o que produz distúrbios no metabolismo celular e está também associado ao processo de envelhecimento. Algumas mutações em genes do DNAmt (herdadas da mãe) resultam em deficiências congênitas nos

Page 18: Monograph Molecular Genetics

complexos da cadeia respiratória ou no sistema enzimático de detoxicação e eliminação de metabólitos tóxicos produzidos ao longo da cadeia respiratória. Em quaisquer dos casos, o resultado será a manifestação de fenótipos patológicos de diferentes graus de gravidade, dependendo do tipo de mutação e da extensão de suas implicações. São exemplos de patologias causadas por mutações no DNA de mitocôndrias o sub-desenvolvimento acompanhado de anorexia crônica durante a infância, que resulta em baixa estatura, desordens neurocognitivas, deterioração neurológica progressiva. Esta condição poderá resultar em demência, convulsões e ataques de origem neurológica, dificuldades de deglutição, desordens visuais, surdez, desordens mielotróficas, cardiomiopatias e arritmias, além de desordens renais.

Todo o DNA de mitocôndrias deriva do óvulo materno e o espermatozóide não contribui nesse processo. No caso de presença de mutações no DNAmt, as mesmas estarão presentes na maioria dos óvulos, mas não em todos – devido à natureza aleatória de distribuição dos mitocôndrias - o que implica um alto risco de mais de um filho com distúrbios derivados de tais mutações. Além disso, cada mitocôndria presente no óvulo contém várias cópias de cada gene mitocondriano e se uma mutação estivesse presente em todas as cópias de um determinado gene, o embrião provavelmente não sobreviveria aos primeiros estágios da embriogênese. Portanto, um indivíduo portador de mutações mitocondrianas possui cópias normais e cópias mutadas do mesmo gene.

Mutações de novo (que não estavam presentes originalmente no óvulo) podem também ocorrer no momento da fertilização, o que não

representará um risco para o restante da progênie. Outra característica da mutação herdada, é que ela não se encontra necessariamente presente em todas as células e tecidos do organismo, de forma que apenas os tecidos portadores de mitocôndrias mutados apresentarão dis-funções. O número de cópias mutadas do gene em questão, em relação ao número de cópias normais presentes nos mito-côndrias é também um fator decisivo para a manifestação ou não do fenótipo patológico. Técnicas Utilizadas em Genética Molecular

A seção de metodologia dos trabalhos científicos atualmente publi-cados sobre Genética Molecular men-ciona diversas técnicas, pressupondo que o leitor esteja familiarizado com elas, ao menos conceitualmente. Portanto, descrê-vemos a seguir, essas técnicas para atualização e a título de uma pronta referência. PCR: Polymerase Chain Reaction, ou Reação em Cadeia da Polimerase é uma técnica de Biologia Molecular (1985), através da qual é possível a amplificação do número de cópias de uma seqüência específica de DNA de maneira expo-nencial. Esta técnica requer a existência de uma sequência molde (template) que será amplificada através da hibridização com sondas complementares (primers) a pequenos trechos de ambas as extre-midades da sequência molde. A reação requer a variação contínua de tempe-ratura, permitindo a hibridização entre fragmentos, a extenção por polime-rização de nucleotídeos e em seguida a desnaturação das seqüências recém-

Page 19: Monograph Molecular Genetics

sintetizadas, para que um novo ciclo possa ser iniciado. Visto que a des-naturação requer temperaturas próximas a 100oC, foi necessário isolar polimerases de organismos termoresistentes, de modo a possibilitar a reação enzimática em cadeia, sem destruir a atividade enzi-mática da polimerase.

Através da técnica de PCR, é possível se utilizar um pequeno número de moléculas de DNA e amplificá-las até se obter o número desejado de moléculas. Este procedimento é de grande valia na clonagem de genes, análise de expressão e identificação de indivíduos (paternidade e medicina forense). rtPCR: Semelhante ao PCR, porém inclui uma etapa anterior na qual o RNA é convertido em cDNA pela enzima transcriptase reversa. O cDNA resultante pode então ser amplificado por PCR. Esta técnica permite a análise de ex-pressão de genes em células ou tecidos específicos. PCR Semi-quantitativo: Variação do PCR no qual os ciclos são otimizados no sentido da amplificação ser o mais quanti-tativa possível. Uma maneira de obter este efeito é contaminar a reação de amplificação com outra seqüência conhe-cida - e geralmente presente em todas as amostras – tal como genes zeladores (i.e. housekeeping genes). Ao se atingir o máximo possível de amplificação da sequência contaminante, a reação pára de progredir de maneira exponencial, impe-dindo assim que, ao longo dos ciclos, as seqüências em menor número sejam amplificadas, produzindo um sinal tão intenso como o gerado pelas seqüências em maior número. Real Time PCR (TaqMan): Variação da técnica de PCR, inventada pela compa-nhia Perkin Elmer, que permite a visualização da amplificação à medida em

que a reação ocorre. Tal efeito é pos-sibilitado atráves da adição de sondas (probes) contendo moléculas fluores-centes que são ativadas somente ao serem degradadas pela polimerase. Assim, pode-se detectar e quantificar a intensidade da amplificação como sendo diretamente proporcional à luz gerada. LCR: Ligase Chain Reaction ou Reação em Cadeia da Ligase consiste na amplificação de um fragmento de DNA pela ligação em cadeia de duas sondas complementares. As sondas são plane-jadas de modo a se hibridizarem ao DNA-molde e serem ligadas pela enzima ligase. A amplificação ocorre após múltiplas etapas de desnaturação e ligação. Southern Blot: Técnica de hibridização de DNA-alvo com DNA-sonda. O DNA-alvo, geralmente fragmentado, é sepa-rado por eletroforese em gel de agarose e transferido para uma membrana de nylon ou nitrocelulose. O DNA-sonda é marcado com radioatividade ou métodos não radioativos e hibridizado ao DNA imobilizado na membrana. O sinal positivo é indicativo da presença no DNA-alvo de seqüências semelhantes ou idênticas às do DNA-sonda. Condições de lavagem podem aumentar ou diminuir o limite da hibridização, permitindo, por exemplo, apenas a hibridização de seqüências idênticas. Dot Blot: Semelhante ao método anterior, porém o DNA-alvo não é separado por eletroforese, mas sim "blotted" ou borrado em regiões específicas da membrana. A vantagem é a rapidez e a desvantagem é a falta de separação por tamanho de fragmentos, o que im-possibilita saber ao certo se a positividade é devido à presença exata do gene interrogado ou de genes semelhantes e/ou com trechos com um grau de homologia

Page 20: Monograph Molecular Genetics

suficiente para permitir a hibridização com a sonda. Northern Blot: Mesma filosofia do Southern Blot, porém o material alvo é RNA, em vez de DNA. Essa técnica, assim como o rt-PCR, permite a análise de expressão de determinados genes em células ou tecidos específicos. Western Blot: Também semelhante aos anteriores, contudo o alvo - que é sepa-rado por tamanho e imobilizado em membrana - é constituído de proteínas e a sonda é substituída por anticorpos mono ou policlonais, que investigam epítopos específicos da proteína de interesse. A detecção do sinal é geralmente por quimio-luminescência. ISH ou Hibridização In Situ (In Situ Hybridization): Permite investigar a expressão de seqüências de RNA em lâminas de tecido. Técnica elegante, onde se pode determinar com precisão a localização do RNA expresso, por exem-plo no tumor ou tecido conjuntivo peritumoral. A hibridização é feita com sondas RNA antisenso e o sinal detec-tado por radioatividade ou imuno-coloração. Imunohistoquímica: Semelhante ao anterior, porém o material investigado na lâmina é proteína e não RNA - e a sonda é substituída por anticorpos mono ou policlonais. A detecção do sinal é por imunocoloração. Imunocitoquímica: Variação da técnica anterior, na qual o tecido em lâmina é substituído por células em suspensão. Expression Analysis: É o uso de qualquer técnica que permita a análise de expressão gênica em tecidos ou células diferentes, por exemplo, rtPCR, North-

ern Blots e, mais recentemente, os modernos Biochips de DNA. cDNA library: Biblioteca gênica gerada pela clonagem de toda uma população de cDNAs em um vetor de escolha. Tal biblioteca representa o pool ou banco de genes expressos naquele grupo celular, visto que foi gerada através da conversão das moléculas de RNA em DNA. Genomic library: Biblioteca gênica gerada pela clonagem de fragmentos de DNA em um vetor de escolha. Tal biblioteca representa todos os genes presentes em um indivíduo - inde-pendente do tecido utilizado. Identificação Genética (DNA finger-printing): Utilização da composição genética de um indivíduo para permitir sua identificação. Atualmente são utilizados preferencialmente os Short Tandem Repeats (STR), que após am-plificação por PCR são separados de acordo com o tamanho, gerando um padrão altamente polimórfico que, combinado, produz uma identificação genética de alta resolução. Fluorescence activated cell sorting (FACS) ou Citometria de Fluxo (Flow Cytometry): Separação celular com base em moléculas expressas na superfície destas células. Anticorpos marcados específicos reconhecem as moléculas marcadoras de superfície, gerando cores diferentes de acordo com o anticorpo utilizado. De acordo com a cor de cada célula - ou combinação de cores, a máquina promove a separação celular para compartimentos diferentes. Este método é também muito útil na iden-tificação e classificação de tumores, de acordo com os marcadores tumorais expressos.

Page 21: Monograph Molecular Genetics

DNA Chip: Chips de sílica contendo milhares de seqüências curtas de DNA, ou seqüências inteiras de cDNA. Utilizados preferencialmente para se analisar simultaneamente a expressão de milhares de genes em um determinado tecido ou grupo de células. Pode-se, por exemplo, analisar as diferenças de expressão gênica entre tecido tumoral e tecido normal e, ao mesmo tempo, obter-se um mapa dos níveis de expressão de milhares de genes. Transgenic Mouse: Camundongos transgênicos contendo um gene exógeno, por exemplo, humano. Esta técnica requer a microinjeção do gene em células cultivadas in vitro, que depois são introduzidas no útero da fêmea grávida. Estas células transgênicas se misturam com as células normais e geram um animal quimérico, contendo células normais e transgênicas. Através de cruzamentos sucessivos, é possível obter um animal completamente transgênico. Knockout Mouse: Consiste na eliminação de um gene específico no camundongo, para estudo das alterações durante a embriogênese ou na vida adulta do camundongo. Por exemplo, abolindo-se a função de um gene supressor tumoral, pode-se observar o aparecimento precoce de tumores. A ruptura é feita in vitro, através da recombinação homóloga em células embrionárias que são poste-riormente selecionadas e implantadas na fêmea grávida. O mesmo processo de cruzamento de quimeras é necessário para se obter um camundongo completamente knockout. Knockin Mouse: Variação da técnica anterior, na qual o gene, ao invés de eliminado, é substituído por outro. Por exemplo, substitui-se a versão normal de um gene pela versão alterada (com

mutações) e estuda-se o efeito fenotípico de forma controlada. SNP ou Single Nucleotide Poly-morphisms: A mais sutil variação genética entre indivíduos, consistindo na variação que ocorre em um único nucleotídeo, como acima exposto. Estima-se que existam variações nucleo-tídicas deste tipo a cada 1.000 ou 1.300 nucleotídeos. Considera-se na atualidade que o grupo total de SNPs de um indivíduo é o fator determinante para todas as predisposições genéticas deste indivíduo. Espera-se que futuramente, com a possibilidade da análise simultâ-nea de todos os SNPs, possa-se deter-minar estatísticamente a predisposição individual a múltiplas doenças e, desta forma, tomar medidas preventivas muito precocemente. Bibliografia Consultada e Recomendada: 1) Peter Beurton, Raphael Falk, Hans-Jørg Rheinberger (eds.) The Concept of the Gene in Development and Evolution. Cambridge Studies in Philosophy and Biology. Cambridge Univer-sity Press, 2000. 2) Alberts, B., Bray, D., Lewis J., Raff, M., Roberts, K., Watson, J. Molecular Biology of the Cell, 3a ed. Garland Publishing, Inc., 1994. 3) Kornberg, R.D. Eukaryote transcriptional control. Trends in Cell Biology, Trends in Biochemistry, Science and Trends in Genetics (joint issue); 1999:24, M46-8. 4) Yaspo, M-L., Reinhardt, R., Lenbrach, H. et. cols. The DNA sequence of human chromosome 21. Nature; 18 May 2000; 311-319.