A estrutura tridimensional das proteínas
O esqueleto covalente das proteínas possui um elevadonúmero de ligações em torno das quais é possível rotação, resultando num enorme número de conformaçõesmoleculares.
A maioria das proteínas biológicas possui uma estruturatridimensional bem definida, chamda estrutura nativa, quecorresponde a um pequeníssimo conjunto dentro de todasas possíveis conformações.
A estrutura nativa é estabilizada por interacções fracas (não-covalentes), sendo apenas marginalmente estável(∆G≈20-65 kJ/mol)
Princípios fundamentais para a compreensão da estruturanativa das proteínas:
a) A ligação peptídica é rígida e planarb) Os resíduos hidrofóbicos preferem o interior não polar das proteínasc) O número de ligação de hidrogénio na proteína émaximizado
∆Gfolding ≈ -20-65 kJ/mol
Sequência->Estrutura
Muitas protéinas adquirem a sua estruturatridimensional espontâneamente (folding)
“Simulação” do folding ubiquitina
Propriedades estruturais da ligaçãopeptídica
• Aligação peptídica apresenta interacções de ressonância quelhe conferem um carácter de 40% ligação dupla:
• O efeito de ressonância favorece a conformação planar daligação peptídica:
• A conformação cis da ligação peptídica é estéricamentemenos favoravel e muito mais raramente observada emproteínas:
A cadeia polipeptídica é formada por umasucessão de planos peptídicos
• Os ângulos de torsão φφφφ (fi) e ψψψψ (psi) descrevem a orientação relativa das planospeptídicos.
• Certos valores de φφφφ (fi) e ψψψψ(psi) não são possíveis, porque provocaminterferência estérica
O diagrama de Ramachandran
• A conformação do esqueleto da cadeia polipeptídica pode ser descrito através da enumeração dos pares de valores φ e ψpara cada resíduo. Dá a esta tipo de representação o nome de diagrama de Ramachandran, em homenagem ao seu inventor.
• No diagrama, cada pontorepresenta um aminoácido. As regiões a verde sãoaquelas que não provocamimpedimentosestereoquímicos
•A conformação φ=ψ=0 nãoé permitida!
Diagrama de Ramachandran da lisozima
Tipe de contacto Limite Normal Limite Extremo
H … H 2,0 1,9H … O 2,4 2,2H … N 2,4 2,2H … C 2,4 2,2O … O 2,7 2,6O … N 2,7 2,6O … C 2,9 2,7N … N 2,7 2,6N … C 2,9 2,8C … C 3,0 2,9
Zonas permitidas e proibidas dodiagrama de Ramachandran
• As zonas a azul escuro são as possíveis sem sobreposiçãoatómica, azul médio são as zonas permitidas indo ao limiteextremo de sobreposição atómica, e a região a azul claro éaccessível através da flexão dos ângulos e comprimentos de ligação
A glicina tem maior liberdadeconformacional
• As regiões do diagrama de Ramachandran accessíveis àGlicina são maiores porque este resíduo não tem cadeia lateral!
Glicina
A estrutura secundária das proteínas
• A estrutura secundária de um polímero é definida como a conformação local da sua cadeia principal.
• No caso particular das proteínas, este termo é geralmenteusado para descrever os padrões regulares da geometrialocal da cadeia polipeptídica, tais como hélices, folhas e voltas (turns).
• A estrutura da hélice α e da folha β foramcorrectamentededuzidas por Pauling e Corey em 1951, ainda antes de se ter conseguido determinar a estrutura de uma proteína com detalhe atómico.
Hélice α Folha β Volta (turn)
A hélice α
• Proposta em 1951 por L.Pauling and R.Corey para explicar os dados de difracção de raios X de fibras de proteína.
• A hélice α possui um número não-inteiro de resíduos por volta (3.6)
• A geometria ideal da hélice α produz ângulos de torsão φ = -57.8, ψ = -47.0, passo = 5.4 Å e elevação por resíduo = 1.5 Å
• O grupo carbonilo do resíduo na posição i forma uma ligação de hidrogénio com o grupo amina do resíduo na posição i+4
• As ligações de hidrogénio possuem uma geometria próxima da ideal.
• O raio da hélice é suficientemente pequeno para permitr a ocorrênciade contactos de van der Waals no interior
• As cadeias laterais de cada volta da hélice estão desfasadas emrelação às das voltas contíguas, evitando contactos desfavoráveis
A hélice alfa é a estrutura helicoidal mais frequente observada nasproteínas globulares, correspondendo a cerca de 30% dos resíduosnas proteínas de estrutura conhecida. O comprimento médio de umahélice é aproximadamente 12 resíduos, mas chega a atingir os 50 resíduos.
A hélice α é uma hélice direita
Hélice esquerda Hélice direita Hélice alfa
Exemplos de hélices α
Albumina do soro humano (representação esquemática)
Albumina do soro humano (representação atómica)
A folha β
• A conformação estendida da cadeia polipeptídica foi primeiramentesugerida nos anos 30, mas só observada nos anos 70 quando daresolução da estrutura da lisozima.
• A conformação em folha β foi prevista correctamente por Pauling e Corey em 1951
• A unidade básica da estrutura β é uma cadeia extendida(semelhante uma hélice de período 2) com ângulos φ e ψaproximadamente iguais a -120, +120. Ao contrario da hélice α, as ligaçãoes de hidrogénio não se formam localmente mas entre cadeias distintas, que podem ser paralelas ou antiparalelas.
Folha βantiparalela
Folha βparalela
A folha β é “plissada”
• Uma cadeia com ângulos fi e psi = 180 produz uma conformaçãocompletamente estendida, como uma fita plana:
• O desvio dos valore de fi e psi de 180 para cerca de 120 faz com que os planos peptídicos subam e descam alternadamente, num padrão “plissado” (pleated)
Estruturas β
Folha β anti-paralela
Imunoglobulina humana
Folha β paralela
Barril ββ “twist”
Cadeia β
Voltas (turns)
• As proteínas globulares têm estruturas compactas, obrigando a múltiplas voltas (turns) da cadeia polipeptídica e constituindo porisso cerca de 30% da estrutura destas proteínas. Os t
Voltas
• As voltas β de tipo I e II são as mais comuns em proteínas, aparecendo a tipo I quase o dobro das vezes que a II. A volta tipo II tem sempre uma glicina como segundo resíduo.
glicina
volta β(β turn)
Folha β anti-paralela
Folha β paralela
Poliglicina e poli L-prolina
Colagénio
Hélice α
Hélice α invertida
Hélice π
Hélice 310
Fita 2.27
Estruturas secundárias regulares
• As estrutura secundárias regulares caracterizam-se porvalores de ângulos φ e ψ aproximadamente constantes.
φφφφ ψψψψ ωωωω Resíduos por volta Translacção por resíduo
Folha β antiparalela -139 +125 -178 2,00 3,40Folha β paralela -119 +113 180 2,00 3,20Hélice α direita -57 -47 180 3,60 1,50
Hélice 310 -49 -26 180 3,00 2,00
Hélice π -57 -70 180 4,40 1,15Poliprolina I -83 -158 0 3,33 1,90Poliprolina II -78 +149 180 3,00 3,12Polyglicina II -80 +150 180 3,00 3,10
A estrutura terciária das proteínas
• A estrutura terciária das proteínas descreve o arranjo dos seusátmos no espaço tridimensional.
• Enquanto a estrutura secundária descreve a conformação local das proteínas, a estrutura terciária descreve a estrutura global, em queas interacções entre pontos muito afastados da cadeia são cruciais.
• Geralmente separam-se as proteínas em dois grupos, as proteínasfibrosas e as proteínas globulares:
Proteínas globulares:
são geralmente solúveis, possuem uma forma compacta (glóbulo), contendo diferentes combinações de elementos de estruturasecundária, e desempenham funções variadas tais como catáliseenzimática, reconhecimento molecular, transmissão de sinais, etc…
Proteínas fibrosas:
são geralmente insolúveis, possuem cadeias muito longas com repetição de um único motivo de estrutura secundária, desempenham papéis estruturais ou de motilidade...
Proteína globular (mioglobina) Proteína fibrosa (colagénio)
A fibroína da seda
• A fibroína, produzida por aranhas e insectos, é uma proteínafibrosa constituída por cadeias β extendidas, e rica em Alanina e Glicina (estudos da sequência indicam a presença da unidade(-Gly-Ser-Gly-Ala-Gly-Ala-)n )
• As folha β ficam sobrepostas em camadas com um empacotamento de Alaninas numa face e Glicinas na outra
• A as propriedades mecânicas da seda podem ser explicadas se considerarmos a sua estrutura:pequena extensibilidade: porque a cadeia β já é uma estruturaquase totalmente extendidaflexibilidade: porque as forças entre camadas sucessivas são de natureza não-covalente (relativamente fracas)
Bicho da seda
Padrão de difracção de uma fibra seda
A α-queratina
• A α-queratina é o principal componente da camada externa dapele, bem com dos pelos, da lã, chifres e cabelo (cerca de 85% do conteúdo celular de proteína).
• As fibras de queratina apresentam uma hierarquia de organizaçãoestrutural, desde os filamentos intermediários do citoesqueleto atéàs moléculas individuais.
•A unidade molecular da queratina é um dímero, constituído porduas hélices α que se enrolam em torno uma da outra numa héliceesquerda (hélice de hélices ou “coiled coil”)
• As hélices do dímero de queratina mantem-se unidas através de um padrão repetido de resíduos hidrofóbicos na face interior da cadahélice (a-b-c-d-e-f-g em que a e g são hidrofóbicos)
Dímero de α-hélices da queratina (coiled coil)
Estrutura do cabelo
Propriedades mecânicasdas α-queratinas
• A α-queratina é rica em pontes de dissulfureto que ligam cadeiasadjacentes através de resíduos de cisteína. O número de ligaçõescruzadas entre cadeias (cross links) determina a rigidez das queratinas: α-queratinas duras contêm um elevado número de pontes de dissulfureto, α-queratinas moles um número maisreduzido.
• A elasticidade das fibras de lã e cabelo resulta da distensão daestrutura helicoidal das moléculas de α-queratina. O grau de distensão é limitado pelo número de pontes de dissulfureto entre cadeias.
• Agentes redutores como o mercaptoetanol podem ser usados pararemover as pontes dissulfureto da α-queratina, tornando maisflexível. O processo pode depois ser invertido com a adição de um oxixdante.
reduzir frisar oxidar
Mecanismo da frisagem do cabelo
O colagénio
• O colagénio existe em todos os animais multicelulares e é a proteína mais abundante dos vertebrados. É uma proteínaextracelular, presente em vários tecidos conectivos: tendão, cartilagem, ligamentoes, matrix orgânica do osso, matriz fibrosa dapele e vasos sanguíneos, córnea do olho.
• O colagénio é, tal como a α-queratina, uma hélice de hélices: trêshélices, as cadeias α (não confundir com αααα-hélices!) enrolam-se numa superhélice direita, enquanto cada uma das cadeias a forma uma hélice esquerda
• Existem muitos tipos de colagénio nos vertebrados, mas a quasetodos contêm cerca de 35% Gly, 11% Ala, 21% Pro + Hyp(hidroxiprolina).
• O colagénio contem percentagens variáves dos resíduosmodificados 3-hidroxiprolina, 4-hidroxiprolina e 5-hidroxilisina.
Estrutura do colagénio
• Cada uma das hélices do colagénio éuma hélice esquerda com umaconformação semelhante à dapoliprolina.
• As sequências de colagénioapresentam uma fórmula geral Gly-X-Y, em que X é frequentemente Prolina e Y Hidroxiprolina
• As hélices têm 3.1 resíduos por volta e uma elevação de 10 Å
• O grupo -NH de cada Glicina forma uma ligação de hidrogénio com o grupoX de uma das cadeias adjacentes
Sequência da região terminal do colagéniobovino α1(I)
Super hélice tripla do colagénio
Interacçõe entre resíduos das 3 cadeias
Fibras de colagénio
Cross links covalente entre cadeias de colagénio, por meio das hidroxilisinas
Proteínas globulares
• As proteínas globulares compreendem um grupo altamentediversificado de proteínas que existem, no seu estado nativo, naforma de um glóbulo compacto, de dimensões mais ou menosesferoidais.
• As proteínas globulares desempenham uma diversidade de funções, tais como enzimas, receptores, hormonas, anticorpos e transportadores.
• As proteínas globulares apresentam, geralmente uma variedade de elementos de estrutura secundária combinados de diversos modos.
Dimensões da albumina do soro humanocomparadas com uma cadeia extendida
Exemplo de proteína globular:a mioglobina
Formas de representação da estruturaterciária da mioglobina
• A mioglobina foi a primeira proteína a ser conhecida com detalheatómico - a sua estrutura foi determinada por difracção de raios X nos anos 50 por John Kendrew e colaboradores.
• A análise da estrutura da mioglobina deu a conhecer os princípiosgerais de organização das proteínas globulares.
• A mioglobina tem 153 aminoácidos de comprimento e possui um grupo prostético, o grupo hémico.
Princípios da estrutura de proteínasglobulares
•A localização das cadeias laterais varia de acordo com a suapolaridade: os resíduos hidrofóbicos têm preferência pelo interior, enquanto os carregados se encontram quase sempre à superfície e os resíduos polares podem aparecer, ocasionalmente, no interior.
• O interior das proteínas está densamente empacotado,
• As proteínas globulares podem conter α−hélices e folhas β
• Os elementos de estrutura secundária organizam-se em estruturas
supersecundárias
• As proteínas de maiores dimensões (>200) estão geralmenteorganizadas em domínios, unidades estruturais mais ou menosautónomas cuja dimensão não ultrapassa os 100-200 aa.
Domínio A
Domínio B
Elements de estrutura supersecundária
Diversidade de estruturas dasproteínas globulares
A estrutura das proteínas globularesé construida a partir de elementos simples
Classificação estrutural das proteínas
As proteínas podem ser classificadas de acordo com o conteúdo emestruturas secundárias, defindo-se as seguintes classes:
• α : contendo apenas hélices alfa
• β : contendo apenas estruturas beta
• α/β : elementos beta e alfa, ocorrendo de forma alternada
• α+β: elementos alfa e beta ocorrendo em regiões separadas
•
Dentro de cada classe definem-se folds, em que cada fold corresponde a um tipo particular de arranjo de elementos de estrutura secundária (por.exemplo o barril beta).
Dentro de cada fold definem-se superfamílias, proteínas com caracteristícas estruturais mais semelhantes, mas geralmente com diversidade funcional. Finalmente, dentro de cada superfamíliadefinimos famílias, conjuntos de proteínas de estrutura muitosemelhante e geralmente com uma função biológica idêntica oupróxima.
classe
fold
superfamília
família