26
Análise de Estruturas de Proteínas Jeane Melo

Análise de Estruturas de Proteínas

Embed Size (px)

DESCRIPTION

Análise de Estruturas de Proteínas. Jeane Melo. Roteiro. Introdução Predição de Estrutura Secundária (Parte 1) Apresentação do problema Exemplos de abordagens Preditor NNPSS Comparação e Detecção de Padrões Estruturais (Parte 2) Apresentação do problema Exemplos de abordagens - PowerPoint PPT Presentation

Citation preview

Page 1: Análise de Estruturas de Proteínas

Análise de Estruturas de Proteínas

Jeane Melo

Page 2: Análise de Estruturas de Proteínas

Jeane Melo

Roteiro Introdução

Predição de Estrutura Secundária (Parte 1) Apresentação do problema Exemplos de abordagens Preditor NNPSS

Comparação e Detecção de Padrões Estruturais (Parte 2) Apresentação do problema Exemplos de abordagens Modelo desenvolvido

Page 3: Análise de Estruturas de Proteínas

Jeane Melo

Introdução Projeto genoma humano

Page 4: Análise de Estruturas de Proteínas

Jeane Melo

Introdução Proteínas

Metabolismo, suporte de filamentos, catálise bioquímica, regulação do volume celular e imunização

Page 5: Análise de Estruturas de Proteínas

Jeane Melo

Introdução

Proteômica

Identificação de todas as proteínas expressas por um genoma

Determinação das funções patológicas e fisiológicas das proteínas

Page 6: Análise de Estruturas de Proteínas

Jeane Melo

Introdução

PDB

48235

Swiss-Prot

290484

Seqüências

X

Estruturas

Page 7: Análise de Estruturas de Proteínas

Jeane Melo

Introdução

Page 8: Análise de Estruturas de Proteínas

Jeane Melo

Introdução

Análise seqüencial Comparação de seqüências Busca por ocorrências de padrões

Análise estrutural Obtenção da estrutura a partir da seqüência Comparação de estruturas conhecidas Busca por motivos ou domínios estruturais

Page 9: Análise de Estruturas de Proteínas

Jeane Melo

Introdução

Problema do dobramento de proteínas Predição de Estrutura Secundária

Análise de estruturas conhecidas Busca por motivos Busca por subestrutura comum

Page 10: Análise de Estruturas de Proteínas

Predição de Estrutura Secundária de

Proteínas

Page 11: Análise de Estruturas de Proteínas

Jeane Melo

Predição de Estrutura Secundária

Patrick J. Fleming, Haipeng Gong and George D. Rose (2006) Secondary structure determines protein topology. Protein Science 15:1828-1834.

Page 12: Análise de Estruturas de Proteínas

Jeane Melo

Predição de Estrutura Secundária Dada uma seqüência de aminoácidos, classificar

cada resíduo em classes de elementos de estrutura secundária, por exemplo: Hélices Fitas Coils

Abordagens estatísticas (50%-60%) Abordagens envolvendo redes neurais têm se

revelado mais eficazes (~80%).

Page 13: Análise de Estruturas de Proteínas

Jeane Melo

Exemplos de abordagens

Qian, N. and Sejnowski, T. J. (1988). Predicting the secondary structure of globular proteins using neural network models. Journal Molecular Biology, 202:865-884.

Q3 = 64,3% Janela de tamanho 13 40 nós na camada escondida

Page 14: Análise de Estruturas de Proteínas

Jeane Melo

Exemplos de abordagens

Georgios J. Pappas Jr. and Shankar Subramaniam. Analysis of the Effects of Multiple Sequence Alignments in Protein Secondary Structure Prediction. LNCS, 3594:128-140, 2005

Page 15: Análise de Estruturas de Proteínas

Jeane Melo

Exemplos de Abordagens

PSIPRED Perfis PSI-Blast Predição em dois níveis Desempenho Q3

Entre 76,5% e 78,3%

Jones, D. T. (1999). Protein secondary structure prediction based on position-specific scoring matrices. Journal of Molecular Biology, 292:195-202.

Page 16: Análise de Estruturas de Proteínas

Jeane Melo

Exemplos de Abordagens Melhor Desempenho

1032 proteínas dissimilares Predição em dois níveis

Combinação de 800 predições Desempenho alcançado

77,2% Utilizando o conjunto RS126 para teste

80,6%

Petersen, T. N., Lundegaard, C., Nielsen, M., Bohr, H., Bohr, J., Brunak, S., Gippert, G. P., and Lund, O. (2000). Prediction of protein secondary structure at 80% accuracy. Proteins, 41:17-20.

Page 17: Análise de Estruturas de Proteínas

Jeane Melo

Pontos Abordados

Resultados próximos porém não comparáveis

Esforço computacional

Algoritmo de treinamento

Regras de combinação

Dados de entrada

Page 18: Análise de Estruturas de Proteínas

Jeane Melo

O Preditor NNPSS

NNPSS Neural Network based Protein Secondary Structure

Predictor

Arquitetura simplificada

Eficiência

Resultados comparáveis

Page 19: Análise de Estruturas de Proteínas

Jeane Melo

Abordagem de Referência

Bancos de Dados CB396, RS126

Preditores avaliados PHD [Rost and Sander, 1994] DSC [King and Sternberg, 1996] NNSSP [Salamov and Solovyev, 1995] PREDATOR [Frishman and Argos, 1997] CONSENSUS [Cuff and Barton, 1999]

Cuff, A. J. and Barton, J. G. (1999). Evaluation and improvement of multiple sequence methods for protein secondary structure prediction. Proteins: Structure, Function and Genetics, 34:508-519.

Page 20: Análise de Estruturas de Proteínas

Jeane Melo

O Preditor NNPSS Dados

Bancos CB396, RS126

Perfis PSI_Blast, Freqüência, PSI_Blast com filtro Banco de dados NR

Método de avaliação Validação cruzada Q3

RPROP Regras de combinação

Votação, Produto, Média, Máximo, Mínimo

Page 21: Análise de Estruturas de Proteínas

Jeane Melo

O Preditor NNPSS

Page 22: Análise de Estruturas de Proteínas

Jeane Melo

Resultados

Método RS126 (%) CB396 (%)

PHD 73,5 71,9DSC 71,1 68,4PREDATOR 70,3 68,6NNSSP 72,7 71,4CONSENSUS 74,8 72,9NNPSS 74,1 75,9

Guimarães, K. S., Melo, J. C. B., and Cavalcanti, G. D. C. (2003). Combining few neural nets for effective secondary structure prediction. In Proc. of the Third IEEE Symposium on Bioinformatics and Bioengineering, pages 415-420,Maryland, USA.

Page 23: Análise de Estruturas de Proteínas

Jeane Melo

Resultados

Page 24: Análise de Estruturas de Proteínas

Jeane Melo

Extração de Características Simplificar arquitetura Seleção de resíduos significativos

Proteínas SSSD Métodos

Análise de Componentes Principais (PCA) Análise de Componentes Independentes (ICA)

Friedberg, I., Kaplan, T., and Margalit, H. Glimmers in the midnight zone: Characterization of aligned identical residues in sequence-dissimilar proteins sharing a common fold. In Proc. of the Eighth International Conference on Intelligent Systems for Molecular Biology, pages 162-170, 2000.

Page 25: Análise de Estruturas de Proteínas

Jeane Melo

Extração de Características

Page 26: Análise de Estruturas de Proteínas

Jeane Melo

Análise ComparativaComparaçãodas Melhores Performances Q3 Médias

180 Componentes (PCA) versus 180 Componetes (ICA)

70.00

71.00

72.00

73.00

74.00

75.00

76.00

Rede1 Rede2 Rede3 Produto Média Votação Mínimo Máximo

Prec

isão

Méd

ia (%

)

PCAICA

Melo, J. C. B., Cavalcanti, G. D. C., and Guimarães, K. S. (2004). Protein secondary structure prediction: efficient neural network and feature extraction approaches. IEE Electronics Letters, 40(21):1358-1359.