23
Allan Lima [email protected]

Allan Lima [email protected]. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology

Embed Size (px)

Citation preview

Page 1: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Allan [email protected]

Page 2: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos

◦ Aplicação de Ontologias The Gene Ontology

Desafios para a próxima geração de BDs Biológicos

Page 3: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

◦ Permitem a previsão de indivíduos com tendência a doenças Imunoterapia Evitar condições ambientais que possam

estimular uma doença Substituição de genes problemáticos (“curativo

genético”) Novas oportunidades de negócios na

◦ Medicina ◦ Agronomia◦ Zootecnia◦ Etc...

Porém, para que isto seja possível

temos que armazenar as informações

genéticas em bases de dados

Page 4: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Então surge o conceito Bancos de Dados Biológicos◦ Guardam seqüências de ácidos nucléicos e

aminoácidos e suas respectivas anotações◦ Fornecem algoritmos para recuperação e análise

destes dados

Page 5: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Laboratório de Genética Aplicada na UFRPE◦ Mapeamento de DNA Mitocondrial

litopenaeus vannamei já publicado no NCBI http://www.ncbi.nlm.nih.gov/Taxonomy/

Browser/wwwtax.cgi?id=6689 Hyporhamphus (unifasciatus e roberti)

e Hemirhamphus (brasiliensis e balao) Auxiliar no estudo de ecologia,

conservação ou distribuição geográfica Em processo de mapeamento

Page 6: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

The Gene Ontology

Page 7: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Problema: Bancos de dados de biologia

molecular possuem um grande e variado montante de tipos de

dados

Mas por que?Ainda não há um padrão que as implementações

pretendem seguir

Page 8: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Arquivos com uma dada estrutura própria◦ GenBank, ACeDB

Bancos de dados implementados via SGBD◦ Relacional, OO, OR.

Arquivos com dados em formato apropriado para execução de determinadas aplicações◦ FASTA e BLAST

Como padronizar e integrar os projetos?

Page 9: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

É um esforço colaborativo para endereçar a necessidade de

descrições dos genes em diferentes bases de dados

Page 10: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

BD RelacionalXML Flat

Files

The Gene Ontology

Search Engine

Page 11: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Iniciado em 1998 com apenas 3 projetos◦ FlyBase (Drosophila)◦ Saccharomyces Genome Database (SGD) ◦ Mouse Genome Database (MGD)

Estado atual◦ Conjunto de ontologias que diversos projetos já

utilizam Representação dos dados biológicos e dos seus

significados (anotações) Ferramentas de busca e análise

◦ Ferramenta de edição de ontologias

Page 12: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Padroniza◦ Processos biológicos

Estruturas anatômicas Retículo Endoplasmático Rugoso

Produtos de um gene Ribossomo

◦ Componentes celulares Série de eventos efetuados por um conjunto de

funções moleculares Transporte de glicose

Page 13: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Padroniza (Continuação) Funções Moleculares

Atividade que ocorrem no nível molecular Catálise

Relacionamentos is_a

Simples relacionamento entre subclasses Cromossomo Nuclear is_a Cromossomo

part_of Núcleo part_of Célula O Núcleo sempre é parte de uma célula, mas nem toda

célula possui um núcleo

Page 14: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology
Page 15: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Os aquivos de definem as ontologias são distribuídos livremente◦ Modelos SQL (MySQL)◦ Definição para o formato dos FlatFiles◦ Esquemas DTD para validar aquivos XML

Há ainda um conjunto de arquivos de mapeamento para algumas bases

Go Downloads

Page 16: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology
Page 17: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

termdb◦ ontologias, definições e mapeamentos para outros

bancos assocdb

◦ adiciona suporte para os produtos dos genes seqdb

◦ adiciona suporte para seqüências de proteínas seqdblite

◦ versão simplificada do bd

Page 18: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Busca um termo da ontologia e mostra todos os produtos de gene anotados para este

Procura por produto de gene e mostra suas associações

Realiza indentificações de seqüências com o algoritmo BLAST

Page 19: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Pontos negativos◦ Padrões podem inibir a criatividade◦ Nem sempre a adaptação é perfeita◦ Ferramenta de modelagem de ontologia bugada!?◦ Modelo obsoleto das ontologias (DTD)

Pontos positivos◦ TGO ataca o problema de padronização no

armazenamento em diversos sentidos◦ Possui uma vasta documentação

Exemplos, Definições, Tutoriais, Wiki, etc.◦ Conta com várias bases de dados◦ Comunidade de pesquisadores◦ Links para Ferramentas

Page 20: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Compactação dos dados◦ Genoma humano ~ 3 gigabytes

Ontologias de integração Metadados para as anotações Inferência do significado das cadeias de

DNA Verssionamento

Page 21: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology
Page 22: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Seibel, L. F. B.; Lemos, M.; Lifschitz, S. Bancos de Dados de Genoma. Departamento de Informática. Pontifícia Universidade Católica do Rio de Janeiro

Laboratório de Genética e Expressão. Disponível em: http://www.lge.ibi.unicamp.br/. Último acesso: 25.07.2007

PIR: Protein Information Resource. Disponível em: http://www-nbrf.georgetown.edu/. Último acesso: 25.07.2007

GO: Gene Ontology. Disponível em: http://www.geneontology.org/. Último acesso: 25.07.2007

NCBI: National Center for Biotechnology Information. Disponível em: http://www.ncbi.nlm.nih.gov/. Último acesso: 25.07.2007

GenBank Overview. Disponível em: http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html. Último acesso: 25.07.2007

IF694 - Bancos de Dados Distribuídos e Móveis. Disponível em: http://www.cin.ufpe.br/~if694/. Último acesso: 25.07.2007

The Gene Ontology Project. Disponível em: http://www.cin.ufpe.br/~if694/. Último acesso: 25.07.2007

Page 23: Allan Lima adsl@cin.ufpe.br.  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology

Allan [email protected]