136
Informática na Biodiversidade: onde estamos, como chegamos aqui e para onde vamos Eduardo Dalcin Núcleo de Computação Científica e Geoprocessamento Diretoria de Pesquisas Instituto de Pesquisas Jardim Botânico do Rio de Janeiro Seminário LNCC Setembro de 2013

Informática na Biodiversidade

Embed Size (px)

DESCRIPTION

Informática na Biodiversidade: onde estamos, como chegamos aqui e para onde vamos

Citation preview

Page 1: Informática na Biodiversidade

Informática na Biodiversidade: onde estamos, como chegamos

aqui e para onde vamos

Eduardo DalcinNúcleo de Computação Científica e Geoprocessamento

Diretoria de PesquisasInstituto de Pesquisas Jardim Botânico do Rio de Janeiro

Seminário LNCCSetembro de 2013

Page 2: Informática na Biodiversidade

Tópicos da apresentação

• Um pouco de história– O início da relação da Biodiversidade com a

Informática– A “renascença”– Como chegamos onde estamos

• Onde estamos?• Para onde estamos indo?• O que precisamos

Page 3: Informática na Biodiversidade

Meu viés• Biólogo• Botânica - Inst. De Pesquisas Jardim Botânico do Rio de Janeiro (1983)• Banco de Dados e Qualidade de Dados

– Qualidade de Dados em Bancos de Dados Taxonômicos (Ph.D. - 2005)• Biodiversidade

– Diversidade de espécies (taxa) e suas ocorrências (indivíduos e populações)• Coleções científicas botânicas

– Herbário• Interesses

– Gestão e entrega de informação sobre biodiversidade (“biodiversity information management and delivery”)

– Governança de Dados sobre Biodiversidade– Arquitetura de Informações e Sistemas sobre Biodiversidade

Page 4: Informática na Biodiversidade

O que é Biodiversidade?• Diversidade biológica significa a variabilidade de organismos vivos de

todas as origens, compreendendo, dentre outros, os ecossistemas terrestres, marinhos e outros ecossistemas aquáticos e os complexos ecológicos de que fazem parte; compreendendo ainda a diversidade dentro de espécies, entre espécies e de ecossistemas (“Convenção sobre Diversidade Biológica - CDB”, 1992).

• Há, então, três níveis de biodiversidade:– Diversidade de ecossistemas, representada pela diversidade de combinações

únicas da diversidade de organismos e ambientes e suas relações que formam os diferentes ecossistemas.

– Diversidade de espécies, representada pela diversidade de espécies individuais.– Diversidade genética, representada pela diversidade de genes dentro de cada

espécie, e pela diversidade de suas combinações em cada espécie.

Page 5: Informática na Biodiversidade

Voltando no Tempo...

O encontro da informática com a biodiversidade

Page 6: Informática na Biodiversidade

“Engenho analítico” (1837)

Charles Babbage (1791 - 1871) Charles Darwin (1809 - 1882)

1859

Page 7: Informática na Biodiversidade

Gregor Mendel(1822 - 1884)

1865 – Leis da Hereditariedade

Page 8: Informática na Biodiversidade

Alan Turing1912 - 1954

• Pai da Ciência da Computação e da Inteligência Artificial

• Formalizou os conceitos de Algoritmo e Computação

Page 9: Informática na Biodiversidade

Linguagens de Alto Nível

Fortran1954 Especificação (John W. Backus)1956 – Primeiro ManualIBM 704

Page 10: Informática na Biodiversidade

• IBM 7090– Lançado em 11/1959– Vendido por

US$2,900,000.00– Versão transistorizada do

IBM 709

Page 11: Informática na Biodiversidade
Page 12: Informática na Biodiversidade
Page 13: Informática na Biodiversidade
Page 14: Informática na Biodiversidade
Page 15: Informática na Biodiversidade
Page 16: Informática na Biodiversidade
Page 17: Informática na Biodiversidade

Scientific American, 215(6) 1966

Page 18: Informática na Biodiversidade
Page 19: Informática na Biodiversidade

1966

Page 20: Informática na Biodiversidade

1967

Page 21: Informática na Biodiversidade

“Diversidade Biológica” (1968)

Page 22: Informática na Biodiversidade
Page 23: Informática na Biodiversidade
Page 24: Informática na Biodiversidade
Page 25: Informática na Biodiversidade
Page 26: Informática na Biodiversidade
Page 27: Informática na Biodiversidade

D.D. Chamberlin and R.F. Boyce, Proc. ACM SIGMOD Workshop on Data Description, Access and Control, Ann Arbor, Michigan (May 1974) pages 249-264.

Page 28: Informática na Biodiversidade

Programa Flora – CNPq1975

Page 29: Informática na Biodiversidade

Programa Flora – CNPqObjetivos

Page 30: Informática na Biodiversidade

Programa Flora – CNPqImplementação - Informática

Page 31: Informática na Biodiversidade

Programa Flora – CNPqResultados - Informática

Page 32: Informática na Biodiversidade
Page 33: Informática na Biodiversidade

Organismos unicelulares na sua vasta maioria e que não apresentam seu material genético delimitado por uma membrana

Os seres vivos com células com um núcleo celular rodeado por uma membrana e com vários organelas.

Até 1977 era assim

Page 34: Informática na Biodiversidade
Page 35: Informática na Biodiversidade

As arquebactérias são semelhantes às bactérias em muitos aspectos da estrutura celular – o mais importante dos quais é a ausência de um núcleo celular diferenciado - e metabolismo, mas apresentam diferenças importantes como, por exemplo, os processos de transcrição do DNA e da síntese proteica que são idênticos aos dos eucariotas, mas o aspecto mais marcante talvez seja o metabolismo de alguns destes seres:

• Algumas espécies de Archaea (Halobacteria), produzem energia a partir da luz, por uma estrutura celular chamada bacteriorrodopsina.

• Outras vivem em fumarolas nas profundezas do oceano, sendo a base da vida destes ambientes, como as plantas são em terra.

• Há ainda aquelas que vivem no trato intestinal de vários animais, produzindo metano.

Page 36: Informática na Biodiversidade

“Renascimento”A década de 80 e 90

• Período marcado por transformações• Assinala o fim da Idade Média e o início

da Idade Moderna

• Período de grande produtividade intelectual e, consequentemente, bibliográfica na Informática na Biodiversidade

Page 37: Informática na Biodiversidade

“Suppose all the information stored in computers everywhere were linked... All the best information in every computer at CERN and on the planet would be available to me and enyone else.”

Tim Berners-Lee, 1980

“TCP + DNS + HTTP + HTML = WEB!”

Page 38: Informática na Biodiversidade

“IBM-PC Compatível”

1981

Page 39: Informática na Biodiversidade

Dbase II e Dbase III Plus (1979 – 1980)

Page 40: Informática na Biodiversidade

1984

Page 41: Informática na Biodiversidade

1985

Page 42: Informática na Biodiversidade

• The first meeting of the Taxonomic Databases Working Group was held at the Conservatoire et Jardin botaniques in Geneva, from 28th to 30th September, 1985.

Page 43: Informática na Biodiversidade

Surgimento dos primeiros padrões

Page 44: Informática na Biodiversidade

O avanço mais significativo do Século!MS-EXCEL

1985 (Mac) – 1987 (Windows)

Page 45: Informática na Biodiversidade

Biodiversity (Papers from the 1st National Forum on Biodiversity, September 1986, Washington, D.C.) – Publicado em 1988

Page 46: Informática na Biodiversidade

“word cloud” criada com definições de “biodiversidade” encontradas com o Google

Page 47: Informática na Biodiversidade

(1993)

Page 48: Informática na Biodiversidade
Page 49: Informática na Biodiversidade
Page 50: Informática na Biodiversidade
Page 51: Informática na Biodiversidade
Page 52: Informática na Biodiversidade

Vicia faba

Vicia alba

Vicia adriatica

Nomes

Vicia faba

Vicia alba

Vicia adriatica

Espécie (Taxon)

Vicia alba

Vicia faba

Vicia adriatica

Vicia alba

Vicia faba

Vicia adriatica

Page 53: Informática na Biodiversidade

Ainda é um problema!

Pris, U. Conceptual Structures for Knowledge Creation and Communication Lecture Notes in Computer Science Volume 2746, 2003, pp 309-322

Page 54: Informática na Biodiversidade
Page 55: Informática na Biodiversidade

1991 1993

Page 56: Informática na Biodiversidade

1989

1992

Page 57: Informática na Biodiversidade
Page 58: Informática na Biodiversidade

1992

Page 59: Informática na Biodiversidade
Page 60: Informática na Biodiversidade

1993 1996

Page 61: Informática na Biodiversidade
Page 62: Informática na Biodiversidade

1993 / 1994

O surgimento do primeiro“Web Browser”

Page 63: Informática na Biodiversidade

• “Pauly recruited Rainer Froese, and the beginnings of a software database along these lines was encoded in 1988. This database, initially confined to tropical fish, became the prototype for FishBase. FishBase was subsequently extended to cover all finfish, and was launched on the Web in August 1996. It is now the largest and most accessed online database for fish in the world. In 1995 the first CD-ROM was released as "FishBase 100". Subsequent CDs have been released annually.”

Page 64: Informática na Biodiversidade
Page 65: Informática na Biodiversidade

1996

Page 66: Informática na Biodiversidade

1997

Page 67: Informática na Biodiversidade
Page 68: Informática na Biodiversidade
Page 69: Informática na Biodiversidade
Page 70: Informática na Biodiversidade
Page 71: Informática na Biodiversidade
Page 72: Informática na Biodiversidade

2000

Page 73: Informática na Biodiversidade
Page 74: Informática na Biodiversidade
Page 75: Informática na Biodiversidade
Page 76: Informática na Biodiversidade

2001

Page 77: Informática na Biodiversidade
Page 78: Informática na Biodiversidade

2003 - 2007

Page 79: Informática na Biodiversidade

2005

Page 80: Informática na Biodiversidade

2006

“Livro Laranja”

Page 81: Informática na Biodiversidade

2008

Page 82: Informática na Biodiversidade
Page 83: Informática na Biodiversidade

Lista de Espécie da Flora do Brasil

Page 84: Informática na Biodiversidade

2010

Page 85: Informática na Biodiversidade

Em resumo• Experimentar

– Taxonomia numérica– Início da informatização das

coleções• Informatizar

– Coleções e Herbários– Evolução dos modelos

• Publicar– Internet– Global Species Databases

• Integrar – Padrões e Protocolos

• Qualificar– “Data Cleaning”

• “Reutilizar”– SOA– “Web Services”

1960

Page 86: Informática na Biodiversidade

Onde estamos

Page 87: Informática na Biodiversidade
Page 88: Informática na Biodiversidade
Page 89: Informática na Biodiversidade
Page 90: Informática na Biodiversidade

Reunião da “Flora do Mundo On-line”16 – 18 de Julho de 2012

Missouri Botanical Garden - USA

Page 91: Informática na Biodiversidade

Padrões e protocolos maduros

Page 92: Informática na Biodiversidade

Cabeças pensantes e falantes

“…If I'd like to see one thing in biodiversity informatics in 2013 it is the emergence of a "platform" that makes the links the centre of their efforts. Because without the links we are not building "platforms", we are building silos…."

http://iphylo.blogspot.com.br/2013/01/megascience-platforms-for-biodiversity.html

Page 93: Informática na Biodiversidade

“We conclude by noting that each aggregator out there seems to want to mint its own flavor of GUIDs, perhaps as much to “brand” an identifier space as for any other reason. We wonder if this strategy of proliferating such spaces is a great idea. A huge advantage of DOIs and EZIDs is abstraction. You know what they mean and how to resolve them because they are well-known and have organizations with specific missions to support identifier creation. This strategy ensures that identifiers can persist and resolve well into the future, and be recognizable not just within the biodiversity informatics community but any other community we interoperate with: genomics, publishing, ecology, earth sciences. This is what we’re talking about when we want to break down walled gardens.”

Page 94: Informática na Biodiversidade
Page 95: Informática na Biodiversidade

Gente que faz!

Page 96: Informática na Biodiversidade

Farta documentação e guias de “boas práticas” disponível

Page 97: Informática na Biodiversidade
Page 98: Informática na Biodiversidade
Page 99: Informática na Biodiversidade
Page 100: Informática na Biodiversidade
Page 101: Informática na Biodiversidade

Presentations and documents for the conference may be found at: http://www.gbic2012.org

Unprocessed outputs from all the workshops are stored in Google Docs and may be accessed via: http://bit.ly/LLUhUb

Page 102: Informática na Biodiversidade
Page 103: Informática na Biodiversidade
Page 104: Informática na Biodiversidade

Outubro de 2012Brasil assina MoU com o GBIF

Page 105: Informática na Biodiversidade
Page 106: Informática na Biodiversidade

Para onde vamos?

Page 107: Informática na Biodiversidade

Impacto das novas Tecnologias de Informação e Comunicação na Ciência

Page 108: Informática na Biodiversidade

Citizen Science

Page 109: Informática na Biodiversidade

• 1999• Cientistas fotografam a

baleia “#1363” na costa do Brasil (Fernando de Noronha)

• 2001• Um turista fotografa a

cauda de uma baleia na costa de Madagascar

• 2009• O turista compartilha a

foto no Flickr

Page 110: Informática na Biodiversidade

Dados de migração de baleias-corcunda foram atualizados, de uma média de 3.000 milhas para 6.000 milhas

Page 111: Informática na Biodiversidade

72 Milhões de registros

Page 112: Informática na Biodiversidade
Page 113: Informática na Biodiversidade
Page 114: Informática na Biodiversidade
Page 115: Informática na Biodiversidade
Page 116: Informática na Biodiversidade
Page 117: Informática na Biodiversidade
Page 118: Informática na Biodiversidade
Page 119: Informática na Biodiversidade
Page 120: Informática na Biodiversidade

Open Science

Page 121: Informática na Biodiversidade

Robert J. Robbins ( http://www.rj-robbins.com/slides/RJR-GBIC-2012.pdf )

Estamos “Informatizando” toda a Biodiversidade?

Page 122: Informática na Biodiversidade

Fungos

Animais

Plantas

O “resto” não parece muito importante...

Page 123: Informática na Biodiversidade

Os liquens são seres vivos “muito simples” que constituem uma simbiose de um organismo formado por um fungo e uma alga ou cianobactéria.

Um líquen é uma unidade viva, mas não é um "indivíduo" como classicamente concebido. Nem pode ser decomposto em indivíduos sem a perda da sua essência e sua viabilidade.

Um líquen é um organismo composto, que não pode ser subdividido em "indivíduos" e permanecer vivo.

Como isto se encaixa com a ideia do "indivíduo", como a "unidade fundamental” da natureza?

Page 124: Informática na Biodiversidade

Ok. Mas liquens podem ser considerados casos especiais. Uma exceção à regra...

Mesmo não sendo raros....

Page 125: Informática na Biodiversidade

E os cupins?

São criticamente importantes, algumas vezes espécies dominantes em alguns ecossistemas, que não sobrevivem sem a presença de organismos simbiontes no seu aparelho digestivo.

Podemos considerar que são exceções também?

Page 126: Informática na Biodiversidade

E os mamíferos ruminantes, com sua flora microbial, capaz de digerir celulose?

Page 127: Informática na Biodiversidade

8 Junho de 2012 14 Junho 2012

E nós?

Page 128: Informática na Biodiversidade
Page 129: Informática na Biodiversidade

Figure 1 Variation in diversity. Researchers of the Human Microbiome Project are studying the microbial inhabitants of the human body, using samples taken from 242 healthy adults at 15 (for males) or 18 (for females) body sites — from the skin (four sites), mouth and throat (nine sites), vagina (three sites), nostrils and faeces (to represent the distal gastrointestinal tract). Huttenhower et al. and Methé et al. have estimated the number of microbial species and their genes in these samples, and found substantial variation in microbial community composition at different body habitats. The two groups used different counting methodologies, and their numbers vary accordingly, such that exact figures are not available. However, crude estimations of number of microbial species (red) and number of microbial genes (blue) are shown for examples of: sites containing high species diversity, such as the gastrointestinal tract and teeth (supragingival plaque); sites with intermediate diversity, such as the inside of the cheek (buccal mucosa) and nostrils (anterior nares); and sites with lower diversity, such as the vaginal posterior fornix. The authors also found substantial variation in both the diversity and the composition of the microbial communities at different sites within the same general body region.

Dentro de nós habitam cerca de 7.300 espécies diferentes.

Page 130: Informática na Biodiversidade

“Micróbios”

• Além de ser onipresente e abundantes nos organismos “macro”, procariontes ocorrem em todos os ambientes imagináveis (e talvez um pouco mais);

• Existem mais bactérias em um balde de água do mar do que mamíferos em toda a África;

• Localmente diversos – em 1g de solo existem 107-109 células procarióticas, com 2.000 – 18.000 genomas diferentes.

Isso significa dizer que em uma colher de sopa de solo, temos entre 2.000 a 18.000 espécies diferentes!

Isso é que é DIVERSIDADE!

Page 131: Informática na Biodiversidade

A noção de que podemos atingir essa meta somente olhando para esta parte é equivocada.

Se o objetivo dos estudos da biodiversidade é entender toda a diversidade na biosfera terrestre…

Precisamos documentar e entender a diversidade microbiótica.

Page 132: Informática na Biodiversidade

Taxonomical bias

Registros no GBIF mostram essa “tendência”

Page 133: Informática na Biodiversidade

Tudo isso junto. Para quê?

Page 134: Informática na Biodiversidade

O que precisamos• A aplicação de ferramentas computacionais para analisar o volume avassalador de dados

relacionado com o fato biológico, em seus escopos espaciais, temporais, biológicos, ambientais e socioeconômicos é a chave que abre a porta que leva ao conhecimento, conservação e uso sustentado e socialmente justo da biodiversidade;

• Precisamos de uma nova plataforma para lidar e, acima de tudo, integrar essa quantidade monumental de dados;

• Caminhamos muito na organização (modelos, padrões, protocolos, etc.) de dados primários de uma parte da biodiversidade;

• Caminhamos pouco no registro do fato biológico em grupos taxonômicos menos “carismáticos”;• Caminhamos muito pouco na indexação e integração de diferentes “recursos de informação”

relacionados com a Biodiversidade (bibliografia, dados socioeconômicos, histórico-culturais, etc);• Precisamos urgentemente formar recursos humanos que irão desenvolver os algoritmos, modelos e

ferramentas computacionais necessárias para organizar, integrar, analisar e oferecer os dados e informações sobre a Biodiversidade à sociedade, geradores de conhecimento, formadores de opinião, tomadores de decisão e formuladores de políticas públicas;

• Precisamos promover junto aos órgãos de fomento e as sociedades científicas uma política de premiação e reconhecimento pelo compartilhamento e qualificação de dados sobre a Biodiversidade;

• Precisamos de uma infraestrutura (inter)nacional de informação sobre biodiversidade, baseada em padrões e sistemas abertos e colaborativos, modular, escalável, baseada em serviços, e que promova a “open and networked science” de forma plena e justa.

Page 135: Informática na Biodiversidade

O Mapa:

Page 136: Informática na Biodiversidade

Eduardo DalcinInstituto de Pesquisas Jardim Botânico do Rio de Janeiro

Diretoria de PesquisasNúcleo de Computação Científica e Geoprocessamento

[email protected]

Obrigado!