31
Projeto speciesLink Objetivos originais e resultados alcançados

Projeto speciesLink Objetivos originais e resultados alcançados

Embed Size (px)

Citation preview

Page 1: Projeto speciesLink Objetivos originais e resultados alcançados

Projeto speciesLink

Objetivos originais e resultados alcançados

Page 2: Projeto speciesLink Objetivos originais e resultados alcançados

Objetivo (Fase 1) – Concepção 1999

resolver o problema da integração dos dados históricos contidos nas coleções biológicas, tornando-os amplamente disponíveis para a comunidade científica e educacional.

desenvolver aplicativos que façam uso dos dados integrados, visando criar ferramentas acessíveis a um público mais amplo.

Page 3: Projeto speciesLink Objetivos originais e resultados alcançados

Objetivos principais

(1) Implementar uma rede distribuída de informação sobre biodiversidade para o Estado de São Paulo, explorando as novas tecnologias e melhor conectividade (Internet 2) para a integração de bases de dados heterogêneas e independentes. As bases de dados a serem integradas incluirão 12 coleções biológicas do Estado de São Paulo, a rede Species Analyst e o SinBiota;

A proposta previa a repatriação de dados de subcoleções específicas fora do estado de São Paulo (no Brasil e no exterior)

Page 4: Projeto speciesLink Objetivos originais e resultados alcançados

Objetivos principais

(2) Integrar ferramentas de modelagem de nicho ecológico e de previsão de distribuição geográfica de espécies ao sistema, utilizando dados da rede distribuída descrita no item (1)

Page 5: Projeto speciesLink Objetivos originais e resultados alcançados

Objetivos principais

(3) Desenvolver aplicativos que façam uso dos dados integrados na rede de informação distribuída descrita no item (1) e dos modelos matemáticos de distribuição no item (2) para dar suporte à comunidade científica, educacional, tomadores de decisão e formuladores de políticas ambientais.

Page 6: Projeto speciesLink Objetivos originais e resultados alcançados

Requisitos esperados da rede

Disponibilidade: a rede deve estar disponível, em funcionamento sempre;

Tolerância a falhas: a rede deve ser capaz de operar quando alguns nós não estiverem funcionando;

Desempenho e Robustez: a rede deve ser capaz de processar e responder em um tempo razoável um grande número de solicitações simultâneas;

Descoberta de novos nós: a rede deve ter mecanismos automáticos ou manuais para inclusão de novos nós;

Independência de plataforma: o software deve operar em ambientes computacionais heterogêneos; e,

Escalabilidade: a rede deve ter capacidade para aumentar o número de nós, sem que seja necessário desenvolver novos componentes de software.

Page 7: Projeto speciesLink Objetivos originais e resultados alcançados

Estratégia adotada

software: livre e/ou de código aberto hardware: intel based protocolo de comunicação: participar do

desenvolvimento do DiGIR modelo de dados: adotar e participar da discussão

do modelo DarwinCore sistema on-line de acesso livre e aberto autonomia plena às coleções com relação à escolha

do software de gerenciamento e à disponibilização dos dados (entrada, correção, saída e controle de dados sensíveis feitos pela coleção)

Page 8: Projeto speciesLink Objetivos originais e resultados alcançados

Estratégia Coleções:

Pressuposto Inicial: cada coleção dispunha de um software de gerenciamento e o papel do CRIA seria o de entender o sistema e, com a mínima interferência possível, conectá-lo à rede.

Constatação: a grande maioria das coleções não tinha sistema de gerenciamento implementado e nem equipe de apoio para dar suporte a esse trabalho.

Resultado: foi necessário oferecer suporte com relação à escolha do software de gerenciamento do acervo e serviços como importação dos dados, configuração do computador, etc.

Page 9: Projeto speciesLink Objetivos originais e resultados alcançados

Estratégia repatriação de dados

A proposta original previa a implementação de bolsas para a digitalização de acervos no exterior, de interesse do país.

No entanto as grandes coleções no exterior passaram a digitalizar e disponibilizar seus dados na Internet

Optamos por investir mais no desenvolvimento de tecnologia de integração de dados ao invés de "trazer" esses dados para um servidor central.

Deu-se prioridade a bolsas para auxiliar as coleções na digitalização de seus acervos

Page 10: Projeto speciesLink Objetivos originais e resultados alcançados

Modelagem

desenvolvimento do GARP (Genetic Algorithm for Rule-set Production)em colaboração com a Universidade de Kansas

vinda do Town Peterson e Arthur Chapman produção de alguns trabalhos colaborativosCom a experiência adquirida durante o projeto a

equipe do CRIA concluiu que para tornar a ferramenta de modelagem mais útil e principalmente mais acessível aos pesquisadores, seria necessário o desenvolvimento de um ambiente que automatizasse partes do processo - openModeller

Page 11: Projeto speciesLink Objetivos originais e resultados alcançados

Resultado Fase 1

Coleção Nome Sigla Acervo Total On-line

HERBÁRIO Herbário do Departamento de Ciências Biológicas - LCB/ESALQ

ESA 80.000 730

Herbário do Estado "Maria Eneyda P. Kaufmann Fidalgo" - Instituto de Botânica (IBt)

SP 350.000 192

Coleção de Algas do Herbário do Estado "Maria Eneyda P. Kaufmann Fidalgo" - Instituto de Botânica (IBt)

SP 15.000 11.088

Herbário do Instituto Agronômico, Campinas

IAC 45.000 24.330

Herbário do Departamento de Botânica - IB/USP

SPF 133.500 20.962

Herbário da Universidade Estadual de Campinas - IB/UNICAMP

UEC 130.000 12.860

Subtotal 753.500 70.162

Page 12: Projeto speciesLink Objetivos originais e resultados alcançados

Coleção Nome Sigla Acervo Total On-line*

PEIXES Coleção de Peixes do Departamento de Zoologia e Botânica - IBILCE/UNESP

DZSJRP 23.000 5.714

Coleção de Peixes do Laboratório de Ictiologia de Ribeirão Preto - FFCLRP/USP

LIRP 30.000 4.314

Coleção de Peixes do Museu da USP MZUSP 82.000

Subtotal 135.000 10.028

ÁCAROS Coleção de Ácaros do Departamento de Zoologia e Botânica - IBILCE/UNESP

AcariDZSJRP 7.000 4.734

Coleção de Ácaros do Departamento de Entomologia, Fitopatologia e Zoologia - LEF/ESALQ

AcariESALQ 15.000 12.392

Subtotal 22.000 17.126

Page 13: Projeto speciesLink Objetivos originais e resultados alcançados

MICROGANISMOS Coleção Brasileira de Microrganismos de Ambiente e Indústria - CPQBA/UNICAMP

CBMAI 700 110

Coleção de Culturas de Fitobactérias do Laboratório de Bacteriologia Vegetal - Instituto Biológico de Campinas

IBSBF 2.000 929

Subtotal 2.700 1.039

Total Acervo 913.200 98.355

SinBiota Dados de observação de campo dos projetos do Programa Biota/Fapesp (flora, fauna e microbiota)

37.814 37.814

TOTAL GERAL 951.014 136.169

Page 14: Projeto speciesLink Objetivos originais e resultados alcançados

Proposta para a Fase 2

Ampliação da rede para 33 coleções biológicas do Estado de São Paulo.

revisão do esquema de metadados do portal DiGIR; desenvolvimento de ferramentas para o monitoramento da rede; desenvolvimento de interface para visualização geoespacial dos

resultados; desenvolvimento de ferramentas de apoio à limpeza e correção

de dados; e, disponibilização on-line de dicionários de nomes e bancos de

dados de localidade e coletores.

Nota: o desenvolvimento de um ambiente computacional para modelagem não foi aprovado

Page 15: Projeto speciesLink Objetivos originais e resultados alcançados

Padronização

ferramentas de data cleaning trabalho com coletores (botânica) houve uma breve discussão sobre

padronização de nomes de estados na lista

Page 16: Projeto speciesLink Objetivos originais e resultados alcançados

Resultados

Monitoramento

Data Cleaning

Perfil das Coleções

Informação on-line

Page 17: Projeto speciesLink Objetivos originais e resultados alcançados

Resultados

Grupo Tax.Média

reg. / mês

Média reg. /

Bolsista /mês

Total Acervo

Reg. on-line

% on-line

registros georef.

% de registros georef.

Ácaros 226 195 31.959 24.554 77% 4.472 18%

Aranhas 0   3.500 2.626 75% 0 0%

Entomologia 0 0 303.000 3.519 1% 0 0%

Abelhas 4.913 3.480 203.715 93.696 46% 76.204 81%

Mamíferos 548 913 34.063 22.955 67% 815 4%

Aves 3.271 2450 112.224 22.710 20% 8.967 39%

Peixes 81 166 128.023 97.040 76% 59.902 62%

Repteis e Anfíbios 193 544 109.389 91.936

84%7.124 8%

Herbários 694 948 1.370.885 238.997 17% 78.972 33%

Algas 109   34.776 33.809 97% 0 0%

Xilotecas 407 222 23.500 10.679 45% 80 1%

Microrganismos 26 233 2.688 1.938

72%0 0%

Totais     2.357.722 644.459 27% 236.536 37%

Sinbiota     63.588 63.588 100% 63.588 100%

Total     2.421.310 708.047 29% 300.124 42%

Page 18: Projeto speciesLink Objetivos originais e resultados alcançados

  Fase 1 Fase 2 Aumento

Ácaros 2 3 50%

Registros 17.774 24.554 38%

Aranhas   1  

Registros   2.626  

Entomologia   2  

Registros   3.519  

Abelhas   2  

Registros   93.696  

Mamíferos   3  

Registros   22.955  

Aves   2  

Registros   22.710  

Peixes 3 4 33%

Registros 10.179 97.040 853%

  Fase 1 Fase 2 Aumento

Répteis e Anfíbios   5  

Registros   91.936  

Herbários 6 12 100%

Registros 74.556 238.997  

Algas   2  

Registros   33.809  

Xilotecas   2  

Registros   10.679  

Microrganismos 2 2 0%

Registros 1.039 1.938 87%

Coleções 12 40 233%

Registros 103.548 644.459 522%

SinBiota 39.402 63.586 61%

TOTAL 142.950 708.045 395%

Page 19: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - Ácaros

Software: Biota (1), Excel (1), Excel-Biota (1)Plano digitalização:

(1) espécimes já identificados (2) organismos em estudo (pós) na conclusão dos trabalhos

1o. Organização em fichários 1o. Material já organizado

Sugestões: associação parasito – hospedeiro treinamento biota

Page 20: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - Aranhas

Software: Excel (1)

Plano digitalização:Não, tendência organização dos lotes por família

Sugestões: erros na digitação por falta de treinamento, sem uma

noção da estrutura de dados = erros (p.ex. falta de padronização dos nomes das localidades)

Bolsista é bom mas o ideal é a existência de um técnico no quadro funcional

Page 21: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - Entomológica

Software: Access, ExcelPlano digitalização:

Não, sim

Problema apontado: não existe na universidade a função de curador

Sugestões: ferramenta para gerenciar referências bibliográficas ferramenta que permitisse pesquisar organismos relacionados a

determinadas espécies ferramentas de distribuição temporal dos espécimes elaboração de um manual explicando passo-a-passo como

configurar o programa que filtra Estudar junto à Fapesp a possibilidade da criação de bolsas para

digitação de acervos para dar continuidade aos trabalhos

Page 22: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - Abelhas

Software: Excel-Access

Plano digitalização: sim: esquema inicial dos campos,vinculação das

tabelas, relacionamento dos campos

Sugestões: CRIA tivesse uma participação mais efetiva na

escolha do softwareElaboração de um programa ‘único’ pelo CRIA minicurso pré início digitaçãoMaior flexibilidade para inclusão de novos campos

Page 23: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário – Mamíferos, aves, ...

Software: Biota, AccessPlano digitalização:

inclusão seguindo a ordem crescente da numeração criação de 2 bancos de dados (roedores, aves),

definição de prioridades por ‘grupo’ (roedores, peles taxidermizadas, ...

Sugestões: treinamento Access extensão do prazo para a digitalização do acervo cursos temas relacionados ao CRIA e coleções para

crescimento profissional dos bolsistas treinamento bolsistas software de gerenciamento

Page 24: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - Peixes

Software: Biota

Plano digitalização: sim: plano geral elaborado em 2000 auxílio

pesquisa Fapesp

Sugestões: treinamento prévio do bolsista na rotina da

coleção (responsabilidade da coleção)

Page 25: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário – Anfíbios e Répteis

Software: Access, Excel-BiotaPlano digitalização:

digitalização do acervo já tombado, correção e refinamento, tombamento de outra coleção, digitalização, ...

reorganização da coleção, substituição de etiquetas apagadas, conferência dos livros de registro, inserção de novos exemplares, digitação, disponibilização no speciesLink

Sugestões: CRIA poderia contribuir mais com a escolha do software desenvolvimento de um banco de dados brasileiro, em português trabalhar mais para aprimorar o gazetteer Falta visibilidade ao projeto (comunidade científica e sociedade) ferramenta que organize os dados em gráficos (no. de exemplares e

táxons, listas de espécies por tipo de habitat) Treinamento programa Biota

Page 26: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - HerbáriosSoftware: Excel-Brahms (2), Excel, BrahmsPlano digitalização:

(1) digitalização campos mínimos; (2) imagens digitais de cada espécime; (3) digitação de todos os campos

Banco em dbase para Excel, padronização formato e campos, inclusão de novos campos (coordenadas geográficas)

Digitalização por famílias Digitalização seguindo a ordem alfabética por famílias com verificação de

“ruídos”. Durante o processo a planilha foi simplificada. Os dados serão completados em uma segunda etapa.

Sugestões: continuar com o suporte CRIA via extensão do projeto ou realização de

outro projeto Ampliar a divulgação da rede speciesLink Mais treinamento no uso do software de gerenciamento (Brahms) Ter listas de referência (atualização de nomes e autores de espécies) Desenvolver outros layers no speciesMapper (hidrografia, vegetação, ...) Na busca ‘grupo taxonômico’ não está claro – exemplos explicativos

poderiam auxiliar o usuário. Gênero é um grupo taxonômico mas tem que ser buscado em nome científico...

Incluir um sistema de ‘help’ e exemplos nas ferramentas

Page 27: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - Herbários

Software: proprietárioPlano digitalização:

Prioridade a materiais recém incluídos e daqueles solicitados para empréstimo (informatização antes de sair do acervo)

Sugestões: treinamento: uso das ferramentas speciesLink, programa de

gerenciamento das coleções, divulgação das experiências na implantação de experiências de informatização com modelos de construção de planilhas, programas para inserção de dados, etc.

ferramenta infoxy: problema de precisão das bases (país, estado, município)

Enriquecer o geoLoc com informações sobre a localização dos rios, serras e outros acidentes geográficos

Treinamento ferramentas speciesLink (openModeller) Previsão de mais equipamentos de informática para as coleções em

projetos futuros

Page 28: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário – Herbários, Algas

Software: proprietário, Brahms (2), Lantana-Brahms, AccessPlano digitalização:

contratação de empresa de digitação escolha de famílias com boa confiabilidade na identificação das espécies designação de um funcionário para digitação junto com alunos e

bolsistas para assegurar uma continuidade mínimaSugestões:

elaboração de um manual à Fapesp: a bolsa deveria ser concedida ao orientador ou coordenador e

não ao candidato – cada substituição é um processo novo Treinamento Brahms Seria importante contar com pessoas fixas e não bolsistas Problema da bolsa TT onde o tempo é descontado caso o aluno faça pós O CRIA não deveria ‘esquivar’ do papel de sugerir o melhor software a

ser utilizado Curso software de gerenciamento

Page 29: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - xilotecas

Software: Excel

Plano digitalização:sim

Problema:IPT: os projetos que não trazem receita não estão

sendo priorizados por causa da necessidade de cumprir metas de desempenho financeiro

Sugestões: treinamento Brahms

Page 30: Projeto speciesLink Objetivos originais e resultados alcançados

Respostas ao questionário - microrganismos

Software: Excel, proprietário

Plano digitalização: digitalização de acordo com o número de

entrada do microrganismo

Sugestões: treinamento nas ferramentas speciesLink

Page 31: Projeto speciesLink Objetivos originais e resultados alcançados

Uso de ferramentas

24 coleções responderam o questionário

11 não responderamdata cleaning: 20speciesMapper: 15geoLoc: 13spOutlier: 13Conversor: 10openModeller:0Banco de coletores e infoxy: 1 resposta espontânea

(não foi incluída nas opções)