73
© 2013 IBM Corporation Buscas no IBM WebSphere Portal Rodrigo Reis IT Specialist & Application Architect IBM Collaboration Solutions

Buscas no IBM WebSphere Portal

Embed Size (px)

Citation preview

Page 1: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

Buscas no IBM WebSphere Portal

Rodrigo Reis IT Specialist & Application ArchitectIBM Collaboration Solutions

Page 2: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation2

Agenda

Parte 1: Disponibilizando conteúdo do Portal na Internet

Parte 2: Como funciona o Portal Search?

Parte 3: Mudanças do Portal Search no WebSphere Portal 8

Parte 4: Integração com ferramentas de busca externas

Page 3: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

Parte 1: Disponibilizando conteúdo do Portal na Internet

Page 4: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation4

Como os motores de busca funcionam?

Os motores de busca coletam dados sobre as informações publicadas na web e constroem um enorme banco de dados que relacionam as páginas com os termos que elas contêm através de um processo de quatro etapas

Page 5: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation5

Como os motores de busca funcionam?

1. Rastreamento (Crawlling) da Web

Os motores de busca (Search engines) executam processos agendados chamados "bots" ou "spiders" que usam os links encontrados na web para "rastrear" (crawl) as páginas e documentos

2. Indexação de documentos

Uma vez que uma página tenha sido rastreada, seu conteúdo é analisado e palavras-chave são extraídas para a construção de um banco de dados de documentos que compõe o "índice" de um motor de busca

Page 6: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation6

Como os motores de busca funcionam?

3. Processamento de consultas

Quando um pedido de informação chega ao motor de busca, o motor recupera de seu índice todos os documentos que correspondem a consulta

4. Classificação (Ranking) dos resultados

Uma vez que o motor de busca determinou quais resultados correspondem a consulta, um algoritmo executa cálculos sobre cada um dos resultados para determinar o que é mais relevante para a consulta dada. Ele classifica estes resultados nas páginas de resultados, a partir do mais relevante ao menos relevante

Page 7: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation7

Desafios de crawlability no portal

Web Crawlers

Search Indexes

Page 8: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation8

Desafios de crawlability no portal

Page 9: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation9

Desafios de crawlability no portal

http://miamidade.gov/wps/portal/Main/home/!ut/p/c5/04_SB8K8xLLM9MSSzPy8xBz9CP0os3hnQ29jA38vF98wk1ALA08fD1MPLzNfAwN_c_1wkA6gCndHDxNzH6CQUZiBgZGfaXCgQWiwsYGnMUTeAAdwNND388jPTdUvyM5Oc3RUVAQAZBGxdA!!/dl3/d3/L2dBISEvZ0FBIS9nQSEh/

Page 10: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation10

Desafios de crawlability no portal

● O estado de navegação contém informações sobre o estado do portal, por exemplo, a página atual e o tema em uso. Ele também contém informações sobre estado de portlet, por exemplo, o modo de portlet (edit, view, help), estado da janela (minimized, maximized) e render parameters

● A principal razão para a inclusão de todas essas informações na URL é apoiar o bookmarking de páginas do Portal, mantendo o layout exato e estado das informações naquele momento

Page 11: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation11

Desafios de crawlability no portal

Home Página A Página C

Página B

URL A

URL B

URL C

URL D

URL E

Um crawler poderia assumir:

- URL A e URL D são diferentes

- URL B e URL E são diferentes

URLs com informações codificadas:

Page 12: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation12

Desafios de crawlability no portal

● O Portal está preparado para enfrentar os desafios de rastreamento usando “URLs Normalizadas”

● Quando o Portal reconhece que está sendo visitado por um crawler, ajusta automaticamente as URLs para cada página, retirando a maioria das informações armazenadas no estado de navegação, deixando apenas informações exigidas para exibir a página

● O Portal é pré-configurado para reconhecer cerca de cinquenta motores de busca

Page 13: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation13

Desafios de crawlability no portal

Um crawler poderia assumir:

- URL A e URL D são iguais- URL B e URL E são iguais

Home Página A Página C

Página B

URL A

URL B

URL C

URL D

URL E

URLs normalizadas:

Page 14: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation14

Sitemaps

● Mapas do Site (Sitemaps) são uma maneira fácil para webmasters informarem aos motores de busca sobre as páginas dos sites que estão disponíveis para rastreamento

● De forma simples, um Sitemap é um arquivo XML que lista os URLs de um site junto com metadados adicionais sobre cada URL para que os motores de busca possam indexar o site de forma mais inteligente

Page 15: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation15

Sitemaps

● Usar o protocolo Sitemap não garante que as páginas web serão incluídas nos motores de busca, mas ajudam os crawlers a fazer um melhor trabalho de rastreamento do seu site

● Os sites de busca sugerem apontar o crawler diretamente para um mapa do site, ou pelo menos ter um link para o mapa do site em algum lugar na página principal do site

● O IBM WebSphere Portal fornece um portlet Sitemap para ajudar no atendimento às melhores práticas recomendadas pela maioria dos motores de busca na Internet

● A melhor prática de uso do portlet Sitemap é colocar um link para ele no topo da página, por exemplo, dentro do tema Portal

Page 16: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation16

Sitemaps

● Informações adicionais, chamadas robot directives, podem ser adicionadas a uma página instruindo o crawler para não rastrear nada além do mapa do site

● As diretivas são meta dados incluídos no HTML, ou um arquivo especial robots.txt, que fornece instruções ao crawler definindo se rastrear seções do site é permitido ou proibido

● A semântica das diretivas são estruturadas. Por exemplo, pode existir um instrução para permitir /home/publico/*, mas incluir uma exceção, não permitindo /home/publico/funcionarios

● URLs do Portal são menos estruturadas, embora elas possam começar de forma estruturada e "amigável" (para bookmarking), depois de clicar em outros links as URLs se tornam mais complexas e desestruturadas

Page 17: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation17

Sitemaps

● A melhor prática para o uso de robot directives no Portal é colocá-las no tema, com a lógica para permitir ou proibir páginas individuais

Por exemplo, se o Portal tem um mapa do site, o tema poderia gerar:

<meta name="robots" content="noindex,follow">

Isso instrui o crawler a seguir todos os links da página com o mapa do site, mas não incluindo ela nos resultados. Para todas as outras páginas:

<meta name="robots" content="index,nofollow">

Esta medida assegura que as páginas serão adicionadas ao índice, mas os links não serão rastreados, uma vez que o crawler já terá feito isso através da página com o mapa do site

Page 18: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation18

Crawlability do Portal com conteúdo WCM

● Se o Portal inclui conteúdo WCM, consideração adicional é necessária para garantir a todo o conteúdo está indexado e os resultados mostram o conteúdo no contexto correto

● Se a página inclui componentes para selecionar o conteúdo (como um navegador WCM), a abordagem Sitemap e robot directives descritas anteriormente não vai funcionar bem

● Se estiver usando um navegador WCM ou qualquer outro componente que depende de request parameter, é necessário reconfigurar a maneira que o Portal apresenta URL normalizadas

Page 19: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation19

Search Engine Optimization

● Fazer um site aparecer nos resultados dos buscadores se tornou uma sub-disciplina na construção de web sites. Na verdade, uma muito madura, por isso há muita documentação, ferramentas e sites disponíveis

● Search engine optimization (SEO) é definido na Wikipedia como o processo de melhorar o volume ou a qualidade do tráfego para um site a partir de sites de busca, através de resultados de pesquisa "naturais". O oposto de Search Engine Marketing (SEM), que lida com a inclusão paga

Page 20: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation20

O Google

● O Google é responsável pela maior parte de todo o tráfego relacionado com pesquisa na Internet. De modo que começar a otimizar seu site para o Google, faz muito sentido

● O Google classifica os sites também por análise de links (PageRank), se o Google não é levado a seu site por outros sites indexados, o Google nunca irá lhe dar uma classificação alta

Page 21: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation21

Otimizando seu site para o Google

● Um dos segredos para ser bem rankeado no Google é otimizar as palavras-chave (keywords) visíveis em uma página

● A estratégia envolvendo palavras-chave tem duas etapas:

Seleção de palavras-chave: Determine quais palavras o seu público potencial pode usar para pesquisar sua página e crie palavras-chave com base nessas palavras

Otimização de palavras-chave: Aplicar essas palavras-chave em todas páginas apropriadas (de 3 a 5 palavras-chave por página é a quantidade recomendada) e otimizá-las a partir do canto superior esquerdo para baixo. Frequentemente, estas serão as 200 primeiras palavras em sua página - tags title, heading, etc

Page 22: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation22

Otimizando seu site para o Google

● Além da estratégia de palavras-chave, diversos outros fatores irão influenciar no raking do seu site no Google, a seguir são relacionadas algumas técnicas extraídas do documento:

Search Engine Optimization Starter Guidehttp://www.google.com/webmasters/docs/search-engine-optimization-starter-guide.pdf

Page 23: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation23

Otimizando seu site para o Google

Objetivos e tarefas de SEO Tarefas do PortalUtilizar a meta tag "description":- Resumir precisamente o conteúdo da página- Utilize descrições únicas para cada página

Use metadados nas páginas do Portal para permitir que os usuários finais escrever meta tags de descrição significativas

Melhorar a estrutura das URLs:- Use palavras nas URLs- Criar uma estrutura de diretório simples- Fornecer uma única versão de um URL para chegar a um documento

Use URLs amigáveis e mapeamentos de URLs para criar URLs semânticas para suas páginas

Torne seu site fácil de navegar:- Criar uma hierarquia de fluxo natural- Usar principalmente texto para navegação- Usar "migalhas" (breadcrumb) na navegação

- Mantenha a sua hierarquia de páginas o mais simples possível no Portal- Incorporar um componente de navegação (breadcrumb) nos seus temas

Page 24: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

Parte 2: Como funciona o Portal Search?

Page 25: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation25

Buscando e indexando Sites com Portal Search

● Como visto, os serviços de busca na Internet apenas incluem páginas do Portal que não necessitam de autenticação

● O Portal Search pode incluir conteúdo protegido e resultados de pesquisa adicionais de outros sistemas internos ou externos que podem complementar a pesquisa inicial

● Usuários podem encontrar conteúdo via os portlets de busca padrão ou o campo de pesquisa no tema

Page 26: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation26

Entendendo Portal Search

● O Portal Search consiste de uma variedade de portlets para administrar as atividades de pesquisa e exibir resultados de pesquisa. Além disso, existe um serviço de pesquisa que inclui uma variedade de crawlers, incluindo Portal Site, WCM e Seedlist

● Os crawlers podem interpretar mais de 250 formatos de documentos

● Crawlers podem ser agendados periodicamente e sua saída é uma coleção de busca, também conhecido como um arquivo de índice

● Usar um crawler adequado é importante

Page 27: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation27

Arquitetura do Portal Search

● O serviço de busca do Portal pode ser configurado para ser executado no Portal local, ou pode ser delegado a um ou mais servidores dedicados

● Cluster vertical não deve ser utilizado para execução do serviço de busca

● Em um ambiente de cluster horizontal, a busca remota deve ser utilizada, de outra forma nós individuais podem retornar diferentes resultados de busca

Page 28: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation28

Arquitetura do Portal Search

● A “alta disponibilidade” do Portal Search pode ser obitida através de dois métodos:

Maiores informações no artigo: http://www.ibm.com/developerworks/websphere/zones/portal/proddoc/dw-w-portalsearch/

Page 29: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation29

Arquitetura do Portal Search

● Backup e Recuperação

- Se o Portal Search detecta uma configuração de coleta corrompida ou até mesmo o indice de busca, automaticamente inicia a recuperação a partir de arquivos de backup

- Configurações para todas as coletas sofrem backup automaticamente

- A localização padrão do backup é: <wp_profile_root>/collections_config_backup/

- Ao recuperar uma configuração de coleta, crawlers associados com a coleção não serão reiniciados. Se houver crawlers agendados, eles serão executados como previsto

Page 30: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation30

Arquitetura do Portal Search

● Existem dois protocolos de comunicação disponíveis; EJB ou SOAP, que têm diferenças relacionadas à segurança

● Independentemente do protocolo utilizado, o Portal manterá sempre dois tipos de segurança:

Segurança em nível de coleção - usado para associar conjuntos com grupos de usuários autorizados. Apenas usuários autorizados podem procurar em uma coleção

Segurança em nível de documento - garante que os usuários têm devidas autorizações em páginas e portlets antes que os resultados da pesquisa sejam apresentados a eles

Page 31: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation31

Serviços, Coletas e Escopos

Serviço de Busca A

Serviço de Busca B

Page 32: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation32

Serviços, Coletas e Escopos

Serviço de Busca A

Serviço de Busca B

Coletas de Busca

Page 33: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation33

Serviços, Coletas e Escopos

Serviço de Busca A

Serviço de Busca B

Portal Crawler

WCM Crawler

Web Crawler

Portal Crawler

WCM Crawler

Web Crawler

Coletas de Busca Fontes de Busca

Page 34: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation34

Serviços, Coletas e Escopos

Serviço de Busca A

Serviço de Busca B

Portal Crawler

WCM Crawler

Web Crawler

Portal Crawler

WCM Crawler

Web Crawler

Escopo de Busca 1

Escopo de Busca 2

Coletas de Busca Fontes de Busca

Page 35: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation35

Interfaces de Busca e Administração

● Centro de Procura

- Este portlet é utilizado para exbir resultados de pesquisa a partir de multiplas coletas e disponibliza recursos como type-ahead

- O usuário também pode fazer uma pesquisa a partir da caixa de pesquisa do tema Portal, e será redirecionado para uma página contendo este portlet

- Os resultados são apresentados, junto com resumo e classificação para cada um

Page 36: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation36

Interfaces de Busca e Administração

● Links Sugeridos

- Este portlet pode ser configurado para exibir resultados de pesquisa recomendadas com base em palavras-chave digitadas na solicitação de pesquisa

- Os administradores podem mapear manualmente as principais fontes de informação / documentos para procurar termos, e entregar resultados prioritários para os usuários

- Os resultados são exibidos ao lado dos resultados de busca de outros portlets de pesquisa.

Page 37: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation37

Interfaces de Busca e Administração

● Resultados da Procura Externos

- Este portlet pode ser usado para exibir os resultados de pesquisa obtidos a partir de um serviço de busca interno ou externo

- O serviço de busca deve fornecer uma interface Web pública e devolver o resultado da pesquisa como um feed RSS ou Atom

- Os resultados são exibidos ao lado dos resultados de busca de outros portlets de pesquisa

- Páginas de resultado em HTML não podem ser processadas pelo portlet

Page 38: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation38

Interfaces de Busca e Administração

● Gerenciar Procura

Através deste portlet são feitas todas configurações e gestão de serviços de busca, coletas e escopos, para busca local ou remota

Page 39: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation39

Interfaces de Busca e Administração

● Componente de Busca

- Este não é um portlet, mas um componente WCM que permite que os resultados da busca possam ser incorporados em conteúdo ou modelos de WCM

- O componente está configurado para apresentar os resultados de uma coleção de pesquisa do Portal

- É muito útil para sites baseados em conteúdo WCM

Page 40: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation40

Portal Search API

● O Portal fornece o Search and Index API (SIAPI), que pode ser usado para desenvolver portlets de pesquisa personalizados para realizar operações de busca e indexação.

● Além da SIAPI, uma interface RESTful pode ser utilizada para retornar resultados de pesquisa. Um pedido REST é feito através de HTTP e uma variedade de parâmetros estão disponíveis

Exemplo de uma consulta simples:http://www.<hostname>:<port>/searchfeed/myportal/search?query=testresults=10

Artigo sobre uso do Search REST API:http://www-10.lotus.com/ldd/portalwiki.nsf/dx/Leverage_Search_Expierence_based_on_Portal_Search_REST_API

Page 41: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation41

Seedlist framework

● Ao configurar uma fonte de conteúdo para rastrear conteúdo WCM ou Portal, um seedlist é gerado automaticamente pelo Portal

● Um seedlist é como uma extensão de um mapa do site e é baseado no Atom Syndication Format [RFC4287]

● A IBM fornece um White paper e código fonte para facilitar a criação de seedlists para qualquer tipo de repositórios de conteúdo

● Fontes de conteúdo adicionais podem ser adicionados ao Portal para rastrear um novo feed seedlist, e adicionar os documentos para a coleta de busca

Page 42: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

Parte 3: Mudanças do Portal Search no WebSphere Portal 8

Page 43: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation43

Coletas e Origem de Conteúdos padrões

● Coleta de Procura

● Default Search Collection

● JCRCollection1

Page 44: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation44

Fontes de Conteúdo em Portais Virtuais

● Portal crawler: http://<hostname>:<port>/wps/seedlist/myserver/<virtualPortalContext>?Source=com.ibm.lotus.search.plugins.seedlist.retriever.portal.PortalRetrieverFactory&Action=GetDocuments&Range=100

● WCM crawler : http://<hostname>:<port>/wps/seedlist/myserver/<virtualPortalContext>?SeedlistId=&Source=com.ibm.workplace.wcm.plugins.seedlist.retriever.WCMRetrieverFactory&Action=GetDocuments

● JCR crawler: http://<hostname>:<port>/wps/seedlist/server?Action=GetDocuments&Format=ATOM&Locale=en_US&Range=100&Source=com.ibm.lotus.search.plugins.seedlist.retriever.jcr.JCRRetrieverFactory&Start=0&SeedlistId=3@OOTB_CRAWLER3

Page 45: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation45

Fonte de conteúdo

● Reunir documentos da Fonte de Conteúdo

Isso exclui todos os documentos existentes a partir da fonte de conteúdo especificada e, em seguida, começa um rastreamento completo

Page 46: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation46

Mudanças no portlet Centro de Procura

● Seedlist – Configuração da Origem de Conteúdo

- A guia Parâmetros Gerais foi modificada:

Menos opções de configuração (opções como: "Os níveis de links a seguir", "Número de documentos para coletar", "Pare de coleta depois", "Ligações expiram após" - foram removidos e existe somente para origem de conteúdo Web)

- Guia Filtros removida

Novo timeout

Page 47: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation47

Mudanças no portlet Centro de Procura

- Planejadores, apenas um agendamento pode ser definido

Sem opção para criar novo agendamento

Page 48: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation48

- Portlet Busca e Navegação migrado para o Centro de Procura

- A opção de editar Metadados foi removida

Portal 7: Portal 8:

- Removido “Carregar documento manualmente para coleta”

Portal 7: Portal 8:

Mudanças no portlet Centro de Procura

Page 49: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation49

Search Engine atualizado

● Foram adicionados novos arquivos jar na pasta /PortalServer/search:

● Como resultado, os traces de rastreamento foram alteradas de com.ibm.crawler. * = All para com.ibm.lotus.search.engine. * = All

Page 50: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation50

Links Sugeridos e serviço Tagging & Rating

● O administrador pode associar recursos do Portal com palavras-chave

Como um substituto para "atualização de metadados" (palavras-chave) que foi removido do Centro de Procura

Page 51: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation51

Links Sugeridos e serviço Tagging & Rating

● Usuários finais podem pesquisar e obter links sugeridos na página de pesquisa principal:

Portlet Links Sugeridos

Page 52: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation52

Links Sugeridos e serviço Tagging & Rating

● O administrador pode visualizar os links Tagging & Rating filtrados pela categoria "Links sugeridos"

Para ver a opção "Links Sugeridos", acesse "Editar Configurações Compartilhadas" do portlet Tags e escolha "Links sugeridos"

Palavras-chave adicionadas a Link Sugeridos

Opção Links sugeridos

Page 53: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation53

Crawling bibliotecas WCM

● Por padrão, o WCM crawler rastreia todas as bibliotecas existentes. Isto é feito, deixando o parâmetro SeedlistId vazio: &SeedlistId=&Format=...

● Se o administrador desejar criar um crawler que rastreia apenas uma biblioteca específica, pode fazer usando o nome da biblioteca como parâmetro: &SeedlistId=mylibrary&Format=...

● É possível definir seedlist em mais de uma biblioteca, usando vírgula como separador: &SeedlistId=myLibrary1,myLibrary2&Format=...

Para maiores informações: http://www-10.lotus.com/ldd/portalwiki.nsf/dx/Seedlist_1.0_REST_service_API_wcm7

Page 54: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation54

Tornando um conteúdo do Portal não pesquisável

● Existe uma propriedade no portlet que deve ser adicionada ou atualizada

- Se "INCLUDE_IN_SEARCH_INDEX = true" é definido para um portlet específico, este é adicionado à lista de portlets que devem ser indexados

- Por padrão, o parâmetro não existe, se você quiser que o portlet não seja procurado, precisa adicionar esta propriedade com valor false

Page 55: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation55

Tornando um conteúdo WCM não pesquisável

● No portlet de Autoria do WCM, você pode clicar em um conteúdo e excluí-lo da seedlist. Isto pode ser feito através de modelo de autoria. Para ver essa opção, você precisa clicar em "Mostrar campos ocultos".

Por padrão é pesquisável

Page 56: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation56

Portlet Procura e Navegação removido

● Como visto anteriormente, o portlet Procura e Navegação não existe no Portal 8

● Como substituto para a busca avançada que ele oferecia, o portlet Centro de Procura pode ser usado

- Os filtros personalizados foram adicionados ao Centro de Procura

- Configure o portlet Centro de Procura e altere o valor do parâmetro displaySearchFilters para true. Isso permitirá seus usuários relizar buscas por filtros de metadados. Por padrão, título e descrição são fornecidos como filtros de pesquisa.

Page 57: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation57

Atualização do portlet Centro de Procura

● Ordenar por data

Page 58: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation58

Atualização do portlet Centro de Procura

● Busca utilizando tagsPesquisando com tags

Tags nos resultados

Page 59: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

Parte 4: Integração com ferramentas de busca externas

Page 60: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation60

Comentários gerais sobre integração

● Posso integrar “meu” motor de busca com o Portal?

● Portal fornece frameworks que permitem utilização de motores de busca externos

- Um framework para consumir Portal e outros recursos como WCM e IBM Connections (incluindo suporte a "segurança")

- Um framework para acessar um serviço de busca para realizar pesquisas

- Portlet que permite adicionar um serviço de busca e exibir os resultados

● Autonomy já fornece o "IBM Connector" (seedlist rastreador)

● Google Search Appliance está chegando lá com o seu 'feed crawler " mas ainda não é compatível

Page 61: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation61

Tecnologia de busca embutida

● O motor de busca dentro do WebSphere Portal oferece uma solução de entrada, adequada para a pesquisas através de Sites e Conteúdos gerenciados de tamanho moderado. Ideal para pequenas e médias instalações do WebSphere Portal

● Algumas limitações do Portal Search:

- Capacidade de pesquisa limitada a menos de 800 mil documentos por índice

- Sem suporte nativo a alta disponibilidade

- Sem suporte a busca semântica

Page 62: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation62

Precisa de uma busca mas poderosa?

● Tecnologias de busca IBM:

- Busca básica - Portal Search

- Busca avançada - IBM Content Analytics com Enterprise Search

open source Lucene

IBM Lucene Extension Library

Portal Search

IBM Content Analytics with Enterprise Search

IBM Search REST

Page 63: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation63

IBM Content Analytics com Enterprise Search

● Experiência de usuário

● Navegação de alto desempenho● Salvar pesquisas● Perfis de busca● Pre-visualização de documentos● E muito mais ...

● Experiência administrativa

● Maior escalabilidade● Suporte à indexação incremental● Flexíbilidade scale-out & HA● Opções de ajuste de relevância● E muito mais ... Auto completar:

- Termos sugeridos baseado no indice e buscas anteriores- Customizável pelos Administradores

Page 64: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation64

ICA – Suporte a dezenas de fontes de conteúdo

• IBM Case Manager V5.0• IBM Lotus Connections 2.5,

3, 4 and 4.5• IBM Lotus Domino DM 6.5.1,

7.0, • IBM Lotus Domino R7, R8,

R8.5 and R9• IBM Lotus Quickr (NSF &

J2EE), 8.1, 8.2 and 8.5• IBM Web Content

Management 6.1, 7 and 8• IBM WebSphere Portal 6.1, 7

and 8

•DB2 for iSeries 5.4 and 6.1•DB2 UDB for Linux, UNIX,

Windows 9.1, 9.5 and 9.7•DB2 for z/OS 8.1, 9.1• IMS 10.0 and 11.0.1• Informix Dynamic Server

11.10 and 11.50•Microsoft SQL Server 2005,

2008•MySQL 5.0•Oracle 10g and 11g•Software AG Adabas 7.1 •Sybase 11.9.2, 12.0, 12.5x

Colaboração

• IBM Case Manager V5.0• IBM Content Manager

Enterprise Edition 8.4, 8.4.1, 8.4.2

• FileNet Content Services 5.4, 5.5

• FileNet P8 Content Manager 4.0, 4.5, 4.5.1 and 5.0

•Hummingbird DM 5.1.0.5 with SR6 and 6.0.4

•EMC/Documentum 6.0 and 6.5

•CA-Datacom 10•Open Text Livelink Enterprise

Server 9.6, 9.7 and 9.7.1

Gerenciamento de Dados

Outras fontes

•Microsoft Exchange Server 2003

•Microsoft Windows SharePoint Services 3.0

•SharePoint Server 2003 SP2, 2007, 2010 Farm Support

•Windows file systems: 2003 and 2008 servers

•Network News Protocol Newsgroup

•UNIX file systems•VSAM for z/OS 1.4•Web (HTTP or HTTPS)

Gerenciamento de Conteúdo

Page 65: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation65

Integração do Centro de Procura com o ICA

Page 66: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation66

IBM Content Analytics portlets

Page 67: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation67

Integração com IBM Connections

● Opção 1 – Use seedlists do IBM Connections para rastrear seus repositórios

- Uma seedlist por tipo de recurso, por exemplo, Wiki, blogs, perfis, arquivos, etc.

● Opção 2 – Integrar a busca do IBM Connections com o Centro de Procura do Portal

- use o recurso 'Remote Content Search Service "(RCSS) para registrar a busca do Connections como um serviço de busca

- IBM Connections e WebSphere Portal (e ICA) utilizam a IBM Search REST API

Page 68: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation68

Page 69: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation69

Dúvidas?

Page 70: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

Para saber mais...

WebSphere Portal and IBM Web Content Manager Information Centerhttp://www.ibm.com/developerworks/websphere/zones/portal/proddoc.html

WebSphere Portal and Web Content Manager Business Solutions Cataloghttps://greenhouse.lotus.com/catalog/

WebSphere Portal developerWorks forumhttp://www.ibm.com/developerworks/forums/forum.jspa?forumID=168

The WebSphere Portal wikihttp://www-10.lotus.com/ldd/portalwiki.nsf/xpViewCategories.xsp?lookupName=IBM%20WebSphere%20Portal%208%20Product%20Documentation

IBM Redbooks® publicationshttp://www.redbooks.ibm.com/portals/websphere

Page 71: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

Referências

Understanding the Essentials of IBM Web Experience software Search services, Excepcional Web Experience 2013 Americas - Todd Leyba, Andreas Prokoph

Integrating Search with WebSphere Portal – Best Practices, IBM Portal Excellence Conference - Andreas Prokoph

Creating External Facing Web Sites with WebSphere Portal - Adam de Leeuw, Ali Beklen, David Axinn, Fanie Korff, Graham Wallace, Janice Taylor, JP Thambuganipalle, Projjwal Saha, Rajaguru Balagurusamy, Raul Munoz Serrano, Bart Jacob

High availability options for IBM WebSphere Portal 6.1 search - Andreas Prokoph, Eitan Shapiro

Page 72: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

Obrigado!!!

Rodrigo [email protected]

IT Specialist & Application Architect IBM Collaboration Solutions

Page 73: Buscas no IBM WebSphere Portal

© 2013 IBM Corporation

© IBM Corporation 2013. All Rights Reserved.

The information contained in this publication is provided for informational purposes only. While efforts were made to verify the completeness and accuracy of the information contained in this publication, it is provided AS IS without warranty of any kind, express or implied. In addition, this information is based on IBM’s current product plans and strategy, which are subject to change by IBM without notice. IBM shall not be responsible for any damages arising out of the use of, or otherwise related to, this publication or any other materials. Nothing contained in this publication is intended to, nor shall have the effect of, creating any warranties or representations from IBM or its suppliers or licensors, or altering the terms and conditions of the applicable license agreement governing the use of IBM software

.

References in this presentation to IBM products, programs, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities referenced in this presentation may change at any time at IBM’s sole discretion based on market opportunities or other factors, and are not intended to be a commitment to future product or feature availability in any way. Nothing contained in these materials is intended to, nor shall have the effect of, stating or implying that any activities undertaken by you will result in any specific sales, revenue growth or other results.

Performance is based on measurements and projections using standard IBM benchmarks in a controlled environment. The actual throughput or performance that any user will experience will vary depending upon many factors, including considerations such as the amount of multiprogramming in the user's job stream, the I/O configuration, the storage configuration, and the workload processed. Therefore, no assurance can be given that an individual user will achieve results similar to those stated here.

Adobe, the Adobe logo, PostScript, and the PostScript logo are either registered trademarks or trademarks of Adobe Systems Incorporated in the United States, and/or other countries.

Java and all Java-based trademarks are trademarks of Sun Microsystems, Inc. in the United States, other countries, or both.

Microsoft and Windows are trademarks of Microsoft Corporation in the United States, other countries, or both.

ries in the United States and other countries.

Linux is a registered trademark of Linus Torvalds in the United States, other countries, or both. Other company, product, or service names may be trademarks or service marks of others.

All references to OpenFinancial, Greenwell and Open Bier refer to a fictitious company and are used for illustration purposes only.