24
Università degli Studi di Milano Bicocca Dipartimento di Informatica, Sistemistica e Comunicazione Corso di Strumenti e applicazioni del Web 10. Ricercare nel Web (Parte II) Roberto Polillo Edizione 2014-15

Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo

Embed Size (px)

Citation preview

Università degli Studi di Milano BicoccaDipartimento di Informatica, Sistemistica e Comunicazione

Corso di Strumenti e applicazioni del Web

10. Ricercare nel Web (Parte II)

Roberto Polillo

Edizione 2014-15

2

Queste slides fanno parte del corso “Strumenti e applicazioni del Web”. Ilsito del corso, con il materiale completo, si trova inwww.corsow.wordpress.com . Data la rapida evoluzione della rete, il corsoviene aggiornato ogni anno.

Il presente materiale è pubblicato con licenza Creative Commons“Attribuzione - Non commerciale - Condividi allo stesso modo – 3.0”(http://creativecommons.org/licenses/by-nc-sa/3.0/it/deed.it ):

La licenza non si estende alle immagini provenienti da altre fonti ealle screen shots, i cui diritti restano in capo ai rispettivi proprietari,che, ove possibile, sono stati indicati. L'autore si scusa per eventualiomissioni, e resta a disposizione per correggerle.

R.Polillo - Marzo 2015

Queste slides

Motori di ricerca: struttura

R.Polillo - Marzo 2015

3

InterfacciaQuery

processing

Rankingdei risultati

Query

Risultati

(SERP)

Front-end process

Indici + cached pages

CrawlerCrawler

IndicizzatoreCrawler

Richieste

Pagine

web

Pagine

webWWW

Back-end process

Semplificando al massimo…

R.Polillo - Marzo 2015

4

URL PAGINE

CACHE

Keyword URLs

INDICE

IndicizzatoreCrawler

Query processing

E’ possibile vedere le pagine cashed(Google search)

R.Polillo - Marzo 2015

5

http://www.digitaltrends.com/computing/directly-access-google-cached-pages/#!BqSUt

Ranking

Gli utenti considerano di solito solo i risultati nella prima SERP

i risultati devono essere presentati in ordine di rilevanza

il successo di un motore di ricerca è fortemente legato al suo algoritmo di ranking

R.Polillo - Marzo 2015

6

Google PageRank

Algoritmo sviluppato da S.Brin e Larry Page nella loro tesi di PhD a Stanford (progetto BackRub, 1995-96), brevettato a nome della Stanford University

L'idea: la "importanza" di una pagina Web è tanto maggiore quante più sono numerose e importanti le pagine Web che la linkano

S.Brin, L.Page, “The anatomy of a large-scale hypertextualWeb search engine”

In sostanza, è il meccanismo con cui vengono valutati i paper accademici

1998: Brin e Page fondano Google Inc

R.Polillo - Marzo 2015

7

PageRank: esempio8

R.Polillo - Marzo 2015

PageRank: esempio9

R.Polillo - Marzo 2015

71

1

61

1

PageRank: esempio10

http://en.wikipedia.org/wiki/PageRank

R.Polillo - Marzo 2015

L’algoritmo: altri criteri

Google utilizza oltre 200 criteri per il ranking delle pagine

I criteri sono segreti e in continua evoluzione

Esempi:

Parole chiave nella pagina (titolo, header, testo …)

Età del sito

Qualità dei contenuti

Ranking fra i siti di analogo argomento

Numero di accessi via URL della pagina

Numero di accessi da parte di chi cerca

Tempo speso sulla pagina dagli utenti

….

R.Polillo - Marzo 2015

11

SEO / SEM

SEO: Search Engine OptimizationMetodi e tecniche per migliorare il ranking di un sito Web, per i vari motori di ricercahttp://http://en.wikipedia.org/wiki/Search_engine_optimization

SEM: Search Engine MarketingAttività di promozione di un sito Web per migliorarne il ranking dei motori di ricercahttp://en.wikipedia.org/wiki/Search_engine_marketing

Page rank checker: esempio:http://www.whatsmypr.net

R.Polillo - Marzo 2015

12

SEM/SEO13

La posizione (rank) in cui un sito viene mostrato dal motore di ricerca èestremamente importante (chi ricerca utilizza le prime posizioni, e non guarda oltrela prima pagina)

Molti specialisti indipendenti offrono servizi di consulenza affinchè il sito clienteacquisisca un buon rank (SEM/SEO: Search Engine Marketing / Search EngineOptimization)

Le tecniche usate non sono sempre corrette: per es. vengono creati siti compostisolo da link per far “salire” i siti che pagano

Periodicamente Google aggiorna gli algoritmi del motore per penalizzare quello checonsidera spamming da parte degli specialisti SEM/SEO

http://www.google.it/support/webmasters/bin/answer.py?answer=35291&hl=it

R.Polillo - Marzo 2015

Risultati della ricerca: non solo link

Provate a cercare (su Google e Bing):- weather Milano- time San Francisco- sunrise New York- 5*9+(sqrt 10)^3=- Ernest Hemingway- Population Milan- define philosophy- ristoranti 20143- movies 20143- mappa 20143- mappa corso italia 6 milano- concessionari Fiat- ….

R.Polillo - Marzo 2015

14

Search engine → Answer engine

Google: quali servizi di ricerca?

R.Polillo - Marzo 2015

15

Marzo 2013

Google: quali servizi di ricerca?

R.Polillo - Marzo 2015

16

Google: quali servizi di ricerca?

R.Polillo - Marzo 2015

17

Google: quali servizi di ricerca?

R.Polillo - Marzo 2015

18

Search history

La search history di ciascuno viene salvata nella ”search history" (Google, Bing)

(Non confonderla con la cronologia Web, che è raccolta dal browser)

È possibile cancellare singoli elementi, o tutti

R.Polillo - Marzo 2015

19

Search history in Google: entrare nel proprio account, ed entrare nella "dashboard”, e…. guardate quello che Google sa di voi

La coda lunga delle ricerche

R.Polillo - Marzo 2015

20

Search terms

Fre

qu

en

za

Alta frequenza, bassa

probabilità di trovare

l’informazione desiderata

Bassa frequenza, alta probabilità di

trovare l’informazione

“negozi scarpe uomo centro milano”

Google Trends (www.google.com/trends)

R.Polillo - Marzo 2015

21

Vedi

http://www.google.com/trends/topcharts?date=2014

SERP: struttura tipica

R.Polillo - Marzo 2015

22

Search box

Risultati sponsorizzati

Opzioni per la ricerca

Risultati "organici"

(non influenzati dalle

sponsorizzazioni)

Google:AdWords

Google search: per saperne di più

Help di Google: http://support.google.com/websearch

Wikipedia:http://en.wikipedia.org/wiki/Google_Search

R.Polillo - Marzo 2015

23

Lavoro individuale

Esplorare accuratamente le funzioni del motore di ricerca di Google, [e confrontarle con quelle di Bing]

Esplorare la propria dashboard (nel proprio account Google), e verificare quali informazioni sulla vostra storia sono memorizzate (importantissimo!)

Esplorate www.wolframalpha.comGuardate che cosa Wolfram alpha vi dice della VOSTRA attività su Facebook cercare su Google: wolfram personal analytics

R.Polillo - Marzo 2015

24