45
1 Google Så god som forventet? Foredrag holdt ved «Treffpunkt Mikromarc» Stockholm 3-4. November 2016 Roar Storleer NTNU UB - Staben

Roar Storleer: Google - Så god som forventet?

  • Upload
    vkp1970

  • View
    304

  • Download
    8

Embed Size (px)

Citation preview

Page 1: Roar Storleer: Google - Så god som forventet?

1

GoogleSå god som forventet?

Foredrag holdt ved

«Treffpunkt Mikromarc»

Stockholm 3-4. November 2016

Roar Storleer

NTNU UB - Staben

Page 2: Roar Storleer: Google - Så god som forventet?

2

U Universitetsbiblioteket

• Roar Storleer

[email protected]

• tel.: 73 59 51 23

• mob: 918 97 049

• adr.:

• NTNU UB Staff

• Høgskoleringen 1

• 7491 Trondheim

Page 3: Roar Storleer: Google - Så god som forventet?

[email protected]

Hvilke søkeverktøy

benytter du for å finne

kvalitets-sikret

informasjon?

Page 4: Roar Storleer: Google - Så god som forventet?

4

Hvilke søkeverktøy skal jeg velge?

Page 5: Roar Storleer: Google - Så god som forventet?

5

Smørbrødliste for vellykket resultat:

1. Forstå spørsmålet/analyser problemstillingen

2. Finne fram til signifikante søkeord.

TENK i SYNONYMER

3. Velge riktig søkeverktøy

4. Vite hvordan du utnytter det aktuelle

søkeverktøyets muligheter

5. Lage en god søkeprosedyre

6. Evaluere den funne informasjon om den er:

Sann

Pålitelig

Troverdig

Objektiv

Nøytral

Seriøs

Page 7: Roar Storleer: Google - Så god som forventet?

7

Bygge søkeprosedyre

• Trunkering – maskering av karakterer (*, ?, #,!)

• Logiske operatorer (NOT, AND og OR)

• Nærhetsoperatorer/avstandsoperatorer

(NEAR/x, ONEAR/x, PRE/x, W/x, Nx, Wx,

AROUND(x)

• Feltkodesøking (TI, AU, JN, LA, DE, ID, ..)

• Frasesøking (” ”)

07.11.2016

Page 8: Roar Storleer: Google - Så god som forventet?

8

Hva har Google?

• Trunkering – maskering av karakterer/ord: (/*)

• Logiske operatorer: (NOT (-), AND (default) , OR)

• Paranteser:

• Nærhetsoperatorer/avstandsoperatorer: (NEAR/x,

ONEAR/x, PRE/x, W/x, Nx, Wx, AROUND(x) ????

• Feltkodesøking:(TI (intitle), AU, JN, LA, DE, ID, ..)

• Frasesøking (” ”)

Søkemuligheter i noen SM: http://extremesearcher.com/chart1.html

Page 9: Roar Storleer: Google - Så god som forventet?

9

Google søketips forts

• Foreslår søketermer når du er usikker på stavemåten (Instant)

• Kan maskere ord i flerordssøk med (*) wildcard, men har IKKE trunkering/maskering

• Stoppord og logiske operatorer søkes ut med ”xxx”

• «XX» søker eksakt (ikke synonymer/flertalls s/ordstammer)

• ” ” og –

• Synonymsøk: med ” ~” foran ord eg.: ~food (er fjernet)kan IKKE lengre søke på alle synonymer til food, men ikke food : ~food -food

• Intervallsøk: alt som har med tall, mengder, år, avstander, temperaturer, vekter, avstander, priser…med ”..” mellom intervall eg: 1958..1972; $200..$300 mm

07.11.2016

Page 10: Roar Storleer: Google - Så god som forventet?

10

Proximity virker IKKE i Scholar

AROUND(x) er foreldet

07.11.2016

Page 11: Roar Storleer: Google - Så god som forventet?

11

Bing/Yahoo!

• Yahoo bruker nå Bing’s database,

kommandoer og rangeringsalgoritme

• Ikke noe Avansert søke side – bruk kommandoer

• Liste over kommandoer:

http://msdn.microsoft.co/en-us/library/ff795620.aspx

• filetype: site: inboady: inurl:

• AND, NOT, OR og paranteser for komplekse søk

• Proximity; NEAR:n

07.11.2016

Page 12: Roar Storleer: Google - Så god som forventet?

[email protected]

GOOGLE (Gogool = 10100

)Wikipedia: 6x1079 atomer i hele universet

Kort historikk:

• Utviklet av Sergey Brin og Larry Page ved Stanford

University

• Basiside: Webs lenkestruktur som en stor graf

• Satt i drift i mars 1996, lansert 4. sept 1997, men

regner virkelig oppstart fra 27. sept 1998

• Hoved-ide for kvalitet: lenkesiteringer (PageRanking)

• Verbet å ”google” ble lagt til Merriam Webster Collegiate Dictionary

and the Oxford English Dictionary in 2006

• kilde: Wikipedia: http://en.wikipedia.org/wiki/History_of_Google

Page 13: Roar Storleer: Google - Så god som forventet?

1307.11.2016

Page 14: Roar Storleer: Google - Så god som forventet?

[email protected]

Så - her er vidunderet:

Page 15: Roar Storleer: Google - Så god som forventet?

15

- tjenester

07.11.2016

+ enda mer

Page 16: Roar Storleer: Google - Så god som forventet?

1607.11.2016

Page 17: Roar Storleer: Google - Så god som forventet?

17

Hva skjer – Google

søking?1. Web er lik en stor bok

med milliarder av sider

og de må indekseres.

Brukt millioner av

timer å bygge opp

indeksen

2. Søkespørsmål reiser

2400 km for å finne

svar og lister forslag og

tips ved feilstaving =

Google Instant

3. PageRanking: sist

oppdatert, linking, ord i

nettside, proximity,

stavelseskontroll,

synonymer, URL og

tittel, personalisering,

Innholdskvalitet, anbef.

av venner, beste

resultat nettside, bilde,

video, nyhet osv

4. Resultatet

5. Tid: 1/10 sek i gj.snitt

Page 18: Roar Storleer: Google - Så god som forventet?

18

Noen tall

• Google Instant bruker i gjennomsnitt 1/10 sek

på hvert spørsmål

• Milliarder av søk hver dag

• Siden 2003 har Google besvart >600

milliarder nye unike spørsmål som ikke har

vært besvart før

• 16% av alle daglig søkinger er nye

Page 19: Roar Storleer: Google - Så god som forventet?

19

Kriterier for utvalg?Googles spider Googlebot finner nettsider og følger lenkene til

nye nettsider osv

Mer enn 200 kriterier for utvalg

• Ord forekommer i tittel

• Ord forekommer i URL

• Ordene står ved siden av hverandre

• Inneholder sidene synonymer

• Er sidene fra «kvalitets»-institusjoner?

• Er sidene «PageRanked»

• Annerkjente sider som lenker til aktuell side

Page 20: Roar Storleer: Google - Så god som forventet?

20

Kriterier for utvalg? forts

• Dokumenter med flest søketermer

• Hyppighet av termer i forhold til

størrelse på dokument

• Termenes innbyrdes avstand

• Står termene i tittel eller første avsnitt

• Metadata (Dublin Core)

07.11.2016

Page 21: Roar Storleer: Google - Så god som forventet?

21

PageRank

07.11.2016

• PageRank er en algoritme for å rangere nettsteder i deres

søkemotor resultater

• PageRank er oppkalt etter Larry Page, en av

grunnleggerne av Google

• Pagerank er en måte å måle betydningen av nettsidene

• PageRank fungerer ved å telle antallet og kvaliteten av

lenker til en side for å finne et grovt anslag over hvor viktig

nettsiden er

• Den underliggende antakelsen er at viktige nettsteder

sannsynligvis får flere linker fra andre nettsteder.

Page 22: Roar Storleer: Google - Så god som forventet?

22

Personalisering

• Hva jeg ser på min skjerm er ikke det samme som du ser på

din skjerm, og er heller ikke det samme som dine kollegaer

ser på deres skjermer, og er ikke det samme som dine

brukere ser.

• Google Scholar er mer konsistent

07.11.2016

Page 23: Roar Storleer: Google - Så god som forventet?

23

Ting du bør vite om Google

• Google bruker personalisering og logger all din bruk på

tvers av Google-plattformene

• Kan slåes av/på ved

eller å logge seg av eller ikke logge på

07.11.2016

Page 24: Roar Storleer: Google - Så god som forventet?

24

Hva samler Google på av data?

Page 25: Roar Storleer: Google - Så god som forventet?

25

Google og personvernet

• bruker opplysningene til å gi våre brukere verdifulle produkter og tjenester

• utvikler produkter som er basert på omfattende personvernstandarder og -praksis

• gir brukerne innsyn i hvilke personlige opplysninger vi samler inn

• gir brukerne en rimelig mulighet til å beskytte sitt personvern

• håndterer opplysningene vi får tilgang på med største forsiktighet, slik at du kan føle deg trygg

[email protected]

Page 26: Roar Storleer: Google - Så god som forventet?

26

Google - Boolsk søking!• (sykkeltur OR båttur) AND (Norge OR Sverige) NOT Danmark

07.11.2016

Page 27: Roar Storleer: Google - Så god som forventet?

2707.11.2016

Page 28: Roar Storleer: Google - Så god som forventet?

28

Søketeknikk – Google • dog OR pet

• cat food

• sukkerveien Norge OR Sverige

• hoteller oslo OR camping stockholm (1.800.000)

• hoteller AND Oslo OR camping AND Stockholm (14.700.000) – funker ikke

• sykkeltur OR båttur norge OR sverige -danmark

• museer trondheim OR ålesund OR kristiansund –oslofunker ikke

• Kan ikke søke på A OR (B AND C) OR D da OR har høyestprioritet

• «average size of octipus is 18 inch» (ikke slik) dropp størrelsen

Page 29: Roar Storleer: Google - Så god som forventet?

29

norge bil OR båt sverige funker ikke

07.11.2016

Page 30: Roar Storleer: Google - Så god som forventet?

30

Google søketips forts

• Ingen skjulte operatorer

• Verbatim for eksaktsøk

• Kan IKKE fjerne dubletter i GS

• GS – eksportfunksjon til EndNote, BibTex mm

• De fleste spesialtegn er med noen få unntak ikke søkbare

07.11.2016

Page 31: Roar Storleer: Google - Så god som forventet?

31

Søk i lokal «land»-versjon

• Er du interessert i info om lokale forhold – søk i aktuell

landversjon eg; google.no, google.de osv

• Lokal søkemotor er bedre indeksert om lokale temaer enn .com

• Nyttig når en er ute etter data om en person, firma, spisesteder,

turopplegg osv som er knyttet til et bestemt land

• Gå til den relevante landversjonen av Google (/no, /se, /uk,

/com….)

• Erfares problemer med å få koblet seg opp mot /com fra lokal

versjon /no bruk google.com/ncr

07.11.2016

Page 32: Roar Storleer: Google - Så god som forventet?

32

Ulike svar for google.no – com – se - osv

• Bruk nasjonal SM for lokal info

• Eks «Pizza – spise-steder i Trondheim»

Page 33: Roar Storleer: Google - Så god som forventet?

33

Søketips - begrensninger

• oil AROUND(3) pollution nærhetsoperator/proximity

=foreldet

• oil * pollution maskering av ett/flere ord

• d?g går IKKE, google har ikke

maskering/trunkering men søker på

hele ord

• 1900..2000 intervallsøk

• 1900.. 2100 alle tall >=1900 - 1999 og

legger til 2100

Page 34: Roar Storleer: Google - Så god som forventet?

34

Ting du bør vite om Google - forts

Google ser automatisk på variasjoner i dine

søketermer og dropper av og til søketermer fra

søket ditt

– Sier ikke ifra at de har gjort det

– «..» rundt termer, fraser, navn og titler virker ikke

alltid

– For å tvinge fram eksakt treff på en del av et søk

bruk ‘intext’ foran

eks: fottur allintext:jotunheimens fauna

– Bruk Verbatim for eksakt søk07.11.2016

Page 35: Roar Storleer: Google - Så god som forventet?

35

Ting du bør vite om Google - forts

• Google web-søk søker IKKE i hele sin

database

– 2 indekser; «hovedindeks» som det søkes i

primært og en «tilleggsindeks»

– Tilleggsindeksen kan inneholde mindre populære,

uvanlige, spesialist materiale

– Tilleggsindeksen tas i bruk når Google tror/mener at

ditt søk har gitt for få treff/lite resultat

– Verbatim og noen avanserte søkekommandoer ser

ut til å trigge søk i tilleggsindeksen

07.11.2016

Page 36: Roar Storleer: Google - Så god som forventet?

36

Ting du bør vite om Google - forts

• Google forandrer sin matematiske søke-algoritme

mange hunder ganger hvert år

– How Google makes improvements to its search algorithm– https://www.youtube.com/watch?v=J5RZOU6vK4Q&feature=youtu.be

• Vi som er brukere av Google er deres

forsøkskaniner

– Alt vi gjør logges og blir brukt til å forbedre søkeopplevelsene

for brukerne

07.11.2016

Page 37: Roar Storleer: Google - Så god som forventet?

37

Ved søking vil Google:

• Foreslå søkeord og alternativ staving

• Personalisert søk – gi sider du har besøkt tidligere

• Inkludere synonymer/tilsvarende ord

• Søke etter ord med samme ordstamme - run fanger

opp running, men child fanger ikke opp children

• Men hvis du ønsker kun treff fra eksakt søk:

• «xxxx» – søke på eksakt ord eller bruk Verbatim

Page 38: Roar Storleer: Google - Så god som forventet?

38

Søkeordenes rekkefølge og bruk av

partikkelord har betydning!

Noen forskjell:

• Who/A who/The who

• Blue sky/Sky blue

• 150 computer/$150 computer

• Tenk på den naturlige

sammenhengen søkeordene

skal stå i ønsket resultat

• Flower spider vs spider

flower

• Adobe Acrobat vs Acrobat

Adobe

• Car vs the car

• Black and white vs White and

black

Page 39: Roar Storleer: Google - Så god som forventet?

39

De fleste spesialkarakterer er med få

unntak IKKE søkbare

• Ingen forskjell på store og små bokstaver

• Spesialkarakterer som betyr noe:

– C++

– C#

– #hashtagGoogle+

– $100

– @dmrussel

• Spesialkarakterer som IKKE betyr noe:

– £, ©, ®, §, ¶, (), !, %, ?

– ©2010 søker på 2010

Page 40: Roar Storleer: Google - Så god som forventet?

40

Rettskrivingshjelp + tips til termer

Google Instant

Page 41: Roar Storleer: Google - Så god som forventet?

41

Søketips

• Tenk på filformat

– PDF for dokumenter

– PPT/PPTX for presentasjoner

– XLS/XLSX for statistikk og regneark

– "summer temperature in Israel" filetype:xls

• Bruk kommdoen: filetype:xxxx

• «fish farming» salmon feeding filetype:ppt

• Gjenta viktige søketermer

• Forandre rekkefølge av ord

• Bruk frasesøk («..») eller nærhetsoperator (AROUND(x))

foreldet07.11.2016

Page 42: Roar Storleer: Google - Så god som forventet?

42

Google - feltkoder

• link:www.ub.ntnu.no

• related:www.vg.no

• info:www.google.com gir informasjon om nettstedet

• define:hoemopathy

• site:www.google.com help / site:edu, site:org

• allintitle/Intitle:solar power

• allinurl/Inurl:google search

• allintext/Intext: søker i ”body” felt

• allinanchor/Inanchor: beste restaurant Tromsø

• safesearch:breast cancer

• filetype: zoology filtype:ppt

• Inauthor:ibsen, henrik kun i Scholar

Page 43: Roar Storleer: Google - Så god som forventet?

43

Google - feltkoder

• Data range:201502-201506 norge

• Related:www.ntnu.no

• Cache:www.google.com

• Book Nora et dukkehjem

• Movie:dance with wolfs

• Weather:Oslo

Page 44: Roar Storleer: Google - Så god som forventet?

44

Snertne søketriks (Shortcuts)Google Search Features

• Snertne søketriks (Shortcuts) :

– Time in Jerusalem

– Weather in Trondheim

– Capital Israel

– Population in Norway

– Movie Trondheim

– Map Telaviv

– Flight SK4552

– Tolvon antidepressant

– 1200 EUR to USD

– 43 C to F

– 150 pounds to kg

– Define ASCII

– ~pretty

– 5.77 * (258+477) /22

– patent 6588078

Page 45: Roar Storleer: Google - Så god som forventet?

45