Upload
vkp1970
View
304
Download
8
Embed Size (px)
Citation preview
1
GoogleSå god som forventet?
Foredrag holdt ved
«Treffpunkt Mikromarc»
Stockholm 3-4. November 2016
Roar Storleer
NTNU UB - Staben
2
U Universitetsbiblioteket
• Roar Storleer
• tel.: 73 59 51 23
• mob: 918 97 049
• adr.:
• NTNU UB Staff
• Høgskoleringen 1
• 7491 Trondheim
4
Hvilke søkeverktøy skal jeg velge?
5
Smørbrødliste for vellykket resultat:
1. Forstå spørsmålet/analyser problemstillingen
2. Finne fram til signifikante søkeord.
TENK i SYNONYMER
3. Velge riktig søkeverktøy
4. Vite hvordan du utnytter det aktuelle
søkeverktøyets muligheter
5. Lage en god søkeprosedyre
6. Evaluere den funne informasjon om den er:
Sann
Pålitelig
Troverdig
Objektiv
Nøytral
Seriøs
6
Søkehjelp
• «Power Searching with google» - YouTube
• «Advanced Goole Search Shortcuts»
7
Bygge søkeprosedyre
• Trunkering – maskering av karakterer (*, ?, #,!)
• Logiske operatorer (NOT, AND og OR)
• Nærhetsoperatorer/avstandsoperatorer
(NEAR/x, ONEAR/x, PRE/x, W/x, Nx, Wx,
AROUND(x)
• Feltkodesøking (TI, AU, JN, LA, DE, ID, ..)
• Frasesøking (” ”)
07.11.2016
8
Hva har Google?
• Trunkering – maskering av karakterer/ord: (/*)
• Logiske operatorer: (NOT (-), AND (default) , OR)
• Paranteser:
• Nærhetsoperatorer/avstandsoperatorer: (NEAR/x,
ONEAR/x, PRE/x, W/x, Nx, Wx, AROUND(x) ????
• Feltkodesøking:(TI (intitle), AU, JN, LA, DE, ID, ..)
• Frasesøking (” ”)
Søkemuligheter i noen SM: http://extremesearcher.com/chart1.html
9
Google søketips forts
• Foreslår søketermer når du er usikker på stavemåten (Instant)
• Kan maskere ord i flerordssøk med (*) wildcard, men har IKKE trunkering/maskering
• Stoppord og logiske operatorer søkes ut med ”xxx”
• «XX» søker eksakt (ikke synonymer/flertalls s/ordstammer)
• ” ” og –
• Synonymsøk: med ” ~” foran ord eg.: ~food (er fjernet)kan IKKE lengre søke på alle synonymer til food, men ikke food : ~food -food
• Intervallsøk: alt som har med tall, mengder, år, avstander, temperaturer, vekter, avstander, priser…med ”..” mellom intervall eg: 1958..1972; $200..$300 mm
07.11.2016
10
Proximity virker IKKE i Scholar
AROUND(x) er foreldet
07.11.2016
11
Bing/Yahoo!
• Yahoo bruker nå Bing’s database,
kommandoer og rangeringsalgoritme
• Ikke noe Avansert søke side – bruk kommandoer
• Liste over kommandoer:
http://msdn.microsoft.co/en-us/library/ff795620.aspx
• filetype: site: inboady: inurl:
• AND, NOT, OR og paranteser for komplekse søk
• Proximity; NEAR:n
07.11.2016
GOOGLE (Gogool = 10100
)Wikipedia: 6x1079 atomer i hele universet
Kort historikk:
• Utviklet av Sergey Brin og Larry Page ved Stanford
University
• Basiside: Webs lenkestruktur som en stor graf
• Satt i drift i mars 1996, lansert 4. sept 1997, men
regner virkelig oppstart fra 27. sept 1998
• Hoved-ide for kvalitet: lenkesiteringer (PageRanking)
• Verbet å ”google” ble lagt til Merriam Webster Collegiate Dictionary
and the Oxford English Dictionary in 2006
• kilde: Wikipedia: http://en.wikipedia.org/wiki/History_of_Google
1307.11.2016
Så - her er vidunderet:
1607.11.2016
17
Hva skjer – Google
søking?1. Web er lik en stor bok
med milliarder av sider
og de må indekseres.
Brukt millioner av
timer å bygge opp
indeksen
2. Søkespørsmål reiser
2400 km for å finne
svar og lister forslag og
tips ved feilstaving =
Google Instant
3. PageRanking: sist
oppdatert, linking, ord i
nettside, proximity,
stavelseskontroll,
synonymer, URL og
tittel, personalisering,
Innholdskvalitet, anbef.
av venner, beste
resultat nettside, bilde,
video, nyhet osv
4. Resultatet
5. Tid: 1/10 sek i gj.snitt
18
Noen tall
• Google Instant bruker i gjennomsnitt 1/10 sek
på hvert spørsmål
• Milliarder av søk hver dag
• Siden 2003 har Google besvart >600
milliarder nye unike spørsmål som ikke har
vært besvart før
• 16% av alle daglig søkinger er nye
19
Kriterier for utvalg?Googles spider Googlebot finner nettsider og følger lenkene til
nye nettsider osv
Mer enn 200 kriterier for utvalg
• Ord forekommer i tittel
• Ord forekommer i URL
• Ordene står ved siden av hverandre
• Inneholder sidene synonymer
• Er sidene fra «kvalitets»-institusjoner?
• Er sidene «PageRanked»
• Annerkjente sider som lenker til aktuell side
20
Kriterier for utvalg? forts
• Dokumenter med flest søketermer
• Hyppighet av termer i forhold til
størrelse på dokument
• Termenes innbyrdes avstand
• Står termene i tittel eller første avsnitt
• Metadata (Dublin Core)
07.11.2016
21
PageRank
07.11.2016
• PageRank er en algoritme for å rangere nettsteder i deres
søkemotor resultater
• PageRank er oppkalt etter Larry Page, en av
grunnleggerne av Google
• Pagerank er en måte å måle betydningen av nettsidene
• PageRank fungerer ved å telle antallet og kvaliteten av
lenker til en side for å finne et grovt anslag over hvor viktig
nettsiden er
• Den underliggende antakelsen er at viktige nettsteder
sannsynligvis får flere linker fra andre nettsteder.
22
Personalisering
• Hva jeg ser på min skjerm er ikke det samme som du ser på
din skjerm, og er heller ikke det samme som dine kollegaer
ser på deres skjermer, og er ikke det samme som dine
brukere ser.
• Google Scholar er mer konsistent
07.11.2016
23
Ting du bør vite om Google
• Google bruker personalisering og logger all din bruk på
tvers av Google-plattformene
• Kan slåes av/på ved
eller å logge seg av eller ikke logge på
07.11.2016
24
Hva samler Google på av data?
25
Google og personvernet
• bruker opplysningene til å gi våre brukere verdifulle produkter og tjenester
• utvikler produkter som er basert på omfattende personvernstandarder og -praksis
• gir brukerne innsyn i hvilke personlige opplysninger vi samler inn
• gir brukerne en rimelig mulighet til å beskytte sitt personvern
• håndterer opplysningene vi får tilgang på med største forsiktighet, slik at du kan føle deg trygg
26
Google - Boolsk søking!• (sykkeltur OR båttur) AND (Norge OR Sverige) NOT Danmark
07.11.2016
2707.11.2016
28
Søketeknikk – Google • dog OR pet
• cat food
• sukkerveien Norge OR Sverige
• hoteller oslo OR camping stockholm (1.800.000)
• hoteller AND Oslo OR camping AND Stockholm (14.700.000) – funker ikke
• sykkeltur OR båttur norge OR sverige -danmark
• museer trondheim OR ålesund OR kristiansund –oslofunker ikke
• Kan ikke søke på A OR (B AND C) OR D da OR har høyestprioritet
• «average size of octipus is 18 inch» (ikke slik) dropp størrelsen
29
norge bil OR båt sverige funker ikke
07.11.2016
30
Google søketips forts
• Ingen skjulte operatorer
• Verbatim for eksaktsøk
• Kan IKKE fjerne dubletter i GS
• GS – eksportfunksjon til EndNote, BibTex mm
• De fleste spesialtegn er med noen få unntak ikke søkbare
07.11.2016
31
Søk i lokal «land»-versjon
• Er du interessert i info om lokale forhold – søk i aktuell
landversjon eg; google.no, google.de osv
• Lokal søkemotor er bedre indeksert om lokale temaer enn .com
• Nyttig når en er ute etter data om en person, firma, spisesteder,
turopplegg osv som er knyttet til et bestemt land
• Gå til den relevante landversjonen av Google (/no, /se, /uk,
/com….)
• Erfares problemer med å få koblet seg opp mot /com fra lokal
versjon /no bruk google.com/ncr
07.11.2016
32
Ulike svar for google.no – com – se - osv
• Bruk nasjonal SM for lokal info
• Eks «Pizza – spise-steder i Trondheim»
33
Søketips - begrensninger
• oil AROUND(3) pollution nærhetsoperator/proximity
=foreldet
• oil * pollution maskering av ett/flere ord
• d?g går IKKE, google har ikke
maskering/trunkering men søker på
hele ord
• 1900..2000 intervallsøk
• 1900.. 2100 alle tall >=1900 - 1999 og
legger til 2100
34
Ting du bør vite om Google - forts
Google ser automatisk på variasjoner i dine
søketermer og dropper av og til søketermer fra
søket ditt
– Sier ikke ifra at de har gjort det
– «..» rundt termer, fraser, navn og titler virker ikke
alltid
– For å tvinge fram eksakt treff på en del av et søk
bruk ‘intext’ foran
eks: fottur allintext:jotunheimens fauna
– Bruk Verbatim for eksakt søk07.11.2016
35
Ting du bør vite om Google - forts
• Google web-søk søker IKKE i hele sin
database
– 2 indekser; «hovedindeks» som det søkes i
primært og en «tilleggsindeks»
– Tilleggsindeksen kan inneholde mindre populære,
uvanlige, spesialist materiale
– Tilleggsindeksen tas i bruk når Google tror/mener at
ditt søk har gitt for få treff/lite resultat
– Verbatim og noen avanserte søkekommandoer ser
ut til å trigge søk i tilleggsindeksen
07.11.2016
36
Ting du bør vite om Google - forts
• Google forandrer sin matematiske søke-algoritme
mange hunder ganger hvert år
– How Google makes improvements to its search algorithm– https://www.youtube.com/watch?v=J5RZOU6vK4Q&feature=youtu.be
• Vi som er brukere av Google er deres
forsøkskaniner
– Alt vi gjør logges og blir brukt til å forbedre søkeopplevelsene
for brukerne
07.11.2016
37
Ved søking vil Google:
• Foreslå søkeord og alternativ staving
• Personalisert søk – gi sider du har besøkt tidligere
• Inkludere synonymer/tilsvarende ord
• Søke etter ord med samme ordstamme - run fanger
opp running, men child fanger ikke opp children
• Men hvis du ønsker kun treff fra eksakt søk:
• «xxxx» – søke på eksakt ord eller bruk Verbatim
38
Søkeordenes rekkefølge og bruk av
partikkelord har betydning!
Noen forskjell:
• Who/A who/The who
• Blue sky/Sky blue
• 150 computer/$150 computer
• Tenk på den naturlige
sammenhengen søkeordene
skal stå i ønsket resultat
• Flower spider vs spider
flower
• Adobe Acrobat vs Acrobat
Adobe
• Car vs the car
• Black and white vs White and
black
39
De fleste spesialkarakterer er med få
unntak IKKE søkbare
• Ingen forskjell på store og små bokstaver
• Spesialkarakterer som betyr noe:
– C++
– C#
– #hashtagGoogle+
– $100
– @dmrussel
• Spesialkarakterer som IKKE betyr noe:
– £, ©, ®, §, ¶, (), !, %, ?
– ©2010 søker på 2010
40
Rettskrivingshjelp + tips til termer
Google Instant
41
Søketips
• Tenk på filformat
– PDF for dokumenter
– PPT/PPTX for presentasjoner
– XLS/XLSX for statistikk og regneark
– "summer temperature in Israel" filetype:xls
• Bruk kommdoen: filetype:xxxx
• «fish farming» salmon feeding filetype:ppt
• Gjenta viktige søketermer
• Forandre rekkefølge av ord
• Bruk frasesøk («..») eller nærhetsoperator (AROUND(x))
foreldet07.11.2016
42
Google - feltkoder
• link:www.ub.ntnu.no
• related:www.vg.no
• info:www.google.com gir informasjon om nettstedet
• define:hoemopathy
• site:www.google.com help / site:edu, site:org
• allintitle/Intitle:solar power
• allinurl/Inurl:google search
• allintext/Intext: søker i ”body” felt
• allinanchor/Inanchor: beste restaurant Tromsø
• safesearch:breast cancer
• filetype: zoology filtype:ppt
• Inauthor:ibsen, henrik kun i Scholar
43
Google - feltkoder
• Data range:201502-201506 norge
• Related:www.ntnu.no
• Cache:www.google.com
• Book Nora et dukkehjem
• Movie:dance with wolfs
• Weather:Oslo
44
Snertne søketriks (Shortcuts)Google Search Features
• Snertne søketriks (Shortcuts) :
– Time in Jerusalem
– Weather in Trondheim
– Capital Israel
– Population in Norway
– Movie Trondheim
– Map Telaviv
– Flight SK4552
– Tolvon antidepressant
– 1200 EUR to USD
– 43 C to F
– 150 pounds to kg
– Define ASCII
– ~pretty
– 5.77 * (258+477) /22
– patent 6588078
45