56
SVEUČILIŠTE JOSIPA JURJA STROSSMAYERA U OSIJEKU ODJEL ZA FIZIKU ALEKSANDAR BOJANC-ŠTEMBERGAR INTERNET, WEB I PRETRAŢIVANJE Diplomski rad Osijek, 2011.

INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

SVEUČILIŠTE JOSIPA JURJA STROSSMAYERA U OSIJEKU

ODJEL ZA FIZIKU

ALEKSANDAR BOJANC-ŠTEMBERGAR

INTERNET, WEB I PRETRAŢIVANJE

Diplomski rad

Osijek, 2011.

Page 2: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

i

SVEUČILIŠTE JOSIPA JURJA STROSSMAYERA U OSIJEKU

ODJEL ZA FIZIKU

ALEKSANDAR BOJANC-ŠTEMBERGAR

INTERNET, WEB I PRETRAŢIVANJE

Diplomski rad

predloţen Odjelu za fiziku Sveučilišta J. J. Strossmayera u Osijeku

radi stjecanja zvanja profesora fizike i tehničke kulture s informatikom

Voditelj: doc.dr.sc. Darko Dukić

Osijek, 2011.

Page 3: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

ii

Ovaj diplomski rad je izraĎen u Osijeku pod vodstvom doc.dr.sc. Darka Dukića u sklopu

Sveučilišnog diplomskog studija fizike i tehničke kulture s informatikom na Odjelu za

fiziku Sveučilišta Josipa Jurja Strossmayera u Osijeku.

Page 4: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

iii

Sadrţaj

1. Uvod .........................................................................................................................................1

2. Internet ......................................................................................................................................3

2.1. Povijest Interneta ...................................................................................................................5

2.2. Internet servisi .......................................................................................................................7

2.3. Tehnički opis Interneta ..........................................................................................................8

2.3.1. Pristup Internetu .............................................................................................................8

2.3.2. Arhitektura Interneta.......................................................................................................9

2.3.3. Protokoli .......................................................................................................................10

2.3.4. TCP/IP ..........................................................................................................................10

2.3.5. Posluţitelji i klijenti ......................................................................................................11

2.3.6. Internet adrese...............................................................................................................12

2.3.6.1. IP adresa ............................................................................................................... 13

2.3.6.2. DNS (Domain Name System)............................................................................... 13

2.3.6.3. Simboličke adrese, domene ................................................................................. 14

2.3.6.4. URL...................................................................................................................... 15

3. World Wide Web .......................................................................................................................17

3.1. Web stranica (HTML, hipertekst, link) ...............................................................................17

3.1.1. Hipertekst i linkovi .......................................................................................................18

3.1.2. HTML ...........................................................................................................................18

3.1.3. Tagovi ...........................................................................................................................19

3.1.4. HTTP ............................................................................................................................20

3.1.5. Web posluţitelj i Web mjesto (Web site) .....................................................................21

3.2. Web preglednici ..................................................................................................................21

4. Pretraţivanje Weba ....................................................................................................................24

4.1. Web pretraţivači (traţilice, search engines) .......................................................................25

4.2. Web imenici (Web directory) ..............................................................................................27

4.3. Metatraţilice (Metasearch engines) ....................................................................................27

4.4. Nevidljivi ili duboki Web ....................................................................................................28

4.5. Internetske (online) baze podataka ......................................................................................30

5. Traţenje informacija na webu ....................................................................................................31

Page 5: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

iv

5.1. Ključne riječi .......................................................................................................................31

5.2. Booleovi operatori ...............................................................................................................33

5.3. Pretraţivanje fraza korištenjem navodnika .........................................................................35

5.4. Pretraţivanje prirodnim jezikom .........................................................................................35

5.5. Kraćenje (stemming) ...........................................................................................................36

5.6. Zamjenski znakovi (wildcards) ...........................................................................................36

5.7. Zaustavne riječi (stop words) ..............................................................................................37

5.8. Pretraţivanje po poljima (field search) ...............................................................................38

5.9. Strategija pretraţivanja ........................................................................................................38

5.10. Kako formulirati upit .........................................................................................................40

6. Kriteriji vrednovanja mreţnih izvora informacija .....................................................................41

6.1. Pitanja na koja valja traţiti odgovore pri vrednovanju podataka o stranici ........................42

6.2. Pitanja na koja treba traţiti odgovore pri vrednovanju sadrţaja stranice ............................43

7. Zaključak....................................................................................................................................45

8. Literatura ....................................................................................................................................46

9. Ţivotopis ....................................................................................................................................49

Page 6: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

v

Sveučilište J.J. Strossmayera u Osijeku Diplomski rad

Odjel za fiziku

INTERNET, WEB I PRETRAŢIVANJE

Aleksandar Bojanc-Štembergar

Saţetak

Ovaj diplomski rad opisuje Internet, Web, te pretraţivanje i vrednovanje informacija na

Webu. Poglavlje o Internetu počinje pregledom povijesti Interneta, nakon čega su opisane neke

njegove osobitosti, od popisa Internet servisa, pristupa Internetu, arhitekture Interneta,

protokola, odnosa klijent-posluţitelj, do Internet adresa. Cilj je tog poglavlja pribliţiti čitatelju

pojam Interneta i način na koji funkcionira. Poglavlje o Webu opisuje specifičnosti Weba, koji

je jedan od Internet servisa. U tom se dijelu spominju i objašnjavaju pojmovi poput Web

stranica, HTML-a, hiperteksta, linka, tagova, HTTP-a, Web posluţitelja, Web mjesta, te Web

preglednika. Poglavlje o pretraţivanju Weba obraĎuje pojmove poput Web pretraţivača, Web

imenika, metatraţilica, nevidljivog ili dubokog Weba i internetskih ili online baza podataka, te

objašnjava kako funkcioniraju, prikupljaju i prikazuju informacije. Sljedeće poglavlje

posvećeno je traţenju informacija na Webu. U okviru njega opisane su neke jednostavne, ali

učinkovite metode pretraţivanja, te su navedeni primjeri pomoću kojih čitatelj moţe značajno

poboljšati svoje izglede pri traţenju informacija koje ga zanimaju. Zadnje poglavlje obraĎuje

vrednovanje informacija na Webu, poučavajući čitatelja na osnovu kojih kriterija treba

procjenjivati izvore na Webu, kako ne bi bio obmanut netočnim ili nepotpunim informacijama.

(49 stranica, 1 tablica, 9 slika, 41 literaturni navod)

Rad je pohranjen u knjiţnici Odjela za fiziku

Ključne riječi: Internet, Web, pretraţivanje, vrednovanje

Mentor: doc.dr.sc. Darko Dukić

Ocjenjivači: doc.dr.sc. Zvonko Glumac, dr.sc. Igor Lukačević

Rad prihvaćen: 26.10.2011.

Page 7: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

vi

J.J. Strossmayer University in Osijek Bachelor of Science Thesis

Department of Physics

INTERNET, WEB AND SEARCHING

Aleksandar Bojanc-Štembergar

Abstract

This graduate work describes Internet, Web, Web searching and evaluation of information

on the Web. Chapter about Internet begins with review of Internet history, followed by

description of its features, starting with Internet services, to Internet access, Internet

architecture, protocols, client-server model and Internet addresses. Aim of this chapter is to

introduce reader with mechanics of Internet. Similarly, chapter about Web describes specifics of

Web, which is one of the Internet services. Thus are mentioned terms like Web pages, HTML,

hypertext, links, tags, HTTP, Web servers, Web sites and Web browsers. As in chapter before,

chapter about Web was written so that reader could understand how Web works. Web search

chapter covers concepts as Web search engines, Web directories, metasearch engines, invisible

or deep Web and online databases, explains how they work, collect information and present

those information. Chapter about information searching on the Web describes simple but

effective methods and shows examples which can be used to greatly improve chance of finding

information we are interested in. Last chapter is about Web information evaluation and educates

reader in means and criteria to evaluate Web sources, in order not to be misguided by false or

incomplete information.

(49 pages, 1 table, 9 pictures, 41 references)

Thesis deposited in Department of Physics library

Keywords: Internet, Web, search, evaluate

Supervisor: Darko Dukić, PhD, Assistant Professor

Reviewers: Zvonko Glumac, PhD, Assistant Professor, Igor Lukačević, PhD

Thesis accepted: 26.10.2011.

Page 8: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

1

1. Uvod

Informacijske i komunikacijske tehnologije prodrle su u sva područja ljudskog ţivota.

Tijekom posljednja dva desetljeća Internet je postao jednim od najprepoznatljivijih simbola

promjena koje su nastupile kao rezultat tehnološkog napretka. Upravo je intencija ovog rada bila

ukazati na osnovne značajke Interneta i Weba, te Web pretraţivanja i vrednovanja informacija na

Webu.

Danas su nam dostupne velike brzine Internet veza i uz to ogroman broj najrazličitijih

mogućnosti. Ljudi često uzimaju te nove mogućnosti zdravo za gotovo, ni ne razmišljajući o

načinu na koji je Internet nastao i kako funkcionira. Internet se s razvojem tehnologije kroz

posljednjih 50-ak godina pretvorio u vrlo vaţan masovni medij, kojeg je nemoguće kontrolirati.

Stoga nam često putem njega dolaze neke informacije koje ne mogu naći put kroz tradicionalne

medije. Posebno je zanimljiv rast i razvoj Interneta u posljednjih 20 godina od kada su se

kućanstva počela spajati na Internet velikim brzinama. To je dovelo do ogromnog rasta broja

informacija na Webu, koji i posljednje dvije godine ima rast od 7-8% godišnje.1

Naţalost velik broj informacija na Internetu i Webu nije provjeren od stane stručnjaka kada

se radi o njihovoj točnosti i vjerodostojnosti, te je zato kvaliteta informacija pronaĎenih na

Internetu često upitna. Prema trenutnom stanju malo je vjerojatno da će informacije na Internetu

postati ureĎene, jer svakoga dana raste njihov broj i ne postoje metode da se ograniči unos samo

na one vjerodostojne. Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da

znamo koristiti alate za pretraţivanje Interneta, te da naučimo vrednovati pronaĎene informacije.

Ljudi često Internet i Web poistovjećuju, meĎutim Web je samo jedan od Internet servisa,

odnosno usluga koje Internet pruţa. Materijalno gledano Internet je infrastrukturna mreţa koja

omogućava da njegovi servisi mogu funkcionirati, dok su Internet servisi ono što ga čini

zanimljivim korisnicima. Svakodnevno raste broj Internet servisa i moţemo samo nagaĎati što

nam budućnost Interneta nosi. Danas zahvaljujući razvoju Interneta i njegovih servisa moţemo

obavljati bankarske transakcije, plaćati račune, kupovati razne predmete čiji su prodavači s druge

strane svijeta, razgovarati sa cijelim svijetom putem telefonske ili putem video veze, slušati

1 Internet 2010. in numbers, http://royal.pingdom.com/2011/01/12/internet-2010-in-numbers/ (pristupljeno

26.09.2011.)

Page 9: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

2

radijske i gledati televizijske programe, „šetati“ kroz virtualne verzije gradova diljem svijeta,

pronaći informacije o bilo čemu što nas zanima, te još mnogo toga što nije nabrojano. Sve je to

bilo nezamislivo prije samo 20-ak godina.

Općenito informatički svijet omogućava stvaranje virtualnih kreacija u koje čovjek moţe

„uroniti“ kada god poţeli, a s povezivanjem na Internet kreće razmjena tih dobara. Upravo se iz

toga vidi da je Internet danas ono što najviše povezuje ljudsku rasu, jer kao ni jedan medij u

povijesti, dopušta svakome da u njemu sudjeluje, kreira ga i komunicira sa drugim ljudima.

Page 10: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

3

2. Internet

Prema Edwardsu, Internetom se naziva grupa svjetski rasprostranjenih meĎusobno

povezanih kompjuterskih informacijskih resursa.2 Clegg smatra da je Internet na osnovnom

nivou kolekcija mreţa, gdje je mreţa skup računala umreţenih da bi mogla razmjenjivati

informacije.3

Prema Musseru Internet je javno dostupna globalna paketna podatkovna mreţa koja zajedno

povezuje računala i računalne mreţe.4 Taj skup računala i računalnih mreţa moţemo promatrati

kao informacijsku superprometnicu, odnosno mreţu koja povezuje regionalna središta, a preko

njih pojedinačne lokalne mreţe i računala na njima.

Izvor: Internet, http://en.wikipedia.org/wiki/File:Internet_map_1024.jpg (pristupljeno 01.09.2011.)

Slika 1. Prikaz internetske mreţe

2 Edwards, M.J.A.: The Internet for Nurses and Allied Health Professionals, Second Edition, Margaret J.A. Edwards

& Associates, Inc., Calgary, 1997., str. 1. 3 Clegg, B.: The Profesionall's Guide to Mining the Intetnet, 2nd Edition, Information Gathering and Research on

the Net, Kogan Page Limited, London, 2001., str. 4. 4 Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004. str. 1.

Page 11: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

4

Vaţan dio Interneta čine posebna računala, koja korisnike posluţuju podacima, ta računala

zovemo posluţitelji (servers). Zamislimo 50-ak milijuna posluţitelja spojenih na Internet koji

nam pruţaju pristup ogromnom broju informacija, razbacanih po čitavom svijetu.5 Na Internetu

se podaci nalaze u raznim oblicima: riječ, slika, zvuk, video, itd. Teško je predočiti količinu

podataka koja se nalazi na Internetu. Evo za primjer slike koja prikazuje prostor informacija, iz

koje se moţe vidjeti da Internet ima velik utjecaj na ukupnost informacija u ljudskome

okruţenju.

Izvor: Milinović, M.: Učinkovito pretraţivanje Interneta (alati i tehnike), http://www.szi.hr/seminar2000/prez/

milinovic.pdf (pristupljeno 09.10.2011.)

Slika 2. Prostor informacija

Danas je na Internet spojen vrlo velik broj ustanova i pojedinaca, od obrazovnih,

istraţivačkih i znanstvenih institucija do raznih komercijalnih organizacija i sve one nude neke

informacije ili usluge. Upravo ta golema količina informacija čini Internet zanimljivim: razni

tekstovi, slike, zvukovi, video zapisi, itd. dostupni 24 sata na dan, 365 dana u godini. Shah, Patel

i Chaudhary navode da krajnji korisnik moţe pristupiti tim informacijama pomoću osobnog

računala spojenog na Internet.6 Napredak tehnologije nam omogućava i pristup Internetu

pomoću raznih drugih osobnih ureĎaja, kao npr. mobitela, televizora, igraćih konzola, itd.

5 Tech Titans Building Boom, http://spectrum.ieee.org/green-tech/buildings/tech-titans- building- boom/2 (pristu-

pljeno 03.09.2011.) 6 Shah, D., Patel D., Chaudhary, S.: Grid-Based Vehicle Locating System, u: Bui, A., et al. (ur.): Innovative Internet

Community Systems, 5th International Workshop, Springer, Berlin, 2006. str. 53-67.

Page 12: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

5

2.1. Povijest Interneta

Razvoj onoga što danas zovemo Internetom počeo je šezdesetih godina 20. stoljeća. U

nastavku je ukratko prikazana povijest Interneta po dekadama.

Šezdesete godine - postanak

Preteča Interneta počela se razvijati šezdesetih godina 20. stoljeća iz projekta američkog

Ministarstva obrane. Tada je za vrijeme Hladnog rata Američka vladina agencija DARPA

(Defence Advanced Research Project Agency) započela razvoj tehnike i tehnologije za

povezivanje različitih računalnih mreţa koje bi mogle razmjenjivati podatke preko ţice, a ne kao

što se to do tada radilo prenošenjem magnetnih traka s jednog mjesta na drugo. Rezultat je

trebala biti mreţa koja bi mogla funkcionirati i u uvjetima djelomičnog uništenja njene fizičke

strukture, što je tada bila realna mogućnost zbog sovjetske prijetnje nuklearnim ratom. Tako je

1969. godine nastala mreţa ARPANet, koja je povezivala američke znanstvene i akademske

istraţivače, a sastojala se od 4 čvora (Kalifornijsko sveučilište u Los Angelesu, Istraţivački

institut Stanford, Kalifornijsko sveučilište u Santa Barbari i sveučilište Utah). Upravo je ta mreţa

bila prethodnica današnjeg Interneta, a s razvojem projekta je nastavljeno jer su uvidjeli da takvo

povezivanje omogućuje mnogo lakšu razmjenu informacija.7

Sedamdesete godine - razvoj

Do početka sedamdesetih godina na mreţu je spojeno 15 čvorova sa 23 računala. Povezana

su mnoga američka sveučilišta i znanstvene ustanove te poneke komercijalne organizacije. Na

ARPANet je 1973. godine spojen prvi čvor izvan SAD-a i to University College of London u

Velikoj Britaniji. Tada je razvijen i uveden novi mreţni protokol nazvan NCP (Network Control

Protocol), koji je omogućavao lakše umreţavanje i pisanje programa za mreţne usluge. 1975.

godine tvrtka BBN je izradila Telnet, prvu javnu komercijalnu informacijsku uslugu. Tih godina

razvijaju se i elektronička pošta, mailing liste i news grupe. Takav sustav mreţa se koristi za

razmjenu e-mail poruka, rad news grupa, pristup udaljenim bazama podataka i prijenos datoteka.

7 Zakon, R.H.: Hobbes' Internet Timeline, 2010., http://www.zakon.org/robert/internet/timeline/ (pristupljeno

10.09.2011.)

Page 13: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

6

MeĎutim krajem 70ih godina se zbog uočenih nedostataka NCP-a razvija protokol koji je danas

temelj Interneta - TCP/IP (Transmission Control Protocol/Internet Protocol).

Osamdesete godine - rast

1983. ARPANet se razdvaja na vojnu mreţu MILNet (MILitary Network) i ARPANet. Iste

godine cijela mreţa počinje umjesto dotadašnjeg NCP-a koristiti TCP/IP protokol, a preostali dio

ARPANet-a postaje okosnica mreţe. U raznim drţavama razvijaju se akademske i komercijalne

mreţe koje se polako priključuju na tu okosnicu - i tako nastaje ono što danas zovemo Internet.

Američka organizacija za znanost NSF (National Science Fundation) 1986. godine osniva 5

superkompjuterskih centara i povezuje ih vlastitom mreţom NSFNet, što dovodi do ubrzanog

umreţavanja vladinih i obrazovnih ustanova. Razvija se NNTP (Network News Transfer

Protocol), koji omogućuje rad news grupa. Sredinom osamdesetih godina se uvodi sustav

označavanja računala pomoću imena i domena (simboličkih adresa), koji olakšava pamćenje

adresa računala, a prva registrirana domena bila je symbolics.com. Zbog uvoĎenja domena i

simboličkih adresa postalo je neophodno uvoĎenje sustava zvanog DNS (Domain Name System)

koji pretvara simboličke adrese u brojčane IP adrese. Krajem osamdesetih godina na Internet je

bilo priključeno preko 100 000 računala iz oko 20 drţava, meĎu kojima su SAD, Kanada, većina

zapadnoeuropskih drţava, Japan, Meksiko i druge.8

Devedesete godine - eksplozija rasta

Devedesetih godina dvadesetog stoljeća ARPANet prestaje postojati. Uvode se nove usluge

i protokoli: WAIS (Wide Area Information Servers), Gopher, te World Wide Web (WWW).

Upravo nastankom WWW-a, koji će kasnije postati najpoznatija i najviše korištena usluga na

Internetu, počinje prava eksplozija priključivanja na Internet. Tako je 1991. godine na Internet

priključena i Hrvatska, putem CARNet-a (Croatian Academic and Research Network - Hrvatska

akademska i istraţivačka mreţa). Poslovni svijet i mediji počinju zamjećivati veličinu i

mogućnosti Interneta, tako da počinje njegova komercijalizacija. Na Internet se spajaju razne

vladine i obrazovne institucije iz svih dijelova svijeta. Sve više tvrtki postavlja na Internet svoje

web stranice, te se 1994. pojavljuju prve on-line trgovine u kojima je moguće kupovati preko

8 Zakon, R.H.: Hobbes' Internet Timeline, 2010., http://www.zakon.org/robert/internet/timeline/ (pristupljeno

10.09.2011.)

Page 14: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

7

Interneta. NSFNet se 1995. vraća svojoj prvobitnoj ulozi istraţivačke i znanstvene mreţe, a

okosnica Interneta postaju komercijalni davatelji usluga. WWW postaje najpopularnija i

najkorištenija usluga te prva po broju prenesenih podataka. Krajem devedesetih razvijaju se nove

tehnologije i usluge, kao što su pretraţivači Interneta (search engines), Internet telefonija,

elektronsko trgovanje (e-commerce), portali, Internet bankarstvo, prijenos slike i zvuka uţivo,

itd. Krajem devedesetih godina na Internet je priključeno preko 56 milijuna računala u oko 1,5

milijuna domena iz skoro svih drţava svijeta, a koristi ga oko 200 milijuna korisnika.9

2.2. Internet servisi

Činjenica je da Internet ne sluţi samo kao novi, izvanredan izvor informacija, već postoji

velik broj neprofitnih organizacija i pojedinaca koji razvijaju nove i unaprjeĎuju već postojeće

servise, te ih distribuiraju kako bi se postiglo da što veći broj kvalitetnih informacija doĎe do

korisnika.10

Prema Musseru Internet pruţa sljedeće mogućnosti: 11

surfanje - World Wide Web, WWW ili samo Web je svjetska mreţa meĎusobno

povezanih podataka u obliku teksta, slika, zvukova i videozapisa. To je najveća i

najpopularnija usluga na Internetu koju mnogi pogrešno poistovjećuju sa samim

Internetom.

dopisivanje - Elektronička pošta ili popularnije e-mail sluţi za slanje i primanje

elektroničke pošte.

prenošenje svih vrsta datoteka - FTP je kratica engleskog naziva (File Transfer Protocol),

a označava uslugu za prijenos podataka izmeĎu računala u obliku datoteka i protokol

kojim se prijenos obavlja.

diskutiranje - Novosti (News) je usluga nalik oglasnim pločama. Korisnici ostavljaju

poruke u tematski raznolike grupe. Svi koji se predbiljeţe na grupe mogu čitati poruke i

slati svoje komentare.

9 Zakon, R.H.: Hobbes' Internet Timeline, 2010., http://www.zakon.org/robert/internet/timeline/ (pristupljeno

10.09.2011.) 10

Hecht, B.L., Ramsey, R.: Dynamic Management for the Digital Age, John Wiley & Sons, New York, 2002., str.

106-107. 11

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 2-3.

Page 15: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

8

pristupanje udaljenim računalima kao da su vam blizu - Telnet je ime protokola i usluge

koji korisnicima nudi mogućnost pristupa udaljenom računalu. Npr. korisnik iz Zagreba

moţe raditi na računalu u New Yorku (naravno, ako na njemu ima otvoren korisnički

račun).

razgovaranje s ljudima iz svih krajeva svijeta - Razgovaranje (Chat) je vrlo popularna

vrsta usluge na Internetu. Osnovna joj je namjena razgovor dvoje ili više ljudi. Razgovor

se ne vodi usmeno, već pisanim putem u stvarnom vremenu.

Postoje i drugi servisi od kojih ćemo spomenuti samo neke: VoIP, p2p, RSS, itd.

2.3. Tehnički opis Interneta

U ovome poglavlju opisani su neki od načina pristupa Internetu, kako su računala na

Internetu meĎusobno spojena, što su to protokoli, kakvih sve protokola ima i čemu sluţe, opis

temeljnog Internet protokola, te što su to posluţitelji i kako rade.

2.3.1. Pristup Internetu

Postoji više načina spajanja na Internet. Da bi se mogli koristiti Internetom, računalo prvo

mora biti spojeno na njega. To se obično dogaĎa spajanjem našeg osobnog računala sa drugim

računalom koje je spojeno stalno na Internet.12

U nastavku teksta spomenut ćemo par osnovnih

načina pristupa Internetu.

Prvi način pristupa je bio tzv. nazovi pristup (dial-up), odnosno pristup preko telefonske

veze. Pomoću modema ili ISDN ureĎaja spajamo se na pristupne ureĎaje (modeme) davatelja

Internet usluga ili ISP (Internet Service Provider) kod kojega imamo otvoren korisnički račun za

pristup Internetu. Na Internet se spajamo samo kada to ţelimo, a takva usluga se najčešće

naplaćuje prema vremenu koje smo proveli spojeni na Internet. Pri takvom načinu povezivanja

koristi se PPP protokol (Point-to-Point Protocol) koji omogućava da naše računalo postane

punopravni član Interneta s vlastitom IP adresom (Internet Protocol address).

12

Morley, D., Parker., C.S.: Understanding Computers Today and Tomorrow, Comprehensive, 12th

Edition, Course

Technology, Boston, 2009., str. 330.

Page 16: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

9

Bitno drugačiji način povezivanja na Internet je zakup stalne veze kojim je moguć pristup

Internetu 24 sata na dan. Takav način su ranije koristila samo poduzeća i ustanove, a danas i

većina kućanstava. Pogotovo korisnici koji imaju vlastite posluţitelje i ţele da njihov posluţitelj

bude stalno spojen na Internet, te tako dostupan drugim korisnicima. Ova vrsta povezivanja na

Internet omogućava zaposlenicima gotovo neograničeno korištenje Interneta na radnom mjestu

ili u kućanstvu. Danas se na Internet spajamo i preko mobitela, koji se spajaju na beţičnu

infrastrukturu davatelja mobilnih telefonskih usluga.

2.3.2. Arhitektura Interneta

Ukratko, davatelj usluga ili ISP pruţa pristup Internetu, a razina usluge koju ISP pruţa

odreĎuje korisnikove mogućnosti u interakciji na Internetu.13

Davatelj Internet usluga ili ISP

(nazvat ćemo ga "čvor") spojen je stalnim vezama velikih brzina na druge čvorove, koji su

spojeni na treće, itd. Čvorovi ne moraju biti samo davatelji Internet usluga. Oni mogu biti i

velika poduzeća, znanstvene i obrazovne ustanove spojene na Internet. Tako je omogućeno da

svojim računalom pristupamo bilo kojem posluţitelju spojenom na Internet.

Veze izmeĎu velikih čvorova, preko kojih se odvija glavnina mreţnog prometa, nazivaju se

okosnice (backbones). To su veze velikih brzina, a kao medij za prijenos signala najčešće se

koriste svjetlovodi. Čvorove često meĎusobno povezuje više veza, što znači da poruka od jednog

do drugog računala moţe putovati različitim putevima. UreĎaji koji odreĎuju kojim će putem

poruka proći (na temelju adrese iz TCP/IP paketa) zovu se usmjerivači (router).14

Slika 3. Shematski prikaz arhitekture Interneta

13

Huber, A.J., Huber, J.F.: UMTS and Mobile Computing, Artech House Inc., Norwood, 2002., str. 129. 14

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 3.

Page 17: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

10

2.3.3. Protokoli

Računala koja se spajaju na Internet ili tvore dio njegove arhitekture koriste dogovorenu

vrstu jezika kojom komuniciraju meĎusobno. Ti se jezici nazivaju protokolima.15

Dakle protokol

označava skup pravila koja odreĎuju kako dva ureĎaja ili programa meĎusobno komuniciraju.

Računala komuniciraju tako da razmjenjuju nizove poruka, a protokoli odreĎuju formate tih

poruka i načine kako ih računala razmjenjuju. Tako omogućavaju komunikaciju izmeĎu raznih

vrsta računala (PC, Macintosh, UNIX, Linux, itd.) i ureĎaja bez obzira na njihove razlike.

Kada govorimo o Internetu i spajanju na Internet, postoji nekoliko vrsta protokola. Tako

postoje:

1. modemski protokoli, tj. standardi koji odreĎuju način i brzinu povezivanja dva modema;

2. protokoli za serijsku komunikaciju izmeĎu našeg računala i tvrtke koja nam pruţa

Internet usluge - stariji SLIP (Serial Line Internet Protocol) i noviji PPP (Point to Point

Protocol); danas se uglavnom koristi PPP;

3. TCP/IP protokol koji omogućava komunikaciju izmeĎu dva računala na Internetu;

4. protokoli za svaku od Internet usluga, kao što su:

HTTP (Hypertext Transfer Protocol) za World Wide Web

FTP (File Transfer Protocol) za prijenos datoteka

SMTP (Simple Mail Transfer Protocol) i POP3 (Post Office Protocol) za

slanje i primanje e-mail poruka

NNTP (Network News Transfer Protocol) za praćenje news grupa

Telnet za rad na udaljenim računalima, itd.16

2.3.4. TCP/IP

TCP/IP (Transmission Control Protocol/Internet Protocol) je najčešće korišten protokol u

računalnim mreţama, on odreĎuje način prijenosa i adresiranja poruka koje putuju od jednog do

drugog računala. Koristi se u lokalnim mreţama (LAN=Local Area Network), te na Internetu, a

omogućava spajanje raznih vrsta ureĎaja i raznih tipova računala. Dakle, TCP/IP je osnovni

15

Farrel, A.: The Internet and its Protocols: A Comparative Approach, Morgan Kaufmann Publishers, San

Francisco, 2004., str. xix. 16

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 4.

Page 18: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

11

protokol na kojem se zasniva Internet. Kada se spojimo na Internet, naše računalo pomoću tog

protokola komunicira s ostalim računalima.17

TCP/IP protokol se, kao što se i vidi iz imena, sastoji od dva dijela, tj. sloja: TCP-a i IP-a.

TCP rastavlja poruku (e-mail poruku, sliku, datoteku) u manje pakete, brine se da oni stignu na

odredište te ih ponovo spaja u originalnu poruku. IP adresira svaki paket i osigurava da kroz

mreţu stigne na pravu adresu - odredište. Svi paketi jedne poruke ne moraju proći istim putem

kroz mreţu, no ipak će na odredištu biti spojeni u originalnu poruku. TCP/IP omogućava da

„viši“ protokoli za pojedine usluge (HTTP, FTP, Telnet, SMTP, POP), koji se nadograĎuju na

njega, budu jednostavniji jer o njima ne ovisi način prijenosa poruka.

Sadašnja verzija IP protokola (verzija 4 - IPv4) pokazuje se sve nepogodnijom za današnje

zahtjeve, pogotovo zbog relativno malog broja raspoloţivih IP adresa (nešto više od 4 milijarde),

te prijenosa multimedijalnih sadrţaja. Zbog toga se na Internet polako uvodi nova poboljšana

verzija IP protokola (IPv6).18

2.3.5. Posluţitelji i klijenti

Posluţitelji su računala stalno spojena na Internet, a funkcija im je pruţati neku od usluga,

kao što su WWW, e-mail, FTP, itd. Za svaku od tih usluga na posluţitelju je pokrenut zaseban

program. Na računalu koje obavlja funkciju Web posluţitelja pokrenut je program za Web, na

FTP posluţitelju program za FTP. Jedno računalo moţe istovremeno biti Web, FTP i e-mail

posluţitelj, za svaku od tih usluga mora se pokrenuti odgovarajući program. Uobičajeno je da se

posluţitelju daje ime prema usluzi koju obavlja, na primjer "www.tvrtka.hr" za Web posluţitelj,

"ftp.tvrtka.hr" za FTP posluţitelj, "mail.tvrtka.hr" za e-mail posluţitelj, itd. Sve te usluge moţe

pruţati jedno računalo, a različita imena im se daju kako bi se olakšalo korištenje.19

Gotovo sve Internet usluge zasnivaju se na sustavu koji zbog načina rada zovemo arhitektura

klijenta i posluţitelja (client-server architecture). Posluţitelj je, kao što smo rekli, računalo koje

pruţa neku od Internet usluga, a klijent je računalo, odnosno program na našem računalu

pomoću kojega koristimo neku od tih usluga. Tako su npr. Internet Explorer, Mozilla Firefox,

Google Chrome i dr. klijenti za WWW, Outlook i sl. za e-mail, Skype i MSN za chat, itd.

17

Leiden, C.,Wilensky, M., Bradner, S.: TCP/IP for Dummies, Wiley Publishing, Inc., Indianapolis, 2009., str. 9. 18

IP address, http://en.wikipedia.org/wiki/IP_address (pristupljeno 15.09.2011.) 19

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 4.

Page 19: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

12

Princip rada arhitekture klijent-posluţitelj je vrlo jednostavan: klijent postavlja zahtjev

posluţitelju (zahtjev za web stranicom, za prebacivanje e-mail poruka, za datotekom, itd.),

posluţitelj taj zahtjev obraĎuje i šalje klijentu traţeno (web stranicu sa svim njenim elementima,

e-mail poruke, traţenu datoteku, itd).20

Izvor : Hoić-Boţić, N.: Računalne mreţe, 2004., http://ahyco.ffri.hr/ritehmreze/teme/uvod.htm (pristupljeno

04.10.2011.)

Slika 4. Shematski prikaz odnosa klijent-posluţitelj

2.3.6. Internet adrese

Kao što adrese u svakodnevnom ţivotu sluţe da bismo znali gdje se netko nalazi, tako i

adrese na Internetu sluţe da bismo znali gdje se nalazi neko računalo, osoba ili sadrţaj.

Korištenje Interneta zahtijeva razumijevanje nekoliko različitih shema adresiranja na Internetu:

1. IP adrese su jedinstvene brojčane adrese računala spojenih na Internet, sastoje se od 4

broja odvojena točkama;

npr. 193.198.74.3

2. Simboličke adrese su sastavljene od imena računala, imena domene i vrhovne domene, a

koriste se jer se pamte lakše od IP adresa;

npr. www.trvtka.hr

3. URL-ovi (Uniform Resource Locator) odreĎuju točnu lokaciju datoteke na računalu,

sastoje se od naziva protokola koji se koristi, adrese računala, porta, imena direktorija i

20

Perks, C., Beveridge, T.: Guide to Enterprise IT Architecture, Springer-Verlag, Inc., New York, 2003. str. 187.

Page 20: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

13

imena same datoteke;

npr. http://fizika.unios.hr/cms/fizos/hr/pocetna.html

4. E-mail adrese odreĎuju osobu (korisnika) i posluţitelj koji korisnik koristi za primanje

e-mail poruka;

npr. [email protected] ili [email protected]

2.3.6.1. IP adresa

Svako računalo ili ureĎaj spojen na Internet ima svoju jedinstvenu adresu. Računala na

Internetu komuniciraju IP (Internet Protocol) protokolom, pa tu adresu nazivamo IP adresa. Ta

adresa je brojčana, a sastoji se od četiri broja (u rasponu od 0 do 255) odvojena točkama (npr.

193.198.74.3).

IP adresa jednoznačno predstavlja računalo i neophodna je za prijenos podataka izmeĎu

računala. IP adresa se sastoji od "mreţnog dijela" koji predstavlja mreţu, odnosno njezin dio na

koji je spojeno računalo i "lokalnog dijela" koji predstavlja samo računalo.21

Mreţni dio adrese davateljima Internet usluga dodjeljuje organizacija Internet Corporation

for Assigned Names and Numbers (ICANN), a lokalni dio svojim računalima ili mreţama

dodjeljuju davatelji Internet usluga.

2.3.6.2. DNS (Domain Name System)

Računala na Internetu obično imaju i simboličke adrese koje se pamte lakše od brojčanih IP

adresa. PrevoĎenje iz simboličkih u brojčane adrese obavlja se putem DNS posluţitelja (Domain

Name Server). Kada bi na svijetu postojao samo jedan DNS posluţitelj, bio bi preopterećen, tako

danas postoji 13 korijenskih DNS posluţitelja. Uz to svaki ISP ima DNS posluţitelje (najmanje

2) za svoje korisnike, koji vode na korijenske DNS.22

21

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 5. 22

DNS, http://hr.wikipedia.org/wiki/DNS (pristupljeno 16.09.2011.)

Page 21: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

14

2.3.6.3. Simboličke adrese, domene

Simboličke adrese su zapravo lakši način za pamćenje računalnih adresa. U dijelu o IP

adresama rečeno je da se računala meĎusobno raspoznaju pomoću brojčanih adresa. Kako bi

korisnici lakše pamtili adrese, računalima se dodjeljuju takozvane simboličke adrese.

Na primjer, IP adresa (brojčana adresa) web posluţitelja Odjela za fiziku je 193.198.74.3.

Simbolička adresa je www.fizika.unios.hr. Naravno, simboličku adresu je lakše zapamtiti.

PrevoĎenje simboličke adrese, koju korisnik upisuje u svoj web preglednik, u IP adresu obavlja

DNS posluţitelj.

Simbolička adresa obično izgleda ovako:

ime_posluţitelja.ime_domene.ime_vrhovne_domene

Ime računala (posluţitelja) moţe biti proizvoljno, npr. "ivica", "moj-pc", itd. Obično se

računalu daje ime prema usluzi koju ono obavlja. Na primjer, tvrtkin Web posluţitelj zove se

"www.tvrtka.hr", FTP posluţitelj "ftp.tvrtka.hr", itd.

Ime domene odreĎuje tvrtka ili organizacija koja je vlasnik te domene. Tako je npr.

iskon.hr naziv domene tvrtke Iskon internet. Vlasnici domene mogu unutar nje otvarati

poddomene po svom izboru. Na primjer, podrska.iskon.hr je poddomena unutar domene

iskon.hr. Ime poddomene upisuje se ispred imena domene.

Ime vrhovne domene ili top-level domene uglavnom označava čime se tvrtka ili

organizacija bavi.

Najpoznatije vrhovne domene su:

.com - commercial - komercijalne organizacije

.edu - educational - obrazovne ustanove (SAD)

.gov - government - vladine ustanove (SAD)

.mil - military - vojne ustanove (vojska SAD-a)

.net - network - organizacije za administraciju mreţnih servisa i mreţa općenito

.org - organization - ostale organizacije

Takva podjela ostala je iz vremena nastanka Interneta, koji se razvijao uglavnom u SAD-u,

tako da je većina adresa s tim domenama u SAD-u. Širenjem Interneta zemlje su dobivale svoje

vrhovne domene, tj. dvoslovne kodove zemalja (country codes). Tako npr. postoje:

Page 22: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

15

.hr - Hrvatska

.de - Njemačka

.uk - Ujedinjeno Kraljevstvo

.at - Austrija

.pl - Poljska

.si - Slovenija

.hu – MaĎarska, itd.23

Primjer adrese: www.tvrtka.hr. Ime računala je "www", domena je "tvrtka", vrhovna

domena je ".hr".

2.3.6.4. URL

Za razliku od IP adrese koja odreĎuje pojedina računala, URL (Uniform Resource Locator)

je standardizirana shema adresiranja sadrţaja na Internetu, koja korisniku olakšava pronalaţenje

tih sadrţaja. Svaki sadrţaj koji je dostupan putem Interneta ima svoj jedinstveni URL.

URL je jedna od temeljnih inovacija u povijesti Interneta. Sintaksa ove adrese je osmišljena

kako bi bila generička, proširiva, te u mogućnosti prikazati adresu u bilo kojem setu znakova.24

URL se sastoji od slova, brojki i točaka. Osnovna struktura URL-a je hijerarhijska, s time da

hijerarhija raste s lijeva na desno:

protokol://ime_posluţitelja.ime_domene.ime_vrhovne_domene:port/ime_direktorija/ime

_datoteke

Primjer: http://www.fizika.unios.hr/cms/fizos/hr/pocetna.html je URL početne stranice

Web mjesta (Web site-a) Odjela za fiziku.

Protokol koji se koristi je HTTP.

Sadrţaj koji se traţi nalazi se na posluţitelju "www" u domeni "fizika.unios", koja

pripada Odjelu za fiziku. Vrhovna domena je ".hr" i ona označava Hrvatsku.

Traţeni sadrţaj je HTML dokument "pocetna.html" koji se nalazi u direktoriju

/cms/fizos/hr/ na posluţitelju, odnosno početna Web stranica.

23

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 4. 24

URL, http://hr.wikipedia.org/wiki/URL (pristupljeno 17.10.2011.)

Page 23: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

16

Treba reći da nije potrebno navoditi ime dokumenta ako se traţi početna stranica Web

mjesta na nekom posluţitelju ili u poddirektoriju, jer u tom slučaju posluţitelj automatski šalje

početnu stranicu. Drugim riječima link: http://www.fizika.unios.hr će prikazati istu stranicu kao u

prethodnom primjeru. MeĎutim, ako se traţi stranica koja nije početna, mora se upisati njezino

ime, npr. http://www.fizika.unios.hr/game.html.

Page 24: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

17

3. World Wide Web

WWW, World Wide Web ili jednostavno Web je dinamična enciklopedija Web stranica na

Internetu u kojoj moţemo pronaći informacije o gotovo svemu čega se sjetimo. Količina

informacija koje nam Web nudi i raznolikost njihovih sadrţaja su zapanjujuće. Korištenje Weba,

tj. pregledavanje web stranica često se naziva „surfanje“. Web se kao najpoznatija i

najkorištenija usluga na Internetu često pogrešno poistovjećuje sa samim Internetom.

Web se danas sastoji od oko 250 milijuna Web mjesta (Web site-ova). Web mjesto se moţe

sastojati od jedne ili više Web stranica, a velika Web mjesta mogu se nalaziti na više posluţitelja

na raznim stranama svijeta.

Informacije pohranjene na web stranicama oblikovane su posebnim programskim jezikom,

HTML-om. Dokumente stvorene HTML-om zovemo hipertekst (tekst koji je ipak više od

teksta). On objedinjuje različite vrste informacija - tekst, slike, zvukove i sl. - povezane

poveznicama (linkovima). Svaki pritisak na poveznicu (link) vodi nas na novi sadrţaj, odnosno

na novu stranicu.25

3.1. Web stranica (HTML, hipertekst, link)

Ukupnost web stranica je zapravo WWW. Web stranica je dokument dostupan putem Weba.

Web site ili Web mjesto se sastoji od jedne ili više Web stranica. Pojam stranica ne odnosi se na

njezinu veličinu, tako da Web stranica moţe biti duţa od slike na ekranu ili zauzimati više od

jednog papira kada se njen sadrţaj tiska na papir.

Web stranice sadrţe tekst, slike, video i audio sadrţaje te poveznice na druge stranice ili

usluge na Internetu. Sadrţaj i izgled Web stranica definira se HTML jezikom (HyperText

Markup Language), zbog čega se stranice nazivaju još i HTML dokumenti. Imena Web stranica

najčešće imaju nastavak „.html“ ili „.htm“. Ponekad se Web stranice nazivaju i hipermedijalni ili

hipertekstualni dokumenti.26

25

Internet 2010. in numbers, http://royal.pingdom.com/2011/01/12/internet-2010-in-numbers/ (pristupljeno

26.09.2011.) 26

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 4.

Page 25: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

18

3.1.1. Hipertekst i linkovi

Iako je hipertekst u svom formatu samo tekst, pokazati ćemo zašto je on više od teksta.

Prema Jonassenu hipertekst se sastoji od fragmenata teksta koji označavaju dijelove ili svojstva

stranice. Ti fragmenti se nazivaju tagovi.27

Hipertekst je tekst kodiran korištenjem programskog

jezika HTML, tako da sadrţi linkove ili poveznice (hiperlinkovi). Linkovi mogu biti tekstualni

(riječ, rečenica ili dio teksta) ili grafički (slika, ikona i sl.). Linkovi upućuju na neki drugi sadrţaj

na Internetu. To moţe biti druga Web stranica, slika, dokument ili neki drugi sadrţaj ili usluga.

Odabir linka otvara sadrţaj na koji link pokazuje. Tekstualni linkovi u nekom tekstu obično su

plave boje i podvučeni. Kada u pregledniku postavimo pokazivač miša na neki link, on se

mijenja iz kose strelice u ruku.

Izvor: Buhin, P.: Internet, 2008., www.inet.hr/~jadransu/dokumenti-informatika/cetvrti/

INTERNET.ppt (pristupljeno 03.10.2011.)

Slika 5. Shematski prikaz Web stranica i poveznica (linkova) na druge stranice

3.1.2. HTML

HTML je skraćenica engleskog naziva HyperText Markup Language. HTML je programski

jezik koji se koristi za kreiranje Web stranica upotrebom standardnih kodova, zvanih tagovi.

Pomoću tagova se definira izgled dokumenta - boja pozadine, veličina i oblik slova, poloţaj

slika, linkovi, itd. Web preglednik interpretira tagove i priprema dokument za prikaz na ekranu.

27

Jonassen, D.H.: Hypertext/hypermedia, Educational Technology Publications, Inc., New Jersey, 1992., str. 7.

Page 26: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

19

HTML je standardiziran i neovisan o platformi, tako da se HTML dokumenti mogu pregledavati

pomoću raznih preglednika na različitim vrstama računala i ureĎaja. Budući da su HTML

dokumenti tekstualne datoteke moţemo ih pregledavati i ureĎivati u bilo kojem alatu za obradu

teksta, pa čak i u Notepadu.28

3.1.3. Tagovi

HTML tagovi se koriste za definiranje dijelova dokumenata koji imaju neku

karakteristiku. Sastoje se od koda koji se nalazi izmeĎu znakova < i >. Na primjer, <B> i </B>

su početni i završni tag za označavanje teksta koji treba biti prikazan podebljano (bold).

Pogledajmo još nekoliko osnovnih tagova:

tag

opis

primjer

Rezultat

<h1>

Definira veličinu naslova (heading).

<h1>Najveći naslov</h1>

Najveći naslov

<h3>

Definira veličinu naslova (heading).

<h3>Srednji naslov</h3>

Srednji naslov

28 Html tagovi svojstva i komentari, http://www.racunalstvo.net/html-tutorijali/html-tagovi-svojstva-i-komentari

(pristupljeno 10.10.2011.)

Page 27: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

20

<h6>

Definira veličinu naslova (heading).

<h6>Najmanji naslov</h6>

Najmanji naslov

Naslovi su napravljeni tagovima, od <h1> za najveći do <h6> za najmanji naslov, pri čemu slova

u tagu označavaju nivo naslova.

<i>...</i>

Definira kosi stil slova (italic).

Ovo su <i>koso pisana</i> slova.

Ovo su koso pisana slova.

<b>...</b>

Definira podebljana slova (bold).

Ovo su <b>podebljana ili bold</b> slova.

Ovo su podebljana ili bold slova.

itd.

3.1.4. HTTP

Ukratko, protokol za prenošenje Web stranica. HTTP je skraćenica engleskog naziva

HyperText Transfer Protocol. To je protokol, tj. skup pravila koja se koriste za prijenos

hipertekstualnih dokumenata (Web stranica) izmeĎu dva računala. HTTP se zasniva na

arhitekturi klijenta i posluţitelja - radi tako da računalo A (klijent) uspostavlja vezu s računalom

B (posluţitelj) i šalje zahtjev za nekim sadrţajem. Posluţitelj prima zahtjev, te traţeni sadrţaj

šalje klijentu. Naravno to se sve odvija unutar TPC/IP protokola koji je, kako smo rekli, osnovni

protokol na Internetu. Najčešće traţeni sadrţaji su HTML dokumenti, tj. Web stranice.29

29

HTTP, http://hr.wikipedia.org/wiki/HTTP (pristupljeno 21.09.2011.)

Page 28: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

21

HTTP je samo jedan od protokola aplikativne razine koji postoje na Internetu, ali pruţa

pristup i do ostalih Internet protokola koji su već ranije nabrojani:

FTP (File Transfer Protocol) - protokol za prijenos datoteka;

SMTP (Simple Mail Transfer Protocol) - protokol za slanje e-mail poruka;

NNTP (Network News Transfer Protocol) - protokol za praćenje news grupa;

Telnet - protokol za istoimenu uslugu koja omogućava rad na fizički udaljenim

računalima.

3.1.5. Web posluţitelj i Web mjesto (Web site)

Web posluţitelj je računalo spojeno na Internet na kojem je pokrenut poseban program za

Web. Na Web posluţiteljima su pohranjene Web stranice, tj. HTML dokumenti zajedno sa svim

slikama, video i audio zapisima i ostalim sadrţajima koji ih sačinjavaju. Web posluţitelji primaju

zahtjeve od Web klijenata (Web preglednika) i šalju traţene sadrţaje.

Web site ili Web mjesto je skup smisleno povezanih Web stranica koje se nalaze na Web

posluţitelju. Primjerice www.iskon.hr je Web mjesto tvrtke Iskon Internet koje se sastoji od

nekoliko desetaka Web stranica. Web site se moţe sastojati od jedne ili više Web stranica, a

veliki Web site-ovi mogu se nalaziti i na više posluţitelja na raznim stranama svijeta. Isto tako,

na jednom Web posluţitelju moţe se nalaziti više Web site-ova, svaki sa svojom zasebnom

adresom.30

3.2. Web preglednici

Stranice napisane u HTML-u Web preglednici prikazuju korisniku u vizualno prihvatljivom

obliku. Web preglednik je dakle program za preuzimanje, predstavljanje i kretanje meĎu

informacijskim resursima na Webu.

Informacijski resursi koje traţimo se nalaze na URL-ovima, oni mogu biti Web stranice,

slike, videozapisi ili drugi sadrţaji. Hiperveze (linkovi, poveznice) na tim informacijskim

30

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 18.

Page 29: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

22

resursima (npr. Web stranicama) omogućavaju jednostavnu navigaciju prema drugim srodnim

resursima. Web preglednik moţemo definirati i kao aplikaciju ili program dizajniran kako bi

korisnicima omogućio pristup, preuzimanje i pregled dokumenata i drugih resursa na Internetu.

Iako su preglednici prvenstveno namijenjeni za pristup WWW-u, oni takoĎer sluţe za

pristup informacijama koje se nalaze na Web posluţiteljima u privatnim mreţama ili datotekama

lokalnog sustava.31

Na primjer dio početne Web stranice Odjela za fiziku u HTML-u izgleda ovako:

Slika 6. Dio HTML koda početne Web stranice Odjela za fiziku

31

Web Browser, http://en.wikipedia.org/wiki/Web_browser (pristupljeno 23.09.2010.)

Page 30: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

23

Dok slika 7 prikazuje izgled dijela početne Web stranice Odjela za fiziku u Web pregledniku.

Slika 7. Izgled dijela Web stranice Odjela za fiziku u Web pregledniku

Page 31: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

24

4. Pretraţivanje Weba

Danas na Internetu postoji oko 255 milijuna Web mjesta (Web site-ova), sa vjerojatno preko

milijardu Web stranica. Ako „surfamo“ Webom, odnosno nasumce slijedimo linkove s jedne na

drugu stranicu, moţemo pronaći zanimljive i korisne Web stranice i Web mjesta. MeĎutim, to

nije učinkovito ukoliko traţimo odreĎenu informaciju. U tom slučaju moţemo koristiti neku od

specijaliziranih usluga za pretraţivanje Weba, tzv. traţilice (search engines) ili Web imenike

(kataloge Web stranica, Web directories), koji nam mogu olakšati pronalaţenje ţeljene

informacije, odnosno usluge.32

Traţilice rade na principu tzv. ključnih riječi (keywords), odnosno tako da u traţilicu

unosimo jedan ili više pojmova koji se odnose na sadrţaj koji traţimo. Tada one pregledavaju

svoju bazu Web stranica (index) i pronalaze one stranice u kojima se spominju uneseni pojmovi -

rezultat pretraţivanja je popis linkova na Web stranice koje odgovaraju našem upitu.

Web imenici ili katalozi Web stranica sadrţe adrese Web stranica razvrstane po tematskim

kategorijama i to od općenitih prema detaljnijima. Birajući kategorije dolazimo do ţeljenih Web

stranica. Razlika izmeĎu traţilica i Web imenika se u zadnje vrijeme sve više smanjuje, pa

traţilice imaju popise Web stranica po kategorijama, a Web imenike moţemo pretraţivati

pomoću ključnih riječi.

Postoje i tzv. metatraţilice koje za pretraţivanje ne koriste vlastitu bazu Web stranica, već

postavljeni upit šalju na nekoliko ostalih pretraţivača i rezultate objedinjuju u jedan popis.

Današnji pretraţivački site-ovi nude mogućnosti pretraţivanja ostalih sadrţaja na Internetu -

news članaka, slika, raznih vrsta datoteka, e-mail adresa, itd. Na njima se nude i razni dodatni

sadrţaji, kao što su najnovije vijesti i zanimljivosti, specijalizirane traţilice i vodiči i besplatna

e-mail usluga. Takve Web site-ove koji postaju "početno mjesto" za veliki broj korisnika

nazivamo Web portalima. Moderni Web preglednici takoĎer omogućavaju pretraţivanje Web

stranica unošenjem ključnih riječi u URL polje preglednika.33

32

Internet 2010. in numbers, http://royal.pingdom.com/2011/01/12/internet-2010-in-numbers/ (pristupljeno

26.09.2011.) 33

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 19.

Page 32: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

25

4.1. Web pretraţivači (traţilice, search engines)

Web traţilice koriste specijalne automatizirane programe za „šuljanje“, „gmizanje“ po Webu

(to crawl the web) koji se nazivaju Web crawlers (gmizavac, puzavac) ili Web spiders (pauci).

Oni „skaču“ sa Web stranice na Web stranicu preko poveznica (linkova, hiperlinkova),

prikupljajući naslove svih mjesta i neke dijelove njihovih sadrţaja. Kada pronaĎu Web mjesto

oni pretraţuju (snimaju, scan) Web stranice tog mjesta, te zapisuju informacije u indeks.

Indeksar je program kojemu je funkcija indeksiranje pronaĎenih informacija iz dokumenata i

spremanje u vlastitu katalošku bazu podataka. Cilj spider-a je posjetiti milijune Web mjesta i

ostati u vezi s njima koliko god je moguće.

Dalje pretraţivački programi provjeravaju aţurnost podataka prije pronaĎenih Web stranica i

Web mjesta, te ukoliko su se dogodile promjene, aţuriraju vlastiti indeks. Tako da kada

koristimo Web pretraţivače, zapravo ne pretraţujemo Web kao takav, već bazu podataka

(indeks) o Web mjestima koji je stvorio pojedini Web pretraţivač (traţilica).

Kako svaki pretraţivač ima vlastitu sliku Interneta u svojoj bazi podataka, tako se i rezultati

koje prikazuje pojedina traţilica na zahtjev korisnika razlikuju od traţilice do traţilice. Cilj

pretraţivača je korisniku dati odgovor na njegov upit i to takav odgovor koji će korisnika

zadovoljiti. Principi pretraţivanja pomoću spider-a ili crawler-a su poslovna tajna svakog

pretraţivača, jednako kao i principi rangiranja rezultata na osnovu korisničkoga upita. Doduše,

poznate su osnovne sheme principa pretraţivanja Weba i faktori koji utječu na rangiranje

rezultata.34

Osnovna shema pretraţivanja Weba pomoću crawler-a, indeksiranja Weba i

prikazivanja rezultata korisniku prikazana je slikom 8 na sljedećoj stranici.

34 Teţak, Đ. Pretraţivanje informacija na Internetu, Hrvatska sveučilišna naknada, Zagreb, 2001., str. 78.

Page 33: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

26

Izvor: Hearst, M.: Search Engines: Technology, Society, and Business, Irvine, 2005.. http://www2.sims.

berkeley.edu/courses/is141/f05/lectures/se-course-intro.pdf (pristupljeno 29.09.2011.)

Slika 8. Shema pretraţivanja Weba pomoću crawler-a, indeksiranja i korisničkog upita s

odgovorom

Popis dijela faktora koji utječu na rangiranje rezultata na osnovu korisničkog upita:

broj riječi iz upita koji se podudara s riječima na Web mjestu;

udaljenost podudarnih riječi meĎu sobom (ukoliko se upit sastoji do više riječi);

mjesto gdje se pojam nalazi na Web mjestu;

mjesto gdje se pojam nalazi pod tagovima <title>, <h1>, tekst poveznice, tekst tijela;

tekst sidra (anchor text) na stranicama koje su povezne sa stranicom koja se prikazuje

kao potencijalni rezultat pretraţivanja;

frekvencija pojavljivanja traţenih pojmova na Web stranici općenito;

analiza linkova koji pokazuju na ovu Web stranicu (broj poveznica stranice);

(ponekad) koliko puta su korisnici otvorili Web stranicu;

koliko je „svjeţa“ Web stranica.

Sve navedene uvjete kombiniraju kompleksne formule, te korisniku šalju odgovor u obliku

rezultata pretraţivanja.35

35 Hearst, M.: Overview of How Search Engines Work, Irvine, 2005., http://www.youtube.com/watch?v=

K8D5uL0y7ho (pristupljeno 29.09.2011.)

Page 34: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

27

4.2. Web imenici (Web directory)

Web imenici ili Web adresari (Web or link directory) su pojednostavljeno rečeno imenici

World Wide Weba. Specijaliziraju se u povezivanju na Web stranice i u kategorizaciji tih

poveznica.

Web imenik, dakle, nije Web traţilica (Web pretraţivač) i ne prikazuje rezultate na osnovu

ključnih riječi, umjesto toga, navodi web stranice po kategorijama i pod kategorijama. Većina

stavki u Web imenicima nije pronaĎena od strane crawler-a, već su ih pronašli i postavili ljudi.

Kategorizacija se obično temelji na cijelom Web mjestu (Web site-u), a ne po pojedinoj

stranici ili ključnim riječima. Najveća prednost Web imenika je u tome što su recenzirani od

strane ljudi, najčešće stručnjaka u pojedinim kategorijama, tako da ih moţemo smatrati prilično

vjerodostojnim izvorima informacija.36

4.3. Metatraţilice (Metasearch engines)

Za razliku od traţilica, metatraţilice ne pretraţuju Web kako bi na osnovu svojih

pretraţivanja korisniku prikazale rezultate. Umjesto toga one upit korisnika upućuju na nekoliko

traţilica i/ili baza podataka, te nakon toga stvaraju jednu listu rezultata koju prikazuju korisniku

kao jedinstveni rezultat pretraţivanja.37

Često se mogu podešavati i kriteriji pretraţivanja, odnosno kojim će traţilicama i bazama

podataka upit biti poslan i sl. Metatraţilice su nastale na percepciji da je cijeli Web prevelik da bi

ga indeksirao jedan Web pretraţivač, tako kombiniranjem rezultata nekoliko traţilica dobivamo

bolje rezultate. Korištenjem metatraţilica moţemo si i skratiti vrijeme koje je potrebno da bismo

upit postavili svakoj zasebnoj traţilici.38

36 Web Directory, http://en.wikipedia.org/wiki/Web_directory (pristupljeno 08.09.2011.) 37 Metacrawlers and Metasearch Engines, http://searchenginewatch.com/article/2066974/Metacrawlers-and-

Metasearch-Engines (pristupljeno 12.09.2011.) 38

Metasearch Engine, http://en.wikipedia.org/wiki/Metasearch_engine (pristupljeno 13.09.2011.)

Page 35: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

28

4.4. Nevidljivi ili duboki Web

Nevidljivi Web je dio Weba do kojega se ne moţe doći koristeći traţilice i Web imenike, dio

koji pauci ne pronalaze. Tu su znanstvene i komercijalne baze podataka, te knjiţnični katalozi,

koje treba pretraţivati izravno preko relevantne Internet adrese (URL-a).

Pauci indeksiraju statičke HTML stranice i ne pronalaze sadrţaj dinamičnih stranica, koji se

generira tek na upit pri pretraţivanju. „Pauk“ pronalazi traţenu stranicu, ali ne i njezin sadrţaj,

jer je vlasnik stranice odredio da će dijelovi stranice biti izuzeti iz pretraţivanja, a za pristup su

potrebni korisničko ime i lozinka.39

Neki od zaključaka istraţivanja o veličini i relevantnosti dubokog Weba koje je provedeno

2000. godine su:

sadrţaj na dubokom Webu je 400 do 550 puta veći od sadrţaja na površinskom Webu;

duboki Web sadrţi 7.500 terabajta informacija, dok površinski Web sadrţi samo 19

terabajta;

duboki Web sadrţi do 550 milijardi individualnih dokumenata, dok površinski Web

sadrţi 1 milijardu;

postoji više od 200.000 Web stranica koje se mogu svrstati u kategoriju dubokog Weba;

kvaliteta sadrţaja na dubokom Webu je jednu do dvije tisuće puta veća nego na

površinskom Webu.

Istraţivanje koje je proveo NEC Research Institute usporeĎivalo je indekse najvećih

svjetskih pretraţivača kao što su Google, AltaVista, Yahoo i nijedan indeks nije sadrţavao više

od 16% površinskog Weba. Ako uzmemo u obzir da pretraţivači uopće ne pretraţuju duboki

Web dobijemo da je samo 0.03% od cjelokupnog Weba pretraţivo putem konvencionalnih

pretraţivača. Ipak, 95% korisnika Weba koristi komercijalne pretraţivače. Treba uzeti u obzir da

su to starija istraţivanja i da se situacija, pogotovo količina podataka na Webu, znatno

promijenila. Ako se uzme u obzir da se sve više izraĎuju dinamičke Web stranice, za očekivati je

da su omjeri slični ili je još veći udio dubokog Weba.40

39

Pretraţivanje i vrednovanje informacija na internetu, Sveučilišna knjiţnica Sveučilišta Jurja Dobrile u Puli,

http://www.escape.hr/skpu/docs/Pretrazivanje_i_vrednovanje_informacija_na_internetu.ppt

(pristupljeno 12.10.2011.) 40 The Deep Web: Surfacing Hidden Value http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=

main;idno=3336451.0007.104 (pristupljeno 15.10.2011.)

Page 36: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

29

Sadrţaj dubokog Web-a bi se mogao svrstati u sljedeće kategorije:

online baze podataka: sadrţaj se dinamički generira tek kada se postavi odreĎeni upit,

čine najveći dio dubokog Web-a;

netekstualni sadrţaji kao što su multimedija, slike, programi i sl.;

sadrţaji koji zahtijevaju autentifikaciju;

sadrţaji koji se neprestano mijenjaju (portali s vijestima): taj sadrţaj se moţe indeksirati,

ali s obzirom da se često mijenja potrebna je neprestana aţurnost;

nepovezane stranice: Web stranice na koje ne vodi ni jedan link, pa „pauci“ do tih

stranica nikada ne dolaze;

sadrţaj na društvenim mreţama: razne rasprave, komentari i sl.;

stranice s ograničenim pristupom: stranice koje ne dozvoljavaju indeksiranje od strane

„pauka“.

Sherman i Price su podijelili sadrţaj dubokog Web-a u četiri glavne kategorije:

1. netransparentni Web (opaque Web): Sadrţaj koji moţe biti indeksiran, ali nije. Postoji

više razloga za to: s obzirom da je indeksiranje skup i dugotrajan posao (velika količina

podataka na Webu) neki pauci ne indeksiraju sve stranice na nekim Web mjestima;

roboti ne stignu indeksirati sve nove stranice i sve promjene koje se dogode na već

indeksiranim stranicama; na neke stranice ne vodi niti jedan link pa pauci ne mogu doći

do takvih stranica.

2. privatne mreţe (intranet) (private Web): Sadrţaj koji moţe biti indeksiran, ali je

namjerno onemogućeno njegovo indeksiranje ili pregledavanje. To moţe biti sadrţaj koji

je zaštićen lozinkom ili Web stranice koje koriste posebne robots.txt datoteke ili

'noindex' metatagove kako bi spriječili indeksiranje od strane robota.

3. sadrţaj koji je dostupan pod odreĎenim uvjetima (proprietary Web): To mogu biti

stranice koje zahtijevaju registraciju, koja moţe i ne mora biti besplatna. Moţe se raditi i

o sadrţaju koji nije besplatan, bilo da se radi o plaćanju samo odreĎenih stranica ili nekoj

vrsti pretplate na neke sadrţaje.

4. nevidljivi Web (truly invisible Web): Sadrţaj koji je tehnički teško indeksirati pomoću

pauka. To su uglavnom dinamičke Web stranice, a najčešći primjer za to su online ili

Internet baze podataka, koje čine glavninu dubokog Web-a.41

41

Sherman, C., Price, G.: The Invisible Web: Uncovering Information Sources Search Engines Can't See,

Information today, Inc., New Jersey, 2001., str. 70-74.

Page 37: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

30

4.5. Internetske (online) baze podataka

Internetske baze podataka su organizirane zbirke znanstvenih, poslovnih i drugih

informacija koje su pouzdane, a dostupne su na Webu. Većina zapisa u online bazama podataka

se odnosi na članke objavljene u časopisima.

U izradi online baza podataka sudjeluju različiti stručnjaci, uključujući knjiţničare

(definiraju strukturu baze podataka, polja zapisa), računalne stručnjake (izraĎuju bazu podataka,

sučelje i sustave pretraţivanja i pregledavanja) i indeksare (opisuju radove ključnim riječima

odnosno predmetnicama).

Vrste online baza podataka:

bibliografske baze podataka: Sadrţe bibliografske podatke o radovima objavljenim u

različitim publikacijama. Danas se često zapisi unutar bibliografskih baza povezuju sa

elektroničkim verzijama radova na Webu.

citatne baze podataka: Bibliografske baze podataka, koje osim samih radova opisuju i

popise korištene literature koje autori navode u svojim radovima. Daju odgovor na

pitanje koji su radovi najviše citirani, dakle oni koji su na neki način najrelevantniji

unutar nekog područja.

baze podataka s cjelovitim tekstovima: Imaju mogućnost uvida u cjeloviti tekst pojedinog

rada, zajedno s bibliografskim opisom rada.42

42

Duboki Web, http://hr.wikipedia.org/wiki/Duboki_Web (pristupljeno 19.09.2011.)

Page 38: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

31

5. Traţenje informacija na webu

U ovome su poglavlju opisane osnovni pojmovi i tehnike pomoću kojih se mogu postizati

kvalitetni i relevantni rezultati pretraţivanja. Većina traţilica i internetskih baza podataka nudi

osnovno (basic) i napredno (advanced) pretraţivanje. Tehnike koje su ovdje opisane mogu se

koristiti u oba tipa pretraţivanja.

Vodilja za ovo i posljednje poglavlje rada bila je knjiga autorice Ţeljane Vučine naslova

Pretraţivanje i vrednovanje informacija na internetu, iz koje je i preuzet velik dio materijala.43

5.1. Ključne riječi

Ključna riječ je ona riječ koja najbolje opisuje sadrţaj odreĎenog dokumenta. U knjiţnicama

i znanstvenim, te drugim bazama podataka ključne riječi odreĎuju predmetni stručnjaci, ljudi

zaduţeni da pojedinom dokumentu pridruţe riječi kojima se najbolje opisuje njihov sadrţaj.

Mnogi sadrţaji na Internetu nisu tako ureĎeni, jer gotovo svatko moţe napraviti stranicu na

Internetu. Nadalje, kada pretraţujemo mreţne stranice korištenjem traţilica, ne pretraţujemo

sreĎene ključne riječi, već cjelovite tekstove (full text) mreţnih stranica koje su sakupili pauci.

Pri pregledavanju mreţnih imenika, kao što je slučaj s Yahooovim imenikom, pretraţujemo

samo naslove i ključne riječi odreĎenog dokumenta smještenog unutar odreĎene kategorije.

Jedini način da pretraţujemo po ključnim riječima koje je odredio autor dokumenta, jest da

pretraţujemo po poljima (naslovu, URL-u, datumu objavljivanja), ali na taj način često ne

dolazimo do onih dokumenata koji su nam potrebni.

Opisano je nekoliko osnovnih pravila za kvalitetan odabir ključne riječi:

Trebamo odrediti temu.

Zatim odrediti ključnu riječ (kao ključnu riječ trebamo koristit riječ koja najpreciznije

opisuje temu o kojoj ţelimo pronaći informacije).

43

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 27.

Page 39: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

32

Ako pretraţivanjem po nekoj ključnoj riječi nismo pronašli ni jedan dokument,

provjerimo jesmo li točno napisali riječ. Naime, gotovo 80% nezadovoljavajućih

rezultata pretraţivanja posljedica su neispravnog upisivanja riječi pri postavljanju upita.

Zbog načina na koje traţilice indeksiraju Web prostor ne treba biti iznenaĎujuće ako od

prvog pokušaja ne doĎemo do zadovoljavajućih informacija.

Nakon što smo od traţilice dobili rezultate, pregledajmo prvih nekoliko informacija.

Ako jedan od dokumenata odgovara onome što smo traţili, a rado bismo pronašli još

dokumenata s istom temom, pogledajmo koje se ključne riječi koriste u tom dokumentu, ako

postoji podatak o tome, te kojoj kategoriji pripada dokument. Pogledajmo i koja se osobna imena

javljaju u tom dokumentu, te ima li dokument bibliografiju koja nam moţe biti dobar putokaz za

nastavak pretraţivanja.

Nakon toga nastavimo s pretraţivanjem po tim ključnim riječima, odnosno autorima.

Pretraţujmo nekoliko puta koristeći ključne riječi i osobna imena iz dokumenata dobivenih

unutar prvih rezultata pretraţivanja. Većina traţilica na dnu prozora koji sadrţi rezultate

pretraţivanja omogućuje nastavak pretraţivanja unutar dobivenih rezultata.

Ako smo dobili previše rezultata, moţemo nastaviti pretraţivati unutar dobivenih

rezultata tako da još više preciziramo ključne riječi. 44

Po dovršenom pretraţivanju odredimo koliko nam je vaţna relevantnost dobivenih podataka,

jer ovisno o razlogu traţenja, nije uvijek jednako vaţno koliko su informacije provjerene. Ovisno

o tome, obratimo pozornost na više pokazatelja s pomoću kojih moţemo vrednovati dobivene

rezultate. Vrednovanje informacija na Internetu obraĎeno je u idućem poglavlju rada.

Ako pretraţujemo dokument o nekom predmetu, obratimo pozornost na korištenje stručnog

nazivlja vezanog uz temu koju pretraţujemo. Jer ako pretraţujemo preko manje stručnih termina,

smanjuje se mogućnost dobivanja relevantnih rezultata pretraţivanja.45

44

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 27-28. 45 Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 30.

Page 40: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

33

5.2. Booleovi operatori

Većina Internet baza podataka i Web pretraţivača podrţavaju Boolove operatore. Boolova

tehnika pretraţivanja se koristi kako bismo bili efikasniji pri pretraţivanju, izbacujući iz

pretraţivanja mnoge nevaţne dokumente.46

Pri pretraţivanju koje se temelji na Booleovoj logici koristimo tri logička operatora. Oni su

jedan od vaţnih alata pri formuliranju upita, te se pri pretraţivanju koristimo njihovim engleskim

oblikom. Booleovi operatori su: AND (i), OR (ili) i NOT (ne).

Operator AND suţava pretraţivanje, tako da rezultati pretraţivanja uključuju samo one

dokumente koji uključuju sve nazive povezane operatorom.

Operator OR proširuje pretraţivanje na dokumente koji uključuju bilo koji pojam povezan

operatorom. Upotrebom ovog operatora isključuje se dupliranje dokumenata.

Operator NOT koristi se za isključivanje nekog termina iz pretraţivanja.

Na sljedećim slikovitim primjerima moţemo vidjeti kako funkcionira pretraţivanje

korištenjem Boolovih operatora i rezultate koje bismo dobili korištenjem svakog operatora

pojedinačno, povezujući dva pojma, odnosno povezujući dvije ključne riječi.

Primjer. Pretraţivanje ključnim riječima mačke i psi.

1. Operator AND: mačke AND psi

Slika 7. Prikazuje samo one dokumente koji govore i o mačkama i o psima

46

Bollean, http://websearch.about.com/od/internetresearch/a/boolean.htm (pristupljeno 10.10.2011.)

Page 41: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

34

2. Operator OR: mačke OR psi

Slika 8. Prikazuje sve dokumente o psima, sve dokumente o mačkama i sve dokumente o

mačkama i psima.

3. Operator NOT: psi NOT mačke

Slika 9. Prikazuje samo dokumente o psima, ali ne i dokumente koji govore i o mačkama i o

psima.

Pojedine traţilice različito označavaju Booleove operatore i različito ih uključuju kada

pretraţujemo nekoliko riječi. Prije nego što uputimo upit nekoj traţilici, preporučljivo je

provjeravanje simbola kojima se prikazuju Booleovi operatori, te koji od njih traţilica

automatski uključuje pri pretraţivanju više od jedne riječi.47

47

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 31.

Page 42: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

35

Ovisno o traţilici, umjesto da pišemo operatore slovima (u tom slučaju ih upisujemo velikim

tiskanim slovima, bez obzira na to prepoznaje li traţilica ili ne mala i velika slova) moţemo ih

zamijeniti znakovima:

AND=+ (dogs +cats)

NOT=- (dogs -cats)

OR=| (dogs |cats)

Obratimo pozornost na to da ne stavljamo razmak izmeĎu simbola za Booleove operatore i

riječi koju, ovisno o operatoru, ţelimo uključiti ili isključiti iz pretraţivanja, te da simbol | ne

postoji na hrvatskim tipkovnicama.48

5.3. Pretraţivanje fraza korištenjem navodnika

Ukoliko ţelimo pretraţivati odreĎenom frazom - izrazom koji se sastoji od nekoliko riječi,

moramo ju upisati meĎu navodnike. Ako koristimo Booleov operator AND, kao rezultate

pretraţivanja dobiti ćemo one stranice koje u sebi sadrţavaju sve riječi iz upita, ali ne kao frazu;

traţilica se neće obazirati na poredak riječi. Na primjer, ţelimo li pronaći stranice koje govore o

kvantnoj teoriji u naredbeni redak upisati ćemo „kvantna teorija“.49

5.4. Pretraţivanje prirodnim jezikom

Mnoge traţilice omogućavaju pretraţivanje prirodnim jezikom. To znači da ne moramo

uvijek koristiti samo ključne riječi za pretraţivanje već moţemo postaviti upit onako kako bismo

ga postavili svom sugovorniku. Nakon što postavimo pitanje prirodnim jezikom, program

procesira naš upit, ispravlja eventualne greške u pisanju i sugerira drugačije upite. Ako ne

dobijemo zadovoljavajuće rezultate pretraţivanja, moţemo promijeniti redoslijed riječi u upitu

tako da riječ najvaţniju za upit upišemo na prvo mjesto. Ako su u upit uključene fraze, uvijek ih

upisujemo meĎu dvostruke navodnike.50

48 Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 32. 49

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 32. 50

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 32.

Page 43: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

36

5.5. Kraćenje (stemming)

U lingvistici i pribavljanju informacija kraćenje je tehnika pretraţivanja koja nam

omogućuje da pronaĎemo više riječi istog korijena. Mnoge traţilice koriste kraćenje tako da

riječi istoga korijena uključuju u pretraţivanje kako bi proširile povratne rezultate.51

Simbol koji

se koristi za kraćenje nije isti kod svih traţilica. Najčešće je to zvjezdica (*).

Postoje dvije vrste kraćenja:

lijevo - znak za kraćenje dolazi na početku riječi,

desno - znak za kraćenje dolazi na kraju korijena riječi.

Prije pretraţivanja treba provjeriti podrţava li odreĎena traţilica kraćenje.

Primjer

gastroenterolo* uključit će sve ove riječi:

gastroenterology, gastroenterologyst, gastroenterologyc,gastroenterologycal.

human* uključit će sve ove riječi:

humanity, humanitarian, humanistic, humanoid.

Kod korištenja kraćenja potrebno je dobro poznavati engleski jezik. Odabrani početak

(korijen) riječi ne smije biti prekratak jer to znatno proširuje rezultat pretraţivanja i pretraţivanje

vodi u pogrešnom smjeru.

Neke traţilice ne podrţavaju kraćenje. Ako traţilica ne podrţava kraćenje, trebalo bi upisati

sve gramatičke oblike riječi koji su nam vaţni za pretraţivanje i povezati ih Booleovim

operatorom OR!52

5.6. Zamjenski znakovi (wildcards)

Engleski izvorni naziv wild card dolazi iz kartaških igara u kojima je wild card karta koja

zamjenjuje bilo koju drugu kartu (najčešće joker).

Zamjenski znakovi su simboli koji se nalaze unutar riječi i koji zamjenjuju jedan ili više

znakova (slova, brojeva i sl.). Ovaj način pretraţivanja omogućuje pretraţivanje termina za koje

51

Stemming, http://en.wikipedia.org/wiki/Stemming (pristupljeno 11.10.2011.) 52

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 33.

Page 44: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

37

nismo sigurni kako se točno pišu - bilo zbog našega neznanja, bilo zbog razlika u pisanju izmeĎu

npr. britanskog i američkog engleskog. Time pretraţujemo, odnosno dobivamo jezično različite

oblike istog pojma:

Primjer 1

colour (britanski engleski)

color (američki engleski).

Moţemo pretraţivati i različite gramatičke oblike iste riječi:

Primjer 2

woman (jednina)

women (mnoţina).

Upotreba zamjenskih znakova, kao i u slučaju ostalih tehnika pretraţivanja, razlikuje se od

traţilice do traţilice. Neke traţilice, npr. Google, dopuštaju upotrebu zamjenskih znakova

isključivo za cijele riječi, a ne za slova unutar riječi. Na prvi pogled to moţda nije praktično, ali

u tom slučaju problem s pojedinim slovima moţemo riješiti korištenjem Booleovog operatora

OR: color OR colour. Ako traţilica ne podrţava zamjenske znakove za slova, upisujemo više

inačica pisanja odreĎene riječi i povezujemo ih Booleovim operatorom OR, uvijek ga pišući

velikim tiskanim slovima ili ekvivalentom koji koristi odreĎena traţilica.53

Sljedeći se zamjenski znakovi mogu koristiti kao kriteriji usporedbe za filtere, te prilikom

pretraţivanja i zamjene sadrţaja:

? (upitnik) umjesto jednog znaka, npr. ko?ač pronalazi „kopač“, „kolač“ i „kovač“;

* (zvjezdica) umjesto više znakova, npr. *istok pronalazi „sjevoroistok“ i „jugoistok“.54

5.7. Zaustavne riječi (stop words)

Zaustavne riječi su najčešće članovi, veznici i prijedlozi (a, an, any, the, to, with, from, for,

of, that, who) koje program zanemaruje pri pretraţivanju. Osim navedenih riječi, traţilice

zanemaruju i Booleove operatore AND, OR, NOT. Dakle, potpuno je svejedno upisujemo li u

redak za pretraţivanje forms of narrative ili forms narrative jer će riječ „of“ biti isključena iz

pretraţivanja.

53

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 33-34. 54

Zamjenski znakovi, http://office.microsoft.com/hr-hr/excel-help/zamjenski-znakovi-HP005203612.aspx (pristuplje

no 13.10.2011.)

Page 45: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

38

Neke traţilice, nakon što je pretraţivanje izvršeno, točno navedu koje su riječi izuzete iz

pretraţivanja. Traţilica zanemaruje te riječi zato što su one najčešće nebitne za pretraţivanje. Ali

što ako je neka od tih riječi vaţna za pronalaţenje dokumenata? U tom slučaju navedenu riječ

upisujemo unutar navodnika ili ispred nje stavljamo znak + (bez razmaka). Ako se zaustavne

riječi nalaze unutar fraze, odnosno izraza, traţilice ih uglavnom uključuju u pretraţivanje. Vaţno

je napomenuti da su popisi riječi koje su izuzete iz pretraţivanja različiti kod pojedinih

traţilica.55

5.8. Pretraţivanje po poljima (field search)

Još jedna tehnika pretraţivanja je pretraţivanje po poljima. Svaki mreţni dokument sastoji

se od dijelova koje nazivamo poljima. To mogu biti: cjelovit tekst dokumenta, naslov, format

dokumenta, poveznice unutar njega. Tehnika pretraţivanja po poljima omogućuje nam daljnje

specificiranje upita, odnosno suţavanje pretraţivanja, a moţemo je koristiti kako unutar

naprednog pretraţivanja pojedine traţilice, tako i unutar osnovnog pretraţivanja uz korištenje

specijalnih operatora polja.56

Ako pretraţujemo po cjelovitom tekstu stranice, nakon što smo dobili rezultate pretraţivanja

i stigli do ţeljene stranice, traţenu riječ/izraz unutar nje naći ćemo tako da pritisnemo ctrl+F (ako

koristimo PC), odnosno command+F (ako koristimo Mac).

5.9. Strategija pretraţivanja

Pretraţivanje je u načelu aktivnost usmjerena na rješavanje informacijskog problema.

Problem treba prvo spoznati pa potom pokušati odabrati odgovarajući pristup za njegovo

rješavanje - pronalaţenje potrebne informacije. Onaj koji traţi informaciju treba prvo odrediti

55

Jurasić, A.: Internet, Odjel za matematiku sveučilišta u Rijeci, Rijeka, 2009. http://www.math.uniri.hr/~ajurasic/I-

2.pdf (pristupljeno 14.10.2011.) 56

Pelivan, I.: Pronalaţenje informacija na internetu i pretraţivanje baza podataka, Stomatološki fakultet sveučilišta u

Zagrebu, Zagreb, 2011.http://www.sfzg.unizg.hr/_download/repository/Pronalazenje_informacija_na_Internetu_

i_pretrazivanje_baza_podata ka.pdf (pristupljeno 15.10.2011.)

Page 46: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

39

predmet pretraţivanja koji se najčešće opisuje ključnim riječima. Potom treba postaviti strategiju

pretraţivanja, odnosno odabrati odgovarajuće tehnike pretraţivanja.

U sljedećoj tablici je naveden popis pitanja koja bismo si trebali postaviti prije nego što

započnemo pretraţivanje. U desnom dijelu tablice ponuĎeni su alati i tehnike pretraţivanja koje

je, ovisno o upitu, najbolje koristiti u svrhu dolaska do kvalitetnih rezultata pretraţivanja.57

Tablica 1. Strategija pretraţivanja

Znamo li doista točno što nas zanima?

Koliko je uska/široka tema koja nas

zanima?

Ako je tema uska koristit ćemo traţilice, a ako je

široka, mreţne imenike.

Koje riječi najbolje opisuju temu koja nas

zanima? Jesu li to pojedinačne riječi ili

fraze?

Koristit ćemo pretraţivanje po ključnim riječima.

Ako pretraţujemo po frazama, koristit ćemo

navodnike kako bi pronašli točno takvu frazu („biti

ili ne biti“).

Ima li traţena riječ/pojam sinonime? Koristit ćemo Booleov operator OR.

(adolescenti OR tinejdžeri OR mladi ljudi)

Piše li se traţena riječ/pojam drugačije na

američkom, odnosno britanskom

engleskom?

Koristit ćemo Booleov operator OR.

(theater OR theatre)

Postoje li teme koje se često povezuju s

tom temom, a koje ţelimo izbjeći?

Koristit ćemo Booleov operator NOT.

(čokolada NOT tamna)

Znamo li neko osobno ime povezano s

tom temom? Ima li ta osoba pseudonim ili

različite inačice pisanja imena?

Koristiti ćemo velika slova pri pretraţivanju

osobnih imena i operator OR ako osoba ima

pseudonim. (Dunja Robić OR Mira Dupelj)

Postoje li teme s kojima ţelimo povezati

traţenu temu?

Koristit ćemo Booleov operator AND.

(university AND scholarship)

Koji su podreĎeni/nadreĎeni pojmovi

traţenoj ključnoj riječi?

NadreĎene pojmove koristit ćemo ako ne moţemo

pronaći informacije o uţem pojmu.

Znamo li organizacije koje se bave našim

područjem interesa?

Traţiti ćemo početne stranice (homepage) tih

organizacija.

Kakvoj čitateljskoj publici ţelimo

namijeniti tekst?

Pretraţivati ćemo po odreĎenim vršnim domenama.

(informacije o američkom obrazovnom sustavu

traţiti ćemo unutar domene .edu).

Moţemo li za traţenu temu u nekim

tiskanim izvorima informacija pronaći

korisne izvore na Internetu?

Pregledati ćemo bibliografije naslova vezanih uz

traţenu temu i pronaći navode li izvore informacija

na Internetu.

Izvor: Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 36.

57

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 36.

Page 47: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

40

5.10. Kako formulirati upit

Kada smo odabrali strategiju pretraţivanja, moţemo formulirati upit koji ćemo uputiti

odabranoj traţilici.

Upit ćemo kvalitetno postaviti ako slijedimo ove korake:

1. Problem, odnosno zahtjev, definirati ćemo i najbolje formulirati u jednoj rečenici.

2. Potom ćemo rečenicu raščlaniti na samostalne dijelove: fraze, riječi, kratice.

3. Za svaki od dijelova rečenice definirati ćemo srodne nazive i/ili sinonime, imajući u vidu

različitosti u terminologiji te pokriti sve gramatičke oblike korištenih naziva.

4. Srodne ključne riječi povezati ćemo operatorom OR.

5. Dijelove rečenice povezati ćemo operatorom AND.

Primjer:

Zanimaju nas informacije o tome pospješuje li konzumiranje zelenog čaja dijetu?

1. Formulirati ćemo upit: zeleni čaj i dijeta.

2. Rastaviti ćemo upit na samostalne dijelove: zeleni čaj; dijeta.

3. Definirati ćemo srodne pojmove za svaki dio upita: dijeta = smanjenje tjelesne težine =

mršavljenje.

4. Pretraţivati ćemo:

a. zeleni čaj kao frazu,

b. srodne pojmove povezane operatorom OR: dijeta OR smanjenje tjelesne težine OR

mršavljenje.

5. Kad pretraţimo svaki dio upita pojedinačno (a i b), spojiti ćemo ih Booleovim

operatorom AND i dobiti informacije o traţenoj temi.

Ovo je osnovno načelo postavljanja upita i pretraţivanja. Uz napomenu da svaki alat za

pretraţivanje ima svoje osobitosti.58

58

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 37.

Page 48: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

41

6. Kriteriji vrednovanja mreţnih izvora informacija

Sadrţaj ovoga poglavlja bi se ukratko moglo prepričati pomoću „tri zakona za informacije

na Webu”:

1. Vrednovati

2. Vrednovati

3. Vrednovati59

U ovome poglavlju su opisane tehnike s pomoću kojih moţemo brzo prepoznati o kakvom

se tipu stranice radi, odnosno koliko su podaci na njoj pouzdani.

Budući da je već prikazano kako koristiti traţilice i ostale alate za pretraţivanje, na redu je

završni nuţan korak za odabir relevantnih informacija - vrednovanje mreţnih mjesta i mreţnih

stranica. Internet sadrţi nepreglednu količinu informacija. Svatko moţe napraviti vlastitu

stranicu, svatko moţe pronaći vašu stranicu. MeĎutim, nisu sve informacije jednako vrijedne.

Zbog toga smo prisiljeni neprestano provjeravati relevantnost informacija na Internetu.

Kako ćemo biti sigurni da su informacije unutar dokumenta do kojeg smo došli

pretraţivanjem provjerene, da im moţemo vjerovati? Kako moţemo, bez čitanja cjelokupnog

teksta, prepoznati da informacije koje dokument sadrţi nisu nečija propaganda? Kako izmeĎu

osobnih stranica znati prepoznati one koje sadrţe relevantne informacije?

Vrednovanje mreţnih stranica podijeljeno je na dva dijela:

vrednovanje podataka o stranici;

vrednovanje sadrţaja stranice.60

59

Saračević, T. Informacijska zbrka na Webu: traţenje i vrednovanje informacijskih izvora, www.ffzg.hr/infoz

/lida/lida2000/informaciona_zbrka_na_webu.ppt (pristupljeno 03.10.2011.) 60

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 60.

Page 49: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

42

6.1. Pitanja na koja valja traţiti odgovore pri vrednovanju podataka o

stranici

1. Što moţemo saznati iz URL-a ili iz domene?

Ovisno o domeni, moţemo doznati o kakvom se tipu stranice radi. Od posebne su

vaţnosti vršne domene i geografske domene. Najlakši način za razlikovanje domena koje

pripadaju nekim organizacijama od onih geografskih je da se prve sastoje od tri slova (iza zadnje

točke u URL-u), a druge od dva!

2. Radi li se o nečijoj osobnoj stranici?

Najlakši način da prepoznamo je li odreĎena stranica nečija osobna stranica je da URL, bez

obzira na vršnu domenu (.com, .edu, itd.) sadrţi negdje u sebi tildu (~).

3. Tko je napisao stranicu?

Stranica kojoj moţemo vjerovati sadrţi jasne podatke o tome tko je njezin autor.

4. Tko je odgovoran za stranicu?

Na stranici bi trebalo biti jasno vidljivo tko je odgovoran za nju. O kakvoj se

organizaciji/kompaniji radi? Moţe li joj se vjerovati? Ako postoji poveznica na organizaciju koja

je odgovorna za tu stranicu, kliknimo na nju i provjerimo čime se navedena organizacija bavi,

koji su joj ciljevi?

5. Je li stranica datirana?

Ovisno o sadrţaju stranice, datum kada je tekst napisan moţe biti vaţan za procjenu

relevantnosti podataka koje on sadrţi. (Za grane znanosti koje se brzo razvijaju, trebati će nam

najnovije informacije).

6. Je li stranica redovito odrţavana?

Provjerimo kada je posljednji put sadrţaj na stranici promijenjen. Taj podatak najčešće

moţemo pronaći na dnu stranice. Pregledajmo i druge stranice na tom mreţnom mjestu i

provjerimo kada su one posljednji puta mijenjane.61

61

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 61.

Page 50: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

43

6.2. Pitanja na koja treba traţiti odgovore pri vrednovanju sadrţaja stranice

1. Je li autor stručnjak za područje o kojem piše?

Provjerimo navodi li autor svoje obrazovanje, struku, specifično područje kojim se bavi?

Provjerimo i moţemo li negdje drugdje naći podatke o toj osobi te na taj način biti sigurni da zna

o čemu piše. Pokušajmo korištenjem traţilica pronaći mreţnu stranicu te osobe pa iz njenog

sadrţaja zaključimo moţemo li vjerovati onome što ona piše.

2. Što mogu saznati iz poveznica?

Jedan od pokazatelja kvalitete stranice su i poveznice. Ako je sadrţaj prema našem mišljenju

vjerodostojan, a poveznice upućuju na neke ne baš kvalitetne stranice, moţemo se upitati i o

kakvoći stranice koju vrednujemo. Provjerimo rade li sve poveznice. To znači da je autor doista

provjerio stranice koje navodi kao poveznice.

3. Kakav je kontekst u kojem se stranica nalazi?

Pretraţivanjem ćemo često dolaziti do stranica koje su dio neke veće cjeline i time se dovesti

u opasnost da ne vidimo kontekst. Da bismo to izbjegli, ako se nudi ta opcija, otiĎimo na početnu

stranicu (homepage) da bismo provjerili izvor informacija koje stranica sadrţi. Na taj način lakše

ćemo doći i do podataka o tome tko je stranicu objavio, te kome je ona namijenjena.

4. Je li stranica recenzirana?

Ukoliko je stranica recenzirana, provjerimo tko je napisao recenziju i čime se autor recenzije

bavi.

5. Ima li stranica bibliografiju?

Provjerimo postoji li na stranici bibliografija i kakva je. Oslanja li se autor na pouzdane

izvore informacija?

6. Kakve tekstove autor citira?

Ako na stranici postoje podaci o citiranim izvorima, savjetuje sa da, ukoliko je moguće,

provjerimo je li navedeni podatak točan. Ako autor citira neki članak, dostupan u bazi podataka s

cjelovitim tekstom, provjerimo i o kakvom se članku radi. Je li to znanstveni članak, ili je samo

Page 51: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

44

prikaz nekog drugog članka ili knjige? U kojemu je časopisu taj članak objavljen? Je li to

znanstveni časopis kojeg priznaju stručnjaci?

7. Kakvim je stilom tekst napisan?

Stručni tekstovi pretpostavljaju stručnu terminologiju. Ako traţimo stručne ili znanstvene

tekstove, jedan od pokazatelja relevantnosti pronaĎenog dokumenta je stil kojim je napisan.

Provjerimo: koristi li autor stručnu terminologiju? Koliko je tekst, tj. autor pismen? I po količini

grešaka u pisanju u tekstu moţemo procijeniti vrijednost stranice. Što više grešaka, to više

trebamo sumnjati u kvalitetu stranice.

8. Kakav je reklamni materijal na stranici?

Mreţne stranice stručnog i/ili znanstvenog sadrţaja u pravilu ne bi smjele sadrţavati

reklamne poruke. Ako postoje sponzori stranice, oni su jasno označeni kao sponzori, reklamni

prostor zauzima vrlo malo ili nimalo prostora. Provjerimo tko sponzorira stranicu. Moţemo li

jasno razlikovati reklamni materijal od informativnog?

9. Kome je stranica namijenjena?

PronaĎimo postoji li na stranici podatak o tome kome je sadrţaj stranice namijenjen.

10. Koliko detaljno, odnosno do koje razine autor obraĎuje temu?

Ako je tema namijenjena različitim obrazovnim skupinama, je li jasno naznačeno kome je

koji dio namijenjen? To je najjednostavnije provjeriti preko mape sadrţaja odreĎene stranice.

11. Kakva je točka gledišta autora i ima li pristranosti?

Pri vrednovanju mreţnih stranica vrlo je vaţno prepoznati koliko je autor objektivan.

Trebamo paziti i na to da nam vlastita razmišljanja ne podmetne kao provjerene informacije.

Zastupa li autor odreĎenu ideologiju?62

62

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 62-63.

Page 52: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

45

7. Zaključak

Kao što je u radu prikazano, Internet, Web i pretraţivanje informacija na Internetu imaju

svoja pravila koja je korisno poznavati. Pretraţivanje, rangiranje rezultata pretraţivanja i

vrednovanje informacija na Webu i Internetu općenito postavljaju ozbiljne zahtjeve pred

programere i inovatore. Dok ne doĎe do nekog novog revolucionarnog napretka na tome polju,

moramo se osloniti na našu intuiciju i stečena znanja o vrednovanju informacija s Interneta.

Zanimljiva je spoznaja da veliki broj informacija ne Internetu nije pretraţiv pomoću

konvencionalnih Web pretraţivača, a opet većina korisnika pretraţuje pomoću istih. To je

vjerojatno zato jer su jednostavni za korištenje i daju velik broj povratnih informacija, od kojih

korisnik jednostavno izabere one koje zadovoljavaju njegovu znatiţelju. MeĎutim, poglavito u

domeni znanstveno-istraţivačkog rada, ne smijemo se ograničiti samo na informacije pohranjene

na Web pretraţivačima i Web imenicima, već moramo koristiti i različite internetske baze

podataka, pogotovo zato jer se tamo nalaze provjerene i recenzirane informacije.

U radu s namjerom nije pisano o pojedinim pretraţivačima i ne postoji lista korisnih Web

adresa, prvenstveno zato jer su Internet i Web kao „ţivi organizmi“ koji evoluiraju i mijenjaju se

iz dana u dan. Na Webu postoji mnoštvo korisnih i otvorenih baza podataka, a čitatelj moţe

jednostavno doći do njihovih Web adresa, kada se za to ukaţe potreba.

Page 53: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

46

8. Literatura

Bollean, http://websearch.about.com/od/internetresearch/a/boolean.htm (pristupljeno 10.

10.2011.)

Buhin, P.: Internet, 2008., www.inet.hr/~jadransu/dokumenti-informatika/cetvrti/INTERN

ET.ppt (pristupljeno 03.10.2011.)

Clegg, B.: The Profesionall's Guide to Mining the Intetnet, 2nd Edition, Information

Gathering and Research on the Net, Kogan Page Limited, London, 2001.

DNS, http://hr.wikipedia.org/wiki/DNS (pristupljeno 16.09.2011.)

Duboki Web, http://hr.wikipedia.org/wiki/Duboki_Web (pristupljeno 19.10.2011.)

Edwards, M.J.A.: The Internet for Nurses and Allied Health Professionals, Second

Edition, Margaret J.A. Edwards & Associates, Inc., Calgary, 1997.

Farrel, A.: The Internet and its protocols: a comparative approach, Morgan Kaufmann

Publishers, San Francisco 2004.

Hearst, M.: Search Engines: Technology, Society, and Business, Irvine, 2005.

http://www2.sims.berkeley.edu/courses/is141/f05/lectures/se-course-intro.pdf

(pristupljeno 29.09.2011.)

Hearst, M.: Overview of How Search Engines Work, Irvine, 2005., http://www.youtube.

com/watch?v=K8D5uL0y7ho (pristupljeno 29.09.2011.)

Hecht, B.L., Ramsey, R.: Dynamic Management for the Digital Age, John Wiley & Sons,

New York, 2002.

Hoić-Boţić, N.: Računalne mreţe, 2004., http://ahyco.ffri.hr/ritehmreze/teme/uvod.htm

(pristupljeno 04.10.2011.)

Html tagovi svojstva i komentari, http://www.racunalstvo.net/html-tutorijali/html-tagovi-

svojstva-i-komentari (pristupljeno 10.10.2011.)

HTTP, http://hr.wikipedia.org/wiki/HTTP (pristupljeno 21.09.2011.)

Huber, A.J. and Associates: UMTS and Mobile Computing, Artech House Inc.,

Norwood, 2002.

Internet, http://en.wikipedia.org/wiki/File:Internet_map_1024.jpg (pristupljeno 01.09.

2011.)

Internet 2010. in numbers, http://royal.pingdom.com/2011/01/12/internet-2010-in-

numbers/ (10.10.2011.)

Page 54: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

47

IP address, http://en.wikipedia.org/wiki/IP_address (pristupljeno 15.09.2011.)

Jonassen, D.H.: Hypertext/hypermedia, Educational Technology Publications, Inc., New

Jersey, 1992.

Jurasić, A.: Internet, Odjel za matematiku sveučilišta u Rijeci, Rijeka, 2009. http://www.

math.uniri.hr/~ajurasic/I-2.pdf (prsitupljeno 14.10.2011.)

Leiden. C and associates: TCP/IP for Dummies, Wiley Publishing, Inc., Indianapolis,

2009.

Metacrawlers and Metasearch Engines, http://searchenginewatch.com/article/2066974/

Metacrawlers-and-Metasearch-Engines (pristupljeno 12.09.2011.)

Metasearch Engine, http://en.wikipedia.org/wiki/Metasearch_engine (pristupljeno 13.09.

2011.)

Milinović, M.: Učinkovito pretraţivanje Interneta (alati i tehnike), http://www.szi.hr/

seminar2000/prez/milinovic.pdf (pristupljeno 09.10.2011.)

Morley, D. and associates: Understanding Computers Today and Tomorrow,

Comprehensive, 12th

Edition, Course Technology, Boston, 2009.

Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004.

Pelivan, I.: Pronalaţenje informacija na internetu i pretraţivanje baza podataka,

Stomatološki fakultet sveučilišta u Zagrebu, Zagreb, 2011. http://www.sfzg.unizg.hr/

_download/repository/Pronalazenje_informacija_na_Internetu_i_pretrazivanje_baza_po

data ka.pdf (pristupljeno 15.10.2011.)

Perks, C., Beveridge, T.: Guide to Enterprise IT Architecture, Springer-Verlag, Inc., New

York, 2003.

Pretraţivanje i vrednovanje informacija na internetu, Sveučilišna knjiţnica Sveučilišta

Jurja Dobrile u Puli, http://www.escape.hr/skpu/docs/Pretrazivanje_i_vrednovanje_

informacijana_internetu.ppt (pristupljeno 12.10.2011.)

Saračević, T. Informacijska zbrka na Webu: traţenje i vrednovanje informacijskih izvora,

www.ffzg.hr/infoz/lida/lida2000/informaciona_zbrka_na_webu.ppt (pristupljeno 03.10.

2011.)

Shah, D., Patel D., Chaudhary, S.: Grid-Based Vehicle Locating System, u: Bui, A., et al.

(ur.): Innovative Internet Community Systems, 5th International Workshop, Springer,

Berlin, 2006.

Sherman, C., Price, G.: The invisible Web: uncovering information sources search

engines can't see, Information today, Inc., New Jersey, 2001.

Page 55: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

48

Stemming, http://en.wikipedia.org/wiki/Stemming (pristupljeno 11.10.2011.)

Tech Titans Building Boom, http://spectrum.ieee.org/green-tech/buildings/tech-titans-

building-boom/2 (pristupljeno 03.09.2011.)

Teţak, Đ. Pretraţivanje informacija na Internetu, Hrvatska sveučilišna naknada, Zagreb,

2001.

The Deep Web: Surfacing Hidden Value, http://quod.lib.umich.edu/cgi/t/text/text-

idx?c=jep;view=text;rgn=main;idno=3336451.0007.104 (pristupljeno 15.10.2011.)

URL, http://hr.wikipedia.org/wiki/URL (pristupljeno 17.10.2011.)

Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb. 2006.

Web Browser, http://en.wikipedia.org/wiki/Web_browser (pristupljeno 23.09.2011.)

Web Directory, http://en.wikipedia.org/wiki/Web_directory (pristupljeno 08.09.2011.)

Zakon, R.H. Hobbes' Internet Timeline, 2010., http://www.zakon.org/robert/internet/

timeline/ (pritupljeno 10.09.2011.)

Zamjenski znakovi, http://office.microsoft.com/hr-hr/excel-help/zamjenski-znakovi-HP00

5203612.aspx (pristupljeno 13.10.2011.)

Page 56: INTERNET, WEB I PRETRAŢIVANJE - mathos.unios.hrmdjumic/uploads/diplomski/BOJ01.pdf · Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da znamo koristiti alate

49

9. Ţivotopis

RoĎen u Osijeku 17.04.1985. Osnovnu školu pohaĎao u Novalji, Osijeku i Puli. 2003. godine

završava srednju Tehničku školu u Puli, smjer elektrotehničar. Iste godine upisuje studij fizike i

tehničke kulture s informatikom u Osijeku.