78
Univerzitet u Novom Sadu Pedagoški fakultet Sombor Diplomski Rad: Različiti Internet Pretraživači

Različiti Internet Pretraživači

Embed Size (px)

Citation preview

Page 1: Različiti Internet Pretraživači

Univerzitet u Novom Sadu

Pedagoški fakultet Sombor

Diplomski Rad:

Različiti Internet Pretraživači

Student: Mentor:

Nenad Filipović Doc. dr Rajko

08/02/035 Pećanac

Sombor, 2012.

Page 2: Različiti Internet Pretraživači

S A D R Ž A J

Uvod...........................................................................................................................................3

Internet.......................................................................................................................................4

Definicija Interneta.................................................................................................................4

Istorija Interneta.....................................................................................................................5

Budućnost Interneta...............................................................................................................6

WWW........................................................................................................................................7

Web Browser..............................................................................................................................9

Analiza Web Browser-a.........................................................................................................9

Internet Pretraživači.................................................................................................................12

Šta je Internet Pretraživač?...................................................................................................13

Funkcija Internet Pretraživača..............................................................................................15

Podela Web Pretraživača......................................................................................................16

Web Direktorijum................................................................................................................16

Spider Pretraživači...............................................................................................................16

Meta Pretraživači.................................................................................................................17

Problemi Pretraživača..........................................................................................................17

Struktura Pretraživača..........................................................................................................18

Crawleri, Spideri i Roboti....................................................................................................20

Robot Meta Tagovi..............................................................................................................23

Tipovi Internet Pretraživača.....................................................................................................24

Po oblasti pretraživanja........................................................................................................24

Po načinu Indeksiranja.........................................................................................................25

Istorijat Internet Pretraživača...............................................................................................25

Domaći Search Engine.............................................................................................................27

Problemi domaćih Pretraživača............................................................................................28

Koncept Internet Pretraživača..................................................................................................28

Arhitektura Inernet Pretraživača..........................................................................................29

Pretraživanje lokacija weba (web sajtova)...........................................................................30

Indeksiranje web stranica.....................................................................................................31

Rangiranje stranica za korisničke upite................................................................................32

1

Page 3: Različiti Internet Pretraživači

Efektivnost i efikasnost pretrage..........................................................................................34

Pretraživanje Interneta.............................................................................................................35

Domaći Pretraživači.................................................................................................................37

YuSearch..............................................................................................................................37

Yu.........................................................................................................................................38

Srbko....................................................................................................................................38

Tražim..................................................................................................................................38

Aladin...................................................................................................................................38

Krstarica...............................................................................................................................39

Pogodak................................................................................................................................40

Šerlok...................................................................................................................................40

Svetski Pretraživači..................................................................................................................41

Bing......................................................................................................................................41

Yahoo!..................................................................................................................................42

Google..................................................................................................................................42

Zaključak..................................................................................................................................45

Literatura..................................................................................................................................46

2

Page 4: Različiti Internet Pretraživači

Uvod

Osnovni problem u korišćenju interneta jeste kako pronaći željene informacije. Naime, Internet nije usluga, već sredstvo koje omogućava pristup uslugama i pronalaženje informacija koje su predstavljene u elektronskom obliku. Internet je na neki način sličan velikom gradu, nekom megapolisu. U ogromnom gradu koji na prvi pogled izgleda da je neorganizovan, može ne samo došljacima već i stalnim žiteljima da bude teško da pronađu ono što traže. Da bi se olakšalo snalaženje po gradu, postoje knjige – vodiči, odgovarajuće informacije u novinama i časopisima, posebno obučeni stručni vodiči za pojedine oblasti, a kroz grad se može kretati peške, autobusom, tramvajem, metroom, taksijem.

Krstarenje internetom može se uporediti sa kretanjem ulicama velikog grada: usluge koje se mogu dobiti preko mreže imaju analogiju sa gradskim čitaonicama, bibliotekama, muzejima, umetničkim galerijama, tržnim centrima u tom gradu. Kao što ćemo u nekoj ulici tog grada pronaći željene informacije ili usluge, tako ćemo gotovo sigurno i na internetu naći ono što tražimo. Istina, u oba slučaja biće nam za to potrebno neko vreme, utoliko duže ukoliko se slabije snalazimo u gradu, odnosno na mreži.

Pretraživanje interneta nije više danas jednostavno čak ni za one koji znaju jako dobro da koriste tzv. pretraživače, poznaju im načine rada, mogućnosti, mane i prednosti. Ako znamo potpunu adresu internet stranice koju želimo da posetimo npr. www.facebook.com, stvar je jednostavna – u programu za pregledanje interneta upisaćemo adresu na predviđeno mesto i on će učitati stranicu. Međutim, ako ne znamo adresu, poželjno je poslužiti se pretraživačima, jer su to web sajtovi koji prikupljaju informacije o sadržaju sajtova koji su dostupni na internetu i nude vam njihove adrese. Na njima se nalaze opisi miliona internet stranica sa linkovima za te stranice.

Internet pretraživač je alatka dizajnirana da traži informacije na www i to uglavnom zadavanjem ključnih reči, a mnogo ređe odabirom ponuđenih stavki. Rezultati pretrage su obično predstavljeni u obliku liste i najčešče se nazivaju pogotci (hits). Informacije se mogu sastojati od web stranica, slika, zvučnih i mnogih drugih tipova fajlova. Neki internet pretraživači takođe pretražuju podatke koji se nalaze u bazama podataka. Za razliku od web direktorijuma, koji se održavaju od strane ljudskih editora, internet pretraživači rade na principu algoritma ili su mešavina algoritamskog i ljudskog faktora.

3

Page 5: Različiti Internet Pretraživači

Internet

Internet je globalni informaciono-komunikacioni sistem, koji čine mreže koje slobodno razmenjuju informacije i koji koristi skoro dve milijarde ljudi. Zbog svoje složenosti i raširenosti internet se mora posmatrati kroz tehnološke, socijalne, komercijalne i operativne aspekte koji oslikavaju njegova lica. Od ARPANET-a, preko PC ere i ere Web 1.0 i Web 2.0 do naučnofantastičnih Web 3.0 i Web 4.0 era, internet postaje naša svakodnevnica i omogućava globalni trend umrežavanja. Ovaj mozaik različitih medija svoj razvitak i popularnost duguje razvoju novih informacionih tehnologija, visokom dostupnošću i korisnošću elektronske pošte i hiperteksta. Iako ne bez problema internet uz pomoć društvenih mreža i raznoraznih gedžeta polako ali sigurno potiskuje televiziju sa suverenog prvog mesta masovne popularnosti. Internet sam po sebi, nije osnovni uzročnik ničega i njegovi uticaji ne mogu se odvojiti od, s jedne strane, mnoštva društvenih faktora koji utiču na koordinate u kojima se krećemo i, sa druge strane, spleta ličnih odlika, potreba i motiva koji karakterišu svakog pojedinca.

Definicija Interneta

Brojna antropološka proučavanja interneta treba za svoj osnov da imaju važnije tehnološke činjenice koje definišu internet. Ta proučavanja se ne bave samom tehnologijom interneta ali u tumačenje fenomena koje istražuju bi trebalo da uključuju i fakte koji proizilaze iz same informacione tehnologije na kojoj je internet zasnovan. Internet je globalni informaciono-komunikacioni sistem, koji čine mreže koje slobodno razmenjuju informacije. To je komunikaciona tehnologija koju koristi skoro dve milijarde ljudi širom sveta i bez koje bi život kakav danas poznajemo bio nemoguć. Samo ime je skraćenica tehničkog termina internetwork što znači međumreža, mada ga ne treba poistovećivati sa mrežom nad mrežama.

Zbog svoje složenosti i raširenosti internet se mora posmatrati kroz tri aspekta koji oslikavaju njegova lica. Tehnološki aspekt je počeo raznim istraživanjima vezanim za prebacivanje paketa informacija i ARPANET-om i usko je vezan za razvitak računarske tehnologije, koju prati kroz sve generacije računara.

Neizostavno uz tehnološki aspekt stoje i aspekti upravljanja globalnom i kompleksnom infrastrukturom. Zatim tu je socijalni aspekt koji bi se bavio širokim društvom internauta, koji utiču na razvitak, usavršavanje i popularisanje tehnologija.

To je društvo koje odlikuje godine iskustva na mreži, uz temeljno znanje korišćenja pretraživača i kriterijuma za pretraživanje, zatim redovno učestvovanje na forumima i u diskusionim grupama, kao i osnovno znanje internet programiranja zbog čega su nezamenljiv deo brze i efikasne ekspanzije mreže.

4

Page 6: Različiti Internet Pretraživači

Za njih se vezuje termin sajbersvet i sajberealnost koji se odnose na nefizičku sredinu koju čine umreženi računari, a koju odlikuje imitiranje fizičke sredine.

Ne treba zanemariti ni komercijalni aspekt u vidu internet marketinga koji se bazira na reklamiranju proizvoda i usluga korišćenjem interneta kao medija. Niži troškovi širenja informacija i globalna publika su njegove glavne prednosti. Njemu je cilj da obuhvati sve podatke u digitalnom obliku potencijalnih kupaca i da njima manipuliše u cilju pravljenja strategije za bolje poslovanje.

Istorija Interneta

Istorija interneta počinje 1961. godine sa teorijom paketnog prebacivanja. Te godine je Lenard Klinrok iz MIT-a objavio prvi rad na tu temu u kome obrazlaže teoretske mogućnosti računarskog komuniciranja korištenjem paketa. Godine 1965. prvi put su povezana dva računara, jedan u Masačusetsu, a drugi u Kaliforniji korišćenjem spore telefonske linije na biranje. Tako je nastala prva mreža širokog područja – WAN. Eksperiment je pokazao da računari mogu funkcionalno da rade umreženi, da po potrebi izvršavaju programe i pretražuju podatke na udaljenoj mašini. Uspostavljanje mreže ARPANET je pocelo 1966. godine. Razvoj je finansirala DARPA, ogranak Ministarstva odbrane Sjedinjenih Američkih Država. Oduvek se smatralo, iako nije javno rečeno, da je interes za stvaranje ovakve mreže ležao u izgradnji mreže koja može da izdrži eventualni nuklearni rat. Čak i sami realizatori mreže priznaju da je kao rezultat dobijena velika i neskladna ali otporna mreža koja je u stanju da podnese gubitak velikog dela mrežne infrastrukture.

Kao prva četiri čvora izabrani su računari u kalifornijskom univerzitetu u Los Anđelesu, računar u Stanfordskom istraživačkom institutu, zatim kalifornijski univerzitet u Santa Barbari i univerzitet u Juti na kojima se radilo na razvoju aplikacija koje su vezane za vizuelizaciju na mreži. U narednim godinama računari su se ubrzo priključivali APRANET-u, a posao se nastavljao na izradi protokola kojima će biti omogućen razvoj mrežnih aplikacija. Prva aplikacija lansirana 1972. godine koja je vremenom postigla veliku popularnost je elektronska pošta.

Početkom 1980. godine došlo je do naglog širenja LAN-ova, upotrebe ličnih računara i radnih stanica i tada počinje takozvana PC era – era ličnih računara. Ovu eru odlikuje prvo pojavljivanje i rapidni rast interneta kao i adresiranje računara.

Pojava velikog broja nezavisnih namenskih lokalnih mreža prvo u SAD, a zatim i širom sveta za potrebe računarskih istraživanja na univerzitetima i u industriji, za ograničenu populaciju naučnika, bez namere da budu među sobom kompatibilne, doprinele su razvoju otvorene arhitekture interneta.

5

Page 7: Različiti Internet Pretraživači

Sredinom 80-tih godina XX veka celokupna visoko-školska populacija, bez obzira na disciplinu kojom se bavi, širom sveta dobija dozvolu da pristupi. Mreža je pustena u javnost 1993. godine, tri godine pošto je CERN – objavila novi mreža nad mrežama projekat. Era poslednje decenije XX veka se naziva era Web 1.0 jer je karakterišu prve verzije što pretraživača mozaik što i same mreže. Tada je došlo i do prvog spajanja nekomercijalnih sa komercijalnim mrežama, da bi zajedničkim kapacitetima smanjili cenu korišćenja interneta. U to doba se razvijaju i prve aplikacije kao što su IRC, forum i blog. IRC je bio namenjen višestrukim korisnicima sa mnogobrojnim kanalima za razgovor u realnom vremenu, na bazi tekstualnih poruka. Forum datira jos od 1995. godine, i sadrži živu diskusiju na unapred postavljenu temu, a blog prvi put napisan 1994. godine od strane Džastina Hola ima formu novinskog članka ili izvoda iz nečijeg ličnog dnevnika.

Novi milenijum donosi i novu internet eru, eru Web 2.0 koja se zasniva na omogućavanju korisnicima da sami kreiraju sadržaj interneta i karakterišu je velika povezanost, aktivnost i sve veća kompatibilnost korisnika međusobom. Razvoj računarske tehnike je omogućio internet programerima da postave samo kostur stanice i da prepuste korisnicima da ga ispune sadržajem. Internet se razvio u platformu koja pomoću niza raznovrsnih mehanizama i tehnologija korisnicima olakšava komunikaciju i tako omogućava zadovoljenje njihovih interesa i potreba.

Budućnost Interneta

Ciljevi pete generacije računara se kreću u pravcu prihvatanja auditivnih i vizuelnih instrukcija, zatim prikupljanje, selektovanje i skladištenja podataka i korisnih informacija. Planirano je da novi računari budu sposobni da istraže sve njima potrebne i dostupne podatke i da na osnovu toga nalaze i nude odgovore na korisnička pitanja, da prevode sa jednog jezika na drugi, da uče na sopstvenom iskustvu i da sami sebe programiraju. Da bi se ostvarili ovi ciljevi, istraživački rad se odvija u dva koloseka, hardver i softver.

Tehnološke inovacije se razvijaju u pravcu upotrebljavanja superprovodnika pa za njima i optičkih vlakana. Veličina procesora se i dalje drastično smanjuje, a brzina izračunavanja u sekundi se povećava, što zahteva nove materijale. Superprovodnici predstavljaju materijal koji gubi svaki otpor prilikom protoka elektriciteta, napravljeni su od specijalne keramike, a za njihov pronalazak je dodeljena Nobelova nagrada. Dalja istraživanja idu u pravcu pronalaženja računara koji neće raditi na struju, već na svetlost pomoću optičkih vlakana, čime bi se dobio, u teoriji, kompjuter koji radi brzinom svetlosti.

6

Page 8: Različiti Internet Pretraživači

WWW

World wide web, još poznat kao web, je ono na šta najveći broj ljudi pomisli kada kaže internet. To je skup usluga za pristup multimedijalnim, distribuiranim bazama podataka. Web je nastao 1989. Godine kao rezultat istraživanja koje je sproveo Tim Berners Lee, fizičar, u laboratoriji za fiziku instituta CERN u Švajcarskoj, a kao rezultat potrebe istraživača da razmenjuju istraživačka dokumenta između istraživačkih grupa koje se nalaze geografski na udaljenim mestima. Web je rapidno počeo da raste kada je 1993. godine stvoren prvi web pretraživač sa grafičkim interfejsom.

Komponente web-a su:

Web Server, Web Client, URL (Uniform Ressource Locator), HTTP (Hyper Text Transfer Protocol), HTML (HyperText Marcup Language),

Java i JavaScript.

Njegov rad se zasniva na klijent-server modelu, što znači da mora postojati www server na kome je smeštena prezentacija koju želimo da pogledamo. Pregled prezentacije se ostvaruje sa drugog računara putem čitača HTML dokumenata. World wide web je najnoviji informacioni servis na internetu. Prve dve reči označavaju svetsku mrežu kompjutera, odnosno da obuhvata čitavu planetu, to jest da je globalni sistem, a poslednja reč web označava mrežu, odnosno elektronsku prezentaciju.

Web – elektronska prezentacija, baziran je na tehnologiji poznatoj kao hipertekst. Hipertekst omogućuje da dokument linkovima bude povezan sa neograničenim brojem drugih dokumenata koji mogu sadržati tekst, sliku, zvuk, video ili bilo šta drugo na bilo kom drugom računaru širom interneta. Ova tehnologija praktično vam omogućuje da klikom miša na link u jednom dokumentu dođemo do nekog drugog dokumenta, i tako redom, bez obzira na kom se, od više miliona računara povezanih u svetsku računarsku mrežu, taj dokument nalazi. Ulaskom u prvu web prezentaciju vi ste se našli u cyberspace-u među više desetina miliona stranica teksta, slika i drugih multimedijalnih sadržaja, bez obzira na kom se mesto na kugli zemaljskoj oni nalaze.

World wide web je danas najmoćniji i najfleksibilniji internet navigacioni sistem koji postoji. Da bi koristili www neophodno je da na svom računaru imate instaliran softver za citanje www prezentacija. To danas nije nikakav problem jer se mnogi od ovih softverskih alata dobijaju besplatno, mogu se besplatno preneti sa interneta na vaš računar. Najpoznatiji su Internet Explorer, Google Chrome, Safari, ali postoje i mnogi drugi koji čitaju www prezentacije sasvim uspešno.

7

Page 9: Različiti Internet Pretraživači

Kako je broj www stranica ogroman razumljiva je pojava sve većeg broja www stranica koje upućuju na druge www stranice iz slične oblasti, odnosno pojava www stranica koje u sebi sadrže alate za pretraživanje različitih baza podataka. To mogu biti baze podataka dokumenata, elektronskih adresa, web-ova. Ove web prezentacije kao što su: Google, Yahoo, itd. omogućavaju zaista efikasno pretraživanje interneta, ali i zahtevaju detaljno upoznavanje sa principima i pravilima na osnovu kojih funkcionišu.

Slika 1. Komumunikacija klijent-server.

8

Page 10: Različiti Internet Pretraživači

Web Browser

Da bi se olakšalo snalaženje i krstarenje po internetu, potreban je odgovarajući softver. U tu svrhu su razvijeni tzv. pretraživači mreže koji se neprekidno usavršavaju kako bi postali što efikasniji i lakši za korišćenje. Danas najpoznatiji pretraživači za pc računare su Internet Explorer, Mozilla Firefox, Opera i Google Chrome.

Web pretraživač je softverska aplikacija pomoću koje korisnik može da pristupi raznovrsnim informacijama koje se nalaze na web stranici na www ili u lokalu. Tekstovi i slike na web strani mogu da sadrže prečice, odnosno hiperlinkove ka drugim web stranama istog ili nekog drugog web sajta. Web pretraživači omogućavaju korisniku da koristeći prečice brzo i lako pristupi informacijama koje se nalaze rasute po web stranicama mnogobrojnih web sajtova. Izgled web stranice može da se razlikuje u zavisnosti od toga koji se pretraživač koristi.

Web pretraživači komuniciraju sa web serverima prvenstveno korišćenjem http-a. HTTP omogućava web pregledačima da dovlače web stranice sa web servera, kao i da web serverima dostavljaju informacije. Mada se pretraživači najčešće koriste za pristup www-u, oni se takodje mogu koristiti u privatnim mrežama. Web stranice se pronalaze pomoću url koji predstavlja adresu koja u slučaju http pristupa počinje sa http://.

Web stranice su obično u html formatu i identifikuju se u http protokolu putem komunikacionog protokola koji omogućava prenos podataka u raznovrsnim oblicima. Većina pretraživača, pored html-a podržava i niz drugih formata.

Analiza Web Browser-a

U sam vrh web brauzera se svrstavaju:

Internet Explorer, Mozilla Firefox, Google Chrome, Opera, Apple Safari.

Internet Explorer:

Grafički web brauzer nastao 1995. godine u korporaciji Microsoft. Uvek je bio u paketu sa Windows operativnim sistemom, i to mu je u velikoj meri osiguralo ubedljivo prvo mesto na tržištu web brauzera, sve do 1999. godine.

Prvobitno se pojavio u paketu sa Windows 95 operativnim sistemom, a nakon toga su izašle i verzije za Mac OS i Unix, ali te verzije nisu dugo opstale.

9

Page 11: Različiti Internet Pretraživači

Tačnije, za Win95 se pojavio u add-on paketu. Od 1999. Godine počinje lagani pad, dolaskom novih i boljih web brauzera, od kojih je najveća konkurencija Mozilla-in Firefox, ali i Opera. Google Chrome itd. Oduvek se provlači pitanje sigursnosti korisnika u ovom brauzeru.

Mozilla Firefox:

Mozila fajerfoks je brauzer otvorenog koda. Ranije je bio poznat pod imenima Feniks i Fajerbird, a nastao je na osnovama programskog koda Geko, koji je koristio i ranije popularni Netscape. Od 9. novembra 2004. godine, od verzije 1.0, fajerfoks je postao ozbiljna konkurencija Internet Explorer-u, koji je najkorišteniji u svetu. Dejv Hajat i Blejk Ros su počeli da rade na projektu Fajerfoks kao ekperimentalnom izdanju projekta Mozilla. Verovali su da komercijalni zahtevi Netscape-a kompromitovali korisnost Mozille. Kako bi se borili protiv toga što su videli, napravili su samostalan brauzer, kojim su planirali da zamene paket Mozilla. Nakon toga Mozilla je objavila da planira prelazak sa paketa Mozilla na Firefox i Tanderbird.

Projekat fajerfoks doživeo je nekoliko promena imena. Prvobitni naziv finiks promenjen je jer je narušavao ime robne marke Feniks tehnologija. Fajerbird, ime koje je odabrano zatim, izazvalo je žestoku reakciju istoimenog besplatnog servera za baze podataka. Kao odgovor na to, fondacija Mozilla objavila je da brauzer uvek treba da nosi ime Mozilla Firebird, kako bi se izbegla zabuna vezana za istoimeni softver za baze podataka. Nastavljeni pritisak zajednice programera baze podataka uslovio je još jednu promenu imena. Mozilla Firebird postao je Mozilla Firefox 9. februara 2004. godine. Ćesto je nazivan jednostavno samo kao fajerfoks, a ponekad i skraćeno FX.

Google Chrome:

U kreiranju ovog proizvoda pošli su od problema koje su prepoznali u radu svog i drugih pretraživača. Analizom problema i poteškoća došli su do rešenja kako da ih poprave, izmene i poboljšaju rad ovih internet alata. Zahvaljujući brojnim inovacijama i poboljšanjima došlo se do potpuno nove koncepcije browser-a koju su nazvali google chrome.

Kao što je svim korisnicima google chrome-a poznato, tim vlasnika, saradnika i naučnika čini grupa mladih vrhunskih stručnjaka i entuziasta. Shvatili su da današnji pretraživači moraju da budu mnogo brži, použdaniji i sigurniji u smislu bolje i efikasnije zaštite od inficiranja raznim štetnim sadržajima počev od neželjenih plug-inova pa sve do raznih virusa ili pecača na korisnikove poverljive informacije.

Počelo je od ideje o čistim, jednostavnim i efikasnim korisničkim interfejsom. Tako da kada pogledate na početnu stranicu pretraživača nista nepotrebno i suvišno vam neće odvlačiti pažnju ili vam smetati u pretrazi.

10

Page 12: Različiti Internet Pretraživači

Google Chrome je pretraživač koji kombinuje minimalan dizajn sa sofisticiranom tehnologijom a sve sa ciljem da se web načini bržim, sigurnijim i lakšim za korišćenje. Dovoljno je da uneste bilo šta što vam je potrebno u bar sa adresom i Google Chrome vam bilo donosi prikaz te stranice ili Google rezultat pretrage. Ovo je pretraživač otvorenog koda. Stabilna verzija je dostupna za Windows, Mac OS i Linux operativne sisteme.

Opera:

Ovo je veoma malen i zgodan web brauzer koji ne zaostaje previše za mnogo popularnijim aplikacijama ove vrste. Opera je višeplatformski web brauzer koji obavlja standardne zadatke povezane sa internetom, uključujući pregledavanje web stranica, slanje i primanje poruka, e-pošte, upravljanje kontaktima. Zatvorenog je koda i sva prava na operu su zadržana. Operin perolaki mobilni web brauzer Opera Mini i najnovije verzije aplikacije za stone računare su besplatne. Jedan je od najbržih ako ne i najbrži, grafički web brauzer.

Operu razvija kompanija Opera Software, sa sedištem u Oslu, u Norveškoj. Radi na raznim operativnim sistemima, uključujući veliki broj verzija sistema Windows, Mac, Linux i Solaris. Takođe se koristi u mobilnim telefonima, pametnim uređajima, pda i interaktivnim televizorima. Opera je nastala 1994. godine kao istraživački projekat Telenor, najveće norveške telekomunikacione kompanije. Tokom 1995. godine razgranala se u nezavisnu kompaniju Opera Software.

Apple Safari:

Safari je internet pretraživač iza kojeg stoji kompanija Apple. Web brauzer debitovao je 2003. godine na Mac OS-u, dok se verzija za windows pojavila četiri godine kasnije. U pitanju je pregledač koji postavlja standarde za web pretraživanje i koji čini da se programeri drugih kompanija ugledaju na ovaj pretraživač da bi prekopirali neke njegove jedinstvene karakteristike. Safari je dizajniran da naglašava pretraživanje a ne pretraživač i svakako je jedan od najbržih pretraživača koji postoje na tržištu. Safari je tako dizajniran da omogući maksimalno iskorišćenje prostora za korisnike. Od 2011. godine, Safari je četvrti najrasprostranjeniji web čitač u SAD, posle Internet Explorera, Mozille Firefox i Google Chrome-a.

11

Page 13: Različiti Internet Pretraživači

Internet Pretraživači

Web masteri i provajderi sadržaja su počeli optimizaciju sajtova na internet pretraživače sredinom 90-tih godina, kada su prvi internet pretraživači katalogizirali web. U pocetku, sve što je webmaster trebao da uradi je da pošalje stranicu, ili url, raznim internet pretraživačima koji bi potom poslali spider da pretražuje po toj stranici, ekstraktuje linkove ka drugim stranicama sa te strane i da vrati informacije pronađene na stranici za indeksiranje.

Sam proces uključuje download stranice uz pomoć pauka i pohranjivanje iste na serveru internet pretraživača, gde drugi program, poznat kao indekser, ekstraktuje razne informacije o stranici, kao što su reči koje sadrži i gde su te reči locirane, takođe značaj specifičnih reči i naravno sve linkove koje stranica sadrži, koje se zapisuju u raspored za kasniji crawling.

Ranije faze algoritama pretrage su se oslanjale na informacije dobijene od web mastera kao što su ključne reči, meta tagovi ili indeksirani fajlovi kod internet pretraživača kao što je ALIWEB. Meta tagovi služe kao vodič sadržaja sajta. Ali ispostavilo se da korišćenje meta tagova za indeksiranje stranica nije dovoljno pouzdano jer izbor ključnih reči, od strane webmastera, u meta tagu može potencijalno da bude neprecizan prikaz stvarnog sadržaja sajta. Nerprecizni, nepotpuni, nekozistentni podaci u meta tagovima su dovodili do rankiranja stranica u nerelevantnim pretragama. Provajderi web sadržaja su takođe manipulisali raznim atributima unutar HTML koda stranica sa namerom da se dobro rankiraju u internet pretragama.

Oslanjajući se u velikoj meri na faktore isključivo kontrolisane od strane web mastera, rani internet pretraživači su imali problema tipa iskorišćavanja i manipulisanja rankiranja. Radi pružanja boljih rezultata svojim korisnicima, internet pretraživači su morali da se adaptiraju da bi osigurali da njihove stranice pretrage prikazuju najviše relevantnih rezultata, umesto nerelevantnih stranica natrpanih brojnim ključnim rečima od strane bezkurpuloznih web mastera.

S obzirom da se uspeh i popularnost internet pretraživača određuje po mogućnostima istog da proizvede najviše relevantnih rezultata za bilo koju pretragu, dozvoljavanje da ti rezultati budu netačni to bi navelo korisnike da potraže druge izvore pretraživanja. Interner pretraživači su na to odgovorili razvijanjem kompleksnih algoritama za rankiranje, uzimajući u obzir samo dodatne faktore kojima su web masteri manipulisali.

12

Page 14: Različiti Internet Pretraživači

Šta je Internet Pretraživač?

To su specijalne web lokacije i neka vrsta dobro označenih raskršća ili vodiča po internetu.

Web pretraživači nam pružaju mogućnost da pregledamo i listamo popise sadržaja mnogih web sajtova, da pronađemo njihove tacne web adrese, ali i da direktno pristupimo javnim sadržajima na proizvoljno udaljenim računarima.

Najčešće na vrhu prve stranice nekog web pretraživača možemo pronaći prazno polje u koje treba uneti jednu ili više odabranih reči, potom kliknuti na odgovarajuće dugme da se započne pretraga za traženim pojmovima. Istog trenutka na osnovu jedne ili više reči koje smo zadali, pretraživač će početi za nas nevidljivu potragu svog indeksa ili kataloga web strana. Kad završi, a to će najčešće biti za nekoliko sekundi, ispisaće sam na računaru spisak sa rezultatima svoje potrage. Rezultati će sadržati putanju, tj. linkove do podataka koje smo tražili. Novi klik na jedan od ponuđenih linkova i eto nas posle kraće pauze na stranici sa traženim podacima. Na žalost, rezultati pretrage skoro uvek pored korisnih sadrže i određeni broj manje potrebnih ili potpuno nebitnih podataka.

Dakle zahvaljujući web pretraživačima među milionima web sajtova možemo relativno precizno odabrati samo one koji su nama zanimljivi i brzo pristupiti njihovim sadržajima. Osnovna razlika izmedju mnogobrojnih web pretraživača je u tome što su neki od njih zasnovani na podacima koje im daju automatizovane mašine za pretraživanje i indeksiranje web stranica – dakle na silikonskoj inteligenciji. Drugu vrstu predstavljaju katalozi odabranih web stranica koje pažljivo uređuju ljudi, znatno sporije ali i znatno mudrije od mašina. Preostale vrste pretraživača ili dovidljivo eksploatišu pomenute dve vrste ili vešto kombinuju njihova dva pretraživanja. Teško bi bilo dati prednost nekoj od pomenutih vrsta. Svi oni imaju svoje prednosti ali i mane. Koju vrstu ćemo odabrati za korišćenje zavisi od situacije do situacije i od vremena koje nam je na raspolaganju.

Jaz interneta i ostalih medija je sve veći, kao i sam internet. Rastom interneta, raste i njegov broj stanica, koji danas iznosi vise milijardi. Verovatno bi svako to protumačio kao vrlo koristan proces, iz razloga što većeg broja informacija na internetu, samim tim i što većoj korisnosti interneta. Ali posle uobičajenog zaključivanja dolazi na red dodatno, procesom rasta, internet je sve više komplikovaniji i teži za snalaženje, kako za prosečnog, tako i za profesionalnog korisnika. Stoga, činjenica je, da puni kapacitet Interneta možemo iskoristiti, samo ukoliko imamo odgovarajuću pomoć. Tu, veoma potrebnu pomoć čine internet pretraživači.

Internet pretraživači su specijalno kreirani sajtovi na internetu, dizajnirani da pomognu nalaženjem informacija lociranih na drugim sajtovima. Razlike izmedju internet pretraživača su velike, ali postoje tri zadatka koje svaki od njih obavlja:

13

Page 15: Različiti Internet Pretraživači

Pretražuje internet ili biraju delove interneta prema važnim rečima, Čuvaju indeks reči koje nađu i njihovu lokaciju, Dozvoljavaju korisnicima da pretražuju reči ili kombinacije reči nadjene u tom spisku.

Prvi internet pretraživači, su sadržali indeks koji je iznosio nekoliko miliona stranica i dokumenata, i primali nekoliko hiljada pretraga dnevno. Danas, najbolji internet pretraživači, sadrže indeks sastavljen od nekoliko milijardi stranica i dokumenata i sa desetinama miliona pregleda dnevno.

Danas, manje više, svi znaju šta u osnovi znači internet pretraživač. Ukucaš reč ili frazu u tekst boks koji služi za traženje i pritisneš dugme da pretražuje. Posle par sekudni čekanja pojaviće se lista od hiljadu ili stotinu hiljada web strana. Onda samo ostaje da odemo na stranu koja nam je potrebna i koju smo tražili. Ali internet pretraživači predstavljaju malo složeniju stvar od jednostavnog koncepta traži i naći ćeš.

Sa strane koja nije vidljiva korisnicima, pretraživači prestavljaju softver koji koristi odredjene aplikacije da sakupi informacije o web stranama. Informacije koje se obično sakupljaju su ključne reči ili fraze koji su potencijalni indikatori šta se tačno nalazi na web strani ili o kojoj tematici je reč, url strane, kod koji je korišćen pri izradi strane, kao i odlazeće i dolazeće linkove. Te informacije se onda indeksiraju i smeštaju u bazu podataka.

Sa strane koja je vidljiva korisnicima, pretraživač ima interfejs koji je namenjen korisnicima u kome mogu da unesu željenu reč ili frazu i pokušaju da nadju informaciju ili web sajt koji im je potreban. Kada korisnik klikne na dugme za traženje, algoritam onda ispituje informacije smeštene u bazi podataka i izbacuje linkove do web strana koje se podudaraju sa frazom koju je korisnik uneo. Proces prikupljanja informacija o web stranama se odvija od strane automatizovanog agenta crawlera, spider-a ili robota.

Neki pretraživači takođe traže podatke dostupne u newsgrupama, bazama podataka, forumima i direktorijumima linkova. Za razliku od klasičnih direktorijuma linkova koji se manuelno održavaju, internet pretraživači funkcionišu putem algoritma ili kombinovano mešajući algoritme i ljudske resurse.

14

Page 16: Različiti Internet Pretraživači

Funkcija Internet Pretraživača

Prvi veći pretraživač na web-u jeste Yahoo.com, koga su podigla dva studenta sa idejom da naprave top listu svojih omiljenih siteova. U početku se na Yahoo-u našlo samo deset sajtova, zatim dvadeset, pa pedeset, sto i kako se broj povećavao rodila se ideja da naprave kategorije i da sve sajtove razvrstaju po njima. Takvi pretraživači nazivaju se web direktorijumi. Prvi ozbiljni pretraživač jeste Altavista.com, koji je počeo kao Yahoo, ali uskoro razvija način indeksiranja i postaje krolerski pretraživač.

Zadatak pretrage je da što efikasnije vrati što kvalitetniji rezultat. Efikasnost se meri brzinom koja protekne od klika na dugme do pojave rezultata, a kvalitet se meri brojem rezultata koje pretraživač vrati i njihovom relevantnošću. Za brzinu je zadužen proces indeksiranja algoritmi koji sortiraju podatke prilikom parsiranja. Broj rezultata zavisi od broja indeksiranih stranica, odnosno broja stranica koje web spajder pretraživača poseti i preuzme u bazu. Relevantnost predstavlja povezanost sadržaja sajta sa traženim pojmom i zavisi od kvaliteta algoritama koje pretraživač koristi.

Proces pretrage počinje dolaskom korisnika na stranicu web pretraživača i unošenjem fraze. Klikom na dugme pretraga fraza se prosleđuje do parsera koji parsira frazu. Izbacuju se one reči koje se nalaze na top listi a ove ostale proveravaju da li postoje u lexicon-u. Ukoliko fraza nije pronađena u lexicon tabeli korisnik dobija poruku da ne postoji ni jedan dokument koji sadrži traženu frazu. U suprotnom za svaku reč iz fraze dobija se id pod kojim je ta reč snimljena u lexicon tabeli.

Nakon dobijanja identifikatora za reči koje se nalaze u frazi izvršava se upit nad inverted index tabelom koja vrača sve dokumente koji ih sadrže. Ovde se proces potrage završava za one pretraživače koji se ne bave relevantnošću rezultata. Za sve ostale sledeći korak je upravo ono što razlikuje dobre od loših – rangiranje rezultata.

Rangiranje rezultata predstavlja proces sortiranja na osnovu relevantnosti. Najpre se za svaki od dokumenata koji sadrže tražene reči broji broj pojavljivanja fraze na istom. Zatim za svako pojavljivanje reči gleda se pozicija u dokumentu i da li je ta reč posebno naglašena. Svaka od pozicija i naglašavanje reči nosi određeni težinski faktor. Sabiranjem težinskih faktora svih pojavljivanja dobija se samo delić vrednosti po kojoj se posle dokumenti sortiraju. Ostali faktori relevantnosti zavise od samog web pretraživača.

Nakon završenog sortiranja dokumenata (svih onih koji sadrže unetu frazu) po relevantnosti web pretraživač korisnika prebacuje na novu stranicu na kojoj se nalaze izlistani linkovi ka dokumentima.

15

Page 17: Različiti Internet Pretraživači

Podela Web Pretraživača

Opšta podela web pretraživača je izvršena na osnovu načina indeksiranja web strana. Ako je neka strana indeksirana od strane pretraživača to znači da je njen deo ili ceo sadržaj, na ovaj ili onaj način ubačen u bazu tog pretraživača i da će iz nje biti pozivan, prilikom upita koji odgovara indeksiranom sadržaju. Iz toga nastaje i podela na:

Web direktorijume, Krolerske ili spider pretraživače,

Meta pretraživače.

Web Direktorijum

Web direktorijumi predstavljaju, uslovno rečeno, najprimitivniji servis za podršku korisnicima prilikom pretrage interneta. Naime, to je prva vrsta search endžajna, i kao takva jasno je da je prevaziđena u mnogo tome.

Indeksiranje na web direktorijumima vrši sam čovek ili u većem slučaju više ljudi, odnosno fizički se u kategorije odnosno direktorijume ubacuju adrese određenih sajtova. Naravno, to ima svoje prednosti ali i mane.

Mana ovog načina indeksiranja je očigledna. Neophodni su ogromni ljudski resursi da bi svojom bazom mogli da pariraju ostalim vrstama pretraživača. To nije isplativo tako da su baze ovih pretraživača uglavnom male i najčešće se koriste kao specijalizovani pretraživači, odnosno kao na primer pretraživači polovnih automobila, pretraživači za sport itd. Nikada se ne indeksira ceo sadržaj sajta već samo ključne reči, naslov i reči u domenu.

Prednost ovih pretraživača je u tome što čovekov faktor utiče na sadržaj direktorijuma tako da je gotovo nemoguće da za određeni upit kao rezultat pretrage dobijete nešto što nema veze sa traženom reči, što je ipak moguće kod krolerskih pretraživača. Ovo je i jedini razlog zbog čega se ovi pretraživači još uvek koriste.

Spider Pretraživači

Način indeksiranja ovih pretraživača je mnogo napredniji. Naime, pretraživači su razvili posebne programe koji sami surfuju i neverovatnom brzinom indeksiraju ceo sadržaj svake strane sajta, čime se baza znatno povećava. Spajderi rade po utvrđenom algoritmu koji se, naravno, može menjati. Prednost ove vrste indeksiranja su mnogo veća baza od baze web direktorijuma, i revolucionarno što su doneli spajderi a to je indeksiranje baš svake reči na strani i svake strane na sajtu, tako da danas uz pomoć ovakvih pretraživača gotovo da ne postoji reč za koju nećete dobiti neki link kao rezultat pretrage.

16

Page 18: Različiti Internet Pretraživači

Pošto savršenstvo ne postoji, i kod ovog pretraživača imamo mane koje su u zavisnosti od same organizacije i mogućnosti ljudi koji rade na njemu, veće ili manje. Jedna od mana je što uvek postoji mogućnost da kao rezultat pretrage dobijete nešto što nema veze sa upitom, ali to su problemi o kojima će kasnije biti reči.

Meta Pretraživači

Pitanje je da li ovakav pretraživač uopšte možemo nazvati pretraživačem, jer u najvećem broju slučajeva ne poseduje svoju bazu već koristi tuđe, najčešće baze spider pretraživača. Odnosno, omogućava nam da pretražujemo pomoću naprednog pretraživača a da zaobiđemo njegov interfejs, što i nije neka prednost, ali jeste to što meta pretraživači najčešće koriste baze od više pretraživača, tako da je veća verovatnoća da za određemo upit dobijemo traženi rezultat. Međutim, tu se javlja problem dupliranja podataka, zbog čega je potrebno programirati određene filtere koji će taj problem rešavati.

Problemi Pretraživača

Od pojave interneta do danas web masteri se trude da budu što bolje rangirani na listi pretraživača, jer neka ispitivanja govore da korisnik ide najčešće na prvi, drugi eventualno treći pogodak za traženi upit. Stoga su web masteri najveći neprijatelj pretraživača jer imaju različite interese. Ljudi koji prave pretraživač, prave ga tako da bude od koristi i da bude efikasan kako bi stekao poverenje i posećenost a samim tim i profit, dok je web masterima interesu da privuku korisnike interneta na svoj web sajt iako on nema veze sa potrebama korisnika. Zbog toga su i spajderi imali svoj razvitak od najjednostavnijih do ovih trenutno aktivnih koji uspevaju da prevaziđu većinu problema koje im zadaju web masteri.

Najveći problem današnjih pretraživača jeste ogroman broj podataka i informacija i kako ih sortirati odnosno rangirati. Cilj je napisati pretraživač koji će svoje podatke u bazi sortirati na način na koji će biti od najveće pomoći korisnicima čak u situaciji koja je vrlo česta a to je da ni sam korisnik ne zna šta traži. Odnosno, potrebno je napraviti algoritam koji će rangirati pogotke. U početku se rangiranje zasnivalo na tome koliko se puta tražena reč nalazi na strani. Što više puta, to bolje mesto na pretraživaču. Ali su web masteri došli na ideju da pišu ključne reči istom bojom kojom je i pozadina tako da se reči ne vide a da ih spajder vidi i broji. Uskoro je i taj problem bio rešen, bar kod ozbiljnijih pretraživača, i takvi sajtovi su stavljani na crne liste.

Sledeća stvar koja se javlja, koja je za korisnike problem, a za pretraživače nije, jesu sponzori. Naime, pretraživači koji su se okrenuli malo više ka profitu su u rezultate pretrage ubacivali i sponzore i to vrlo dobro kotirane, iako nisu zadovoljavali upit korisnika. Takvi pretraživači su, logično gubili poverenje i posećenost a samim tim i sponzore.

17

Page 19: Različiti Internet Pretraživači

Sledeći problem koji se javlja jeste dupliranje pogodaka odnosno jedan korisnik –više domena. Korisnik ne želi da na listi pogodaka vidi nrp. www.link.com i www.link.net ukoliko su to potpuno iste prezentacije. Problem je u tome koji prikazati a koji ne. Svaki pretraživač rešava to na svoj način ali je Google u tome najbolji. O tome u daljem tekstu.

Ništa manji problem je više korisnika-jedan domen. To je karakteristično za domaće provajdere koji svoji korisnicima omogućavaju postavku njihovih prezentacija na svom serveru pa imamo npr. www.eunet.rs/korisnici/2012/petrap..

Struktura Pretraživača

Da bi se razumeo SEO potrebno je biti upoznat sa strukturom internet pretraživača. Svi pretraživači sadrže sledeće osnovne komponente:

Spider: Ovaj program čita internet stranice isto kao i web browseri. Razlika je da čitači čitaju sve informacije na svakoj stranici dok spider nema ni jednu vizuelnu komponentu i vidi samo HTML kod.

Crawler: Ovaj program pronalazi sve linkove na stranici. Na taj način Spider određuje gde će da ide dalje. Crawler prati ove linkove i pokušava da nađe stranice koje još uvek nisu u bazi podataka internet pretraživača.

Indexer: Ova komponenta obeležava svaku stranu i analizira različite elemente kao što su tekst, zaglavlje, struktura, spec. HTML tagovi.

Moguća je implementacija ovih mehanizama. Na primer, Spider + Crawler + Indexer se mogu implementirati u jedan program koji vrši sve njihove funkcije i zajedno kao celina zovu se crawler. Pretraživači crawluju bukvalno svaki sajt na itnernetu, pritom sakupljajući ključne reči i fraze na svakoj strani sajta koje potom ubacuju u svoju bazu. Da bi se dobila slika o značaju crawlera potrebno je reći da se svakoga meseca pojavi oko 1.5 miliona sajtova na internetu.

Database: Ovo su ogromna skladišta za podatke o svakom sajtu na web-u koje pretraživači indeksiraju i analiziraju. Podaci su klasifikovani u zavisnosti od metode rangiranja pretraživača.

Results Engine: Results Engine rangira stranice i odlučuje koja stranica najviše odgovara kojoj ključnoj reči i u kom redosledu te stranice treba da budu izlistane. Ovo se radi po algoritmu pretraživanja internet pretraživača kao što je Google-ov PageRank.

18

Page 20: Različiti Internet Pretraživači

Rang stranice je veoma važan i svaki web master treba da razume kako svi algoritmi pretraživanja vodećih internet pretraživača funkcionišu. Povećanje ranga stranica je glavni cilj optimizacije sajta zato što predstavlja najbitniji faktor koliko će poseta sajt imati sa internet pretraživača. Algoritmi pretraživanja se svakodnevno menjaju i nemoguće je tacno predvideti kako će se neka stranica sajta rangirati, tako da optimizacija predstavlja samo hipotezu kako i na koji način bi pretraživači mogli rangirati određenu stranicu.

Neki od najbitnijih faktora rangiranja web sajta su:

Lokacija ključnih reči – odnosi se na lokaciju ključnih reči i fraza u sadržaju određene web strane. Ukoliko se npr. ključna reč nalazi u nazivu domena sajta ili u title tagu sajta, veći su izgledi da se taj sajt bolje rangira od sajta koji ima iste ključne reči ali ne na odgovarajućim mestima.

Broj i gustina ključnih reči – Što se više ključna reč pojavljuje u sadržaju sajta veća je verovatnoća da će sajt biti bolje rangiran za tu ključnu reč. Bilo je pokušaja zloupotrebe ovog faktora rangiranja. Webmasteri sajtova su ispisivali i po 1000 ključnih reči na svakoj strani i skrivali ih izjednačavanjem boje teksta i pozadine. Međutim danas skoro svaki internet pretraživač prepoznaje ovu vrstu keyword spaminga i kažnjava je smanjivanjem ranga sajta ili čak izbacivanjem iz rezultata pretrage.

Linkovi – Jedan od novijih faktora koji utiču na rangiranje stranice je vrsta i broj linkova na web stranici. Sve vrste linkova utiču na rangiranje: dolazeći linkovi koji vode ka sajtu, linkovi unutar sajta koji vode ka drugom sajtu i linkovi unutar sajta. Sama kolicina linkova je važna samo za dolazeće linkove a rang sajta se povećava i ukoliko su svi linkovi relevantni tj. da se njima povezuju sajtovi sličnih tematika.

Broj ulazaka na sajt – Predstavlja bitan elemenat jer određuje koliko web strana ima ulazaka sa pretraživačima u odnosu na ostale web strane za iste ključne reči tj. u odnosu na sajtove koji se nalaze na istom SERP-u.

Query Interface i Web Server – Interfejs internet pretraživača uglavnom je predstavljen jednostavnom HTML stranom u kojoj se ističe polje za unos reči ili fraze pomoću koje korisnik očekuje da dobije traženu informaciju. Interfejs pretraživača najčešće polazuje deset linkova po stranici rezultata pretrage a stranice su odvojene pagerom. Query Interface je jedini deo internet pretraživača dostupan korisnicima. Danas mnogi pretraživači pored osnovnih elemenata imaju još personalizovanog sadržaja kao što je e-mail nalog, informacije o vremenu ili najnovije vesti. Google npr. omogućuje da korisnici imaju opciju da po svom izboru dodaju takve ili slične dodatke.

19

Page 21: Različiti Internet Pretraživači

Slika 2. Protok informacija od trenutka kada korisnik unese reč pa do trenutka kada se rezultati vrate.

Crawleri, Spideri i Roboti

Roboti, Spajderi i Crawleri predstavljaju softver koje je programiran da ide od jedne do druge web stranice vodeći se linkovima koji se nalaze na tim stranama. Dok se kreće, stranu po stranu, kroz internet on skuplja sadržaje sa web sajtova i čuva ih u bazi podataka koja je indeksirana i u kojoj su podaci rangirani u skladu sa algoritmom pretraživača.

Kada se crawler pusti na mrežu, obično se usadi u nekoliko web sajtova i on kreće svoju pretragu sa jednog od tih sajtova. Prva stvar koju uradi na tom početnom sajtu jeste da beleži koji su linkovi na toj strani. Onda on čita tekst i zatim počinje da prati linkove koje je prethodno sakupio. Ova mreža linkova se naziva crawler frontier i predstavlja teritoriju koju crawler istrazuje na veoma sistematican način.

Linkovi koji se nalaze u crawler frontier će ga nekada odvesti do drugih stranica na istom web sajtu a nekad će ga odveti skroz sa sajta. Crawler će pratiti linkove dokle god bude mogao, dok ne dođe do neispravnih linkova. Onda se vraća i počinje proces ponovo sve dok ne pregleda sve linkove na strani.

20

Page 22: Različiti Internet Pretraživači

Šta se u stvari dešava kada crawler počinje da pregledava sajt. Crawler šalje zahtev web serveru na kom se nalazi web sajt, zahtevajući stranice da mu budu dostavljene na isti način koji naš web browser traži strane koje mi gledamo.

Slika 3. Googlebot

Razlika između toga šta naš browser vidi i onoga što crawler vidi jeste da crawler vidi sve u tekstualnom interfejsu. Ne prikazuje se ni jedan grafički ili bilo koji drugi tip medija. Sve je tekst i sve je pisano u HTML kodu.

Pošto imaju potencijala da naprave haos na sajtu, treba da postoje neka određena pravila kojima će se kontrolisati crawleri. Ta uputstva se nazivaju Robot Exclusion Standardi, robots Exclusion protocol ili robots.txt.

Fajl robots.txt je pravi elemenat sa kojim ćemo raditi. To je tekstualni dokument koji bi trebalo biti uključen u koren našeg domena i u osnovi sadrži instrukcije za bilo koji crawler koji dođe na naš sajt o tome šta mu je dozvoljeno a šta nije da indeksira.

Da bi smo komunicirali sa crawlerom, potrebna nam je specifična sintaksa koju on razume. U najjednostavnijoj formi tekst izgleda ovako:

User-agent: *

Disallow: /

21

Page 23: Različiti Internet Pretraživači

Slika 4. Ograničenje kretanja google bota.

Ove dve rečenice su najbitnije. Prva rečenica user-agent govori crawleru kojem korisničkog agenta ili crawlera komandujemo. Znak * ukazuje na to da su svi crawleri uključeni, ali možemo specificirati svakog crawlera pojedinačno ili više njih. Druga rečenica Disallow govori crawleru gde mu je dozvoljeno da pristupi. Kosa crta ukazuje na svi direktorijumi. Tom kosom crtom robots.txt dokument u osnovi kaže da svi crawleri trebaju da izbegavaju sve dokumente. Kada pišemo fajl robots.txt uvek treba da uključimo znak : posle User-agent naredbe i posle Disallow naredbe. Taj znak ukazuje crawleru da bitna informacija sledi i da obrati pažnju. Crawleru se nikada ne govori da ignoriše sve direktorijume. Umesto toga možemo reći svim crawlerima da ignorišu naš temporary direktorijum tako što ćemo napisati ovakav tekst:

User-agent: *

Disallow: /tmp/

Bitna stvar na koju treba obratiti pažnju jeste da crawleri dokument robots.txt čitaju odozgo nadole i čim naiđu na rečenicu koja se odnosi na njih odmah prestaju da čitaju i kreću da pretražuju naš sajt. Tako da ako želimo da upravljamo sa više krawlera sa robots.txt dokumentom moramo biti jako pažljivi kako ga pišemo.

22

Page 24: Različiti Internet Pretraživači

Različiti crawleri različitih internet pretraživača se različito zovu. Navešćemo samo neke najpoznatije crawlere:

Google: Googlebot MSN: MSNBot Yahoo!: Yahoo! SLURP Ask: Teoma AltaVista: Scooter LookSmart: MantraAgent WebCrawler: WebCrawler

Ovo su samo neki od crawlera velikih internet pretraživača. Cela lista sadrži preko trista crawlera. Isplati se znati koji crawler pripada kom pretraživaču jer postoje crawleri koji posećuju pretražuju sajtove iz neetičkih razloga. Ako znamo njihove nazive možemo da ih držimo podalje od sajta. Oni su problematični jer pretražuju net u potrazi za nečim što liči na e-mail adresu. Ove adrese se prikupljaju i onda prodaju ljudima iz marketinga ili čak i ljudima koji se ne bave legitimnim poslovima. Većina ovakvih crawlera će ignorisati naš robots.txt fajl.

Robots.txt ako ne postoji može se lako napraviti u bilo kom tekstualnom editoru. Ovaj dokument nikako ne sme da bude prazan. Crawleri kad vide prazan dokument automatski pretpostavljaju da ne želimo da naš sajt bude pretražen i idu dalje preskačući naš sajt.

Robot Meta Tagovi

Nemaju baš svi pristup našem web serveru, ali je ipak poželjno imati kontrolu nad ponašanjem crawlera na našem web sajtu. To znači da moramo kontrolisati crawlere koje dolaze na naš web sajt. Umesto robots.txt dokumenta koristićemo robot meta tagove da bi smo kontrolisali crawlere.

Robots meta tag je mali deo HTML koda koji je ubačen u head tag našeg web sajta i u osnovi funksioniše na isti način kao i robots.txt. Ubacimo naše instrukcije koje se odnose na crawlera unutar taga. Taj kod može izgledati ovako:

<html>

<head>

<meta name=”robots” content=”noindex, nofollow”>

<meta name=”description” content=”page description”>

<title>Web site title</title>

23

Page 25: Različiti Internet Pretraživači

</head>

<body>

<meta name=”robots” content=”index,nofollow”>

<meta name=”robots” content=”noindex, nofollow”>

Velika je razlika između robots.txt i robot meta taga jeste ta da mi u okviru meta taga ne možemo da definišemo na kojeg se crawlera naredba odnosi. To je sve ili ništa komanda, tako da ili naređujemo svim crawlerima kako da se ponašaju ili nijednom. Nije precizan kao robots.txt ali je dobra alternativa ako nemamo pristup web serveru.

Nažalost, ne prepoznaju svi pretraživači robots.txt ili robot meta tagove. To znači da u nekim slučajevima uopšte nemate kontrolu nad tim šta crawler ispituje na našem web sajtu.

Tipovi Internet Pretraživača

Po oblasti pretraživanja

Primarni internet pretraživači – je najstandardniji tip pretraživača kao što su Google, Yahoo! i MSN. Oni indeksiraju skoro sve sajtove koji se pojave na internetu i generišu većinu poseta na većini sajtova.

Optimizacija sajtova je većinom bazirana za ovu vrstu pretraživača. Većina njih ima dosta dodatnih opcija pored pretraživanja kao što su e-mail, blog, mape, vesti, različite vrste zabavnih aplikacija u cilju povećanja broja korisnika.

Sekundarni internet pretraživači – su manji servisi koji pokrivaju specifične grupe korisnika bez obzira na to što je sadržaj pretraživanja i kod njih uopšten. Sekundarni pretraživači kao što su Lycos, LookSmart, Miva, Ask.com i Espotting ne donose puno poseta sajtu ali mogu biti korisni kod regionalnih ili specifičnih pretraga. Takođe, neki od sekundarnih pretraživača rangiraju sajtove po nekim drugim kriterijumima tako da ne bi trebalo da se izostave iz SEO optimizacije.

Tematski Internet Pretraživači – Pretraživači koji su fokusirani na neku oblast kao npr. medicinu, turizam, muziku. Poželjno je da webmaster uradi optimizaciju za tematski internet pretraživač ukoliko postoji takav da je fokusiran na temu njegovog sajta.

24

Page 26: Različiti Internet Pretraživači

Po načinu Indeksiranja

Crawler bazirani pretraživači – Pretraživači koji koriste automatizovanog agenta – crawler koji posećuje, pregleda i indeksira web sajtove. Sve informacije koje crawler skuplja se upisuju u bazu podataka internet pretraživača i to se zove indeksiranje web sajta. Crawler-bazirani pretraživači se vraćaju periodično na web strane svakog sajta u vremenskom razmaku kojeg određuju administratori pretraživača.

Pretraživači sa manuelnim upisom – Ovakvi pretraživači se oslanjaju na ljude koji šalju informacije koje se indeksiraju i kasnije prikazuju u rezultatima pretrage. Ponekad se pod takve pretraživače svrstavaju i web direktorijumi. Yahoo! je nekada bio pretraživač sa manuelnim upisom, a danas je najpoznatiji Mahalo.

Hibridni pretraživači – Predstavljaju hibrid, kombinaciju prethodne dve grupe pretraživača, gde webmasteri mogu manuelno da prijave sajt na pretraživač a pritom oni imaju i crawlere koji automatski ubacuje sajtove. Danas je većina pretraživača hibridna, međutim uglavno indeksiraju sajtove preko crawlera.

Istorijat Internet Pretraživača

Internet pretraživači su nastali u vreme ekspanzije podataka na internetu. Pristup podacima bio je omogućen korisniku jedino ako je znao tačnu adresu lokacije podatka. Da bi se premostio problem traženja podataka na internetu, Alan Emtage, student Univerziteta Mc Gill u Montrealu, napravio je 1990. godine Archie, prvu alatku za pretraživanje i indeksiranje fajlova na internetu. Archie, koji je ime dobio od reči archive, je napravljen da skida liste ili direktorijume svih fajlova koji su se nalazili na javnim, anonimnim FTP sajtovima. Međutim Archie nije indeksirao sadržaj tih web sajtova.

Slika 5. Prvi internet pretraživač.

1991. godine Mark Mc Cahill, student Minesota Univerziteta je napravio Gopher, prvi pretraživač koji je indeksirao tekstualne dokumente, odnosno sadržaj u to vreme prvih javnih web sajtova na internetu. Za njim su sledila dva servisa podrške Gopheru, Veronica i Jughead koji su omogućili pretraživanje indeksiranih informacija po ključnoj reči u Gopher sistemu.

25

Page 27: Različiti Internet Pretraživači

Slika 6. Interfejs prvog internet pretraživača.

Wandex je prvi web pretraživač u formi sličnoj onoj koja danas predstavlja standard. Njega je razvio Matthew Gray 1993. godine. Wandex je ujedno indeksirao i pretraživao web stranice koristeći tehnologiju koja je standardna kod danas vodećih internet pretraživača.

U periodu od 1993. do 1998. u skladu sa ekspanzijom i komercijalizacijom interneta, nastali su najpoznatiji internet pretraživači koji danas imaju primat na internetu:

1993 – Excite, Aliweb, 1994 – Yahoo!, Infoseek, WebCrawler, Lycos, 1995 – AltaVista, Magellan, SAPO, 1996 – Inktomi, Dogpile, HotBot, Ask Jeevs, 1997 – Google, Northhern Light. 1998 – MSN Search.

Trenutno postoje tri vodeća svetska internet pretraživača – Google, Yahoo! i MSN. Od pomenutih Google se izdvaja kao vodeći servis.

26

Page 28: Različiti Internet Pretraživači

Pored svog minimalističkog interfejsa koji omogućuje savršenu preglednost i laku navigaciju, Google daje najpreciznije i najrelevantnije rezultate pretrage pomoću PageRank algoritma koji rangira web stranice i na osnovu tih rangiranja pravi redosled u rezultatima pretrage.

Svi današnji internet pretraživači su usavršili servis koji omogućuju korisniku da nađe sve potrebne informacije ili fajlove koristeći sintaksu i semantiku koja se koristi u svakodnevnim konverzacijama.

Slika 7. Najpopularniji internet pretraživači (2003).

Domaći Search Engine

Domaći internet je veoma mali. Procenjuje se na oko sto hiljada sajtova. Donekle ta brojka se može opravdati lošom finansijskom situacijom građana, ali podatak koji zapanjuje je da samo 5 procenata stanovništva izvan Beograda koristi internet.

27

Page 29: Različiti Internet Pretraživači

Globalna mreža u našoj zemlji dostupna je korisnicima od 1998. godine, dok je u 1997. godini postojala samo akademska mreža.

Domaći pretraživač predstavlja posebnu vrstu specijalizovanog pretraživača, koji je ograničen na govorno područje. Sve opšte vrste pretraživača, o kojima je bilo reči, mogu se naći i kod nas, što znači da i svi problemi koje imaju oni imaju i domaći, uz još mnogo jezičkih problema.

Problemi domaćih Pretraživača

Možda najveći problem domaćih pretraživača jeste odrediti koji je to domaći sajt. Da li su to svi sajtovi koji su na .rs domenu?. Postoji veliki broj sajtova na engleskom jeziku koji se nalaze na .rs domenu. Oni nikako ne spadaju u domaće sajtove. Skoro polovina naših sajtova se nalazi na .com domenu. Njih treba indeksirati. Tu su i ostali domeni: .net, .org. Dolazimo do zaključka da su domaći sajtovi oni koji su pisani za naše govorno područje. Ali kako napisati algoritam za kroler koji pravi razliku između srpskog i bosanskog koji su veoma slični jezici. U takvim problemima, odnosno rešenjima tih problema se i vidi prednost pretraživača.

Ali ni to nije sve. Neophodno je pomenuti da smo jedna od vrlo retkih zemalja koja ima dva pisma. Ćirilicu koja je službeno pismo i latinicu koja je mnogo više zastupljena na webu zbog sličnosti sa alfabetom. To znači da bi naš pretraživač morao da nam za upit na latinici izlista i rezultate na ćirilici i obrnuto, što je zaista komplikovana procedura. Međutim, ni to nije sve što se pisama tiče. Domaći pretraživač bi mogao da nam za upit na latinici da i rezultate pretrage za taj isti upit na alfabetu, odnosno bez slova: č, ć, š, ž, đ. Nije potrebno pominjati da se očekuje i obrnuto.

Sledeća jezička karakteristika našeg govornog područja je u tome što za razliku od npr. engleza koji nemaju ni jedan, mi imamo čak sedam padeža. Tako da je poželjno da pretraživač pored svih pomenutih mogućnosti, ima i sposobnost da prepozna koren reči. Izlišno je pričati o komplikovanosti ovog zahteva. Ukoliko pretraživač ne podržava ovu opciju, a korisnik otkuca “novine”, ostaće uskraćen za stranice na kojima piše npr. “novinama”, što nije dobro za popularnost.

Koncept Internet Pretraživača

Web se sastoji od površinskog i dubinskog (takođe skriveni ili nevidljivi web). Svaka stranica na površinskom webu ima logičku adresu koja se naziva web adresa. Web adresa stranice omogućava njeno direktno učitavanje. Suprotno tome, dubinski web sadrži stranice koje nije moguće direktno učitati kao i zapise u bazama podataka koji su skladišteni u sistemima baza podataka. Smatra se da je dubinski web sto puta veći od površinskog.

28

Page 30: Različiti Internet Pretraživači

Alatke koje se koriste za pronalaženje informacija na webu se zovu pretraživači. Veruje se da je više od milion pretraživača aktivno na webu. Pretraživanje je moguće klasifikovati na osnovu tipa podataka koje pretražuju.

Pretraživači koji pretražuju tekstualne dokumente zovemo pretraživači dokumenata, dok pretraživače koji pretražuju strukturisane podatke koji se čuvaju u bazama podataka zovemo pretraživači baza podataka.

Slika 8. Šema koncepta meta-pretraživača.

Mnogi popularni pretraživači kao što su Google i Yahoo su pretraživači dokumenata, dok se mnogi pretraživači e-trgovina kao što je Amazon.com, smatraju pretraživačima baza podataka. Integrisan pretraživač wikipedie je takođe primer pretraživanja baze podataka.

Pretraživači dokumenata obično imaju prostiji interfejs sa tekstualnim poljem gde korisnici unose svoj upit koji obično čine ključne reči koje odražavaju potrebe korisnika za određenim informacijama. S druge strane, mnogi pretraživači baza podataka omogućuju korisnicima da vrše specifične i složenije upite.

Postoje i pretraživači koji su specijalizovani za pretragu multimedijalnih datoteka (audio, video zapisa i slika). Većina pretraživača pokrivaju samo mali deo weba. Da bi se povećala pokrivenost jednog sistema pretrage, moguće je kombinovati više pretraživača odjednom. Sistemi za pretragu koji koriste druge pretraživače za obavljanje pretrage i kombinuju ih sa svojim rezultatima, nazivaju se metapretraživači.

Arhitektura Inernet Pretraživača

Arhitektura različitih pretraživača weba može znatno varirati, međutim tipičan pretraživač dokumenata se obično sastoji od sledeće četiri komponente: Pretraživača lokacije weba (web crawler), indeksera (indexer), indeksa baze podataka i mašine za upite (query engine).

29

Page 31: Različiti Internet Pretraživači

Pretraživač lokacije weba, takođe poznat kao program tragač (web spider) ili web robot, prolazi kroz web u potrazi za web stranicama sledeći njihove URL adrese. Indekser je zadužen za analizu teksta svake pronađene web stranice i vađenje ključnih reči na osnovu kojih se onda pravi indeksna baza podataka svih analiziranih web stranica.

Kada korisnik uradi upit, mašina za upite pretražuje indeksnu bazu podataka u potrazi za stranicama koje odgovaraju ključnim rečima koje su predmet korisnikovog upita.

Pretraživanje lokacija weba (web sajtova)

Pretraživač lokacija weba (web crawler) je računarski program koji preuzima web stranice od web servera. URL svake web stranice identifikuje njenu lokaciju na webu. Obzirom na postojanje URL adrese, svaka web stranica se može preuzeti sa web servera upotrebom protokola za prenos hiperteksta. Polazeći od jedne URL adrese, pretraživač lokacija weba neprestano preuzima web stranice bazirajući se na njihovim URL adresama i vadi URL adrese sa onih već preuzetih, tako da je moguće preuzeti nove.

Ovaj proces se završava kada je neki uslov za zaustavljanje programa ispunjen. Neki od mogućih uslova za njegovo zaustavljanje su: 1) Nema novih URL adresa na lokaciji ili 2) Unapred definisani broj, odnosno spisak web stranica je već preuzet. Pošto pretraživač web lokacija može biti u interakciji sa raznolikim samostalnim web serverima, bitno je da bude projektovan tako da ga je lako prilagoditi novim zahtevima.

Slika 9. Arhitektura standardnog web crawlera.

Kako bi se ubrzao proces pretraživanja, moguće je upotrebiti više pretraživača lokacija weba. Oni mogu biti dva različita tipa, centralizovani i distribuirani. Centalizovani pretraživači lokacija weba se nalaze na istoj lokaciji sa koje se pokreću paralelno i sa više mašina.

Distribuirani pretraživači lokacija weba se nalaze na više različitih lokacija na internetu i kontrolišu se putem jednog centralnog koordinatora, drugim rečima svaki pretraživač lokacija weba preuzima samo web stranice koje su mu georgafski blizu. Najznačajnija prednost distribuiranih pretraživača lokacija weba tiče se smanjenja troškova komunikacije koji su rezultat njihove aktivnosti. Međutim centralizovani pretraživači su lakši za implementaciju i kontrolu nego distribuirani.

30

Page 32: Različiti Internet Pretraživači

Rast i kontstante promene na webu, stvaraju potrebu da pretraživači lokacija weba regularno vrše nova pretraživanja kao i da održavaju indeksnu bazu podataka ažurnom. Međutim, suviše često pretraživanje weba bi dovelo do značajnog trošenja resursa, ali i poteškoće u radu web servera na kojima se tražene web stranice nalaze. Stoga je potrebno upotrebiti jednu strategiju inkrementalnog pretraživanja. Jedan od njih je da se samo pretražuju web stranice čiji se sadržaj ili URL adresa promenila od poslednje pretrage. Druga strategija je da se upotrebe pretraživači lokacija weba koji imaju predefinisanu oblast pretrage, ili predefinisan skup tema za pretragu. Ovi poslednji se mogu koristiti za kreiranje specijalizovanih pretraživača lokacija weba koji su jedino zainteresovani za web stranice određene tematike.

Konvencionalni pretraživači web lokacija se mogu upotrebiti samo za pretraživanje površinskog weba. Posebni pretraživači lokacija weba se projektuju za pretragu informacija koje se nalaze u dubinskom webu. Pošto su informacije koje se nalaze u dubinskom webu obično skrivene iza raznih interfejsa pretrage, pretraživači lokacija dubinskog weba su projektovani tako da prikupljaju podatke vršeći upite u interfejsu pretrage i preuzmu povratne rezultate.

Indeksiranje web stranica

Nakon što su stranice preuzete na mesto pretraživača, one se obrađuju u formatu koji je podesan za efektivnu upotrebu sa pretraživačima. Sadržaji stranice mogu biti predstavljeni rečima koje se na njoj nalaze. Nesadržajne reči kako što su “je” ili “li” se obično koriste za prestavljanje sadržaja. Neretko, reči se konvertuju u njihov koren upotrebom odgovarajućih programa kako bi se olakšalo pogađanje različitih varijacija iste reči. Na primer “račun” je koren reči “računati” i “računarstvo”. Nakon uklanjanja nesadržajnih reči sa stranice i procesa izvlačenja korena, preostale reči (takozvani indeksni pojmovi) koriste se za predstavljanje stranice u pretrazi.

Rečenice se takođe mogu prepoznati kao zasebni indeksni pojmovi. Nakon toga, odlučuje se o značaju svakog pojma u zastupanju sadržaja stranice prilikom davanja rezulata pretrage u pretraživaču.

Značaj pojma P na stranici S u okviru datog skupa C stranica, može se odrediti na više načina. Ako tretiramo svaku stranicu kao tekstualni dokument, onda se značaj P obično izračunava na bazi dve statistike. Prva se odnosi na frekventnost pojma u S, odnosno broj puta ponavljanja pojma P u stranici S, a druga se odnosi na frekventnost dokumenta u skupu C, odnosno broj stranica u skupu stranica C u kojima se sreće pojam P. Intuitivno gledano, što se u više stranica nalazi pojam P, to je više bitan kao zastupnik sadržaja stranice. Međutim, što se u više različitih stranica pojavljuje pojam P, utoliko je manje upotrebljiv za diferenciranje različitih stranica jednih od drugih. Kao rezultat, značaj pojma bi trebalo da bude monolitna opadajuća funkcija njegove frekventnosti u različitim dokumentima.

31

Page 33: Različiti Internet Pretraživači

Trenutno, većina web stranica je formatirana u jeziku za markiranje hiperteksta, koji poseduje skup tagova kao što su title i header. Te informacije se mogu koristiti za uticaj na značaj pojmova koji predstavljaju web stranice. Na primer, pojmovi koji se nalaze u naslovu jedne web stranice, istaknuti masnim ili iskošenim slovima, vrlo verovatno su značajni za zastupanje jedne web stranice nego oni koji se pojavljuju u njenom sadržaju (body) i koji su bez posebnog formatiranja.

Rangiranje stranica za korisničke upite

Uobičajeni upit pretraživaču weba se sastoji od nekih ključnih reči. Takav upit se može predstaviti kao skup pojmova sa određenim značajem. Stepen poklapanja između stranice i upita, odnosno takozvane sličnosti, može se meriti pojmovima koje oni međusobno dele. Jednostavan pristup ovom problemu je da se sabiraju proizvodi značaja koji odgovaraju pojmovima između upita i stranice. Ovaj pristup daje kao rezultat veće sličnosti za stranice koje dele najvažnije pojmove sa samim upitom.

Međutim, ima tendenciju da daje prednost dužim stranicama nad kraćim. Ovaj problem se obično rešava tako što se gornja sličnost deli sa proizvodom značaja upita i stranice. Funkcija koja izračunava ovu vrstu sličnosti, naziva se kosinus funkcija. Dužinu svake stranice je ovde moguće izračunati unapred i uskladištiti u pretraživaču. Postoje mnoge metode za rangovanje web stranica za korisničke upite, a zazličiti pretraživači ih različito koriste. Na primer, neke metode rangiranja mogu uzeti u obzir blizinu pojmova koji su predmet upita u nekoj stranici. Kao drugi primer, pretraživač može sačuvati informacije o broju pristupa različitih korisnika određenoj web stranici i koristiti te informacije za rangiranje web stranica koje će se prikazati povodom budućih upita.

Na webu postoji mnogo popularnih pretraživača, ali Gugl je smatran jednim od najpopularnijih. Glavni razlog za to je njegova metoda rangiranja stranica koja ima sposobnost da razlikuje najvažnije stranice od onih manje važnih čak i kada se u svima njima isti broj puta ponavljaju pojmovi koji su predmet upita.

Za odlučivanju o značaju svake stranice, Gugl koristi informacije o linkovanju među njma, odnosno način na koji linkuju jedne na druge. Tako link sa stranice A na stranicu B a koji je postavio autor stranice A, služi kao indikacija da autor stranice A smatra da stranica B ima neku vrednost. Na čitavom webu, na stranicu B može linkovati veći broj drugih stranica i ti linkovi mogu poslužiti za odlučivanje o njenoj sveukupnoj vrednosti ili značaju. Za datu stranicu, PageRank je mera njenog relativnog značaja na webu, i on se izračunava na bazi informacija o linkovanju.

32

Page 34: Različiti Internet Pretraživači

Tri glavne ideje stoje iza definisanja značaja i izračunavanja PageRank-a: 1) Stranice koje su linkovane sa više stranica su najverovatnije važnije. Drugim rečima, značaj stranice treba da se uspostavi na osnovu njene popularnosti među autorima svih drugih web stranica. 2) Stranice koje su linkovane sa najznačajnijih web stranica najverovatnije i same imaju poseban značaj. 3) Stranice koje imaju linkove na više stranica imaju manje uticaja na značaj svake linkovane stranice pijedinačno. Drugim rečima, ako stranica ima više podstranica, onda ona može preneti manji deo svog značaja na svaku od njih.

Na osnovu ovih shvatanja Guglovi osnivači su razvili metod za izračunavanje značaja svake stranice na webu. PageRank webstranice se može kombinovati sa drugim merama na bazi sadržaja za indikaciju njenog sveukupnog značaja u odnosu na dati upit. Na primer, za zadati upit x, stranica može biti rankovana na osnovu ponderisanog zbira njenih sličnosti sa upitom i njenog PageRank-a. Među stranicama sa velikim sličnostima, ovaj metod će dati prednost onima koji imaju viši PageRank.

Slika 10. Google PageRank logo.

33

Page 35: Različiti Internet Pretraživači

Efektivnost i efikasnost pretrage

Za sranicu se kaže da je relevantna, ukoliko korisnik koji je izvršio upit nalazi da je korisna. Za zadati upit korisnika na fiksni skup stranica, skup onih koje su relevantne je takođe fiksan. Dobar sistem pretrage treba korisniku da vrati visok stepen relevantnih stranica kao i da ih ranguje visoko u povratnim rezultatima. Tradicionalno, efektivnost sistema pretrage se meri preko dva količnika poznata kao odziv i preciznost. Kod upita u skup dokumenata x, odziv je procenat relevantnih dokumenata koji se na upit odzivaju, a preciznost je procenat odzvanih dokumenata koji su za upit relevantni. Da bi se ocenila efektivnost jednog sistema pretrage, vrše se probe nizom upita. Za svaki poseban upit, skup relevantnih dokumenata se identifikuje unapred.

Kod svakog probnog upita traži se vrednost preciznosti za svaku tačku odziva ponaosob. Kada se napravi jedna prosečna vrednost preciznosti za svaku tacku odziva, onda se dobije kriva ukupne prosečne preciznosti sistema pretrage koja služi kao mera njegove efektivnosti. Jedan sistem pretrage se smatra efektivnijim od drugog, ukoliko je njegova kriva preciznosti i odziva iznad krive drugog. Kod savršenog sistema pretrage vrednosti odziva i preciznosti treba da budu jednake broju 1. Drugim rečima, takav sistem pronalazi tačan skup relevantnih dokumenata za svaki upit. U praksi, savršen učinak nije ostvarljiv iz mnogo razloga. Na primer, potrebe korisnika za određenim informacijama obično ne mogu biti precizno definisane probnim upitom, ali ni sam sadržaj u dokumentima, kao ni u upitima, se ne može u potpunosti prestaviti ponderisanim pojmovima.

Upotreba odziva i preciznosti za merenje efektivnosti tradicionalnog sistema pretrage teksta, zahteva da je unapred poznat broj svih relevantnih dokumenata za svaki probni upit. Međutim, ovo nije praktično za ocenjivanje i nezavisno vrednovanje velikih pretraživača, budući da je nemoguće znati broj relevantnih stranica za svaki upit u pretraživaču, ukoliko se sve one ručno ne pregledaju. Bez poznavanja broja relevantnih stranica za svaki probni upit, mera odaziva se ne može izračunati. Kao rezultat ovog praktičnog ograničenja, pretraživači se često ocenjuju na osnovu srednje preciznosti koja se izračunava na osnovu najrelevantnijih odzvanih stranica k za skup probnih upita za neki mali celi broj – recimo 20, ili na osnovu prosečne pozicije prve relevantne stranice koja je povratni rezultat u svakom pojedinačnom probnom upitu.

Pretraživači weba su, u suštini, ekspertski sistemi koji imaju za cilj stvaranje što više heuristika sposobnih za pomoć ekspertskom sistemu u predviđanju šta je to što korisnik traži.

34

Page 36: Različiti Internet Pretraživači

Pretraživanje Interneta

Na ovom terenu praktično su ostali Internet Krstarica i "srpski" Google.

Pri pretraživanju celog Interneta, ukoliko tražimo opšte informacije koje bi mogle da se svrstaju u neku kategoriju u katalogu, najkorisnija će nam biti najpoznatija kataloška mašina za pretraživanje - Yahoo. S druge strane, ukoliko tragamo za stranicama raznih sajtova koji sadrže određeni pojam, najefikasnije će nam biti da ukucamo upit u polje za pretragu najpoznatije mašine za pretraživanje po ključnoj reči - Google. Situacija se unekoliko menja ako želimo da pretražimo Domaći web prostor bez rezultata iz stranih zemalja. Za kataloško pretraživanje potražićemo pomoć nekog od domaćih pretraživača, a ako želimo da pronađemo neku stranicu koja sadrži određenu reč, imaćemo izbor između nekog od domaćih pretraživača i jednog stranog koji podržava, između ostalog, i posebnu pretragu stranica sajtova na srpskom jeziku. Pogađate, opet je reč o "nemilosrdnom" Google-u.

Do pre nekoliko godina, domaći Internet pretraživači utrkivali su se za lidersku poziciju pretrage domaćeg Web-a. U međuvremenu, njihov razvoj je uglavnom posustao, najviše iz finansijskih razloga. Ako smo pretragu želeli da ograničimo samo na naše lokacije, domaći pretraživači su nam tada bili potrebni i kod kataloške i kod pretrage po ključnoj reči. Iz tog vremena poznat je "rivalitet" za prevlast na domaćem pretraživačkom nebu između Internet Krstarice (www.krstarica.com) i Šerloka (www.pretrazivac.com). Po pohvalama, posećenosti i raznim testovima broja rezultata i kvaliteta pretraživanja, i jedan i drugi su se smenjivali na vodećim pozicijama. Pored ova dva, tada se moglo računati i na relativno kvalitetno pretraživanje na Yusearch. U međuvremenu kao da se stalo. Štaviše, imali smo priliku da pronađemo i rezultate testova pretraživanja određenih reči još iz 1999. godine, i da ih uporedimo sa sadašnjim za iste reči. Razočaravajuće je to da smo na pojedinim pretraživačima za mnoge reči sada pronašli manji broj rezultata nego pre četiri godine!?

Najbolji način da ocenimo sadašnje stanje u kome se nalaze pretraživači pomoću kojih možemo da pretražujemo domaći Web jeste da im postavimo nekoliko različitih upita u polje za pretragu i da vidimo koliko će rezultata prikazati. Ono što nam je takođe potrebno je da rezultati budu "očišćeni" od lokacija koje su iz susednih zemalja, odnosno sa sličnog govornog područja. U tu svrhu, postavili smo deset odabranih reči (učestale, retke, sa i bez domaćih slova, fraze) za pretragu domaćim pretraživačima i Google-u u opciji srpskog jezika, pri čemu nas je interesovao broj pronađenih stranica i kvalitet pretrage, dok brzinu pretraživanja i ostale osobine pretraživača nismo uzimali u obzir. A odmah je jasno da su na ovom terenu praktično ostali: domaći pretraživač - Internet Krstarica i globalni pretraživač broj jedan - Google. Po broju pronađenih stranica pobedio je Google, jer je pronašao između dva i devet puta više stranica od Krstarice. Međutim, pozabavimo se i kvalitetom pretrage.

35

Page 37: Različiti Internet Pretraživači

Na zadate upite, Krstarica u opciji pretrage Srpske/Web stranice prikazuje isključivo domaće sajtove, dok Google, pored većinski pronađenih naših sajtova, ponekad prikazuje kao rezultat i jedan broj stranica iz susednih zemalja sličnog govornog područja, kao što su BiH, Hrvatska, Makedonija, a ponekad i jedan broj stranih stranica gde se iz nekog razloga nalazi poneka naša reč. BiH je posebna priča jer ne postoji opcija pretrage na "bosanskom" jeziku, tako da Google verovatno pomalo dodaje sajtove iz BiH i na srpsku pretragu. Generalno, za 10 naših upita za pretragu Srpskog Web prostora, Google je u proseku pronalazio oko pet odsto (slobodna procena) rezultata koji nisu iz Srbije, što ćemo ipak oceniti kao minimalno "odstupanje" od željene pretrage. U kvalitetu pretrage, pobednikje Krstarica. Ipak, kada uzmemo u obzir i broj pronađenih stranica i kvalitet pretrage, malu prednost bismo ipak dali broju stranica, na osnovu čega za pobednika našeg testa proglašavamo "srpski" Google.

Od Google-a uskoro možemo očekivati da i za Srbiju reši problem prikaza jednog broja lokacija iz susednih zemalja prilikom pretrage sajtova na srpskom jeziku. Namerno kažemo "i za nas" jer postoji opcija jezičkog alata (language tools) koja pruža mogućnost, za jedan broj država, pretraživanja stranica sajtova na odabranom jeziku i/ili iz odabrane zemlje. Na primer, za Hrvatsku i Sloveniju već postoje opcije i jedne i druge pretrage, dok Srbija još uvek nema u padajućem meniju pretrage iz odabrane zemlje. Tako, ako preciziramo pretragu za određenu reč ili frazu sa: 1) traži strane na hrvatskom jeziku i 2) traži strane koje se nalaze u Hrvatskoj, dobićemo izdašan rezultat isključivo hrvatskih sajtova (podrazumeva se na hrvatskom jeziku). Isto je sa slovenačkim opcijama pretrage, ali ne i sa našim. Pored prisutne opcije 1) traži na srpskom jeziku, nemogućnost da dodatno preciziramo pretragu i na 2) traži strane koje se nalaze u Srbiji, očigledno utiče da se ponekad u pretrazi „zalomi" i poneki sajt iz susednog sličnog govornog područja. Uostalom, neki sajt sa .hr domenom može da bude na srpskom jeziku i da ga Google prikaže kao takvog, što opet znači da će se isti pojaviti i kao rezultat pretrage sajtova na srpskom jeziku, a iz Hrvatske. Zašto nas još uvek nema u opciji pretraživanja iz odabrane države, mogli bismo onako kuloarski da pretpostavljamo, a jedan od verovatnijih odgovora bi mogao da bude usko vezan za veoma dobru upućenost urednika Google-a u političku situaciju kod nas. Uz to, nas očekuje i novi domen.

Ipak, ako nećete striktno da razmišljate o eventualnim neželjenim rezultatima pri pretrazi domaćih Web stranica, makar oni bili prisutni u malom procentu, onda je najbolje da koristite polje pretrage Internet Krstarice. Ovaj pretraživač prihvata i domaća slova, fraze, a podržava i pretragu čirilice. Nekada je najveća konkurencija Krstarici bio pretraživač Šerlok na adresi www.pretrazivac.com. Međutim, iako se na ovom sajtu redovno ažuriraju nove vesti iz raznih oblasti, polje za pretraživanje ne funkcioniše već duže vreme, tako da nažalost nismo bili u prilici da vidimo rezultate.

36

Page 38: Različiti Internet Pretraživači

Pored svega, i Krstarica i Šerlok su jedni od najposećenijih domaćih sajtova, jer su uređeni kao portali, tako da mnogi korisnici Interneta započinju svoje svakodnevne aktivnosti na Mreži upravo sa ovih sajtova. Krstarica ima odličan katalog sajtova grupisanih po tematskim oblastima, dok se ova sekcija Šerloka nalazi na staroj adresi ovog pretraživača www.yustart.com. Velika posećenost ova dva portala zasniva se i na sadržajima tipa najnovijih vesti iz različitih oblasti, vremenske prognoze, poslovnih izveštaja, vesti iz kulture, zabave itd.

Od ostalih domaćih, pretraživač koji po nazivu asocira na pretragu domaćeg Web-a - Srpko, na adresi www.srpko.com je za naše upite u opciji Jugoslavija (?) pronalazio ravnopravno rezultate iz Srbije i iz susednih zemalja sa sličnim jezicima, tako da se praktično radi o balkanskom pretraživaču.

Yusearch, Beocity i www.yu su na zadate upite pretraživali reči u nazivima sajtova i njihovim opisima, a rezultati su poražavajuće skromni. Takođe, Yusearch ne prihvata domaća slova, a Beocity ih prikazuje "oskrnavljeno".

Domaći Pretraživači

YuSearch

Yusearch je jedan od prvih domaćih pretraživača. Od samog nastanka pa do danas one je tipa web direktorijum. Bio je veoma popularan, ali mu je posećenost znatno opala pojavom krstarice. Nije rađeno na njegovom usavršavanju tako da ni danas nema podršku za latinicu i ćirilicu, a o drugim mogućnostima nema ni govora. Ne daje informacije o vremenu pretraživanja baze. Sajtovi su razvrstani po kategorijama, data je rang-lista najposećenijih sajtova do kojih se stiglo preko ove mašine za pretraživanje, omogućeno je postavljanje sajta na YUSearch server... Na osnovu broja pronađenih rezultata zaključili smo da pretraživač indeksira kako ključne reči teko i ostatak sadržaja stranice. Najveći nedostatak mu je što ne pronalazi rezultate ako se u upitu pojave naša slova.

www.yusearch.com

Slika 11. Yusearch engine logo.

37

Page 39: Različiti Internet Pretraživači

Yu

Takođe jedan od prvih. Doživeo je sličnu sudbinu kao i yusearch što se tiče nadogradnje. Ima veoma malu bazu, u odnosu na vreme koje je proveo kao pretraživač. Nije bio posebno popularan. Ne podržava latinicu i ćirilicu, samim tim ni naprednije mogućnosti. Ni on ne daje informacije o vremenu pretraživanja baze.

www.yu

Srbko

Iako vlasnici tvrde da ima krolersku bazu, na testu se nije tak pokazao. Radi kao najobičniji web direktorium, čak ne ni kao meta. Podržava alfabet i latinicu. Ne daje informacije o vremenu trajanje pretrage.

www.srbko.com

Tražim

Ovaj pretraživač teško da tako možemo nazvati. Čak nije ni tipična meta i ne krije to jer nas pita čiju bazu želimo da pretražimo (Yahoo, Google, Altavista), što znači da ne može čak ni da uporedi dve baze pa da na osnovu toga sam sortira rezultate. Pun je linkova ka drugim specijalizovanim pretraživačima (automobili), zvog čega je bio popularan, što je i jedini razlog njegovog pominjanja.

www.trazim.com

Slika 12. Tražim engine logo.

Aladin

U odnosu na pomenute, malo napredniji. Nema bazu već koristi Yahoo i Google. Prikazuje vreme trajanja pretrage i naravno znatno je veće od trajanja pretrage samog Google-a. Podržava alfabet i latinicu i odvojeno ćirilicu.

38

Page 40: Različiti Internet Pretraživači

Ukoliko je upit na latinici rezultat na latinici je boldovan a alfabet nije. Najveći broj pogodaka koji prikazuje je 99 000.

www.aladin.co.yu

Krstarica

Prvi ozbiljni domaći pretraživač. Nastao pre Googla. U početku je radila kao meta, a sada ima i svoju bazu. Kao što je Altavista doživela ekspanziju uvođenjem krolera, tako je i krstarica postala najpopularniji domaći pretraživač koristeći baze Altaviste i Yahoo-a (koji je do tada i sam postao krolerski pretraživač).

Međutim, ostao je istih mogućnosti do danas. Podržava dva pisma i alfabet ali odvojeno. Prikazuje vreme trajanja pretrage. U početku je bio bez popapova i reklamnih banera, sada je situacija drugačija. Ipak uspeva da zadrži treće mesto na listi domaćih pretraživača.

Na naslovnoj strani (www.krstarica.com) prikazani su raznorazni sadržaji, ali su oni dobro i pregledno organizovani. Krstarica može da se pregleda na srpskom ili engleskom jeziku, a posebna poslastica je ćirilična verzija. Iz sadržaja ovog sajta možemo izdvojiti linkove ka vestima, TV program, vremensku prognozu, horoskop, biblioteku softvera, magazin (sa desetinama tema koje se svakodnevno ažuriraju), rečnik...

Pretraga podataka je napravljena u Yahoo! stilu. Krstarica poseduje katalog sajtova po kategorijama (oko 5,000 domena). Mašina za pretraživanje ima i jedinstven prikaz rezultata koji se odvija na tri nivoa: najpre se pretražuju kategorije, zatim sajtovi i na kraju pojedinačne stranice. Tako se, ako je verovati iskustvima pretraživača Yahoo!, postižu najbolji rezultati.

Prilikom postavljanja upita korisnik može da bira između pretrage domaćeg Interneta, stranica koje se nalaze van Srpskih domena, slika i MP3 fajlova. Ovo je jedini pretraživač koji je pronašao rezultate za sve upite koje smo postavili. Čak se nije zbunio ni sa rečima "čekić" i "Đurdevdan" koje su za ostale pretraživače bile fatalne.

Bez obzira na to da li ste postavili upit na ćirilici ili latinici, Krstarica će izvršiti konverziju teksta i prikazaće rezultate koji ne zavise od pisma korišćenog na sajtu. Krstarica pravi još jednu internu konverziju: ako kao upit unesete reč "cacak", Krstarica će kao rezultat prikazati sajtove koje u sebi imaju kako tu reč, tako i reč „Cačak".

Na Krstarici bi uskoro trebalo da zaživi potpuno novi algoritam pretraživanja koji će dozvoljavati unos upita u obliku fraza i korišćenje Bulovih izraza, čime će pretraživanje Srpskog Interneta biti dodatno olakšano.

39

Page 41: Različiti Internet Pretraživači

Slika 13. Logo Krstarica pretraživača.

www.krstarica.com

Pogodak

Najmlađi domaći pretraživač. Delo Slovenaca koji su posle uspeha u svojoj zemlji I Hrvatskoj došli kod nas i napravili najozbiljniji pretraživač. Radi kao sinteza mete jer koristi bazu Google-a, i kroler pretraživača jer ima i svoje krolere i svoju bazu koju administriraju ljudi, zbog čega podseća i na web direktorijum. U prevodu, izvukli su najbolje osobine svih pretraživača i napravili do sada najbolji search engine kod nas. Zbog svojih mogućnosti uveren sam da je bio najpopularniji domaći pretraživač. Treba pomenuti da je jedini bio koji za upit na jednom pismu daje rezultate i na drugom i to vrlo lepo sortirane. Da jedini prepoznaje koren reči, što znači da ima podršku za padeže. Ovaj pretraživač više neće biti updejtovan, ali i dalje je u funkciji.

www.pogodak.rs

Slika 14. Logo Pogodak pretraživača.

Šerlok

Jedan od najpoznatijih domaćih pretraživača zaslužuje da ga detaljnije opišemo. Na www.pretrazivac.com naći ćete meta-pretraživač koji na naslovnoj stranici nudi obilje sadržaja i najnovije vesti. Ovo je jedini pretraživač koji omogućava da se po jednom domenu prikaže samo jedan rezultat (nismo koristili tu opciju, jer nam je cilj bio da vidimo koliko stranica može da pronađe). Dodatne opcije su mogućnost pregleda upita koje su postavljali drugi korisnici, prikaz najnovijih dodatih linkova, pretraživač slika i mesta za zabavu po gradovima...

U katalogu pretraživača nalazi se oko 3600 linkova, a on prikazuje deset pronađenih linkova po stranici. Uz osnovne sadržaje o sajtu, vide se i informacije o serveru na kome se nalazi pronađena stranica, uz mogućnost pregleda sličnih sajtova, prikaza rezultata samo sa tekućeg domena (ili isključivanje tog domena iz prikaza), kao i informacije Alexa servisa za praćenje prometa na datom domenu.

40

Page 42: Različiti Internet Pretraživači

Prilikom postavljanja upita, pretraživač je dao najveći broj rezultata, mada treba naglasiti da on indeksira i stranice koje nisu vezane za Srbiju, pa zato nismo mogli da odredimo tačan broj rezultata koji se odnose samo na našu zemlju. Indeksiranje se ne vrši samo preko ključnih reči - "robota" indeksira čitav sadržaj stranice. Na sajtu postoje englesko-srpski i srpsko-engleski rečnik sa 70,000 reči.

Šerlok omogućava napredno pretraživanje, ali mu ozbiljno nedostaje opcija za pretraživanje reči sa Srpskim slovima. Da nema tog problema, Šerlok bi bez problema mogao da istakne svoju kandidaturu za najbolji Srpski pretraživač. Ovaj pretraživač nije updejtovan i nije u funkciji još od 2005. godine.

www.pretrazivac.com

Svetski Pretraživači

Bing

Bing ( Bivši Live Search, Microsoft Live Search i MSN Search) je servis pretraživanja interneta kompanije Mikrosoft. Predstavio ga je Steve Ballmer 28. maja 2009. na konferenciji All Things Digital u San Diegu, Bing je zamena za live pretraživanje. Puna funkcionalnost pretraživača dostupna je od 3. juna 2009. Značajne promene uključuju uključivanje predloga za pretraživanje u realnom vremenu prilikom unosa pojmova za pretraživanje i popis povezanih pretraživanja na temelju semantičle tehnologije iz Powerseta, koje je Mikrosoft kupio u 2008. Bing takođe uključuje i sposobnost spremi i deli istoriju pretraživanja putem Windows Live SkyDrive-a, Facebook-a i pošte.

Slika 15. Logo Bing pretraživača.

41

Page 43: Različiti Internet Pretraživači

Yahoo!

Yahoo! je poznat svetski internet pretraživač, koji mnogi smatraju najvećom konkurencijom Google-u. Yahoo! su 1994. godine osnovali Dejvid Filo i Džeri Jang. Smatra se da Yahoo! ima najpoznatiji besplatan web mail.

Yahoo! nije samo internet pretraživač nego i najpoznatiji web direktorium koji predstavlja ogromnu listu web sajtova uređeno podeljenih po kategorijama i podkategorijama. Naime, Yahoo! je nastao kao lista omiljenih linkova dvoje ljudi koji su danas vlasnici ove multi-kompanije. I ako rangiranje stranica nije precizno kao Google-ovo, preko kupljenih kompanija, All the web, Altavista i Overture kao i pružanja velikog broja dodatnih usluga i servisa, Yahoo! je stekao popularnost i kao internet pretraživač.

www.yahoo.com

Slika 15. Logo Yahoo! pretraživača.

Google

Google je internet pretraživač u vlasništvu kompanije Google Inc. Google je nakorišteniji pretraživač na internetu. Osnovali su ga dva studenta, Larry Page i Sergey Brin 1997. godine. Google-ova misija je, kako kažu, organizovati informacije sveta te ih učiniti korisnima.

Google je potaknuo i lavinu jednostavnog, ali i funkcionalnog web dizajna, njihove stranice su jednostavno dizajnirane, a opet veoma atraktivne. Zanimljivo je reći kako je Google po prvi put pretraživao pomoću tada jedinstvenog sistema posećenosti korisnika. Dakle, što je neka stranica bila više posećena, to se ona bolje kotirala u rezultatima pretrage. Danas većina velikih pretraživača koristi tu tehniku.

Google se već godinama održava kao neprikosnoveni lider u svetu pretraživača, i po svemu sudeći, njegova pozicija još dugo neće biti ugrožena. Svakog dana Google prikazuje rezultate pretrage za preko 150 miliona upita i važi za pretraživač koji daje najpreciznije podatke.

42

Page 44: Različiti Internet Pretraživači

Slika 16. Google-ov interfejs iz 1998. godine.

Tehnologija koja leži u pozadini Google-ovih pretraga već godinama je dobro čuvana poslova tajna kompanije i želja je mnogih, naročito konkurentskih pretraživača i ljudi koji se bave optimizacijom za pretraživače. Od 2001. godine, Google je prijavio nekoliko patenata vezanih za algoritme pretrage iz kojih se mogu videti detalji tehnologija koje Google koristi ili namerava da koristi za svoje pretrage. Google je svoje patente zaštitio od konkurenata i onemogućio im je da koriste slična rešenja, ali je ujedno razjasnio mnogre stvari koje su SEO kompanije pokušavale da razjasne godinama. Patent koji objašnjava PageRank koji sajtove rangira sada već definiše jednu od osnovnih stvari koje svaki SEO stručnjak mora da uradi kada optimizuje sajt za Google: Da obezbedi dovoljan broj ulaznih linkova sa stranica koje imaju veliki PageRank

Jedna od glavnih tendencija koja se može videti iz najnovijih Google-ovih patenata jeste borba protiv “search engine spam”, to jest protiv sajtova koji se korišćenjem neetičkih metoda optimizacije za pretraživače rangiraju bolje nego što to njihov sajt zaista jeste. Naime, u najnovijim patentima se otkriva da se velika pažnja kod kreiranja rezultata pretrage i uopšte rangiranja sajta na pretraživače poklanja istorijskim podacima sa sajta. Pod istorijski podacima podrazumeva se niz faktora čije promene Google prati na svakom sajtu tokom vremena.

Neki od praćenih faktora su:

Konstantnost tematike – sajtovi koji dugo obrađuju jednu ili čak više tema, a onda naglo promene svoju oblast, rizikuju da im rank opadne,

Dinamika dodavanja novih sadržaja – koliko se često sajt osvežava novim sadržajem ili koliko se često stari sadržaji značajno menjaju,

Dinamika promena enkora (sidra),

43

Page 45: Različiti Internet Pretraživači

Dinamika promene gustine ključnih reči na stranicama, Procenat klikova na link sajta koji je prikazan u rezultatima pretrage – Google ipak

prati linkove kod rezultata pretrage iako je bilo dvoumljenja oko toga treba li ih pratiti ili ne,

Dinamika promene broja linkova, Praćenje promene saobraćaja na sajtu (broja posetilaca) – po svemu sudeći, Google će

tek odlučiti iz kojih izvora će dobijati podatke o saobraćaju.

Nagla promena svakog od ovih faktora obaveštava Google da se na sajtu nešto neobično događa i sajt rizikuje da bude izbačen iz rezultata pretrage.

Iz zadnjeg patenta se saznaje da Google prati i neke stvari koje do sad nije uzimao u obzir kao što su dužina registracije domena (što je duži to je bolje – sa pretpostavkom da vlasnik domena ima ozbiljne namere), stabilnost i regularnost hosta (hosting sajta je postao ozbiljan faktor pri rangiranju i ukoliko neki legalan sajt deli host sa spemerskim sajtovima i njemu će se rank smanjiti), potpunost podataka vezanih za domen u WHOIS bazi kao i koliko se ti podaci često menjaju.

www.google.com

Slika 16. Google logo.

44

Page 46: Različiti Internet Pretraživači

Zaključak

U ovoj računarskoj eri, kada je informacija a samim tim i internet u ekspanziji, pojavio se problem organizacije i pronalaženja potrebnih stvari preko interneta. Sada pretraživanju predstavlja problem velika količina nepotrebnih informacija, koju namerno ili ne namarno web masteri puštaju i forsiraju na web pretraživače. To je neetički sa njihove strane, ali su zato tu kompanije u čijem su vlasništvu poznati web pretraživači i oni se bore na svoje načine sa ovim problemom.

Internet pretraživač je jednako bitan alat i internet početniku i profesionalcu, u tome se ogleda njegova bitna uloga, praktično su postali nezamenljivi u svakodnevnom životu. Nezavisno od opredeljenja koji biste koristili pretraživač on je deo svakodnevnog surfovanja i pronalaženja potrebnih informacija. U ovoj modernoj eri se krstarenje internetom ne može zamisliti bez internet pretraživača, koji su do pre samo desetak godina bili toliko nerazvijeni da se na njih nije ni obraćala pažnja, a kamoli mislilo da će dostignuti popularnost kakvu sada poseduju.

Što se tiče pretraživača u Srbiji, veoma je loše stanje, ali Google je postao toliko globalno rasprostranjen i prilagođen da mi sada možemo koristiti lokalizovanu verziju na srpskom jeziku bez problema, takođe može pretraživati na ćirilici i latinici, tako da postojanje srpskog pretraživača i nije toliko neophodno.

45

Page 47: Različiti Internet Pretraživači

Literatura

Korišćen materijal:

Nadrljanski,Soleša, Informatika u obrazovanju,Učiteljski fakultet, Sombor, 2002. Brad Callen – The SEO Mindset Jerri L. Ledford – Search Engine Bible – Wiley Publishing, Inc Google’s Search Engine Starter Guide, published 13 November 2008. http://www.google.com (17.08.2012) http://www.wikipedia.com (17.08.2012) http://www.sk.rs/2008/11/skin03.html (17.08.2012) http://saznaj.in/stajeinternet.html (27.08.2012) http://www.scribd.com/doc/19542016/ (19.08.2012) http://www.telfor.rs/files/radovi/NOVE TEHNOLOGIJE_10_22.pdf (11.08.2012) http://www.sk.rs/2003/05/skin08.html (01.09.2012) http://www.sk.rs/2010/10/skin03.html (01.09.2012) http://www.sk.rs/2010/11/skin03.html (01.09.2012)

Slike preuzete sa: http://images.google.com

Slike editovane na: http://pixlr.com/editor/

46