45

Wyszukiwanie informacji w Internecie

  • Upload
    iria

  • View
    36

  • Download
    1

Embed Size (px)

DESCRIPTION

Wyszukiwanie informacji w Internecie. Wydzi ał Prawa i Administracji Pracownia Komputerowa mgr inż. Adam Bielański. Internet Inter-net sieć o zasięgu globalnym, łącząca sieci lokalne. - PowerPoint PPT Presentation

Citation preview

Page 1: Wyszukiwanie informacji w Internecie
Page 2: Wyszukiwanie informacji w Internecie

2

Wyszukiwanie informacji w Internecie

Wydział Prawa i AdministracjiPracownia Komputerowamgr inż. Adam Bielański

Page 3: Wyszukiwanie informacji w Internecie

3

InternetInter-net sieć o zasięgu globalnym, łącząca sieci lokalne.

Internet łączy miliony komputerów pracujących z różnymi systemami operacyjnymi. Aby komputery i programy na nich pracujące mogły bez przeszkód wymieniać dane, niezależnie od różnorodnych sposobów przesyłania danych potrzebne są uniwersalne protokoły transmisji. Stanowią one „międzykomputerowy” język porozumiewania się.

Wszystkie informacje w Internecie przesyłane są w postaci niewielkich pakietów. Większe informacje przed przesłaniem dzielone są na pakiety.

Page 4: Wyszukiwanie informacji w Internecie

4

Protokół TCP/IP

Transport pakietów w Internecie reguluje zespół dwóch protokołów TCP/IP. Wymagają one aby każdy komputer przyłączony do Internetu miał unikalny cyfrowy 32 bitowy adres IP, np.: 149.156.224.2 (cztery człony ośmiobitowe —liczby z zakresy 0-255, rozdzielone kropkami). Pula takich adresów (IPv4), używana od wielu lat jest już na wyczerpaniu. Przygotowane do wdrożenia są adresy 128 bitowe (IPv6), zapisywane jako 8 członów 16 bitowych. IPv4 dysponuje pulą 232 = 4 294 967 296, a IPv6 ma 2128 = 3,4028236692093846346337460743177*1038.

8 czerwca 2011 roku najwięksi giganci Internetu (Google, Facebook i Yahoo!) przełączyli się na nowy protokół.

Adresy są niewygodne dla użytkowników Internetu.

Page 5: Wyszukiwanie informacji w Internecie

5

Adresy domenowe

Wprowadzono więc drugi system adresów — tak zwane adresy symboliczne, lub adresy domenowe np.: cicero.law.uj.edu.pl (odpowiada adresowi IP 149.156.224.2). Takie adresy łatwiej zapamiętać, można także często je odgadnąć znając zasady ich tworzenia.

Jeśli człowiek wpisuje adres domenowy, jego komputer zwraca się do serwera DNS w żądaniem przetłumaczenia adresu domenowego na adres IP. I tym adresem posługuje się komputer w dalszej części sesji.

Page 6: Wyszukiwanie informacji w Internecie

6

Adresy domenowe

Obecnie w adresach domenowych występują tylko małe litery alfabetu łacińskiego, również z literami alfabetów narodowych (od końca 2009r.). Adresy składają się z członów rozdzielonych kropką (a nie przecinkiem).

Ostatni, dwuliterowy człon jest oznaczeniem kraju, a dokładniej kraju zarejestrowania domeny, a nie krajem „pobytu” komputera. I tak pl = Polska, de=Niemcy, fr=Francja, hr=Chorwacja, ru=Rosja, a eu=Europa (Unia Europejska), Brak dwuliterowego oznaczenia kraju = USA.

Ten fragment adresy domenowego jest zawsze przestrzegany.

Page 7: Wyszukiwanie informacji w Internecie

7

Adresy domenoweNiektóre domeny są często używane dla stron niezwiązanych z krajem,

któremu je przydzielono, lecz ze względu na podobieństwo do skrótów, na przykład:

* .tv - Tuvalu, często używane dla stron związanych z telewizją.* .fm - Mikronezja, często używane dla stron radia internetowego (np.:

last.fm).* .me - Czarnogóra, często używana dla stron społecznościowych, z

powodu, że angielskie słowo "me" oznacza "ja".* .cd - Demokratyczna Republika Konga - skrót CD oznacza płytę

kompaktową.* .mu - Mauritius - koncerny muzyczne, muzyka.* .dj - Dżibuti, rzadko używana dla stron dotyczących Dj-ów i branży

muzycznej.* .si - Słowenia, rzadko używana dla stron hiszpańskojęzycznych, ze

względu na to, że hiszpańskie "si" oznacza "tak".

Czasami używa się też innych domen dla stron niezwiązanych z danym krajem, ale rzadko (mołdawskie .md dla stron medycznych, .sh należące do Wysp Świętej Heleny, dla stron związanych z Szanghajem lub Shenzhen).

Page 8: Wyszukiwanie informacji w Internecie

8

Adresy domenowe (cd)

Przedostatni człon adresu (dla USA ostatni) — występuje często, ale nie koniecznie — określa rodzaj działalności właściciela serwisu internetowego lub miejsce geograficzne. I tak domeny określające rodzaj działalności:

•com — podmioty prowadzące działalność komercyjną, tu przeważnie znajdziemy różne firmy np.: www.fiat.com.pl (fiat w Polsce), www.tasco.com.pl (sieć supermarketów Geant), www.asus.com.tw (firma Asus z Tajwanu). Wiele firm o zasięgu międzynarodowym rejestruje również swoje domeny w USA (np.: www.fiat.com lub www.ford.com) aby ułatwić ich znalezienie potencjalnym odbiorcom. Wtedy w takich serwisach umieszczone są odsyłacze do przedstawicielstw firmy w poszczególnych krajach.

•edu — domena edukacyjne; uczelnie, szkoły, ale również placówki naukowe nie prowadzące działalności dydaktycznej, np. www.uj.edu.pl to serwer Uniwersytetu Jagiellońskiego,

Page 9: Wyszukiwanie informacji w Internecie

9

Adresy domenowe (cd)•gov — instytucje związane z władzą wszelkiego rodzaju

—w Polsce również sejm (www.sejm.gov.pl), senat (www.senat.gov.pl) oraz NIK (www.nik.gov.pl),

•mil — instytucje związane z wojskiem i obronnością,•net — podmioty związane z sieciami komputerowymi,•org — organizacje nie związane z władzą a więc patie,

organizacje pozarządowe, ruchy społeczne,•int — instytucja międzynarodowe, np.: strona Światowej

Organizacji Zdrowia www.who.int ,•prv — strony WWW prywatnych użytkowników internetu.

Page 10: Wyszukiwanie informacji w Internecie

10

Adresy domenowe (cd)

Niedawno wprowadzono nowe domeny — na razie mało popularne:

•aero — dla instytucji i organizacji związanych z lotnictwem,

•biz — dla biznesu,•coop — dla spółdzielni,•info — dowolne zasoby o charakterze informacyjnym,•museum — dla muzeów,•name — dla osób prywatnych,•pro — dla osób wykonujących wolne zawody.

Page 11: Wyszukiwanie informacji w Internecie

11

Adresy domenowe (cd)Domeny określające miejsce w Polsce:•krakow.pl — (uwaga: krakow nie Kraków) domena Krakowa

np.: www.krakow.pl, www.komunikacja.krakow.pl, www.wawel.krakow.pl

•waw.pl — domena Warszawy •gda.pl — domena Gdańska, np.. www.pg.gda.pl serwis WWW

Politechniki Gdańskiej•wroc.pl — domena Wrocławia, • lodz.pl — domena Łodzi, Kolejne licząc od prawej człony oznaczają domeny

użytkowników np: cicero.law.uj.edu.pl oznacza czytając od prawej domena polska, domena edukacyjna, UJ, wydz. Prawa, komputer cicero.

Page 12: Wyszukiwanie informacji w Internecie

12

Adresy domenowe (cd)Zasady dotyczące drugiej od prawej domeny często nie są przestrzegane np.: onet.pl, interia.pl.

Na oznaczania rodzaju serwera (przedostatnia część nazwy) należy zwracać uwagę, gdyż pomyłki mogą prowadzić do nieoczekiwanych rezultatów. Np.: www.mswia.gov.pl to serwer Ministerstwa Spraw Wewnętrznych i Administracji natomiast pod adresem www.mswia.com.pl do niedawna był serwer pornograficzny.

Jednak przy poszukiwaniu w internecie informacji przeważnie odgadywanie adresu nie wystarcza. Z tego powodu powstały różnego typu serwisy wyszukiwawcze ułatwiające poszukiwania.

Page 13: Wyszukiwanie informacji w Internecie

13

Serwisy wyszukiwawczeStopniowo powstawały różne typy serwisów wyszukiwawczych:•katalogi stron internetowych,•wyszukiwarki•multiwyszukiwarki

Page 14: Wyszukiwanie informacji w Internecie

14

Katalogi stron internetowychNajwcześniej powstały katalogi stron internetowych.

Było to przystosowanie do potrzeb Internetu rozwiązania znanego od dawna w bibliotekach – katalogu działowego.

Tworzona jest drzewiasta struktura tematów, i tam umieszczane są odsyłacze do skatalogowanych stron internetowych.

Katalogi pozwalają przeszukiwać zasoby Internetu według tematów. To jedyny typ serwisu wyszukiwawczego odpowiadający na pytanie: Pokaż strony o......

Korzystanie z katalogu jest łatwe, intuicyjne, nie wymaga instrukcji.

www.katalog.onet.pl

http://katalog.wp.pl/

http://dir.yahoo.com/

http://www.dmoz.org/

Page 15: Wyszukiwanie informacji w Internecie

15

Zalety w wady katalogówZalety:• Korzystanie z katalogu jest łatwe, zgodne z ludzką intuicją, nie wymaga instrukcji,• Zasoby są dobrze skatalogowane, w danym dziale znajdziemy zasoby rzeczywiście na dany temat,•Katalogi pozwalają rozpocząć poszukiwanie bez znajomości słów kluczowych określających poszukiwaną tematykę.

Wady:•Zawartość katalogów jest bardzo uboga (tworzą je ludzie pracujący powoli),•Niekiedy trudno odgadnąć, w którym dziale umieszczono jakiś temat.

Podsumowanie: Katalogi znakomicie nadają się do rozpoczęcia poszukiwań, pozwalają określić jakimi hasłami prezentowana jest poszukiwana tematyka. Lecz na szukaniu w katalogach nie można zakończyć poszukiwań!

Page 16: Wyszukiwanie informacji w Internecie

16

Niektóre adresywww.sejm.gov.pl prace Sejmu przegląd wszystkich projektów ustaw

www.europa.eu/rapid

Page 17: Wyszukiwanie informacji w Internecie

17

WyszukiwarkiGłówną wadą katalogów jest ich skąpa zawartość spowodowana zbieraniem stosunkowo powolną pracą człowieka. Aby zapewnić szybsze zbieranie informacji o zasobach Internetu postanowiono „zatrudnić” do tego komputer i program.

Dla wyszukiwarki informacje o zasobach Internetu zbiera program, zwany robotem lub szperaczem. Działa on wg schematu: wczytaj stronę internetową, skopiuj na serwer, wyszukaj na niej jeden odsyłaczy i po tym odsyłaczu przejdź na następną stronę.

Jednak współczesny program nie potrafi określić tematyki strony (jak to robił człowiek katalogujący strony WWW), a jedynie zapamiętać słowa występujące na stronie. Z tego powodu wyszukiwarka nie może odpowiedzieć na pytanie „pokaż strony o..” a jedynie „pokaż strony zawierające wskazany wyraz lub wyrazy”.

Page 18: Wyszukiwanie informacji w Internecie

18

WyszukiwarkiWyszukiwarka przeważnie tak rozumie pytania:

spacja między wyrazami zamieniana jest na operator logiczny AND w więc zapytanie ukryty internet zostanie zrozumiane: pokaż strony www zawierające oba te wyrazy na stronie – lecz w dowolnej konfiguracji, nie koniecznie razem.

dwa (lub więcej) wyrazy razem musza być objęte cudzysłowem więc zapytanie „ukryty internet” oznacza pokaż strony, na których występuję te wyrazy razem.

operator OR rozdziela hasła, z których musi wystąpić przynajmniej jedno. tak więc zapytanie „opieka społeczna” OR „pomoc społeczna” oznacza: pokaż strony, na których występuje przynajmniej jeden z podanych terminów.

Wystąpienie hasła po operatorze NOT wyklucza stronę w wyniku poszukiwania, więc gmina NOT budżet oznacza: pokaż strony zawierające słowo gmina, lecz strony zawierające również budżet należy odrzucić.

Page 19: Wyszukiwanie informacji w Internecie

19

WyszukiwarkiWyszukiwarka przeważnie tak rozumie pytania:•spacja między wyrazami zamieniana jest na operator logiczny AND w więc zapytanie ukryty internet zostanie zrozumiane: pokaż zasoby zawierające oba te wyrazy na stronie – lecz w dowolnej konfiguracji, nie koniecznie razem.•dwa (lub więcej) wyrazy razem musza być objęte cudzysłowem więc zapytanie „ukryty internet” oznacza pokaż strony, na których występuję te wyrazy razem.•operator OR rozdziela hasła, z których musi wystąpić przynajmniej jedno. tak więc zapytanie „opieka społeczna” OR „pomoc społeczna” oznacza: pokaż strony, na których występuje przynajmniej jeden z podanych terminów.•gwiazdka * zastępuje dowolną ilość znaków do końca hasła, tak więc zapytanie stworzy* dotyczy wyrazów: stworzył, stworztła, stworzyciel itd..

Page 20: Wyszukiwanie informacji w Internecie

20

Do wyszukaniaznaleźć odpowiedź na pytanie:Odpowiedź na pozew została złożona po terminie. Sąd odrzucił wniosek o przywrócenie terminu. Czy, w wypadku wystąpienia pozwanego z powództwem wzajemnym, dowody i twierdzenia przytoczone w odpowiedzi na pozew ulegają prekluzji w związku z orzeczeniem Sądu Najwyższego, czy też są one traktowane jako niebyłe, nie przedstawione w sprawie i mogą zostać przytoczone w pozwie wzajemnym?

Page 21: Wyszukiwanie informacji w Internecie

21

Do wyszukaniaznaleźć odpowiedź na pytanie:Odpowiedź na pozew została złożona po terminie. Sąd odrzucił wniosek o przywrócenie terminu. Czy, w wypadku wystąpienia pozwanego z powództwem wzajemnym, dowody i twierdzenia przytoczone w odpowiedzi na pozew ulegają prekluzji w związku z orzeczeniem Sądu Najwyższego, czy też są one traktowane jako niebyłe, nie przedstawione w sprawie i mogą zostać przytoczone w pozwie wzajemnym? sugestia: prekluzja "termin zawity"

Page 22: Wyszukiwanie informacji w Internecie

22

Do wyszukaniaznaleźć odpowiedź na pytanie:Jakie zalety i wady ma spółka cicha?powództwo przeciwegzekucyjneJak prawo polskie traktuje przestępstwa komputerowe?Jakie są dostępne materiały omawiające zjawisko uporczywego prześladowania w internecie.

Page 23: Wyszukiwanie informacji w Internecie

23

Do wyszukaniaznaleźć odpowiedź na pytanie:Jakie zalety i wady ma spółka cichasugestia: „spółka cicha” wady zalety

Co to jest powództwo przeciwegzekucyjne?sugestia: „powództwo ekscydencyjne”

Jak prawo polskie traktuje przestępstwa komputerowe?sugestia: "przestępczość komputerowa" "prawo polskie„Jakie są dostępne materiały omawiające zjawisko uporczywego prześladowania w internecie.sugestia: "prześladowanie w internecie" uporczywe

Page 24: Wyszukiwanie informacji w Internecie

24

Inne wyszukiwarki

AltaVista www.altavista.com HotBot http://www.hotbot.com/Lycos http://www.lycos.com pokazuje miniatury

znalezionych stron WWW

Page 25: Wyszukiwanie informacji w Internecie

25

Multiwyszukiwarki

Zasoby poszczególnych wyszukiwarek różnią się między sobą. Gdy porównamy zasoby dwóch wyszukiwarek, okaże się, że będą strony występujące w obu, a także strony WWW występujące tylko w jednej, a w drugiej nie. Pomimo, że wyszukiwarka Google jest najpotężniejsza, są zasoby, których nie znajdziemy w Googlach, a znajdziemy w innych wyszukiwarkach. Przy robieniu poważnych poszukiwań materiałów w Internecie należy skorzystać z kilku wyszukiwarek. W takim przypadku warto skorzystać z jednej z multiwyszukiwarek. Multiwyszukiwarka to serwis nie posiadający własnej bazy zasobów Internetu, ale współpracujący z kilkoma wyszukiwarkami. Pytanie odebrane od użytkownika jest rozsyłane do współpracujących wyszukiwarek. Z odpowiedzi tych wyszukiwarek tworzona jest wspólna lista przedstawiana użytkownikowi.

Page 26: Wyszukiwanie informacji w Internecie

26

Multiwyszukiwarki – wady i zalety

Multiwyszukiwarki nie mają własnych baz danych. Jednakże wyraźnie podnoszą komfort pracy, bo umożliwiają jednoczesne korzystanie z wielu "zwykłych" wyszukiwarek/katalogów. Otrzymane zapytanie multiwyszukiwarka jest wysyła równocześnie (lub sekwencyjnie) do wielu serwisów wyszukiwawczych, a zebrane w ten sposób wyniki są wyświetlane na oddzielnej stronie. Mogą być segregowane według miejsca skąd pochodzą, trafności itd. Niektóre multiwyszukiwarki dają się skonfigurować, czyli ustawić liczbę i rodzaj serwisów wyszukiwawczych, do których będzie wysłane zapytanie. Zalety Multiwyszukiwarka pozwala na szybkie wygodne przeszukanie naraz zasobów kilku wyszukiwarek.WadyZe względu na różny sposób interpretowania pytań złożonych przez poszczególne wyszukiwarki, przez multiwyszukiwarki nie przechodzą takie pytania.

Page 27: Wyszukiwanie informacji w Internecie

27

Multiwyszukiwarki – przykladyMultiwyszukiwarki są dostępne poprzez swoje adresy w Internecie lub są osobnymi programami.DogPile to multiwyszukiwarka, sprawdza światowe zasoby Internetu, wykorzystuje kilkanaście serwisów naraz, m.in.: Excite, Go2.com, Lycos, Lycos A2Z, Magellan, Thunderstone, WebCrawler, What U Seek, Yahoo. http://www.dogpile.com/Metacrawler sprawdza między innymi Google, Yahoo, Bing i Ask http://www.metacrawler.com/,Search sprawdza między innymi Google, Yahoo, Bing Ask, Open Directory http://www.search.com/ Ixquick http://s3-eu.ixquick.com/do/metasearch.pl InfoSpace http://www.infospace.com/ispace/ws/index szuka stron WWW, obrazów, video

Page 28: Wyszukiwanie informacji w Internecie

28

Multiwyszukiwarki – programy

Są też multiwyszukiwarki w postaci programów do zainstalowania. Jedną z nich jest Copernic Agent występujący w trzech wersjach „Basic” (darmowy) i bardziej rozbudowane, płatne „Personal” i „Proffesional”. Strona producenta www.copernic.com.Polski program Negative do pobrania ze strony http://www.negative.pl/

Page 29: Wyszukiwanie informacji w Internecie

29

Grupowanie wyników multiwyszukiwarek (clustering)

Prowadzona jest analiza występowania poszczególnych terminów w wynikach w wyszukiwarek, co pozwala sa sensowne pogrupowanie wyników poszukiwania.

http://search.carrot2.org/stable/search

Page 30: Wyszukiwanie informacji w Internecie

30

Możliwe jest wyświetlenie wyników w postaci grup w folderach (folders) lub w postaci graficznej (circles) lub FoamTree)

Page 31: Wyszukiwanie informacji w Internecie

31

Grupy dyskusyjne

Z Wikipedii, wolnej encyklopediiGrupa dyskusyjna – w Internecie to ogólna nazwa wszelkich form dyskusji internetowej przypominających wymianę korespondencji, a nie rozmowy w czasie rzeczywistym. Grupy dyskusyjne przyjmują formę list dyskusyjnych pozwalających na automatyczną wymianę e-maili, grup Usenetowych, grup występujących w Fidonecie i forów dyskusyjnych dostępnych przez bramki WWW.Grupy dyskusyjne mogą stanowić cenne źródło informacji.

Page 32: Wyszukiwanie informacji w Internecie

32

Grupy dyskusyjne – podział ze względu na dostępność

Grupy dyskusyjne ze względu na dostępność można podzielić na:

• zamknięte – tzn. być dostępne tylko dla wybranej grupy osób (np: grupy przeznaczone dla pracowników jednej firmy),

• półotwarte – tzn. dostępne dla wszystkich, ale pod pewnymi warunkami, (np. po udowodnieniu swoich kwalifikacji),

• moderowane – czyli dostępne dla wszystkich, ale wysyłane nań komunikaty są cenzurowane przez specjalną osobę,

• otwarte dla zarejestrowanych – czyli dostępne dla wszystkich, którzy się doń zapisali i niecenzurowane,

• całkowicie otwarte – czyli dostępne także dla tych, którzy się do nich nie zapisali.

Page 33: Wyszukiwanie informacji w Internecie

33

Grupy dyskusyjne – podział ze względu na dostępność

„Instrukcja obsługi” grup dyskusyjnych http://rtfm.killfile.pl/ Przykłady adresów poprzez które można przeglądnąć grupy

dyskusyjne: http://usenet.gazeta.pl/usenet/0,0.html http://groups.google.pl/ Ale standardowym czytnikiem grup dyskusyjnych jest program

pocztowy np.: Mozilla Thunderbird (raczej nie Outlook) Zasady korzyskania z grup dyskusyjnych reguluje netetykieta,

dostępna między innymi pod adresem http://pl.wikipedia.org/wiki/Netykieta.

Page 34: Wyszukiwanie informacji w Internecie

34

Księgi Wieczyste

Siatka działek geodezyjnych:http://maps.geoportal.gov.pl/webclient/

Wyszukiwarka działek Księgi wieczyste (jeszcze niekompletna)http://ksiegi-wieczyste-online.pl/ ->"wyświetl mapy" w górnym menu mapy -> "dane o

charakterze katastralnym".

http://ekw.ms.gov.pl/pdcbdkw/pdcbdkw.html Niestety na razie brak rozsądnego przejścia od numeru działki

o numeru księgi wieczystej. Można to zrobić jedynie z pomocą Wydziału Geodezji, Kartografii i Katastru, Starostwa Powiatowego.

Page 35: Wyszukiwanie informacji w Internecie

35

KRS

Krajowy Rejestr Sądowy on line http://www.ekrs.pl/ http://www.krs-online.com.pl

Wyszukiwanie ludzihttp://people.yahoo.com

www.ditel.com.pl instytucje i formy

Page 36: Wyszukiwanie informacji w Internecie

Pracawww.pracuj.pl (łącze do płatnej usługi LM i CV)www.praca.pl www.infopraca.pl (podaje ilość zgłoszeń)www.gazetapraca.pl (kalkulator płac, porady do CV)www.praca.gratka.pl

36

Page 37: Wyszukiwanie informacji w Internecie

37

Ukryty internet (deep web)

Z zasady działania wyszukiwarki wynika, że zawiera ona wyłącznie informacje o tych stronach WWW, do których dojdzie jej robot, zbierający informacje. Są jednak takie serwisy WWW, w których trzeba podać jakieś zapytanie (np.: katalog biblioteki, baza aktów prawnych) lub zalogować się (podać nazwę użytkownika i hasło). Do takich zasobów Internetu roboty nie mają dostępu, bo nie potrafią zadać pytania, podać nazwy użytkownika oraz hasła.. Tak więc te zasoby — tworzące „ukryty internet” nie będą widoczne w wyszukiwarkach. Polska nazwa „ukryty internet” nie oddaje istoty zjawiska. Tych zasobów nikt nie ukrywa, są tylko niewidoczne w wyszukiwarkach. Lepiej oddają charakter angielskie nazwy „deep web” (głęboki internet) lub „invisible internet” (niewidoczny internet).Tzw. głęboki Internet albo ukryty Internet zawiera kilkaset razy więcej zasobów niż Internet do powszechnego użytku, widoczny dla zwykłych przeglądarek.

Page 38: Wyszukiwanie informacji w Internecie

38

Ukryty internet (deep web)

Page 39: Wyszukiwanie informacji w Internecie

39

Ukryty internet (deep web)

Większość zasobów ukrytego stanowią specjalistyczne bazy danych i dokumentów elektronicznych, a także archiwa bardzo cennych materiałów źródłowych i referencyjnych. Zwykłe przeglądarki nie indeksują stron internetowych z tymi materiałami.Zasoby te utrzymywane są w sieci głównie przez uniwersytety oraz instytucje rządowe i międzynarodowe. Odnośniki do tych olbrzymich zasobów są zbierane, kwalifikowane i katalogowane przez wyspecjalizowanych redaktorów. Katalogi są często jedyną "bramą", przez którą można dotrzeć do zasobów wielokrotnie większych, niż te dostępne powszechnie.Do zasobów głębokiego internetu można uzyskać dostęp poprzez „bramy” stanowiąca adresy WWW odpowiednich serwerów. I tak poprzez bramę o adresie http://www.bj.uj.edu.pl/uj/katalog (adres katalogu on-line Biblioteki Jagiellońskiej) mamy dostęp do zasobów katalogu tej biblioteki.

Page 40: Wyszukiwanie informacji w Internecie

40

Ukryty internet (deep web)

Przeszukiwania w ukrytym internecie są znacznie bardziej mozolne niż poszukiwania w „płytkim internecie” – widocznym w wyszukiwarkach, ale wyniki poszukiwań są często znacznie ciekawsze.Po wpisaniu w wyszukiwarce zapytania „ukryty internet” lub „deep web” otrzymamy jako odpowiedź strony zawierające spis bram do ukrytego internetu.Kolekcję bram do zasobów ukrytego internetu zawierają między innymi strony WWW:http://www.bg.umcs.lublin.pl/nowa/deep.php http://www.ukrytyinternet.yoyo.pl/gleboki.html

Page 41: Wyszukiwanie informacji w Internecie

41

Niektóre bramy do ukrytego internetuhttp://dmoz.org/ - największy na świecie katalog stron redagowany przez internautów. http://scholar.google.com/ - najnowsze dziecko Google - przeszukuje sieć pod kątem materiałów akademickich dla wykładowców i studentów. http://www.allsearchengines.com/ - ogromny zasób linków do wyszukiwarek ogólnych i specjalistycznych . http://www.searchenginecolossus.com/ - wyszukiwarki lokalne ze 153 krajów. http://www.northernlight.com/ - katalog kwalifikowanych materiałów z różnych dziedzin. Szerokie możliwości dostosowania do indywidualnych potrzeb, wiele opcji wyszukiwania. http://www.digital-librarian.com/ - miejsce do poszukiwania bibliografii, źródeł i opracowań ze wszelkich dziedzin. (http://www.scirus.com/) - ponad 410 mln dokumentów, z licznych stron www, m. in.nw domenach edu, org, gov (np. PubMed Central, Nature Publishing Group, strony uczelni wyższych, strony Open Access, raporty techniczne NASA) http://vlib.org/ The WWW Virtual Library

Page 42: Wyszukiwanie informacji w Internecie

42

Niektóre bramy do ukrytego internetuhttp://www.freepint.com/gary/direct.htm - narzędzia przeszukiwania i katalogi zasobów Niewidocznego Internetu. Są tam także serwisy dodatkowe, na przykład lista list czyli rankingów z całego świata. "http://www.completeplanet.com/ - katalog "głębokich" zasobów Internetu, innowacyjna technologia przeszukiwania LexiBot. Mnóstwo danych i materiałów źródłowych. http://infomine.ucr.edu/ - katalog materiałów dla studentów i wykładowców.http://www.kent.ac.uk/lawlinks/electronic-law-library/index.html - Electronic law library Legal databases at Kent

Page 43: Wyszukiwanie informacji w Internecie

43

STRATEGIE WYSZUKIWAWCZE • Strategia „ON THE WEB” -najczęściej stosowane przez internautów. Polega na korzystaniu z jednej popularnej wyszukiwarki internetowej i prostych zapytań. Przeważnie nieskuteczna i nieefektywna. Wyszukiwarki dobrze sprawdzają się w wyszukiwaniu popularnych serwisów WWW, przeszukiwaniu słowników i encyklopedii, dokumentów HTML - dają miliony odpowiedzi.

• Strategia „VIA THE WEB” - jeden ze sposobów na Ukryty Internet. Polega na korzystaniu z różnych narzędzi wyszukiwawczych, dostosowanych do potrzeb i oczekiwań użytkowników. Polega na tym, by nawet za pomocą tych narzędzi szukać głębiej - poszukiwać wielowarstwowo, wieloetapowo. Strategia ta dobrze nadaje się to poszukiwań naukowych.

Page 44: Wyszukiwanie informacji w Internecie

Wiarygodność informacji w Internecie

44

Informacje znalezione w Internecie należy poddać weryfikacji. Nie każda informacja znaleziona w sieci musi być prawdziwa. Najczęściej, lecz nie jedynie, zagrożenie występuje w serwisach amatorskich i forach dyskusyjnych. Bardziej wiarygodne są źródła informacji w serwisach WWW niezależnych instytucji, cieszących się autorytetem. Bardziej wiarygodne są informacje podpisane przez autora, niż anonimowe.

Ze względu na łatwość publikowania informacji w Internecie i brak jakichkolwiek form weryfikacji treści – odbiorca informacji musi sam dokonać zweryfikować jej prawdziwość, przed dopuszczeniem jej do własnej świadomości i przed jej dalszym wykorzystaniem i rozpowszechnianiem.

Wskazane jest weryfikowanie informacji w tradycyjnych źródłach wiedzy- książkach i czasopismach fachowych. Można zwrócić się do specjalistów z danej dziedziny wiedzy.

Page 45: Wyszukiwanie informacji w Internecie

Wiarygodność informacji w Internecie

45

Przeważnie weryfikacja prawdziwości informacji pochodzącej z Internetu jest trudniejsza od jej wyszukania! Warto tu zacytować naszego narodowego wieszcza Adama Mickiewicza”

Wiedzę możemy zdobywać od innych, ale mądrości musimy nauczyć się sami.