of 38 /38
Wydzia³ Matur 2004 BIULETYN MATURALNY Informatyka NR CENTRALNA KOMISJA EGZAMINACYJNA Spis treœci • Wstêp 2 4 • Techniczne warunki przeprowadzania egzaminu maturalnego z informatyki 7 • Informacje i zalecenia dla zdaj¹cych egzamin maturalny z informatyki 10 • Przebieg i dokumentowanie egzaminu z informatyki w czêœci drugiej 11 O informatyce w szkole ponagimnazjalnej • Zadania administratora (opiekuna) pracowni komputerowej podczas przygotowywania i przeprowadzania egzaminu maturalnego z informatyki 12 • Lista œrodowisk, jêzyków programowania i programów u¿ytkowych, z której mog¹ wybieraæ zdaj¹cy egzamin maturalny z informatyki 13 • Przygotowanie do egzaminu maturalnego z informatyki podczas lekcji z tego przedmiotu 14 • Wyszukiwarki internetowe 22 • Warunki i tryb rekrutacji na studia w roku akademickim 2005/2006 (wyci¹gi z uchwa³ senatów wybranych uczelni) 34 10

BIULETYN MATURALNY Informatyka 10 - oke.waw.pl · BIULETYN MATURALNY NR 10 Centralna Komisja Egzaminacyjna 3 Wydział Matur W dalszej części biuletynu znajdziemy również dwa bardzo

  • Author
    donga

  • View
    225

  • Download
    0

Embed Size (px)

Text of BIULETYN MATURALNY Informatyka 10 - oke.waw.pl · BIULETYN MATURALNY NR 10 Centralna Komisja...

  • Wydzia Matur2004

    BIULETYNMATURALNY

    Informatyka NR

    CENTRALNA KOMISJA EGZAMINACYJNA

    Spis treci

    Wstp 2

    4

    Techniczne warunki przeprowadzania egzaminu maturalnego z informatyki 7

    Informacje i zalecenia dla zdajcych egzamin maturalny z informatyki 10

    Przebieg i dokumentowanie egzaminu z informatyki w czci drugiej 11

    O informatyce w szkole ponagimnazjalnej

    Zadania administratora (opiekuna) pracowni komputerowej podczas przygotowywania i przeprowadzania egzaminu maturalnego z informatyki 12

    Lista rodowisk, jzykw programowania i programw uytkowych, z ktrej mog wybiera zdajcy egzamin maturalny z informatyki 13

    Przygotowanie do egzaminu maturalnego z informatyki podczas lekcji z tego przedmiotu 14

    Wyszukiwarki internetowe 22

    Warunki i tryb rekrutacji na studia w roku akademickim 2005/2006 (wycigi z uchwa senatw wybranych uczelni) 34

    10

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 2

    WSTP

    Od roku szkolnego 2004/2005 informatyka moe by wybrana tylko jako przedmiot dodatkowy i zdawana wycznie na poziomie rozszerzonym, np. ucze wybra i bdzie zdawa:

    1. jzyk polski 2. np. jzyk niemiecki (jako j. obcy) 3. np. biologia

    przedmioty obowizkowe

    4. informatyka przedmiot dodatkowy

    Egzamin bdzie jednakowy w caej Polsce. Do tej pory nie byo takiego egzaminu1, poniewa informatyk mona byo jedynie zdawa na maturze jako egzamin ustny. Ponadto adna z uczelni wyszych nie organizowaa egzaminu wstpnego z informatyki, a tym samym nie byo selekcji kandydatw pod ktem wiadomoci i umiejtnoci z tego przedmiotu jako kryterium przyjcia na studia (nawet na kierunki informatyczne).

    Egzamin maturalny z informatyki jest egzaminem pisemnym i praktycznym, sprawdza wiadomoci i umiejtnoci okrelone w Standardach wymaga egzaminacyjnych i polega na rozwizaniu zada egzaminacyjnych zawartych w arkuszach egzaminacyjnych.

    W Informatorze maturalnym od 2005 roku Informatyka, wydanym w 2003 roku (mona go pobra z naszej strony internetowej) znajdziemy m.in.: opis struktury i formy tego egzaminu, wymagania egzaminacyjne oraz przykadowe arkusze egzaminacyjne. Egzamin maturalny z informatyki trwa 240 minut i skada si z dwch czci:

    cz pierwsza egzaminu trwa 90 minut i polega na rozwizaniu Arkusza I zawierajcego 3-4 zadania bez korzystania z komputera (w tym m.in. zada algorytmicznych); za rozwizanie ich mona uzyska maksymalnie 40% oglnej liczby punktw z caego egzaminu (40 punktw),

    cz druga egzaminu trwa 150 minut i polega na rozwizaniu Arkusza II zawierajcego 3-4 zada przy uyciu komputera (np. napisanie programu, wykorzystanie znanego programu uytkowego do rozwizania problemu); za rozwizanie ich mona uzyska maksymalnie 60% oglnej liczby punktw z caego egzaminu (60 punktw).

    Poniewa druga cz egzaminu jest egzaminem praktycznym (przy komputerze),

    w procedurach organizowania i przeprowadzania egzaminu maturalnego od 2005 roku znajduj si bardzo wane dokumenty z nim zwizane:

    techniczne warunki przeprowadzania egzaminu maturalnego z informatyki, informacje i zalecenia dla zdajcych egzamin maturalny z informatyki, przebieg i dokumentowanie egzaminu z informatyki w czci drugiej, zadania administratora (opiekuna) pracowni komputerowej podczas przygotowywania

    i przeprowadzania egzaminu maturalnego z informatyki.

    Tre tych dokumentw publikujemy na nastpnych, kolejnych stronach tego biuletynu.

    1 W maju 2002 r. odby si po raz pierwszy egzamin maturalny z informatyki zdawany w ramach nowej matury jako jeden z przedmiotw do wyboru. Przystpio do niego 462 abiturientw w caej Polsce, co stanowio ponad 7% wszystkich zdajcych, ktrzy zdecydowali si zdawa matur w nowej formie.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 3

    W dalszej czci biuletynu znajdziemy rwnie dwa bardzo ciekawe i interesujce artykuy: prof. dr hab. M. M. Syso z Instytutu Informatyki Uniwersytetu Wrocawskiego na temat przygotowania do egzaminu maturalnego z informatyki podczas lekcji z tego przedmiotu oraz doc. dr hab. in. M. A. Kopotka z Instytutu Informatyki PAN powicony wyszukiwarkom internetowym. Na zakoczenie publikujemy wycigi z uchwa senatw wybranych uczelni wyszych okrelajcych warunki i tryb rekrutacji na studia w roku akademickim 2005/2006 na kierunki studiw zwizane z informatyk w odniesieniu do kandydatw, ktrym wiadectwo dojrzaoci wydaa Okrgowa Komisja Egzaminacyjna. Warto rwnie zajrze na strony internetowe innych uczelni wyszych i sprawdzi ich wymagania rekrutacyjne na poszczeglne kierunki studiw.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 4

    O INFORMATYCE W SZKOLE PONADGIMNAZJALNEJ

    W 1980 roku ukazaa si ksika Burze mzgw Seymoura Paperta, w ktrej autor (ucze i wsppracownik Jeana Piageta) odwrci relacj komputer czowiek:

    Dzisiaj w wielu szkoach powiedzenie nauczanie wspomagane komputerowo oznacza stosowanie komputera do uczenia dzieci. Mona by sdzi, e komputer jest wykorzystywany do programowania dziecka. W mojej wizji to dziecko programuje1 komputer, a robic to, nabywa zarwno poczucia panowania nad fragmentem najnowoczeniejszej i najpotniejszej techniki, jak te nawizuje zayy kontakt z niektrymi z najgbszych idei nauk przyrodniczych, matematyki i sztuki budowania intelektualnych modeli.

    Papert przyj od Piageta model dzieci jako budowniczych swych wasnych struktur intelektualnych i uwaa, e komputer moe wspiera procesy umysowe, wpywajc na sposb mylenia nawet wtedy, gdy ludzie nie maj z nim kontaktu. Jest autorem bardzo popularnych rodowisk uczenia si, bazujcych na stworzonym przez niego jzyku Logo, a take Matlandii, krainy przyjaznej nauce matematyki z pomoc komputera.

    Obecnie komputer i technologia informacyjna s w stanie wspomaga ksztacenie wielostronne: mog by wykorzystane jako rodek poznawczy (np. w nauczaniu przez odkrywanie i nauczaniu problemowym), w ksztaceniu przez przeywanie (dziki swoim interaktywnym moliwociom) i w uczeniu si poprzez dziaanie praktyczne.

    Informatyka jest mod dziedzin wiedzy, a jej szerokie zastosowania prowadz do usamodzielniania si technologii informacyjnej, stanowicej ca sfer zastosowa narzdzi komputerowych do powszechnego posugiwania si informacj. Znajomo struktury informatyki i technologii informacyjnej oraz powiza midzy nimi umoliwia uczcym si lepszy dobr zakresu tych dziedzin do rozwoju zainteresowa i przyszej pracy zawodowej.

    Mimo wielu definicji, nie ma zadowalajcej definicji informatyki, jak te technologii informacyjnej. Jednak coraz wyraniej zarysowuje si pogld, e mwic o technologii informacyjnej mamy na myli posugiwanie si w rnej formie gotowymi produktami informatycznymi (np. do pisania tekstw stosujemy edytor tekstu, przegldark lub wyszukiwark do wyszukiwania informacji a arkusz kalkulacyjny do planowania i wykonywania oblicze). Korzystanie z gotowych programw nie wyklucza wasnej twrczoci (np. tworzenie rysunkw, wykresw, wasnych schematw oblicze). Natomiast domen informatyki jest tworzenie nowych produktw informatycznych, np. program (lub grupa programw) zapisanych w danym jzyku lub rodowisku programowania, algorytm lub metoda komputerowego rozwizania jakiego problemu, teoria informatyczna.

    Analizujc zapisy zawarte w Podstawach programowych dla technologii informacyjnej i informatyki atwo dostrzec czciowe relacje w treciach nauczania tych przedmiotw, np. w czci dotyczcych materiaw prezentacyjnych, wykorzystania sieci komputerowych, baz danych. Schematycznie mona to przedstawi w nastpujcy sposb:

    1 Sowo programuje nie odnosi si tutaj dosownie do programowania komputera, ale oglnie do wydawania polece komputerowi, wg wasnego uznania.

    TECHNOLOGIA INFORMACYJNA

    INFORMATYKA

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 5

    Z tych przesanek wynika, e w Standardach wymaga egzaminacyjnych do egzaminu maturalnego z informatyki zawarte s rwnie niektre umiejtnoci wynikajce z Podstawy programowej technologii informacyjnej.

    Wyjtkowo istotnym zaoeniem edukacyjnym ksztacenia informatycznego w szkole ponadgimnazjalnej jest przygotowanie uczniw do podjcia studiw i pracy zawodowej. Uczniowie, wybierajc informatyk w zakresie rozszerzonym, kieruj si rnymi przesankami, np. mod na informatyk, chci zdobycia dodatkowej wiedzy o grafice komputerowej lub multimediach, chc dalej studiowa informatyk. Chc nauczy si algorytmiki i programowania, co jednak dla niektrych okazuje si zbyt trudne, abstrakcyjne. Wielu uczniw zdobywa samodzielnie wiedz i umiejtnoci, nie ograniczajc si do zaj szkolnych, zatem stan wiedzy uczniw w danej grupie czsto jest bardzo zrnicowany.

    Oto kilka przydatnych wskazwek, o ktrych warto pamita w przygotowaniu uczniw do egzaminu maturalnego z informatyki:

    1. Przygotowania do egzaminu maturalnego naley zacz jak najwczeniej, konsekwentnie realizowa program nauczania; nakoni uczniw do zapoznania si z Informatorem maturalnym.

    2. Jak najwczeniej rozpoczynamy zapis w jzyku programowania algorytmw prowadzcych do tworzenia programw, ktre realizuj omawiane algorytmy (rozpoczynanie nauki programowania w klasie trzeciej jest bardzo powanym bdem).

    3. Naley dokadnie formuowa treci zada (najlepiej tak, jak s formuowane w Informatorze), a rozwizania uczniw ocenia zgodnie z dokadnym schematem punktowym; powinien on by podany dla uczniw warto rwnie zapozna uczniw z zasadami tworzenia schematw punktowania zada.

    4. Podczas kadego sprawdzianu stwarza warunki podobne do warunkw, z jakimi ucze spotka si na egzaminie maturalnym (bdem jest udzielanie dodatkowych wyjanie, udostpnianie sieci, dostp do wczeniejszych materiaw i prac, niezachowywanie dyscypliny czasowej).

    Wan cech egzaminu zewntrznego jest to, e prace egzaminacyjne sprawdzaj i oceniaj egzaminatorzy powoani przez dyrektora okrgowej komisji egzaminacyjnej. Rozwizania poszczeglnych zada oceniane s na podstawie szczegowych kryteriw oceniania, jednolitych w caym kraju. Egzaminatorzy, w szczeglnoci, zwracaj uwag na:

    poprawno merytoryczn rozwiza, kompletno i dokadno prezentacji rozwiza zada, np. wygld, czytelno

    i przejrzysto tworzonych dokumentw, zachowanie odpowiednich zasad w zapisie programw i algorytmw.

    Podczas pisania egzaminu z informatyki mog pojawi si w pracach zdajcych rne bdy, powodujce przyznanie niepenej (a nawet zerowej) liczby punktw za dane zadanie lub jego cz. Czsto s to tzw. bdy nieuwagi, ktre mog wynika m.in. z niedokadnego czytania tekstu ze zrozumieniem (np. w poleceniu zadania trzeba byo nazwa plik w okrelony sposb zdajcy nazywa go zupenie inaczej, a egzaminator sprawdzajcy prac nie bdzie wiedzia, e ten wanie plik jest rozwizaniem danego zadania lub jego czci), przeoczenie jakiego polecenia (np. podanie specyfikacji algorytmu). Podczas opisywania zjawisk informatycznych i wypowiedzi wyraajcych opinie lub sdy nierzadko pojawiaj si bdy uycia niewaciwy dobr rodkw jzykowych w okrelonej wypowiedzi, niedostosowanie do charakteru wypowiedzi (np. gociu wchodzi w Internet), skrty mylowe (np. wchodz w ftpa), uywanie poj z gwary informatycznej (np. robak zamiast wirus komputerowy).

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 6

    Innym rodzajem bdw s bdy natury informatyczno matematycznej (maj znaczcy wpyw na ocen zadania):

    bdy rzeczowe, wynikajce z nieznajomoci poj, twierdze, algorytmw, zarwno informatycznych, jak i matematycznych (np. suma dugoci dwch bokw trjkta jest wiksza od dugoci trzeciego boku),

    bdy logiczne, wynikajce z bdnego rozumowania (np. rozpatrzenie tylko czci zamiast wszystkich przypadkw),

    bdy rachunkowe i mechaniczne, wynikajce z niekonsekwentnego prowadzenia rozwizania zadania (np. niezgodno oznacze wystpujcych na rysunku z zapisem w rozwizaniu), bdnego stosowania symboli, niewaciwego zapisu wyrae arytmetycznych (np. w formuach arkusza kalkulacyjnego lub w programie).

    Ze sprztem i oprogramowaniem wie si popenianie poniszych bdw: a) bdy programowania:

    bd skadniowy (syntax error), wykrywany przez kompilator w fazie analizy skadniowej programu, polegajcy na niedopuszczalnym przez gramatyk jzyka programowania ssiedztwie symboli w tekcie programu. Diagnostyka wykonywana przez kompilator pomaga usuwa bdy skadniowe, dlatego te naley oczekiwa od zdajcego, e oczyci swj program z takich bdw,

    bd semantyczny w programowaniu, polegajcy na niezgodnoci oczekiwa uytkownika ze stanem faktycznym (nie s wykrywane przez kompilator, ujawniaj si podczas dziaania programu). Ich rdem jest nieznajomo rzeczywistego znaczenia instrukcji programowych, polece systemowych itp.

    b) bdy systemowe uytkownika, zwizane z nieuwag zdajcego lub nieuwanym czytaniem polece systemowych. Mog spowodowa utrat dokumentu, strat czasu podczas egzaminu, stres zdajcego.

    c) bdne dziaanie systemu komputerowego lub awaria sprztu, np. moe objawia si bdami w zapisie plikw, uszkodzeniem danych, utrat plikw. Zdajcy powinien zadba o robienie kopii swoich zada, aby w razie awarii mg przej do zapasowego komputera (tak moliwo przewidziano w procedurach egzaminu). Takie bdy s w zasadzie niezalene od zdajcego, ale naley tutaj wykluczy jego ewentualne celowe, destrukcyjne dziaanie powodujce np. zawieszenie systemu.

    Mam nadziej, e takich bdw nie bdzie.

    Opracowa Jan Chyy

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 7

    TECHNICZNE WARUNKI PRZEPROWADZANIA EGZAMINU MATURALNEGO Z INFORMATYKI

    1. W pracowni, w ktrej odbywa si egzamin znajduj si sprawne komputery przeznaczone

    do pracy dla zdajcych i komputer operacyjny.

    2. Konfiguracja kadego komputera dla zdajcego musi spenia wymagania dotyczce rodowiska komputerowego, jzyka programowania i programw uytkowych, ktre zostay wybrane przez danego zdajcego z listy ogoszonej przez Dyrektora CKE.

    3. Komputer operacyjny jest wyposaony w nagrywark pyt CD i podczony do drukarki. Jest on przeznaczony do drukowania prac zdajcych, nagrywania wynikw egzaminu na pyt CD oraz tworzenia kopii zapasowych i kopiowania danych na potrzeby egzaminu.

    4. Liczba komputerw przeznaczonych do pracy dla zdajcych jest wiksza od liczby zdajcych. Na kadych dziesiciu zdajcych przypadaj przynajmniej dwa zapasowe komputery.

    5. Konfiguracja (oprogramowanie) komputera zapasowego musi umoliwia zdajcemu kontynuowanie dalszej pracy, przerwanej z powodu awarii komputera.

    6. Oprogramowanie wykorzystywane podczas zdawania egzaminu musi by w peni licencjonowane.

    7. W pracowni, w ktrej odbywa si egzamin, znajduje si odpowiednia ilo materiaw eksploatacyjnych dla potrzeb egzaminacyjnych, w tym:

    papier do drukarki, pyty CD jednorazowego zapisu do nagrywania wynikw egzaminu, zapasowe dyskietki i pyty CD.

    8. W pracowni, w ktrej odbywa si egzamin, jest dostpna podstawowa dokumentacja oprogramowania (opisy oprogramowania dostarczone z licencjami), pene wersje oprogramowania z plikami pomocy.

    9. System informatyczny wykorzystywany na egzaminie jest przygotowany w sposb uniemoliwiajcy poczenie z informatyczn sieci lokaln oraz sieciami teleinformatycznymi.

    10. Zdajcy ma prawo sprawdzi, w cigu jednej godziny, poprawno dziaania komputera, na ktrym bdzie zdawa egzamin i wybranego przez siebie oprogramowania1. Sprawdzanie to odbywa si w przeddzie egzaminu w obecnoci administratora lub opiekuna pracowni oraz czonka zespou nadzorujcego, w czasie wyznaczonym przez przewodniczcego szkolnego zespou egzaminacyjnego. Fakt sprawdzenia komputera i oprogramowania zdajcy potwierdza podpisem na stosownym owiadczeniu (wzr owiadczenia na stronie 8).

    11. W czasie trwania drugiej czci egzaminu zdajcy pracuje przy autonomicznym stanowisku komputerowym i moe korzysta wycznie z programw, danych zapisanych na dysku twardym i na innych nonikach, stanowicych wyposaenie stanowiska lub otrzymanych z arkuszem egzaminacyjnym. Nie mona korzysta na rnych komputerach

    1W dniu 8 czerwca 2004 r. Dyrektor CKE na stronie internetowej www.cke.edu.pl ogosi list rodowisk, jzykw programowania i programw uytkowych, z ktrej mog wybiera zdajcy egzamin maturalny z informatyki w 2005 roku.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 8

    z tych samych zasobw i nie jest moliwe komunikowanie si osb zdajcych midzy sob oraz z innymi osobami. Niedozwolony jest bezporedni dostp do sieci lokalnej oraz zasobw Internetu.

    12. Zdajcy nie moe samodzielnie wymienia elementw i podzespow wchodzcych w skad zestawu komputerowego oraz przycza dodatkowych; nie moe rwnie da takiego dodatkowego przyczenia lub wymiany przez administratora (opiekuna) pracowni.

    13. Zdajcy nie moe samodzielnie instalowa, a take da zainstalowania przez administratora (opiekuna) pracowni, dodatkowego oprogramowania na komputerze przydzielonym mu do egzaminu.

    14. W czasie egzaminu maturalnego z informatyki w sali egzaminacyjnej jest obecny przez cay czas administrator lub opiekun pracowni, ktry nie wchodzi w skad zespou nadzorujcego. Administrator (opiekun) pracowni moe by wychowawc zdajcych.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 9

    ........................................................ ........................................................ (piecztka szkoy) (miejscowo, data)

    Owiadczenie Owiadczam, e sprawdziem poprawno dziaania komputera i zainstalowanego na nim oprogramowania, na ktrym bd zdawa egzamin maturalny z informatyki i nie wnosz zastrzee.

    Lp. Imi i nazwisko zdajcego PESEL zdajcego Numer stanowiska Podpis zdajcego

    Podpisy: 1. ................................................... administrator (opiekun) pracowni 2. ................................................... czonek zespou nadzorujcego.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 10

    INFORMACJE I ZALECENIA DLA ZDAJCYCH

    EGZAMIN MATURALNY Z INFORMATYKI

    Przygotowanie do egzaminu 1. Cz pierwsza egzaminu z informatyki polega na rozwizaniu zada egzaminacyjnych

    bez korzystania z komputera i przebiega wedug takich samych zasad jak w przypadku pozostaych przedmiotw egzaminacyjnych.

    2. W czasie trwania drugiej czci egzaminu zdajcy pracuje przy autonomicznym stanowisku komputerowym i moe korzysta wycznie z programw, danych zapisanych na dysku twardym i na innych nonikach, stanowicych wyposaenie stanowiska lub otrzymanych z arkuszem egzaminacyjnym. Nie mona korzysta na rnych komputerach z tych samych zasobw i nie jest moliwe komunikowanie si osb zdajcych midzy sob oraz z innymi osobami. Niedozwolony jest bezporedni dostp do sieci lokalnej oraz zasobw Internetu.

    3. Komputer na stanowisku egzaminacyjnym zdajcego jest sprawny, a jego konfiguracja spenia wymagania dotyczce rodowiska komputerowego, jzyka programowania i programw uytkowych, ktre zostay wybrane przez tego zdajcego z listy ogoszonej przez Dyrektora CKE.

    4. Zdajcy ma prawo sprawdzi, w cigu jednej godziny, poprawno dziaania komputera, na ktrym bdzie zdawa egzamin i wybranego przez siebie oprogramowania. Sprawdzanie to odbywa si w przeddzie egzaminu w obecnoci administratora lub opiekuna pracowni oraz czonka zespou nadzorujcego, w czasie wyznaczonym przez przewodniczcego szkolnego zespou egzaminacyjnego. Fakt sprawdzenia komputera i oprogramowania zdajcy potwierdza podpisem na stosownym owiadczeniu.

    5. Zdajcy nie moe samodzielnie wymienia elementw i podzespow wchodzcych w skad zestawu komputerowego oraz przycza dodatkowych; nie moe rwnie da takiego dodatkowego przyczenia lub wymiany przez administratora (opiekuna) pracowni.

    6. Zdajcy nie moe samodzielnie instalowa, a take da zainstalowania przez administratora (opiekuna) pracowni, dodatkowego oprogramowania na komputerze przydzielonym mu do egzaminu.

    7. W pracowni, w ktrej odbywa si egzamin, jest dostpna podstawowa dokumentacja oprogramowania (opisy oprogramowania dostarczone z licencjami, pene wersje oprogramowania z plikami pomocy), z ktrej moe korzysta zdajcy.

    8. W czasie egzaminu maturalnego z informatyki w sali egzaminacyjnej jest obecny przez cay czas administrator lub opiekun pracowni, ktry nie wchodzi w skad zespou nadzorujcego. Administrator (opiekun) pracowni moe by wychowawc zdajcych.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 11

    PRZEBIEG I DOKUMENTOWANIE EGZAMINU Z INFORMATYKI W CZCI DRUGIEJ

    1. W czasie egzaminu: a) do drugiej czci egzaminu kady zdajcy otrzymuje arkusz egzaminacyjny i dwa

    zewntrzne noniki danych podpisane DANE oraz WYNIKI: - nonik DANE zawiera dane (pliki) do zada drugiego arkusza egzaminacyjnego, - nonik WYNIKI jest czysty (nie zawiera adnych plikw) i jest przeznaczony dla

    zdajcego do nagrywania plikw z rozwizaniami, b) zdajcy sam interpretuje tre otrzymanych zada, a czonkowie zespou

    nadzorujcego nie maj prawa odpowiada zdajcym na pytania dotyczce zada ani sugerowa interpretacji,

    c) zdajcy nie ma potrzeby sprawdzania poprawnoci danych w plikach do zada egzaminacyjnych; s one poprawne,

    d) obowizkiem zdajcego jest zapisywanie efektw swojej pracy nie rzadziej ni co 10 minut w folderze EGZAMIN, a po zakoczeniu kadego zadania na noniku WYNIKI, aby w przypadku awarii sprztu moliwe byo kontynuowanie pracy na innym stanowisku.

    2. Zdajcy zobowizany jest dokumentowa egzamin w nastpujcy sposb: a) wszystkie swoje pliki zdajcy przechowuje w katalogu (folderze) EGZAMIN,

    znajdujcym si na pulpicie oraz na noniku o nazwie WYNIKI, b) jeli rozwizanie zadania lub jego czci przedstawia algorytm lub program

    komputerowy, to zdajcy zapisuje go w tym jzyku programowania, ktry wybra przed egzaminem,

    c) jeli rozwizaniem zadania lub jego czci jest program komputerowy, zdajcy zobowizany jest umieci na noniku WYNIKI wszystkie utworzone przez siebie pliki w wersji rdowej,

    d) pliki, ktre zdajcy oddaje do oceny na noniku WYNIKI nazywa dokadnie tak, jak polecono w treciach zada lub zapisuje pod nazwami (wraz z rozszerzeniem), jakie podaje w arkuszu egzaminacyjnym; pliki o innych nazwach nie bd sprawdzone przez egzaminatorw,

    e) w razie potrzeby wydrukowania zawartoci utworzonego przez zdajcego pliku obowizuje nastpujca procedura:

    o zdajcy zapisuje plik na noniku WYNIKI i podnosi rk z nonikiem do gry, sygnalizujc w ten sposb potrzeb drukowania,

    o czonek zespou nadzorujcego odbiera nonik, dokonuje wydruku (osobicie lub zlecajc administratorowi pracowni) wskazanego przez zdajcego pliku (plikw) i niezwocznie zwraca nonik oraz wydruk zdajcemu,

    f) przed upywem czasu przeznaczonego na egzamin zdajcy zapisuje na noniku WYNIKI ostateczn wersj plikw stanowicych rozwizania zada.

    3. w przypadku awarii komputera, zdajcy natychmiast informuje o tym zesp nadzorujcy. Jeli prba usunicia awarii nie powiedzie si w cigu 5 minut, to zdajcy jest kierowany do zapasowego stanowiska komputerowego w sali egzaminacyjnej (wyposaonego w takie samo oprogramowanie). W sytuacji opisanej wyej zdajcy otrzymuje tyle dodatkowego czasu, ile trwaa przerwa w pracy (czas od zgoszenia awarii do momentu ponownego podjcia pracy).

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 12

    ZADANIA ADMINISTRATORA (OPIEKUNA) PRACOWNI KOMPUTEROWEJ

    podczas przygotowywania i przeprowadzania egzaminu maturalnego z informatyki

    Przed egzaminem: 1. Najpniej dwa dni przed terminem egzaminu maturalnego z informatyki w danej sesji

    egzaminacyjnej administrator (opiekun) przygotowuje sprzt komputerowy i oprogramowanie w pracowni w celu sprawnego przeprowadzenia tego egzaminu, tzn.: a) stanowiska komputerowe dla zdajcych przygotowuje do pracy jako autonomiczne

    uniemoliwiajce zdajcym: czenie si z informatyczn sieci lokaln i z sieciami teleinformatycznymi, korzystanie na rnych komputerach z tych samych zasobw, komunikowanie si zdajcych midzy sob oraz z innymi osobami za pomoc

    komputera, b) konfiguruje komputery, tak aby kady komputer, przydzielony danemu zdajcemu

    posiada pen wersj oprogramowania (z plikami pomocy), jakie ten zdajcy wybra z listy ogoszonej przez Dyrektora CKE,

    c) tworzy na kadym komputerze dla zdajcego na pulpicie katalog (folder) EGZAMIN, d) sprawdza dostpno podstawowej dokumentacji oprogramowania (opisy

    oprogramowania dostarczone z licencjami, pliki pomocy programw), e) konfiguruje zapasowe stanowiska komputerowe, tak aby umoliwiay kontynuacj

    dalszej pracy w przypadku ewentualnej awarii komputera ktregokolwiek ze zdajcych oraz komputer operacyjny, na ktrym sprawdza m.in. sprawno nagrywania pyt CD i drukowania,

    f) stwierdza na pimie, e sprzt w pracowni komputerowej zosta przygotowany zgodnie z wymogami.

    2. W przeddzie egzaminu wraz z czonkiem zespou nadzorujcego: asystuje podczas sprawdzania komputerw i oprogramowania przez zdajcych, odpowiada na pytania zdajcych i wyjania ewentualne wtpliwoci, odbiera od zdajcych podpisy pod owiadczeniem o sprawdzeniu komputera

    i oprogramowania.

    W czasie egzaminu: 1. Jest obecny w pracowni, w ktrej odbywa si egzamin i pozostaje do dyspozycji zespou

    nadzorujcego (nie wchodzi w jego skad); nie ma prawa odpowiada zdajcym na pytania dotyczce zada ani sugerowa interpretacji.

    2. W przypadku ewentualnej awarii komputera zdajcego, na wniosek przewodniczcego zespou nadzorujcego, niezwocznie i w miar swoich moliwoci usuwa usterki, ktre spowodoway awari lub udostpnia komputer zapasowy.

    3. W razie potrzeby, na wniosek przewodniczcego zespou nadzorujcego, dokonuje wydrukw plikw wskazanych przez zdajcych.

    Niezwocznie po egzaminie: 1. Jeli jest to konieczne dla udokumentowania egzaminu, na wniosek przewodniczcego

    zespou nadzorujcego, dokonuje wydrukw plikw wskazanych przez zdajcych. 2. Nagrywa na pyt CDROM jednorazowego zapisu wszystkie pliki ze wszystkich

    nonikw WYNIKI przekazanych komisji nadzorujcej przez poszczeglnych zdajcych, kierujc si zasad, e wszystkie pliki jednego zdajcego zapisane s w jednym katalogu (folderze) nazwanym PESELEM danego zdajcego i przekazuje przewodniczcemu przedmiotowego zespou egzaminacyjnego.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 13

    LISTA RODOWISK, JZYKW PROGRAMOWANIA

    I PROGRAMW UYTKOWYCH, Z KTREJ MOG WYBIERA ZDAJCY EGZAMIN MATURALNY Z INFORMATYKI

    W dniu 8 czerwca 2004 r. Dyrektor CKE na stronie internetowej www.cke.edu.pl ogosi

    list rodowisk, jzykw programowania i programw uytkowych, z ktrej mog wybiera

    zdajcy egzamin maturalny z informatyki w maju 2005 roku. Oto ta lista:

    rodowisko Jzyk programowania (kompilator)* Program uytkowy*

    Windows z systemem plikw NTFS

    Turbo Pascal 7 Free Pascal (FPC 1.0.10) DJGPP V2.03 C/C++ MS Visual Studio NET C++ MS Visual Studio NET C# Borland C++ Builder 6

    Personal Dev C++ 5.0 Delphi 7 Personal MS Visual Studio NET VB

    MS Office 2000 (w tym: Word, Excel, Access, PowerPoint)

    MS Office XP (w tym: Word, Excel, Access, PowerPoint)

    MS Office 2003 (w tym: Word, Excel, Access, PowerPoint)

    Star Office 6.0 PL

    Macintosh OS X 10 PL

    Apple Developer Plus C++ Real Basic 5.2

    MS Office dla MAC OS X i File Maker Pro 5 PL

    Apple Works 6.0 PL i File Maker Pro 5 PL

    Linux z KDE FreePascal (FPC 1.0.10) GCC 3.4 C/C++ Star Office 6.0 PL

    *tylko jeden dla wybranego rodowiska Naley nadmieni, e przed powstaniem tej listy, CKE we wsppracy z OKE,

    przeprowadzia rozpoznanie w szkoach ponadgimnazjalnych w caym kraju, za

    porednictwem ankiet, o posiadanym przez te szkoy sprzcie i oprogramowaniu. Lista ta na

    kolejne sesje egzaminu maturalnego bdzie zmodyfikowana m.in. ze wzgldu na szybki

    rozwj oprogramowania komputerowego i wyposaenia pracowni komputerowych.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 14

    PRZYGOTOWANIE DO EGZAMINU MATURALNEGO

    Z INFORMATYKI PODCZAS LEKCJI Z TEGO PRZEDMIOTU prof. dr hab. Maciej M. Syso

    Instytut Informatyki, Uniwersytet Wrocawski

    STRESZCZENIE

    W tym artykule omawiamy, w jaki sposb przygotowywa uczniw do egzaminu maturalnego z informatyki podczas zaj z tego przedmiotu.

    Informatyka jako przedmiot szkolny obrosa w wiele nieporozumie. Niektrzy uczniowie, sprawni w posugiwaniu si komputerem uwaaj, e matura z informatyki jest sprawdzianem gwnie tych ich umiejtnoci. Autor stara si przekona, e jest inaczej, a solidne przygotowanie si uczniw do tego egzaminu powinno zaprzta uwag nauczyciela od samego pocztku zaj z tego przedmiotu. Zwracamy rwnie uwag na nie mniej wan stron techniczn tego egzaminu, gdy w znaczcy sposb powodzenie na tym egzaminie zaley od prawidowego i bezawaryjnego posugiwania sprztem komputerowym i jego oprogramowaniem przez zdajcych.

    1. Wprowadzenie

    Zgodnie z obowizujcymi przepisami, informatyka jest jednym z dodatkowych przedmiotw do wyboru na egzaminie maturalnym1, moe wic by zdawana tylko na poziomie rozszerzonym. Warto pamita, e ucze moe zdawa informatyk na egzaminie maturalnym, nawet jeli nie uczszcza na zajcia z tego przedmiotu w szkole. Jest due prawdopodobiestwo, e tacy uczniowie mog pojawi si na egzaminie, gdy wielu uwaa, e ich wiedza i umiejtnoci informatyczne s wystarczajce, by przystpi do tego egzaminu z marszu. Wszystkich zdajcych obowizuj jednak te same zasady.

    W tym artykule `przyjmujemy, e uczniowie, ktrzy zamierzaj zdawa egzamin maturalny z informatyki maj zajcia z tego przedmiotu w zakresie rozszerzonym od pierwszego semestru w szkole ponadgimnazjalnej, a VI (ostatni) semestr zaj jest przeznaczony na lekcje, ktrych gwnym celem jest ich przygotowanie do zdawania tego egzaminu.

    2. Egzamin maturalny z informatyki kwestie formalne

    Najwaniejsze kwestie formalne, zwizane z przeprowadzeniem egzaminu maturalnego z informatyki s poruszone w dokumencie INFORMATOR maturalny od 2005 roku. Informatyka [2], dalej zwanym przez nas Informatorem. Zawiera on m.in.:

    opis struktury i formy egzaminu maturalnego z informatyki, standardy oraz opis wymaga egzaminacyjnych z informatyki, przykadowe arkusze z zadaniami egzaminacyjnymi, schematy oceniania tych zada

    i przykadowe rozwizania zada podane przez uczniw.

    1 Czynione s starania, aby informatyka zostaa zaliczona do grupy przedmiotw wybieranych obowizkowo na egzaminie maturalnym.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 15

    Informator jest bardzo wanym dokumentem, zarwno dla nauczyciela, jak i dla uczniw przygotowujcych si do egzaminu maturalnego, gdy zawiera podstawowe informacje i materiay, ktre mog pomc nauczycielowi w przygotowaniu uczniw do tego egzaminu, a uczniom bliej zapozna si z przebiegiem takiego egzaminu oraz z postaci zada maturalnych i sposobami ich oceniania. Niestety niewielu uczniw siga po Informator.

    Uwaamy, e nauczyciel uczcy informatyki w liceum powinien obowizkowo zapozna si z Informatorem i nakoni do tego rwnie wszystkich uczniw, zdajcych egzamin maturalny z informatyki. 3. Przebieg egzaminu maturalnego z informatyki

    Egzamin maturalny z informatyki jest egzaminem zewntrznym. Nie naley tego rozumie dosownie, gdy fizycznie miejscem egzaminu z informatyki bdzie pracownia komputerowa, w ktrej uczniowie mieli zajcia. Prace s oceniane poza szko, przez egzaminatorw powoanych przez OKE. Dla zapewnienia, e ewentualne kopoty techniczne ze sprztem lub z oprogramowaniem nie bd miay wpywu ani na przebieg egzaminu ani na ocen prac, w sali egzaminacyjnej bdzie obecny administrator (opiekun) pracowni, ktry moe udziela pomocy jedynie w zakresie sprztu i oprogramowania, jeli doszoby do ich awarii.

    Szczegowy opis struktury i formy egzaminu maturalnego z informatyki jest zamieszczony w rozdz. IV w Informatorze [2]. Komentujemy poniej najwaniejsze z tych ustale.

    1. Egzamin maturalny z informatyki skada si z dwch czci. Pierwsza cz trwa 90 minut i polega na rozwizaniu zestawu zada bez korzystania z komputera za t cz ucze otrzymuje nie wicej ni 40% cakowitej liczby punktw. Druga za cz trwa 150 minut i polega na rozwizaniu zada przy uyciu komputera za t cz ucze moe uzyska nie wicej ni 60% cakowitej liczby punktw. Mona wic powiedzie, e pierwsza cz egzaminu jest przeznaczona na sprawdzenie znajomoci poj i metod informatyki, a druga dodatkowo sprawdza praktyczne umiejtnoci posugiwania si komputerem i jego oprogramowaniem.

    2. Ucze zdaje drug cz egzaminu przy stanowisku komputerowym, ktrego wyposaenie w oprogramowanie wybra wczeniej, z listy ogoszonej przez CKE. Mona przyj, e na tej licie znajdzie si oprogramowanie wykorzystywane przez ucznia na zajciach z informatyki w szkole. Ucze ma prawo sprawdzi komputer, na ktrym bdzie zdawa egzamin, oraz wybrane przez siebie oprogramowanie, w dniu poprzedzajcym egzamin. Nawet jeli s to komputery szkolne, na ktrych uczniowie pracowali wczeniej przez kilka lat, naley ich zachci, by skorzystali z tej moliwoci dokadnego zapoznania si ze swoim stanowiskiem pracy na egzaminie. Moe ono bowiem nieco rni si od tego, przy ktrym ucze pracowa na lekcjach, np. nie bdzie moliwy dostp do Internetu, nie wszystkie systemy oprogramowania bd zainstalowane. Zakada si, e ucze pracuje tylko z tym oprogramowaniem, np. jzykiem programowania, ktre wybra na egzamin.

    3. W czasie egzaminu, kady komputer pracuje jako autonomiczna jednostka nie jest wczony ani do sieci lokalnej, ani do sieci Internet. Mona wic przyj, e adne z zada nie bdzie wymagao wykonania poszukiwa w sieci. Moe jednak pojawi si zadanie wymagajce przeszukania pewnych zasobw informacyjnych, np. pochodzcych z sieci, ale znajdujcych si na pycie.

    4. Dane do zada w drugiej czci egzaminu mog znajdowa si na dyskietce lub na pycie. Podobnie, rozwizania zada w tej czci naley zapisa na dyskietce lub na pycie. Naley

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 16

    przestrzega zalece podanych w treci zada, dotyczcych nazw plikw, w ktrych maj by umieszczone rozwizania. Uatwi to egzaminatorom odszukanie waciwych plikw z rozwizaniami.

    5. Dla wasnego dobra, w drugiej czci egzaminu ucze powinien co jaki czas zapisywa wyniki swojej pracy, by w razie awarii komputera mc skorzysta z czciowych rozwiza po przeniesieniu si na inny komputer.

    Te i inne zasady regulaminu egzaminu maturalnego powinny by przedmiotem dyskusji na zajciach i ewentualne prbne sesje tego egzaminu powinny odbywa si zgodnie z tymi zasadami, by uczniowie je sobie utrwalili. 4. Wymagania egzaminacyjne z informatyki a zakres zaj

    Wymagania egzaminacyjne z informatyki s zawarte w rozdz. V Informatora [2]. Ponadto, zamieszczono tam rwnie bardziej szczegowy opis wymaga egzaminacyjnych, gwnie z myl o uczniach, przygotowujcych si do egzaminu, i nauczycielach, ktrzy maj pokierowa tym przygotowaniem. Budowa standardw wymaga i opisu wymaga jest przejrzysta i uczniowie nie powinni mie adnych kopotw z ich analiz. Co wicej, opis wymaga ma form operacyjn, czyli ucze dowiaduje si z tego opisu, co musi umie wykona.

    Chcemy zwrci uwag, e zarwno standardy, jak i szczegowy ich opis, zawieraj zapisy odnoszce si do materiau nauczania, ktry wchodzi w zakres technologii informacyjnej w szkole ponadgimnazjalnej, bdcej rozszerzeniem zakresu zaj z informatyki w szkole podstawowej i w gimnazjum. Powtrzmy, technologia informacyjna to zastosowania informatyki i ich znajomo wchodzi w zakres wymaga maturalnych z informatyki. Moe wic pojawi si zadanie, wymagajce uycia edytora tekstu (na og do sporzdzenia raportu) lub arkusza kalkulacyjnego (do wykonania oblicze). Z wykazu standardw egzaminacyjnych i z ich opisw korzystaj autorzy zada maturalnych, naley je wic potraktowa jako wykaz wiadomoci i umiejtnoci, ktre ucze przystpujcy do egzaminu maturalnego powinien opanowa.

    Analiz wymaga egzaminacyjnych na tle dotychczas przerobionego materiau proponujemy nauczycielowi wykona wsplnie z uczniami, by byli wiadomi swojej wiedzy i umiejtnoci i ewentualnych brakw w tym zakresie. Wyniki tej analizy powinny posuy uczniom i nauczycielowi do lepszego zaplanowania wsplnych zaj oraz pracy wasnej w semestrze VI, tu przed egzaminem.

    Naley zwrci uwag uczniw, e z opisu wymaga egzaminacyjnych wynika, i zadania maturalne nie maj na celu sprawdzenie umiejtnoci posugiwania si konkretnym zestawem komputerowym i wybranym oprogramowanie. Na egzaminie maturalnym z informatyki nie s rwnie sprawdzane umiejtnoci technicznych w posugiwaniu si komputerem, ale wiadomoci informatyczne i umiejtnoci rozwizywania problemw z pomoc rodkw i narzdzi informatyki. 5. Zakres zaj z informatyki i metodyka ich prowadzenia

    Na zajciach z informatyki nauczyciel powinien znale czas, by wyjani uczniom i przedyskutowa z nimi wzajemne relacje midzy zakresem informatyki i technologii informacyjnej. Podstawowa rnica midzy tymi dziedzinami polega na tym, e informatyka zajmuje si tworzeniem nowych produktw informatycznych (takich, jak: algorytmy, oprogramowanie, nowe konstrukcje komputerw, twierdzenia i teorie), za technologia

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 17

    informacyjna to gwnie posugiwanie si gotowymi produktami informatycznymi (np. systemami uytkowymi, sieciami).

    Powysze rozrnienie ma na og wpyw na metodyk nauczania informatyki oraz na posugiwanie si technologi informacyjn, ksztacone na zajciach z tego przedmiotu oraz na zajciach z innych przedmiotw:

    w pracy z informacj, ktrej s powicone zajcia w ramach przedmiotu technologia informacyjna oraz podczas jej stosowania w poznawaniu innych dziedzin, proponujemy prac w dobrym stylu, dziki czemu zarwno ostateczne rozwizanie, jako efekt posuenia si technologi informacyjn, ma dobre cechy, jak i posugiwanie si rodkami i narzdziami informatycznymi ma znamiona profesjonalnego wykorzystania;

    zajcia z informatyki powinny mie cechy, charakterystyczne dla procesu formowania nowego produktu, nie koniecznie informatycznego; w takim procesie dotyczcym produktu informatycznego mona wyrni cztery podstawowe etapy:

    analiza sytuacji problemowej lub wymaga, postawionych przed produktem, i opracowanie specyfikacji zadania, ktre ma by rozwizane lub wykonane; w specyfikacji powinny zosta okrelone m.in. dane i wyniki oraz warunki jakie speniaj i zalenoci, jakie je cz;

    etap projektowania polega na zaplanowaniu sposobu postpowania, ktre ma doprowadzi do otrzymania rozwizania lub produktu, opisanego precyzyjnie w specyfikacji; efektem projektowania moe by np. algorytm, projekt bazy danych, projekt prezentacji, schemat dziaania zespou, rozwizujcego dany problem itp.; do tego etapu zalicza si rwnie dobr oprogramowania, w ktrym zostanie wykonane rozwizanie w nastpnym etapie, gdy projekt rozwizania czsto zaley od systemu oprogramowania, w ktrym bdzie ono realizowane; czci etapu projektowania jest rwnie zaplanowanie odpowiednich testw, ktre posu pniej do sprawdzenia (przetestowania) komputerowej realizacji rozwizania;

    kolejny etap to komputerowa realizacja rozwizania, a faktycznie projektu rozwizania, zaplanowanego na poprzednim etapie; na tym etapie wykonawca (ucze) ma na og swobod w wyborze odpowiedniego systemu, w ktrym bdzie tworzy komputerowe rozwizanie, przy tym moe czsto korzysta z gotowych bibliotek podprogramw lub z innych fragmentw oprogramowania, wczeniej opracowanych; nieodczn czci tego etapu jest testowanie poprawnoci komputerowej realizacji rozwizania, np. na testach przygotowanych w poprzednim etapie;

    proces tworzenia produktu informatycznego koczy etap ewaluacji i badania poprawnoci otrzymanego rozwizania, czyli zgodnoci ze specyfikacj i daniami zamawiajcego produkt; na tym etapie tworzone s rwnie: raport z przebiegu caego procesu otrzymywania produktu oraz dokumentacja uytkownika dla tego produktu.

    Wymienione etapy tworzenia produktu informatycznego na lekcjach informatyki w liceum odnosz si do wikszoci tematw zaj, ktrych celem jest opracowanie jakiego fragmentu oprogramowania. Mog by one rozcignite w czasie, gdy np. najpierw jest opracowywana specyfikacja zadania i algorytm jego rozwizywania, a dopiero pniej, po jakim czasie uczniowie pisz odpowiedni program. Podobnie moe by w przypadku tworzenia bazy danych, ktra moe by stopniowo rozbudowywana, jaki i tworzenia prezentacji, do ktrej materiay s zbierane przez jaki czas.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 18

    Przestrzeganie trybu pracy, zgodnie z powyszymi etapami, dotyczy zwaszcza pracy metod projektu, zespoowego lub indywidualnego. W tym przypadku, przechodzenie kolejno przez powysze etapy moe uatwi organizacj pracy i realizacj caego projektu.

    Produkty informatyczne, wykonywane przez uczniw na lekcjach informatyki, nie maj na og znamion produktw praktycznie uytecznych, chocia niektre z nich, takie jak prezentacje i programy wspierajce nauczanie lub strony internetowe, mog znale zastosowanie w otoczeniu uczniw. Mimo to zalecamy prac uczniw zgodnie z powyszymi etapami, jako ilustracj profesjonalnego podejcia do rozwizywania problemw informatycznych. Takie podejcie moe by bardzo uyteczne podczas rozwizywania zada maturalnych, zwaszcza tych, ktre wymagaj najpierw opracowania specyfikacji, a nastpnie napisania programu.

    W okresie bezporednio poprzedzajcym egzamin maturalny, powinny by dalej ksztacone nastpujce umiejtnoci, na co by moe nie zawsze jest czas podczas regularnych zaj: dobr narzdzi (tj. programu komputerowego) do rozwizywanego zadania, rozwizywanie zada algorytmicznych bez uycia komputera, wykorzystanie elementw technologii informacyjnej (np. przy opracowywaniu polemiki na tematy informatyczne). 6. Zakres i posta zada

    Na egzaminie maturalnym nie ma zada bardziej lub mniej wanych. O znaczeniu zadania dla kocowej punktacji wiadczy liczba punktw przydzielonych za jego rozwizanie lub za poszczeglne czci rozwizania (zadania do czsto skadaj si z kilku czci, ktre s osobno oceniane). W treci zadania jest dokadnie opisane, co naley przedoy jako rozwizanie, ktre podlega ocenie.

    Naley zwraca uwag uczniw, e teksty zada s starannie i precyzyjnie opracowane i ewentualne ich niezrozumienie na og moe by spowodowane pewnymi brakami w przygotowaniu si do tego egzaminu. Zajcia powicone analizie standardw wymaga na tle zakresu odbytych zaj powinny doprowadzi do wyeliminowania u uczniw tych obszarw wymaga, ktre wczeniej nie zostay pokryte na zajciach. Efektem dokadnego zapoznania si z treci praktycznych zada egzaminacyjnych powinno by rwnie przestrzeganie przez uczniw zalece dotyczcych postaci rozwiza i nazw plikw, w ktrych ucze ma umieci swoje rozwizania. Jest to wane, gdy na noniku z rozwizaniami mog pozosta inne pliki utworzone podczas rozwizywania, egzaminatorzy musz wic mi pewno, e oceniaj waciwe rozwizania.

    Jeli chodzi o zakres zada egzaminacyjnych, to zakada si, e sprawdzaj one w miar rwnomiernie wszystkie standardy wymaga egzaminacyjnych. Aby si o tym przekona i zademonstrowa to uczniom, mona si posuy odpowiednim diagramem w postaci tablicy. W tej tablicy, w wierszach umieszczamy poszczeglne zadania (ewentualnie z rozbiciem na czci), a w kolumnach poszczeglne elementy standardw wymaga i na przeciciu zadania ze standardem stawiamy znak X, jeli to zadanie ma na celu sprawdzenie u zdajcych przygotowania w zakresie tego standardu. Taka tabela jest opracowywana wsplnie dla obu arkuszy egzaminacyjnych. Na jej podstawie mona oceni, e zestaw arkuszy w miar rwnomiernie suy do wersyfikacji wiedzy i umiejtnoci uczniw, jeli jej wypenienie znakami X jest w miar rwnomierne.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 19

    7. Ocenianie rozwiza W kadym arkuszu egzaminacyjnym jest podane, ile punktw mona otrzyma w sumie

    za rozwizanie wszystkich zada z tego arkusza. W treci kadego zadania jest okrelone, ile punktw mona otrzyma za to zadanie, a na kocu zadania ta liczba punktw jest rozbita na poszczeglne czci zadania, jeli zadanie wyranie podzielono na czci.

    W przypadku zada egzaminacyjnych, pochodzcych z odbytych egzaminw, dostpne s rwnie modele odpowiedzi i schematy oceniania poszczeglnych zada. Zalecamy, by podczas rozwizywania poszczeglnych zada egzaminacyjnych na zajciach posugiwa si ich modelami odpowiedzi i schematami oceniania, gdy okrelaj one dodatkowo, co i w jakiej wysokoci jest oceniane w rozwizaniu. Analiza sposobu oceniania rozwiza poszczeglnych zada moe wskaza na te elementy rozwiza, ktre s brane pod uwag przy ocenianiu, a ktre nie zawsze s dostrzegane przez rozwizujcych.

    8. Wskazwki metodyczne

    Analiza standardw wymaga egzaminacyjnych Standardy wymaga egzaminacyjnych i ich szczegowy opis, zawarte w Informatorze [2],

    powinny by znane nauczycielowi od samego pocztku zaj z informatyki i uwzgldnione w realizowanym rozkadzie materiau. Nie wystarczy zainteresowa si tymi standardami dopiero w ostatnim semestrze zaj, gdy moe by za pno na nadrobienie ewentualnych zalegoci. Ponadto, jeden semestr, i to niepeny, to zbyt mao czasu na utrwalenie wiedzy i umiejtnoci opisanych w standardach.

    Jeli standardy wymaga egzaminacyjnych zostan uwzgldnione przez nauczyciela w jego zajciach od pocztku, to mona mie pewno, e wyniki analizy porwnawczej standardw z zakresem zrealizowanego materiau, przeprowadzonej na pocztku VI semestru, nie bd zaskoczeniem ani dla uczniw, ani dla nauczyciela, i ostatni semestr zaj zostanie przeznaczony na tematy przewidziane w rozkadzie na utrwalenie nabytej wiedzy i umiejtnoci oraz na przeprowadzenie prbnej matury.

    Przygotowania przez trzy lata Wydzielone zajcia, powicone przygotowaniu uczniw do egzaminu maturalnego

    z informatyki, proponujemy umieci w ostatnim semestrze, ale oczywicie przez cay okres nauczania informatyki nauczyciel powinien mie na uwadze, e od pierwszych zaj (w tym take z technologii informacyjnej) uczniowie przygotowuj si do tego egzaminu. Powinien znale wydzielony czas na zmierzenie si z przykadowymi zadaniami maturalnymi. Te zadania powinny zosta umieszczone w odpowiednich miejscach zaj, by wskaza uczniom, z czego powinni skorzysta w ich rozwizaniach, oraz by zapewni ich w ten sposb, e potrzebne do rozwizania zada wiedza i umiejtnoci s przedmiotem odpowiednich lekcji.

    Cz teoretyczna i cz praktyczna Egzamin maturalny skada si z dwch czci. Mona powiedzie, e pierwsza cz jest

    teoretyczna, bo nie wymaga uycia komputera, a druga praktyczna, bo polega na posueniu si komputerem i jego oprogramowaniem. Do obu tych czci naley odpowiednio przygotowywa uczniw i cz zada naley rozwizywa bez dostpu do komputera, a cz przy komputerach.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 20

    Umiejtno pracy nad zadaniem informatycznym bez pomocy komputera naley zacz ksztaci u uczniw znacznie wczeniej ni w ostatnim semestrze. Odpowiednie ku temu okazje powinny pojawia si od pocztku zaj, wielokrotnie.

    Czytanie ze zrozumieniem tekstw zada W przypadku egzaminu zewntrznego, jakim jest egzamin maturalny, jedn z niezbdnych

    umiejtnoci uczniw jest czytanie ze zrozumieniem tekstw zada. Zgodnie z regulaminem tego egzaminu, zdajcy sam interpretuje tre zada i czonkowie zespou nadzorujcego egzamin nie maj prawa odpowiada na adne pytania zwizane z interpretacj treci zada.

    Nauczyciel powinien zapewni uczniw, e zadania egzaminacyjne s tak przygotowane pod wzgldem klarownoci sformuowania, e powinny by zrozumiae przez ucznia liceum, ktry mia zajcia z informatyki i jego przygotowanie wypenia standardy wymaga egzaminacyjnych z tego przedmiotu. Trudno ze zrozumieniem treci zadania moe si bra gwnie z brakw w przygotowaniu.

    Umiejtno waciwej interpretacji treci zada z informatyki naley ksztaci na wszystkich zajciach, nie tylko na tych, ktre s powicone rozwizywaniu zada pochodzcych z egzaminu maturalnego.

    Zadania opisowe Jedn z umiejtnoci wrd standardw wymaga jest poprawne posugiwanie si

    terminologi informatyczn, a w konsekwencji take rozumienie tekstw informatycznych i ich tworzenie. Std arkusze egzaminacyjne z informatyki zawieraj czasem zadania polegajce na interpretacji tekstu informatycznego. W odpowiedzi nie wystarczy napisa cokolwiek, jak sdzi wielu uczniw.

    Do tej grupy zada mona zaliczy rwnie zadania polegajce na dokadnym okreleniu (lub porwnaniu) znaczenia odpowiednio wybranych poj. Tym zadaniom naley rwnie powici odpowiednio wiele czasu podczas przygotowa do egzaminu maturalnego, gdy faktycznie na zajciach uczniowie nie znajduj czsto dokadnych definicji stosowanych poj zwaszcza, gdy nauczanie informatyki przebiega w sposb czynnociowy i uczniowie zapoznaj si ze znaczeniem poj podczas wykonywania rnych czynnoci, zwizanych z rozwizywaniem stawianych zada. Tak uksztatowane znaczenia poj powinny zosta skonfrontowane z ich dokadnym opisem w wybranym sowniku, leksykonie lub encyklopedii. 9. Rola prbnej matury

    Proponujemy, by przynajmniej dwa razy przeprowadzi z uczniami prbn matur z informatyki, raz na pocztku semestru VI, a raz pod koniec zaj w tym semestrze. Pierwsza prba powinna uzmysowi uczniom, nad czym naley jeszcze wsplnie popracowa, aby dobrze przygotowa si do egzaminu, druga za powinna by kocowym sprawdzeniem przygotowania uczniw i powinna wypa znacznie lepiej ni pierwsza, gdy uczniowie powinni by znacznie lepiej przygotowani.

    Na prbnych egzaminach maturalnych nauczyciel moe posuy si zadaniami z wczeniejszych egzaminw maturalnych, rwnie z prbnych, mamy bowiem wiadomo, e nie jest atwo samodzielnie opracowa odpowiedni zestaw zada.

    Warunki techniczne na prbnej maturze powinny by takie same, jak na prawdziwej maturze, lub przynajmniej zblione do warunkw, w jakich uczniowie bd zdawa egzamin maturalny. Prbne matury s okazj, by szczegowo objani uczniom poszczeglne zasady

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 21

    pracy podczas egzaminu maturalnego. Naley zadba rwnie, by techniczne przygotowanie do egzaminu komputera i oprogramowania nie miao ujemnego wpywu na komfort pracy uczniw.

    Sam przebieg prbnego egzaminu powinien by rwnie sprawdzianem umiejtnoci czytania ze zrozumieniem treci zada egzaminacyjnych.

    Rozwizania zada z prbnego egzaminu nauczyciel powinien oceni podobnie, jak s oceniane rozwizania z prawdziwego egzaminu. Nastpnie, oceny te powinny zosta udostpnione uczniom wraz z modelem odpowiedzi i schematem oceniania, a w dyskusji nauczyciel powinien wyjani dodatkowo wtpliwoci uczniw zwizane z przyjtymi zasadami oceniania zada. rda 1. Centralna Komisja Egzaminacyjna: http://www.cke.edu.pl/ 2. INFORMATOR maturalny od 2005 roku. Informatyka, CKE, Warszawa 2003.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 22

    WYSZUKIWARKI INTERNETOWE

    doc. dr hab. in. Mieczysaw A. Kopotek Instytut Podstaw Informatyki PAN

    Wstp W dzisiejszych czasach wyszukiwarki internetowe (zwane u nas take szperaczami, a po angielsku search engines) s nieodczn czci naszego ycia. Jeli szukamy natchnienia do wypracowania, materiay na lekcj historii, informacje o celu naszej turystycznej wyprawy, ofert studiw czy pracy, chtnie korzystamy z zasobw informacyjnych zgromadzonych w wyszukiwarkach oglnego typu (np. Google) czy specjalizowanych (np. CiteSeer), bd te osadzonych w popularnych portalach (np. Onet). Wyszukiwarki to aplikacje usugowe w sieci WWW charakteryzujce si tym, e na zapytanie uytkownika sformuowane w jzyku naturalnym zwracaj list adresw WWW dokumentw prawdopodobnie odpowiadajcych potrzebom informacyjnym uytkownika. Wyszukiwarka utrzymuje baz adresow stron/dokumentw WWW wraz z informacjami potrzebnymi do skojarzenia zapytania z dokumentem. Aby mona skorzysta z wyszukiwarki, musimy dysponowa odpowiedni infrastruktur techniczn poczeniem z Internetem oraz przegldark WWW. Wyszukiwarki ze swej strony w celu zgromadzenia i utrzymywania bazy adresowej rwnie korzystaj z infrastruktury Internetu. Infrastruktura techniczna

    Internet jest megasieci czc wsplnym protokoem wiele sieci wielkoobszarowych (WAN). Kada z uczestniczcych sieci WAN integruje szereg sieci lokalnych (LAN). Warstwowa architektura oprogramowania Internetu zapewnia jednolity dostp zbudowanych nad ni aplikacji do wszystkich doczonych komputerw (a dzi coraz czciej innych urzdze, np. telefonw komrkowych, sprztu AGD, czujnikw kontrolujcych stan zdrowia pacjenta) poprzez protokoy TCP/IP i UDP, pozwalajc twrcom oprogramowania aplikacyjnego na abstrahowanie od rodzaju nonika informacji (skrtka, wiatowd), metod zabezpieczania przed bdami transmisji, drogi przepywu informacji. Internet pozwala nawiza dwm aplikacjom internetowym kontakt ze sob w celu przesania strumienia danych. Aplikacje internetowe komunikujce si poprzez okrelony strumie danych moemy podzieli na aplikacje usugowe (serwery) i aplikacje klienckie. Aplikacja serwerowa, umieszczona na danym komputerze nasuchuje na ustalonym porcie, czekajc na komunikaty od chccej nawiza kontakt aplikacji klienckiej i ewentualnie przekazuje na okrelony port swego komputera odpowiedzi dla aplikacji klienckiej. Aplikacja kliencka musi wiedzie, na jakim komputerze i porcie czeka aplikacja usugowa. Kady komputer w sieci mona zidentyfikowa jednym lub kilkoma unikalnymi adresami IP. Adres IP to cztery liczby z zakresu 0-255 (w nowszym protokole 8 liczb z zakresu 0-65000). Adres komputera moe te by symboliczny (np. www.google.com) - wtedy korzysta si z tzw. usugi DNS, ktra przelicza adres symboliczny na liczbowy. Wrd licznych usug oferowanych poprzez Internet (e-mail, ftp, telnet, ssh) szczeglne miejsce zajmuje usuga WWW (world wide web oglnowiatowa sie). Usuga

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 23

    ta pozwala poprzez tzw. protok http na udostpnianie plikw oraz uruchamianie aplikacji usugowych (programw CGI, serwletw, aktywnych stron) na tzw. serwerach WWW. Do aplikacji usugowych szczeglnie nas tu interesujcych nale wyszukiwarki internetowe. Tak wic aplikacje klienckie mog pobiera wystawione pliki lub pobiera wyniki dziaania programw ze zdalnych komputerw.

    Szczegln aplikacj klienck s tzw. przegldarki internetowe (browsery) pozwalajce na ogldanie plikw/dokumentw zapisanych w formacie HTML (ale dzi take w okoo 300 innych formatach) oraz co jest szczeglnie istotne wdrowa do innych dokumentw, na ktre wskazuje dany dokument za pomoc tzw. odsyaczy (linkw, hiperlinkw). Infrastruktura logiczna Dokumenty zgromadzone w sieci WWW charakteryzuj si kilkoma istotnymi cechami z punktu widzenia konstrukcji wyszukiwarki WWW: (1) tworzone s w sposb autonomiczny nie istnieje centralny wykaz adresw dokumentw WWW (2) dokumenty (zwaszcza pisane w formacie HTML) s powizane ze sob odsyaczami, podajcymi adresy innych, tematycznie zblionych dokumentw (3) dokumenty czsto nie s samoopisujce (lepiej s charakteryzowane przez wskazujce na nie odsyacze ni przez wasn tre) oraz nie s kompletne w sobie (wskazywane dokumenty wraz z danym stanowi dopiero logiczn cao). Struktura pocze dokumentw WWW jest niezwykle ciekawym dla matematykw obiektem bada. Okazuje si, e graf WWW, czyli taki, ktrego wzami s dokumenty, a ukami skierowanymi odnoniki, posiada wielk skadow silnie powizan, tzn. 40% dokumentw ma t wasno, e startujc z ktregokolwiek mona wdrujc po odnonikach dotrze do kadego innego dokumentu tej grupy. Ta wasno stanowi merytoryczn podstaw do zbierania dokumentw WWW przez wyszukiwark. Infrastruktura pragmatyczna

    Sdzi si, e za 5-10 lat wszelkie pisemnie dostpne informacje bd zgromadzone take w postaci elektronicznej w Internecie. Tak wic Internet bdzie stanowi kompendium ludzkiej wiedzy. Ale wiele dokumentw jest zupenie bezwartociowych, wiele zawiera informacje celowo zafaszowane, treci obsceniczne, obraliwe, bd stanowi zaplecze dziaalnoci przestpczej. Dlatego jednym z wanych zada wyszukiwarki jest ocena zgromadzonych dokumentw tak, aby jej uytkownik otrzymywa na zapytania naprawd wartociowe dokumenty.

    Kolejnym problemem dla wyszukiwarek jest dynamiczny rozwj rodkw wyrazu zawartoci stron WWW. Wyszukiwarki w zasadzie przetwarzaj jedynie treci tekstowe stron WWW, podczas gdy czsto tak naprawd zawarto dokumentu wyraa si w umieszczonej na grafice, dwiku, animacji. Tu pomoc w rozpoznaniu treci strony s napisy na odnonikach wskazujcych na dany dokument. Co wicej, odnoniki do kolejnych stron WWW mog by zakodowane nie tylko w prostym jzyku HTML, ale take w JavaScript, apletach Javy, plikach flash i innych. Std nawigacja do kolejnych stron WWW moe by prosta dla czowieka, ale trudna lub niemoliwa dla automatu takiego jak wyszukiwarka.

    Wiele dokumentw ukrytych jest w bazach danych dostpnych poprzez odpowiednie portale internetowe. Dostp do tych dokumentw wymaga specjalizowanego oprogramowania lub te jest w ogle niemoliwy dla wyszukiwarki z uwagi na patno usug.

    Z uwagi na komplikacje dostpu sie WWW dzieli si na tzw. pytk, do ktrej mog mie dostp wyszukiwarki dysponujce prostymi rodkami technicznymi, oraz tzw.

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 24

    gbok sie WWW, do ktrej dostp dla systemw automatycznych jest wysoce utrudniony lub niemoliwy. Podczas gdy liczb stron dostpnych w pytkiej sieci WWW szacuje si na ok. 10 miliardw, to w sieci gbokiej jest ich prawdopodobnie sto razy wicej. Najwiksze wyszukiwarki komercyjne zawieraj adresy 20-30% dokumentw dostpnych w sieci pytkiej. Budowa wyszukiwarki internetowej Wyszukiwarka internetowa skada si z trzech zasadniczych komponentw:

    pajka (robota, crawlera, spidera), ktrego zadaniem jest zbieranie dokumentw internetowych,

    indeksera/analizatora, ktrego zadaniem jest przygotowanie dokumentw do wyszukiwania,

    podsystem odpowiadania na zapytania. Pajk

    Wyszukiwarki czsto korzystaj ze wskazwek uytkownikw podajcych adresy dokumentw WWW, ktre s ich zdaniem interesujce. W ten sposb wyszukiwarka uzyska pewien zbir startowych dokumentw do rozpoczcia przeszukiwania Internetu. Jednake gwnym rdem dokumentw dla wyszukiwarki jest praca pajka.

    Celem pracy pajka jest ciganie z Internetu jak najwikszej liczby dokumentw, ktre zawieraj interesujc tre, do wasnego serwera, oraz utrzymywanie jak najbardziej aktualnych kopii zgromadzonych dokumentw. Dokumenty mog by ocenione jako interesujce lub nie dopiero po ich ciganiu.

    Pajk moe stosowa jedn z nastpujcych strategii cigania dokumentw: Bdzenia po stronach Internetowych: otrzymawszy na wejciu list (startowych)

    adresw URL, pajk przeszukuje graf pocze metod kolejki priorytetowej. Poszukiwanie w innych bazach danych (multi search) np. Yahoo, Google,...

    Trudno polega na sformuowaniu zapyta do tych baz danych. Konieczne jest skonstruowanie tzw. pijawek (leech), czyli programw specjalizujcych si w pozyskiwaniu informacji z konkretnego serwisu. Jeeli chcemy to samo zapytanie kierowa do kilku rnych baz danych, potrzebny jest take komponent tumaczcy okrelone zapytanie na semantyczne rwnowaniki kwerendy dla konkretnych baz. Ostatnio trwaj prace nad systemami tworzcymi pautomatycznie aplikacje pijawek.

    Mieszana: najpierw za pomoc multi search ustali list potencjalnych adresw, nastpnie wyszukuje grafu pocze metod kolejki priorytetowej.

    Warto w tym miejscu wspomnie, i wydajno pajkw jest z wielu wzgldw

    (przepustowo sieci, szybko i szczegowo przetwarzania) ograniczona. Obecnie uwaa si, e pajk cigajcy milion stron dziennie jest pajkiem wysoce wydajnym.

    Gwnym problemem dla pajkw przeczesujcych strony WWW po linkach jest posortowanie aktualnej listy adresw URL w taki sposb, e na pocztku listy znajduj si dokumenty, ktre z duym prawdopodobiestwem zawieraj podan wartociow informacj. Zwykle pajki korzystaj w tym celu z odpowiednich baz wiedzy, skadajcych si z list sw i fraz kluczowych z wagami oraz reguy rozpoznawania interesujcych stron, dziki ktrym pajk moe oceni wag (warto) jeszcze nie odwiedzonych stron WWW. Baza wiedzy powstaje bd to manualnie (w wyniku pracy ekspertw) bd jest wynikiem procesu automatycznego uczenia: indekser/analizator dogbnie bada zawarto ju

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 25

    odwiedzonych stron, ocenia je, a nastpnie w procesie uczenia ustala si zaleno midzy wartoci strony a zawartoci stron wskazujcych na dan stron.

    Nie tylko poszukiwanie nowych dokumentw, ale i utrzymywanie aktualnej bazy ju istniejcych dokumentw jest dla pajkw powanym wyzwaniem. Co p sekundy zmienia si zawarto jednego z dokumentw. W niektrych obszarach WWW (np. biznes) poowa stron zmienia si w przecigu 10 dni. Tymczasem pajki np. wyszukiwarki Google aktualizuj swe bazy rednio raz na miesic. W zwizku z tym potrzebne s wyszukane metody statystyczne pozwalajce przewidzie, ktre ze stron zmieniaj si szybciej, ktre wolniej, aby waciwie skalowa czas midzy kolejnymi rewizytami. Indekser/analizator dokumentw

    Indeksowanie to proces tworzenia indeksu, czyli specjalizowanej bazy danych zawierajcej skompresowan wersj dokumentw cignitych przez pajka. Indeks winien by zoptymalizowany w celu szybkiego wyszukania listy dokumentw zawierajcych okrelone sowa bd frazy (termy) z zapytania uytkownika. Tak wic proces indeksowania jest cile zwizany ze strategiami podsystemu odpowiadania na zapytania. Ale take wane jest sprzenie z procesem pajka indekser musi uwzgldni okresowo zmiany, jakie nastpiy w zawartoci ju zaindeksowanych stron. Jest to do powany problem. Uytkownicy Google czsto skar si na skokowe (a nie cige) zmiany bazy wyszukiwarki. Jest to zwizane z zakadkow prac systemu: podczas gdy uytkownicy korzystaj z aktualnej bazy dokumentw, pajki i indeksery przygotowuj nastpne wydanie, ktre jest w pewnym momencie podstawiane w miejsce starej bazy.

    Proces indeksowania skada si zasadniczo z nastpujcych etapw: analiza poszczeglnych dokumentw, analiza caej kolekcji dokumentw, przygotowanie struktur do wyszukiwania dokumentw,

    Analiza pojedynczego dokumentu skada si zwykle z krokw: identyfikacja jzyka dokumentu, ewentualne tumaczenie treci na jzyk standardowy (np. angielski), identyfikacja sw/fraz/termw wystpujcych w dokumentach, usuwanie sw popularnych, ekstrakcja tematw sw przy uyciu algorytmu szukajcego tematu.

    Analizujc ca kolekcj dokumentw przechodzimy przez kroki: zliczanie wystpie tematw (obliczanie tzw. term frequency), opcjonalnie uycie tezaurusa dla termw o niskiej czstoci (zastpienie termu

    terminem oglniejszym), opcjonalnie tworzenie fraz dla termw o wysokiej czstotliwoci, obliczanie wag dla wszystkich prostych termw, fraz i klas tezaurusa (w oparciu

    o stosowany pniej model wyszukiwania), przypisanie kademu dokumentowi przynalenych prostych termw, fraz i klas

    tezaurusowych z odpowiednimi wagami, ewentualnie streszczenie dokumentw, ocena wartoci (statycznej) kadego dokumentu.

    Przygotowanie kolekcji dokumentw do wyszukiwania polega m.in. na: stworzeniu sownika, utworzeniu list inwersyjnych, kompresji list inwersyjnych, kompresji sownika,

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 26

    ewentualnie wygenerowaniu tezaurusa i/lub mapy dokumentw.

    Dla wikszoci stosowanych technik przetwarzania dokumentu istotne jest rozpoznanie jzyka, w jakim zosta napisany. Istnieje szereg technologii rozpoznawania jzyka dokumentu. Wikszo opartych jest bd o analiz wystpowania charakterystycznych sw (pospolitych), zbitek liter, znakw diakrytycznych charakterystycznych dla jzyka. Jednak aktualnie najefektywniejsze s metody statystyczne, oparte o koncepcj n-gramw, gdzie na podstawie prawdopodobiestwa warunkowego nastpstwa poszczeglnych sekwencji n liter (zwykle dwch lub trzech) ocenia si prawdopodobiestwo przynalenoci dokumentu do jzyka.

    Niezbdnym elementem indeksera jest analizator, ktry bdzie sterowa podziaem dokumentu na termy (sowa, czy te frazy). Analizator moe przykadowo tekst 'The ill dogs' rozbi na jednostki 'the', 'ill, dogs' (mae litery), podczas gdy inny moe zamieni ten tekst na 'ill', 'dog' (mae litery, zamiana na liczb pojedyncz, pominicie pospolitego wyrazu 'the').

    Zwykle analizatory wykrywaj (z pewnym przyblieniem) temat sowa. Tak np. sowa recognition, recognizing, recognized, recognizes itd. zostan zredukowane do recognize, przez co znacznie zredukuje si rozmiar utrzymywanego sownika oraz stanie si bardziej prawdopodobne znalezienie dokumentu speniajcego oczekiwania uytkownika. Ma to szczeglne znaczenie dla jzykw silnie fleksyjnych takich jak polski.

    Czsto analizator moe doda i/lub zamieni sowa na ich tumaczenia na okrelony jzyk. Moe doda i/lub zamieni sowo na sowo pokrewne (pies-suka), synonim (pies-piesek), pojcie bardziej oglne (pies-zwierz) i/lub zbir poj zawajcych (pies-dalmatyczyk, jamnik itd.). Tu trzeba oczywicie uy odpowiedniego sownika /ontologicznej bazy wiedzy/ tezaurusa (np. WordNet dla jzyka angielskiego).

    Wreszcie na podstawie czstego bliskiego wspwystpowania i/lub odpowiedniego sownika fraz analizator moe zamieni grup sw na term, np. computer science itp.

    Analizator moe szerzej patrze na analizowany dokument i wiza z wygenerowanymi termami dodatkowe atrybuty, takie jak czsto wystpowania w tekcie, czy jest to by moe nazwa wasna, jaka jest jego forma gramatyczna, jaka funkcja w zdaniu (podmiot, dopenienie), czy term wystpi w wanym miejscu (tytu dokumentu, nagwek rozdziau, opis pliku) czy te w miejscu deprecjonowanym (np. jako notatka zapisana maymi literami itp.), czy wreszcie wag termu, mierzc jego wano na tle wystpowania w caej populacji dokumentw.

    Std blisko jest do generowania listy sw kluczowych dla dokumentu, a take automatycznego generowania streszcze oraz automatycznego przydzielania do kategorii (pozycji w katalogu) czy te grupowania (automatycznego kreowania katalogw).

    Wanym zagadnieniem jest wstpna ocena wartoci dokumentu. Jak z pewnoci ju dowiadczylimy, proste zapytanie do wyszukiwarki o duych zasobach zwraca setki, a nawet tysice odpowiedzi. Wiadomo, e uytkownik spojrzy tylko na kilka z nich, zwykle tylko z pierwszej strony. Jego zadowolenie z uywania wyszukiwarki bdzie zalee od jakoci wanie tych stron z pocztku listy. Aby przybliy si do oczekiwa uytkownika, opracowano szereg strategii szeregowania stron, zwanych te rankingiem (rank) czy te ocen lub wag (score) dokumentu. Ranking stron/dokumentw decyduje zwykle o kolejnoci wywietlania ich opisw w odpowiedzi systemu na kwerend uytkownika.

    Ranking stron moe zosta przygotowany dynamicznie (np. przez obliczenie "odlegoci" czy "podobiestwa" midzy zapytaniem uytkownika a dokumentem w trybie on-line) albo te statycznie (przez ocen wartoci strony w porwnaniu z ca populacj stron WWW w trybie off-line).

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 27

    Zwykle stosuje si statyczn ocen rankingu (z uwagi na koszt oblicze). Stosuje si tu szereg podej, do ktrych moemy zaliczy: opinie redaktorw, popularno, zawarto informacyjna, ilo i struktura stron wskazujcych.

    W pocztkowym okresie rozwoju prekursorw wyszukiwarek (w tzw. katalogach) czsto ranking dokumentw by ustalany rcznie przez redaktorw. Jest to bez wtpienia najlepszy sposb oceny wartoci strony w tym sensie, e opiera si na inspekcji caej treci dokumentu przez czowieka, a czowiekiem jest uytkownik narzdzia wyszukiwawczego, wic istnieje najwiksza szansa odzwierciedlenia potrzeb i opinii przyszego uytkownika. Wad jest niewtpliwie to, e z uwagi na rnorodno zainteresowa rni eksperci mogliby potencjalnie nada temu samemu dokumentowi rne wagi, a tymczasem brana jest pod uwag zwykle opinia tylko jednego.

    W systemach wyszukiwarek to podejcie nie jest realistyczne z uwagi na liczb dokumentw. Zastpczo stosuje si opiniowanie przez redaktorw (znikomej) czci dokumentw, a innym dokumentom nadaje ranking jako funkcj pewnej miary odlegoci midzy dokumentami opiniowanymi przez ekspertw a innymi dokumentami.

    W niektrych wyszukiwarkach zaprasza si uytkownikw, aby dla konkretnego dokumentu podali sw opini punktow na jego temat (zwykle w skali 1-5) i urednia si j.

    Wreszcie w niektrych wyszukiwarkach istnieje moliwo zaznaczenia przez internaut, czy jest usatysfakcjonowany oglnie dokumentami, ktre znalaza wyszukiwarka, i wtedy modyfikuje si ranking znalezionych dokumentw.

    Jeeli wyszukiwarka ma odpowiednio duy zasb zebranych dokumentw, moe si pokusi o obliczenie liczby linkw wskazujcych na dan stron. Wychodzi si tu z zaoenia, e twrcy stron WWW czytaj dokumenty i dopiero jeli uznaj dany dokument za wany/ciekawy, umieszczaj do linki.

    Miar popularnoci stosowan w niektrych wczesnych wyszukiwarkach bya liczba kwerend zadanych przez internautw, ktrym odpowiadaa dana strona. Niektre wyszukiwarki kontroluj, do ktrych stron znalezionych przez wyszukiwark rzeczywicie wchodz internauci.

    Alternatyw jest automatyczna ocena zawartoci informacyjnej strony na podstawie jej struktury. Stron mona okreli jako interesujc, jeeli zawiera duo (ale niezbyt duo) tekstu. Ukad strony moe stron deprecjonowa, jeli sugeruje on reklamwkowo jej zawartoci. Mona bada kwiecisto tekstu, tj. czy sowa powtarzaj si niezbyt czsto. Mona te bada liczb linkw wychodzcych ze strony (dobra strona startowa). Moe te by istotne wystpowanie lub nie okrelonych sw kluczowych na okrelonych pozycjach (np. w artykule naukowym wanymi sowami bdzie twierdzenie, postulat itp.). Zawarto informacyjna jest na obecnym etapie niemierzalna obiektywnie w wypadku, gdy treci strony jest grafika.

    Jako skadow miary wanoci strony stosuje si czasami gboko na ciece w jej URLu. Zakada si, e strona umieszczona w korzeniu jest waniejsza ni np. w podkatalogu na gbokoci np. 5. W zalenoci od zainteresowa wysz rang mona nadawa dokumentowi pochodzcemu z okrelonej domeny (rzdowej, edukacyjnej, komercyjnej itp.). Przedmiotem zainteresowania mog by dokumenty z okrelonych krajw, kontynentw itp. Dokumenty umieszczane na serwerach darmowych mog by uwaane za mniej wane ni umieszczane na serwerach patnych.

    Inn metod rankingu stron jest stopie ich popierania przez sponsorw wyszukiwarki i/lub reklamodawcw.

    Z uwagi na istotne wady wczeniej przytoczonych metod rangowania stron WWW, poszukiwano innych, ktre byyby bardziej odporne na manipulacj ni metoda finansowa czy oparta o zawarto, a jednoczenie bardziej realistyczna z technicznego punktu widzenia ni metoda redaktorw. Tu zwrcono uwag na niezwykle wane rdo

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 28

    informacji, jakim jest struktura linkw midzy stronami. Do godnych zauwaenia nale w tej kategorii metody HITS, SEPSA i PageRank. Ta ostatnia staa si fundamentem sukcesu wyszukiwarki Google. Metody oparte o analiz linkw opieraj si na zaoeniu, e twrcy stron WWW wskazuj ze swych stron na te strony, z ktrych treci si zapoznali i uznali za wane. Metody te bazuj wic na tzw. przepywie autorytetu dana strona ma wyszy autorytet, im wicej autorytatywnych stron na ni wskazuje. Szczeglnie wana okazaa si tu metoda PageRank oceny wartoci strony, gdy stosunkowo prosto si j liczy (ptora miesica trwaj obliczenia dla 4 miliardw stron), a z drugiej strony trudno zmanipulowa ten ranking.

    W ostatnim czasie trwaj poszukiwania nowych metod reprezentacji wynikw wyszukiwania. Niewtpliwie powan rol odegraj w przyszoci tzw. mapy dokumentw w stylu WebSOM. Tworzenie takiej mapy to mudny (kilka tygodni dla 10 milionw dokumentw) proces rozmieszczania dokumentw na dwuwymiarowej planszy tak, by podobne dokumenty znalazy si blisko siebie. Mapa wzbogacana jest sownym opisem w stylu nazw miast czy te krain, ktre charakteryzuj wystpujce tam dokumenty. Trzeci wymiar mapy moe charakteryzowa bd liczno dokumentw w okrelonym regionie bd stopie ich podobiestwa do regionw ssiednich.

    Tzw. listy inwersyjne to listy identyfikatorw dokumentw zawierajcych konkretne sowo. Odpowied na zapytanie uytkownika uzyskuje si dziki nim poprzez poszukiwanie wsplnych czci list inwersyjnych dla wszystkich termw wymienionych w zapytaniu uytkownika. Ta metoda reprezentacji kolekcji dokumentw powoduje, i przy kadym zapytaniu odwoujemy si jedynie do znikomej czci bazy danych. Cho sama idea list inwersyjnych stanowi powane przyspieszenie procesu wyszukiwania, to jednak konieczne s specjalne metody kompresji danych na tych listach pozwalajce na ich adowanie do pamici operacyjnej w celu szybszego przetwarzania.

    Podsystem odpowiadania na zapytania

    Wyszukiwanie to operacja polegajca na identyfikacji podzbioru zbioru dokumentw, zawierajcych podan tre lub majcych podane cechy.

    Proces odpowiadania na zapytania skada si zwykle z etapw: pobranie od internauty sw z kwerendy, wyszukiwanie tematw tym samym algorytmem co na etapie indeksowania, zastpienie tematw numerami termw indeksujcych, obliczanie wag dla wszystkich termw z zapytania, tworzenie wektora zapytania (lub innej formy reprezentacji kwerendy, zalenie od

    modelu wyszukiwania), obliczanie stopnia podobiestwa midzy kwerend a opisami dokumentw, zwrcenie listy dokumentw z podaniem rankingu. Na wejciu operacji wyszukiwania podaje si kwerend (zapytanie), ktra specyfikuje

    kryteria wyboru dokumentw, a wynikiem jest lista dokumentw (trafie), ktre speniy kryteria.

    Lista trafie jest zwykle uporzdkowana wedug pewnego kryterium relewancji (zwanego rankingiem, ranking, score) i moe zawiera tylko podzbir zbioru tych dokumentw, ktre faktycznie speniaj kryteria (zwykle s to dokumenty o najwyszym rankingu).

    Operacja wyszukiwania przebiega zwykle nie na faktycznych dokumentach, lecz na indeksie, ktry zawiera wczeniej przygotowane informacje o dokumencie.

    Wyniki kwerendy s prezentowane zwykle w jednej z nastpujcych postaci: wektorowej,

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 29

    dynamicznej listy grup, statycznej listy grup, mapy dokumentw.

    W pierwszej kolejnoci winnimy zda sobie spraw, e uytkownik moe mie rne zapotrzebowania na informacj. Moe on w szczeglnoci by zainteresowany odnalezieniem dokumentw na okrelony temat. W tym wypadku w pierwszej kolejnoci bdzie siga do wynikw kwerendy w postaci wektorowej, ktre oferuje np. wyszukiwarka www.google.com. Moe by zainteresowany nie tyle dokumentem, co definicj okrelonego pojcia, odpowiedzi na konkretne pytanie. Wtedy odwoa si do wyszukiwarki typu www.ask.co.uk, answerbus (missihoover.si.umich.edu/~zzheng/qa-new/), www.askjeeves.com.

    Moe wreszcie nie by zainteresowany konkretnym dokumentem, lecz raczej ogln orientacj w okrelonej dziedzinie. Wtedy bez wtpienia usugi oferujce grupowanie dokumentw w postaci list (np. www.vivisimo.com, czy te system marchewa w www.cs.put.poznan.pl/dweiss/sie/research/carrot/), grafw dokumentw powizanych semantycznymi zwizkami (www.Kartoo.com) czy te map (statycznych jak w projekcie WebSOM czy dynamicznych jak w maps.map.net) bd przydatne w pierwszej kolejnoci.

    Reprezentacja wektorowa to najstarsza i jak dotychczas najpopularniejsza metoda prezentacji wynikw zapyta przez wyszukiwarki. Jej popularno wynika z atwoci implementacji. Gwn cech takiej prezentacji jest stosunkowo niewielka ilo wywietlanych opisw dokumentw na jednej stronie. Jest to najczciej 10 100 opisw posortowanych wedug trafnoci, gdzie trafno charakteryzuje si stopniem powizania i podobiestwa do wprowadzonego wczeniej zapytania. Opisy dokumentw przedstawione s w postaci listy, jeden za drugim. Sab stron tego typu prezentacji jest maa ilo wywietlanych wynikw w jednym oknie przegldarki, co w duym stopniu utrudnia przegldanie opisw stron WWW.

    Listowa prezentacja dynamicznie grupowanych wynikw wyszukiwania jest stosowana w praktyce od niedawna. Bardzo dobrym przykadem jest grupowanie zastosowane w systemie vivisimo.com, gdzie klasteryzacja skada si z krokw: ekstrakcja z opisw dokumentw (wynikw wyszukiwania w rnych wyszukiwarkach) fraz zoonych z jednego, dwch, trzech itd. kolejnych sw (a waciwie tematw sw) i uoenie ich wedug czstoci wystpowania (z pominiciem stop-sw). Dla najczciej wystpujcych fraz (np. stu) konstruuje si drzewo, a waciwie las fraz odwrotnych (wzy etykietowane tematami z fraz oraz frazami w ich oryginalnym brzmieniu), przy czym dzieci wza s uszczegawiajcymi frazami swoich rodzicw. Kademu wzowi przypisuje si dokumenty, w ktrych wystpuje dana fraza (w wersji tematowej"). Jak atwo zgadn, jeden dokument moe si znale w wicej ni jednej grupie. Klastry zachodz wic na siebie. Tak wyprodukowane klastry przedstawiane s w postaci listy. Uytkownik klikajc odpowiedni grup przenosi si albo do jej zawartoci (prezentacja wektorowa) lub rozwija kolejne podgrupy. System ten umoliwia objcie wikszej iloci dokumentw. Poprzez zgrupowane wyniku wyszukiwania moemy oprcz prostego przegldania dokumentw, wnioskowa o prawidowociach oglnych. Grupowanie statyczne polega zasadniczo na tym, e zadana jest z gry hierarchia poj, do ktrej w trybie off-line przyporzdkowywane s wszystkie istniejce w bazie dokumentw wyszukiwarki dokumenty. Algorytm klasyfikacji dokumentw moe by bardzo zoony z uwagi na brak koniecznoci odpowiedzi w trybie rzeczywistym. Hierarchia poj jest przygotowywana pod konkretne potrzeby specjalizowanego katalogu dokumentw i winna odzwierciedla pojciow struktur dziedziny, z ktrej dokumenty s przechowywane. W trakcie wyszukiwania system wycina pewn podhierarchi zawierajc gros odnalezionych dokumentw, waon stopniem podobiestwa do kwerendy i do innych dokumentw, i ta podhierarchia jest prezentowana

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 30

    jako statyczne grupowanie dokumentw. Przykadem jest wyszukiwarka Excavio firmy NutechSolutions.

    Luna lista grup bardzo czsto nie wystarcza uytkownikowi, ktry poszukuje szerszych zwizkw pomidzy dokumentami z danej dziedziny. Dziki wykorzystaniu graficznej wizualizacji wynikw wyszukiwania moemy takie zwizki wyodrbni. Rezultaty wyszukiwania moemy prezentowa na jedno-, dwu- lub trjwymiarowej przestrzeni. Jednostk czasu przedstawia si np. za pomoc dodatkowej osi. Podobiestwo semantyczne obiektw wizualizuje si poprzez usytuowanie obiektw blisko siebie. Prezentacje graficzne uatwiaj nawigacj w zbiorze dokumentw. Pozwalaj one take na zrozumienie dziedziny dziki bardziej intuicyjnemu dla czowieka pogrupowaniu dokumentw.

    Mapy dokumentw mog mie rny charakter. Istniej mapy, na ktrych powizania pomidzy dokumentami obrazuj linie. Jest to

    do dobry sposb, ale tylko przy maej iloci dokumentw. Dua ilo powiza (ilo stron) mogaby spowodowa utrat przejrzystoci caej mapy. Tak opisane rozwizanie przyjli twrcy mapy INTERNET CARTOGRAPHER (http://www.inventix.com/).

    Lepsze rozwizanie, take powiza dokumentw jest zaproponowane przez twrcw mapy INXIGHT - TREE STUDIO (http://www.inxight.com/). Twrcy tej mapy wyszli od dokumentu, ktry jest najbardziej bliski do wszystkich i ustanowili go tak jakby centrum. Nastpnie przyporzdkowano do niego odpowiednio bliskie tematycznie mu dokumenty, a do tyche dokumentw odpowiednio inne. Jeli jednak dokument posiada ju powizanie do jednego dokumentu to nie ma ju powizania z innym. Mapa ta skonstruowana jest na zasadzie drzewa hierarchii.

    Najbardziej przejrzyst metod reprezentacji jest mapa WEBSOM (http://websom.hut.fi/websom/doc/background.html). Mona na niej umieci praktycznie nieskoczon liczb dokumentw. Istnieje moliwo przedstawienia wielopoziomowego, rozpoczynajc od oglnych grup zagbiajc si w coraz bardziej szczegowe elementy mapy.

    Efekt naturalnego grupowania si dokumentw osignito dziki zastosowaniu samoorganizujcych si sieci neuronowych. WebSOM pozwala odzwierciedli zalenoci pomidzy du liczb dokumentw zachowujc wysok dokadno. Niestety proces nauki sieci neuronowej jest bardzo czasochonny, co praktycznie uniemoliwia szersze stosowanie sieci, ktre przy kadej nowej porcji dokumentw musz przeprowadza proces nauki do zastosowa, gdzie czas odpowiedzi jest bardzo wany.

    Z powodu duej zoonoci procesu uczenia WebSOMu tworzone przeze mapy mog by jedynie statycznymi mapami zbioru dokumentw uzyskiwanymi off-line. Dynamik konkretnej kwerendy uytkownika dodaje si do mapy podczas prezentacji on-line jako zbir punktw odpowiadajcych wynikowi kwerendy naoonych na pierwotn map.

    Stwierdzenie, czy okrelony dokument odpowiada na zapytanie uytkownika, czy nie, jest w duej mierze specyficzny dla okrelonej wyszukiwarki. Tym nie mniej mona wyrni pewne modele reprezentacji dokumentw i zapyta, ktre z grubsza charakteryzuj metodyk porwnania treci zapytania z treci dokumentu. Wyrnia si zasadniczo nastpujce klasy modeli:

    model boolowski (logiczny), (statystyczny) model przestrzeni wektorowej, model oparty na systemach uczcych si, model lingwistyczny (zorientowany na analiz morfologiczn, syntaktyczn

    i semantyczn tekstu). W modelu boolowskim dokument reprezentowany jest jako zbir (w matematycznym

    sensie) sw. Rne systemy mog dodatkowo uwzgldnia usuwanie sw ze stop-listy bd

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 31

    wydzielanie tematu sowa, utrzymywa dodatkowe informacje w indeksie, stosowa rne metody implementacji.

    Kwerendy s wyraane jako wyraenia boolowskie nad sowami poczonymi spjnikami logicznymi AND, OR, NOT, z wykorzystaniem nawiasw do okrelania kolejnoci wykonywania operacji.

    Model boolowski jest zdecydowanie najbardziej popularnym modelem z uwagi na to, e jest atwy do zrozumienia dla prostych zapyta i ma si pen kontrol nad wynikami stosujc zoone wyraenia logiczne. Implementacja jest stosunkowo prosta, jeli chodzi o identyfikacj termw, cho wymaga dodatkowych wspierajcych struktur np. indeksw w przd dla operacji negacji.

    Wad modelu jest jego dua sztywno: AND oznacza przymus obecnoci kadego z termw, OR tylko jednego. Nie mona powiedzie, e interesuje nas co najmniej m sw z listy n sw. Wyraenie zoonych zapyta moe by bardzo trudne. Nie bardzo da si sterowa liczb wyszukiwanych dokumentw. Nie mona te ich rankingowa, gdy wszystkie dokumenty speniajce kwerend speniaj j w rwnym stopniu. Trudno jest z uytkownikiem wsppracowa na zasadzie wzmocnienia przez uytkownika (czyli informacji o usatysfakcjonowaniu): nie wiadomo, jak najlepiej wcza nowe termy do uszczegawianej kwerendy, czy przez AND, czy przez OR.

    W modelu przestrzeni wektorowej zakada si istnienie pewnego sownika termw czy te listy termw indeksujcych. Termy indeksujce reprezentuj termy wane z punktu widzenia zastosowania. Termy uwaa si za nieskorelowane i tworz one przestrze wektorow. Dokument jak i kwerenda jest opisana jako liniowa kombinacja termw s wektorem w przestrzeni. Wektor opisujcy dokument jest na og normalizowany (aby mia dugo 1).

    Gdy wyszukujemy dokumenty w modelu wektorowym, zasadniczo mierzymy "odlego" midzy zapytaniem a dokumentem. Zwracamy dokumenty, ktre le "najbliej" kwerendy. Odlego moe posuy jako waga przy dynamicznym rankingu dokumentw. Najczciej stosuje si tzw. miar kosinusow (kosinus kta midzy wektorem dokumentu a wektorem zapytania).

    Probabilistyczne wyszukiwanie informacji opiera si na ocenie prawdopodobiestwa relewancji dokumentu dla uytkownika przy zadanej kwerendzie internauty. Zwykle wykorzystywana jest informacja zwrotna od uytkownika na podstawie kilku dokumentw, aby oceni relewancj innych dokumentw z bazy. Oceny prawdopodobiestwa dokumentw dokonuje si dla przykadowych dokumentw, przykadowych zapyta i rozszerza si t ocen na pozostae dokumenty.

    W dziedzinie metod wyszukiwania informacji opartych na bazie wiedzy mona zaobserwowa dwa zasadnicze kierunki: (1) prby modelowania wiedzy eksperta poszukujcego czego w bazie dokumentw, np. jego strategii poszukiwania i heurystyki sprzenia zwrotnego (Unified Medical Language System), (2) modelowanie uytkownika systemu, w podobny sposb, jak bibliotekarz opracowuje profil klienta. To podejcie sprawdza si nie we wszystkich dziedzinach.

    Baz wiedzy czsto generuje si w sposb automatyczny z uprzednio przygotowanych danych. Stosuje si m.in.:

    uczenie symboliczne (dajce reguy typu if-then), sieci neuronowe (np. sie neuronowa autorw, termw indeksujcych i dokumentw

    moe by wykorzystana do tworzenia nowych powiza midzy dokumentami i termami indeksujcymi),

    algorytmy genetyczne, wykorzystywane do: zmiany opisu dokumentu, modyfikacji klasteryzacji (grupowania) dokumentw,

  • BIULETYN MATURALNY NR 10

    Centralna Komisja Egzaminacyjna Wydzia Matur 32

    korygowania kwerendy na podstawie informacji zwrotnej o relewancji, optymalizacji sw kluczowych reprezentujcych relewantne dokumenty.

    Przyszo wyszukiwarek

    Przyszy rozwj wyszukiwarek bdzie niewtpliwie zwizany z rozwojem technicznym Internetu (podczenie nowych klas urzdze: telefonia komrkowa, sprzt audio/video, nowa klasa interfejsw: komunikacja gosowa), rozwojem usug oferowanych przez Internet (standaryzowane oferty usug business-to-business), a take z integracj wiedzy dziedzinowej oraz samouczenia si ze standardowymi mechanizmami wyszukiwania. Z uwagi na dostpno wiedzy w postaci tezaurusw czy innej jedynie dla okrelonych wycinkw wiedzy z pewnoci naley oczekiwa rozkwitu specjalistycznych narzdzi wyszukiwawczych. Jednake rozczonkowanie wyszukiwarek na wysoko specjalizowane serwisy nie bdzie zjawiskiem trwaym. Mona spodziewa si systemw czcych w sobie heterogeniczne podsystemy reprezentacji wiedzy z rnych dziedzin, kooperujce ze sob przy przetwarzaniu zapytania uytkownika. Wreszcie naley zda sobie spraw, i zapewnienie krtkiego, kilkusekundowego czasu reakcji na kade moliwe zapytanie nie jest moliwe na dalsz met, jeeli wyszukiwarka ma sprosta coraz bardziej zoonym wymaganiom. Jeeli uytkownik oczekuje dogbnej analizy i czas gra nieco mniejsz rol (np. jest gotw czeka kilka godzin, zanim system wyszuka dla niego odpowiedni ofert pracy), to moemy sobie pozwoli na tworzenie nowych klas wyszukiwarek, z zupenie innym rozoeniem akcentw na struktur czy zawarto bazy danych, na sposb pracy indeksera czy pajka. Naley take w dalszej kolejnoci oczekiwa odejcia od wycznie jednokrokowego wyszukiwania (zapytanie-odpowied) i przesunicia ciaru dziaania wyszukiwarek zwaszcza w dziedzinie business-to-business na kompleksowe wieloetapowe wyszukiwanie informacji (kwerenda-odpowied-automatyczne sformuowanie dodatkowych podcelw wyszukiwania-ponowne wyszukiwania-integracja odpowiedzi-odpowied). Przykadem byoby np. poszukiwanie kontrahentw do realizacji konkretnego zadania. Kontrahenci potencjalnie realizujcy zadanie gwne oferuj na og usugi czciowe, zakadajc realizacj zada pobocznych osobom trzecim. Aby usatysfakcjonowa uytkownika, wyszukiwarka powinna poszuka nie tylko gwnych kontrahentw, ale take koniecznych w realizacji podwykonawcw, gdy dopiero na bazie penego cigu koniecznych prac mona porwna oferty, zdecydowa o wykonalnoci zamierzenia itp.

    Ju dzi widzimy, i zasoby zgromadzone przez wyszukiwarki s wykorzystywane do innych celw ni wyszukiwanie dokumentw.

    Obecnie wyszukiwarki zasadniczo poszukuj dokumentw podobnych do kwerendy uytkownika. Ale uytkownik jest zainteresowany czsto nie caymi dokumentami, lecz odpowiedziami na konkretne pytania (Gdzie w pobliu kupi tanio buty? O ktrej zamykaj sklep obok mojego osiedla? Co to jest hamiltonian? Gdzie znajd prac z moimi kwalifikacjami?), ale take moe by zainteresowany eksploracj okrelonej dziedziny (Jakie s najnowsze trendy w rachunku rniczkowym? Jakie s kierunki bada w dziedzinie dezynfektantw relewantne dla zwalczania pryszczycy?). Wspczenie tworzone systemy odpowiadania na zapytania z jednej strony bazuj na dogbnej analizie struktury zapytania uytkownika, ale z drugiej na odpowiedziach wsppracujcej wyszukiwarki.

    Zasoby wyszukiwarek s wykorzystywane do bada lingwistycznych. Przykadowo identyfikowane s automatycznie dokumenty bdce tumaczeniami na rne jzyki i bada si czstotliwo uywania okrelonego sowa jako tumaczenie z danego jzyka obcego. W ten sposb identyfikuje si najczciej stosowane znaczenia okrelonego sowa.

  • BIULETYN MATURALNY NR 10

    Centralna