119
Модул ІІ. Справочно- информационна дейност Тема 4. Стратегии и техники за информационно търсене Направление 3. Услуги в модерната библиотека

2modul 4tema

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: 2modul 4tema

Модул ІІ. Справочно-информационна дейност

Тема 4. Стратегии и техники за информационно търсене

Направление 3. Услуги в модерната библиотека

Page 2: 2modul 4tema

Слайд 2

Тематичен обхват

Съдържа основни теоретични познания за средствата за търсене в интернет, за процеса на информационно търсене и на основните стратегии – търсене и преглеждане. Обяснява значението на информационното търсене за образователни, научни и други цели, на основните елементи на двата вида стратегии, на техните предимства и недостатъци. Описва теоретичен модел на информационно търсене, който може да се прилага като възможна рамка за собствено информационно търсене. Запознава с техники за намиране на нужната информация и дава практически препоръки за ефективно търсене.

Page 3: 2modul 4tema

Слайд 3

Цели

Знания за основните средства за търсене в интернет

Разбиране същността на процеса на информационно търсене

Разбиране същността на двете основни стратегии – търсене и преглеждане

Практическо приложение на стратегиите и техниките за информационно търсене

Page 4: 2modul 4tema

Слайд 4

Основни задачи

Да запознае с основните средства за търсене в интернет

Да запознае с основните етапи на процеса на информационно търсене

Да предложи теоретичен модел на информационно търсене, който може да се използва като модел за собствено търсене

Да запознае с основните и допълнителните техники, прилагани в стратегиите за информационно търсене

Да запознае с начините за получаване на резултатите

Да запознае с начините за оценка на намерената информация

Page 5: 2modul 4tema

Слайд 5

Очаквани резултати

Обучаемите трябва да придобият следните умения: да разбират процеса на информационно търсене и

ролята му за изследванията да могат да очертаят собствен модел на

информационно търсене да създават стратегия за търсене по конкретна

тема/предмет, като използват основните и допълнителните техники

да оценяват намерената информация да управляват намерената информация да представят намерената информация да използват онлайн бази данни да използват източниците в WWW

Page 6: 2modul 4tema

Слайд 6

Уроци1. Средства за търсене в интернет. Търсачки. Указатели2. Средства за търсене в интернет. Виртуални библиотеки. Бази данни.

Електронни каталози. Невидимият уеб3. Какво е информационно търсене? Модели на информационно

търсене4. Теоретичен модел на информационно търсене5. Стратегии за информационно търсене. Аналитични стратегии6. Стратегии за информационно търсене. Преглеждане7. Основни техники за търсене: по ключови думи; маскиране; търсене с

булеви оператори8. Допълнителни техники за търсене. Използване на скоби.

Контекстови оператори9. Допълнителни техники за търсене. Използване на цифрови

оператори; използване на тезауруси и индекси; търсене по фраза, в определено поле

10.Задачи към уроци 7 – 911.Други техники за търсене. Комбинирано търсене. Търсене по

цитиране. Текущо информиране. Контролиране процеса на търсене12.Особености на информационното търсене в интернет13.Основни стъпки при използване на търсачките и указателите14.Получаване на резултатите. Проучване. Управление. Оценка

Page 7: 2modul 4tema

Урок 1. Средства за търсене в интернет. Търсачки. Указатели

Тема 4. Стратегии и техники за информационно търсене

Page 8: 2modul 4tema

Урок 1. Слайд 8

Новата среда

Днес библиотеките работят в нова среда, която е резултат от действието на новите ИКТ. Тази среда промени както концепцията за библиотеката, така и ролята на библиотекарите.Промениха се още: Средствата, в които търсим информация – голяма

част от тях са електронни информационни ресурси. Затова е нужно да познаваме структурата и информационните им възможности, както и начините за работа с тях – те налагат познаване на специални стратегии и техники за търсене.

Потребителите – промениха се както техните информационни нужди, така и тяхното поведение. Появи се и напълно нова категория – дистанционни потребители, които също трябва да се познават.

Page 9: 2modul 4tema

Урок 1. Слайд 9

Средства за търсене

Интернет, и по точно WWW, е източник на огромна информация, в която лесно можем да се загубим. Документите в уеб не се индексират по стандартен начин, затова намирането на информация е трудно.

За да се ориентираме в интернет, бяха създадени специални средства за търсене. Така информационните източници, чийто електронен адрес не знаем, могат да бъдат открити. Но за да бъде търсенето ефективно, е нужно да знаем какви средства за търсене има и как те действат.

Принципите на действие на средствата за търсене се разглеждат в уроците в направление ИКТ. Тук накратко ще посочим действието им от гл.т. на информационното търсенето в тях.

Page 10: 2modul 4tema

Урок 1. Слайд 10

Основни средства

Средствата за търсене в интернет са софтуер за намиране на бази данни от документи. Разликите между средствата за търсене произтичат основно от начина, по който се събира и индексира информацията в базите данни – автоматично или ръчно.

Page 11: 2modul 4tema

Урок 1. Слайд 11

Индексиране

Два основни начина за индексиране: автоматично пълнотекстово индексиране (full

text indexing) – всяка дума от уеб страницата се прибавя към базата данни и по нея може да се търси. Това се прави от специални програми, които обхождат страниците, а някои – и всички следващи линкове към тях

индексиране от хора – експерти, които оценяват сайтовете, подбират ги и тогава ги индексират

Page 12: 2modul 4tema

Урок 1. Слайд 12

Основни видове средства за търсене

Това определя двата основни вида средства – търсачки, при които тази дейност извършват роботи/паяци, които представляват специален софтуер, и такива, при които тази дейност се извършва от хора (robot-generated databases; human-selected databases).

Page 13: 2modul 4tema

Урок 1. Слайд 13

Начини на търсене

Това определя и начина, по който потребителят “говори“ на базата данни.

Два основни начина: като написва дума в кутийката за търсене (в

търсачките)

като избира рубрика от списъка на предметните рубрики (в указателите). Съвременните указатели също дават възможност за изписване на дума, за препоръчване – след като сме избрали рубрика

Средствата за търсене по съдържание се разделят на общи и специализирани.

Page 14: 2modul 4tema

Урок 1. Слайд 14

Търсачки

Търсачките позволяват да се намери нужната информация, без да се знае адресът на документите.

Състоят се от: софтуер (робот, паяк), който обикаля уеб и открива нови сайтове подсистема, която автоматично поддържа база от данни за

ресурсите (техните адреси и съдържание) и индексира тяхното съдържание, въз основа на получените от паяка сведения

потребителски интерфейс – под формата на уеб страница, чрез който ползваме търсачката, задаваме ключовите думи и получаваме отговора

Не са организирани по предметни категории; страниците са подредени от компютърен алгоритъм.

Page 15: 2modul 4tema

Урок 1. Слайд 15

Търсачки

За разлика от виртуалните библиотеки и указателите, в търсачките се включват всички уеб страници – без подбор. Това са класическите търсачки. Те могат да търсят в WWW, но също и в новинарски бази (news groups). Когато търсим в търсачката, ние търсим в базата данни, която тя е изградила, не в целия интернет; там можем да намерим документи, съдържащи думите, които сме задали

Популярни търсачки: AltaVista,Google,Teoma,Yahoo! HotBot, A9.com, Northern Light, Lycos

Метатърсачки – позволяват едновременно търсене в няколко средства

Page 16: 2modul 4tema

Урок 1. Слайд 16

Указатели (Directories)

Представляват списъци на уеб ресурси, включени в предметни рубрики/категории. Рубриките са подредени в йерархичен ред; те не са стандартизирани и зависят от обхвата на отделния указател. Макар първоначално да са замислени само за преглеждане на ресурсите, включени в предметните рубрики, те вече позволяват комбиниране на предметните рубрики с ключови думи.

Page 17: 2modul 4tema

Урок 1. Слайд 17

Указатели Някои от указателите са анотирани и подложени на предварителна преценка. Търси се само в това, което се вижда – заглавия, дескриптори, предметни рубрики – не по текст от уеб страницата, затова при търсене трябва да се използват широки или общи термини.

Page 18: 2modul 4tema

Урок 1. Слайд 18

Характеристика на указателите

За да характеризираме указателите, трябва да отговорим на следните въпроси: кой подбира включените уеб ресурси; кой категоризира уеб страниците; как се появяват резултатите – азбучно подредени, по степен на релевантност или по тип на уеб страницата; дали са ранжирани ресурсите, анотирани ли са?

Page 19: 2modul 4tema

Урок 1. Слайд 19

Характеристика на указателите

Всеки указател се различава от останалите по нивото на контрол в неговото управление. Някои имат нисък контрол, като разчитат само на създателите на уеб страниците, включени в указателя – както на качеството им, така и на посочването на областта, за която се отнасят. Други са по-строги. Някои създатели/издатели дават подробни анотации на страниците, които могат да са описателни, оценъчни или и двете.

Page 20: 2modul 4tema

Урок 1. Слайд 20

Предимства

Фактът, че се използва човешки фактор при създаването им, определя слабите и силните страни на указателите.

Предимства: съдържат много по-малко ресурси от търсачките, когато се търси по общ проблем; те ранжират, анотират и категоризират подбраните ресурси, което увеличава вероятността за намиране на релевантни резултати.

Page 21: 2modul 4tema

Урок 1. Слайд 21

Недостатъци

Недостатъци: произволно йерархично подреждане; не много честа актуализация; субективност при ранжирането и анотирането. Напр. едни и същи теми могат да се намерят в различни рубрики в различните указатели.

Page 22: 2modul 4tema

Урок 1. Слайд 22

Откриване на информация в указателите

Два начина за откриване на информация в указателите: Browsing and Searching – преглеждане по предметна рубрика и търсене по ключова дума в рубриката.

Преглеждане – предметната категория може да доведе до ново подниво в йерархията, където да изберете нов предмет или списък с предмети. Тогава може да се наложи да промените първоначалното търсене и да зададете по-тясно запитване.

Page 23: 2modul 4tema

Урок 1. Слайд 23

Откриване на информация в указателите

Търсене по ключова дума – ако е трудно да преценим в коя предметна рубрика да търсим. Но това търсене е различно от търсенето в търсачките. Ако търсим в указател, ние търсим само в ресурсите, вкл. в него. В някои указатели (Yahoo) не търсим в пълния текст на уеб страниците, а само думите от URLs, заглавията на уеб страниците и анотациите.

Page 24: 2modul 4tema

Урок 2. Средства за търсене в интернет. Виртуални библиотеки. Бази данни. Електронни каталози.

Невидимият уеб

Тема 4. Стратегии и техники за информационно търсене

Page 25: 2modul 4tema

Урок 2. Слайд 25

Виртуални библиотеки Виртуалните библиотеки са подобни на указателите и

представляват колекция от уеб ресурси, подбрани и организирани по предмет от хора, в повечето случаи библиотекари.

Предметите са подредени йерархично, от най-общия към най-тесния. Това е подобно на организацията в традиционните библиотеки, оттам е и името. Все повече виртуални библиотеки предлагат търсене по ключови думи, за да се избегне прелистването на различни предметни списъци, т.е. имат кутийка, където пишем термина за търсене. Резултатите предлагат заглавие, кратко описание и адрес на уеб страниците или др. документи, а често и хипервръзки. Те са по-специализирани от указателите.

Page 26: 2modul 4tema

Урок 2. Слайд 26

Виртуални библиотеки

Виртуалните библиотеки разчитат още повече на подбора и контролирането на ресурсите. Те са организирани по начин, който позволява да се преодолее хаотичната природа на интернет и напомнят организацията на една библиотека.

Page 27: 2modul 4tema

Урок 2. Слайд 27

Услуги на виртуалните библиотеки

Насочват към три основни типа ресурси: Предметни пътеводители (subject guides) –

уеб ресурси, които съдържат хиперлинкове към сайтове по определен предмет

Справочници (reference works) – енциклопедии, речници и др.

Специализирани бази данни (specialized databases)

Основна услуга – ”Ask a question” – отговори на библиотекари на въпроси, зададени по електронна поща

Page 28: 2modul 4tema

Урок 2. Слайд 28

По-важни адреси

Internet Public Library: http://www.ipi.org/ – като структура е подобна на традиционната библиотека; достъпна от 1995 г. По проект на Университета в Мичиган. Целта е всички предлагани услуги да се осъществяват чрез интернет

WWW Virtual Library – 100 основни рубрики, всяка от тях препраща към отделен уебсайт, където се поддържа списък на ресурси по нея

BULB Subject Links: http://bubl.ac.uk/ Whole Internet Catalog: http://www.gnn.com/gnn/wic/ Andy Holt Virtual Library – основно по хуманитарни науки и

изкуство

Page 29: 2modul 4tema

Урок 2. Слайд 29

Бази данни

Дефиниция: Организирана колекция от компютъризирана информация – книги, статии, графика, мултимедия и др., предназначена за търсене и намиране на информация. Предоставя възможност за търсене едновременно по няколко критерия. Базите данни се изграждат и поддържат от компютър чрез специален софтуер, известен като система за управление на БД – СУБД. Всяка БД се състои от записи. Всеки запис е съвкупност от данни за един обект (книга, статия…) по определени показатели, наричани полета (поле автор, поле заглавие). Запитването се формулира на специален език – информационно-търсещ език (ИТЕ).

Всички записи в колекцията са интегрирани записи – отделните елементи се включват в записи, записите – във файлове, а те – в БД. Но БД включва не само отделните файлове, а също речник, както и описание на взаимоотношенията между елементите.

Page 30: 2modul 4tema

Урок 2. Слайд 30

Структура

Всяка база данни се състои от:

1. Записи, представени под формата на линеарни файлове. Всяко поле има етикети на полета.

2. Основен индекс (Basic Index) – списък на всички думи и фрази, по които може да се търси (в загл., в абстракта или в целия текст). Индексират се думите, затова се използват оператори за свързването им. Всяка част от записа се идентифицира с т.нар. етикети или тагове на отделните полета (Field labels, field tag) – суфикс/код от две букви, който идентифицира полето. Може да се търси само по думата или чрез код. Използва се, за да ограничи термините от конкретното търсене или група от търсения (set) в определено поле/полета. В основния индекс се включват съдържателните характеристики на документа – заглавие, ключови думи и др.

Напр. Бюджет/ti – искаме посочената дума да е в заглавието.

Page 31: 2modul 4tema

Урок 2. Слайд 31

Структура на БД – продължение

3. Допълнителен индекс (Additional Index) – отнася се до формалните характеристики на документа – година на публикуване, вид на документа и др. Данните нямат връзка със съдържанието на документите. Индексирането е по фрази, затова връзки между тях не са нужни. Тук етикетите се наричат префикси (prefixes).

Т.е. In=term, където In e етикетът на полето, а term е терминът за търсене, напр. PY=2009.

Всяка база данни има и т.нар. Bluesheets/datasheets – детайли, описание на БД – тематичен обхват, видове документи, опции за търсене и др.

Page 32: 2modul 4tema

Урок 2. Слайд 32

Режими

Всяка БД има два режима: търсене (основно и сложно) и преглеждане (по тезауруси и предметни рубрикатори)

Подходящи за търсене в БД са аналитичните стратегии

Page 33: 2modul 4tema

Урок 2. Слайд 33

Библиотечни каталози

Традиционно библиотеките разкриват съдържанието на колекциите си чрез каталози. Сега традиционните записи в повечето каталози са конвертирани и са създадени онлайн публични каталози, OPACs.

Характеристики: Предлагат информация за книги и периодични издания в

библиотеката/библиотеките

Различни са от търсачките – не индексират всяка дума от всеки документ във фонда. Индексират записите в библиотечните колекции

Всеки запис може да бъде открит чрез търсене по определено поле

Вече е възможно пълнотекстово каталогизиране. Все повече библиотеки каталогизират пълнотекстовите версии на списанията в БД, за които са абонирани

Възможно е търсенето и в специалните колекции

Page 34: 2modul 4tema

Урок 2. Слайд 34

Развитие на функциите на библиографското търсене чрез различните поколения OPAC

ЕК възникват от локалните АИС на библиотеките. По-късно се добавя интерфейс за публичен достъп, което променя взаимодействието ползвател – библиограф. Първо поколение ЕК – търсенето е ограничено до основните

елементи на библиографския запис, а резултатът е списък със записи, обикновено нестандартизирани.

Второ поколение ЕК – търсене и по факултативните/незадължителни елементи на БЗ, които стават точки за достъп (дата и място на издаване, език, тип издание и т.н.). Разширяват се параметрите за търсене чрез възможност за търсене по ключови думи и предметни рубрики; използване на булеви оператори. Резултатите са в стандартизирана форма с възможност за избор на формата за показване (кратко/пълно БО). Интерфейс за неопитни и опитни ползватели.

Page 35: 2modul 4tema

Урок 2. Слайд 35

Функции на ЕК – продължение

Трето поколение ЕК – то, а следователно и автоматизираното търсене, се характеризира с появата на средства за помощ; достъп до речници; достъп до контролни/авторитетни файлове.

Четвърто поколение ЕК – представяне на ЕК в уеб среда и съответно възможност за ползване от дистанционни потребители. Възможност за унифицирано представяне на БЗ от средства, базирани на различни платформи. “Насищане” на БЗ – включване на линкове към допълнителни ресурси, едновременно търсене в различни средства и др. ЕК става основно средство и за навигация!

Page 36: 2modul 4tema

Урок 2. Слайд 36

Невидимият уеб

Категории информация в уеб: Видимият уеб – страниците, които се индексират от

търсачките. За целта използваме подходящи търсачки и указатели.

Невидимият уеб – тази категория включва съдържанието на сайтовете, чието съдържание е достъпно за ползвателите, но само ако достигнем директно до сайта. Тук са някои списания, вестници, справочници и др., както и много бази данни – правни, медицински, финансови и др. За да достигнем до тях, трябва да ги открием! Съдържанието на невидимия/дълбокия/скрития уеб е многократно по-голямо от това на видимия!

Платени бази данни – необходимо е да имаме парола или IP адреси, за да достигнем до тях.

Page 37: 2modul 4tema

Урок 3. Какво е информационно търсене? Модели на

информационно търсенеТема 4. Стратегии и техники за

информационно търсене

Page 38: 2modul 4tema

Урок 3. Слайд 38

Модели на информационно търсене За да отговорят на новите нагласи на потребителите, специалистите разработиха различни модели за информационно търсене. Най-разпространените са стандартен (статичен), познавателен и динамичен модел.

Page 39: 2modul 4tema

Урок 3. Слайд 39

Стандартен модел

Стандартен (класически, статичен) модел на информационно търсене – основава се на наблюдения върху поведението на хората, които участват в процеса.

Един от най-известните създадели на този модел – Marchionini – го определя така: “процесът на информационно търсене е по същество решение на определен проблем. Включва разпознаване и интерпретиране на информационния проблем, съставяне на план за търсене, провеждане на търсенето, оценка на резултатите и повтаряне на търсенето, ако е нужно.”

Page 40: 2modul 4tema

Урок 3. Слайд 40

Стандартен модел

Процесът се състои от: признаване/идентифициране на

информационната нужда приемане на предизвикателството и

предприемане на действия за задоволяване на информационната нужда

формулиране на проблема изразяване на информационния проблем към

търсещата система проучване на резултатите преформулиране на проблема и неговото

изразяване използване на резултатите

Page 41: 2modul 4tema

Урок 3. Слайд 41

Познавателен модел

Познавателен (когнитивен) модел – основава се на по-обща перспектива – как хората действат в заобикалящия ги свят; човекът трябва да има обща идея за това, което търси, и цел, която да постигне. Той използва свой въображаем модел на ситуацията, за да реши какви действия да предприеме, кои обекти да изследва и кого да привлече, за да постигне целта си. Този личен въображаем модел е динамично вътрешно представяне на проблемната ситуация. Моделът включва две фази: първа, изпълнение и втора, оценка, проверка на резултатите.

Page 42: 2modul 4tema

Урок 3. Слайд 42

Познавателен модел

Познавателният модел е подобен на стандартния – признаването на информационната нужда е сходно с формулирането на целта. Формулирането на проблема и изразяването на информационната нужда чрез информационен въпрос или навигирането в системата за търсене кореспондира с изпълнението на действия, а проучването на резултатите кореспондира с оценката в този модел.

Page 43: 2modul 4tema

Урок 3. Слайд 43

Динамичен модел

Стандартният модел приема, че: информационната нужда е статична процесът е успешно преформулиране на

въпроса, докато не бъдат открити всички релевантни документи

Но наблюденията показват, че нуждите се променят по време на взаимодействие с търсещата система. Хората научават нещо по време на търсенето и формулират нови въпроси. Това “пропуква” стандартния модел. Затова специалистите предлагат динамичен модел (Bates, 1989) на информационно търсене, който има две основни части.

Page 44: 2modul 4tema

Урок 3. Слайд 44

Динамичен модел – части

Първа – обхваща процеса на четене и изучаване на информацията, получена по време на процеса на търсене, на информационните нужди и на последващите ги информационни въпроси. Изучаването на информацията едностранно може да доведе до нова, неочаквана посока. Целта може да се постигне частично, както и да доведе до нови цели.

Втора – информационните нужди не са задоволени с определени намерени документи, а по-скоро със серия от документи, получени и проучени по време на търсенето. Това е в контраст с допускането, че целта се постига с първоначален набор от намерени документи и че те точно отговарят на информационната нужда.

Page 45: 2modul 4tema

Урок 3. Слайд 45

Основни разлики

Стандартен модел – информационната нужда е статична, променят се въпросите, за да бъдат открити всички релевантни документи.

Динамичен модел – информационната нужда не е единствена и непроменяща се; тя се променя в процеса на търсене. Резултатът от информационното търсене не е наборът от документи, намерени в резултат на един въпрос, а по-скоро документи, които са намерени “в крачка”, в резултат на нови и нови въпроси, възникнали по време на процеса на търсене. Откриването на нови документи поставя и нови въпроси. Затова другото название на този модел е “развиващо се търсене” (evolving search). Динамичният модел се състои от различни, но взаимосвързани търсения, а постигната цел поставя нови цели, които водят търсенето в нова посока.

Page 46: 2modul 4tema

Урок 3. Слайд 46

Разлики

Разликите в етапите на търсене в двата модела са малки, но динамичният модел отговаря по-точно на практиката на провеждане на търсенето!

Page 47: 2modul 4tema

Урок 4. Теоретичен модел на информационно търсене

Тема 4. Стратегии и техники за информационно търсене

Page 48: 2modul 4tema

Урок 4. Слайд 48

Информационно търсене – определение

Информационното търсене се определя като набор от действия, методи и процедури, позволяващи подбор на определена информация от даден масив с информация или още: процес на откриване и подбор на информация по предварително зададени признаци и нейното предоставяне на потребителя.

Информационното търсене е динамичен процес, в който можем да обособим 8 основни стъпки.

Page 49: 2modul 4tema

Урок 4. Слайд 49

Основни стъпки

1. Установяване на информационна потребност2. Признаване и осмисляне на информационен

проблем3. Дефиниране на проблема4. Избор на средства за търсене5. Формулиране на информационен въпрос6. Изпълнение на търсенето7. Проучване на резултатите8. Извличане на информация9. Обратна връзка. Ново търсене или

преустановяване на търсенето

Page 50: 2modul 4tema

Урок 4. Слайд 50

Информационно търсене – части

Три основни части: Разбиране План и изпълнение Оценка и използване

Page 51: 2modul 4tema

Урок 4. Слайд 51

Разбиране

Установяване на нуждата от информация Приемане и осмисляне на информационния

проблем Дефиниране на проблема

Page 52: 2modul 4tema

Урок 4. Слайд 52

План и изпълнение

Избор на средство/средства за търсене Формулиране на информационния

въпрос/въпроси Изпълнение Проверка

Page 53: 2modul 4tema

Урок 4. Слайд 53

Оценка и използване

Извличане/получаване на информацията Проверка Ново търсене (ако е необходимо), за което се

използва намерената информация от началното търсене

Край на търсенето

Page 54: 2modul 4tema

Урок 5. Стратегии за информационно търсене.

Аналитични стратегии Тема 4. Стратегии и техники за

информационно търсене

Page 55: 2modul 4tema

Урок 5. Слайд 55

Какво е стратегия?

Какво е стратегия – подходът, който избираме като потребител, за да извършим информационно търсене, или наборът от тактики, които прилагаме и контролираме.

Стратегиите описват общия подход. Тактиките са индивидуалният избор, направен по време на информационното търсене. Затова са много по-конкретни.

Page 56: 2modul 4tema

Урок 5. Слайд 56

Видове стратегии

Електронните бази данни работят по избран алгоритъм, затова експертите по информационно търсене разработват аналитични стратегии, които са общи или специализирани, и стратегии за преглеждане, които са интерактивни и неформални.

Page 57: 2modul 4tema

Урок 5. Слайд 57

Видове стратегии

Аналитичните стратегии са планирани, целеви, формални, състоят се от отделни части. Стратегиите за преглеждане са конкретни (според случая, затова са неформални) и продължаващи.

Page 58: 2modul 4tema

Урок 5. Слайд 58

Видове аналитични стратегии

1. “Изграждане на блокове” (“Building blocks”)2. “Успешно разлагане” (“Successive fractions”)3. “Нарастване на перличката” (“Pearl-growing”)4. “Интерактивно сканиране” (“Interactive scanning”)

Page 59: 2modul 4tema

Урок 5. Слайд 59

“Изграждане на блокове”

Състои се от: изграждане на блокове (групи, концепции), в

които изброяваме синоними на основния термин

свързване на блоковете с оператори

Page 60: 2modul 4tema

Урок 5. Слайд 60

“Успешно разлагане”

При тази стратегия започваме с голям брой записи, които постепенно редуцираме – чрез допълнителни термини, добавени към основното търсене, булеви оператори, лимитиране по определени критерии. Т.е. подхождаме към проблема по-общо и използваме успешни “стъпки”, за да стесним търсенето. Тази стратегия е особено подходяща при информационни системи, състоящи се от огромен брой документи.

Page 61: 2modul 4tema

Урок 5. Слайд 61

“Нарастване на перличката”

Тази стратегия започва с търсене по термин от най-релевантния документ – “перличка” (“the pearl”) или от малка група документи, които го съдържат. Терминът може да бъде подсказан от потребителя или трябва да го намерим ние. При търсенето използваме характеристиките на този документ, за да открием още релевантни резултати (напр. думи от заглавието, сходни термини и др.).

Page 62: 2modul 4tema

Урок 5. Слайд 62

“Нарастване на перличката”

Разновидност е т.нар. Citation pearl growing – когато не знаем коя точно ключова дума/термин да използваме, правим търсене с най-общата ключова дума и от показаните цитирани документи избираме термини за търсене.

Page 63: 2modul 4tema

Урок 6. Стратегии за информационно търсене.

ПреглежданеТема 4. Стратегии и техники за

информационно търсене

Page 64: 2modul 4tema

Урок 6. Слайд 64

“Интерактивно сканиране” Сканиране (Interactive scanning) – макар да е определяна като аналитична, тази стратегия е по-близка до преглеждането, “прелистването” и изисква взаимодействие между търсещия и системата. Започва се с голям брой намерени документи, релевантни на темата, като постепенно ги “пресяваме” по автор, издател, термини и др., за да отпаднат част от тях. Изисква се известно познаване на проблема, както и честа смяна на стратегията.

Page 65: 2modul 4tema

Урок 6. Слайд 65

Преглеждане

Какво е “преглеждане” (Browsing)?Това е електронният еквивалент на преглеждането в традиционните каталози на библиотеките или на библиографиите към документите. В интернет това е навигирането от сайт към сайт.

Page 66: 2modul 4tema

Урок 6. Слайд 66

Преглеждане

Основни предимства: директен контрол върху процеса на търсене

– лесно можем да го променим възможност да получим ново знание, докато

преглеждаме документите Недостатък – отнема много време, а и не

всички средства имат тази функция. Освен това – лесно можем да се отклоним и “загубим”, да получим излишна информация, а да пропуснем релевантна

Page 67: 2modul 4tema

Урок 6. Слайд 67

Кога е подходящо да използваме преглеждането?

Когато: трябва да направим общ преглед по темата трябва да получим обща представа за

характеристиката на документ искаме да научим нещо ново по непознат проблем искаме да се информираме за новости по даден

проблем искаме да наблюдаваме процеса

не владеем аналитичните стратегии

Стратегията е особено подходяща при бази данни, които нямат тезаурус. Не всички системи поддържат тази функция, но тя е особено подходяща за интернет.

Page 68: 2modul 4tema

Урок 6. Слайд 68

Видове преглеждане

Сканиране (Scanning) – то може да бъде линейно (преглеждаме заглавия, за да намерим релевантни) и селективно (преглеждаме само предметни рубрики, цитирания в документите и др.)

Наблюдение (Observation) – не изисква интерпретация или обсъждане на документите, но трябва предварително да търсим в подходяща предметна област

Page 69: 2modul 4tema

Урок 6. Слайд 69

Видове преглеждане

Навигация (Navigation) – т.е. избор на “път”. Най-характерен пример е навигирането/сърфирането (”surfing”) в интернет, т.е. следването на линкове. В базите данни има смисъл, ако самите те имат линкове към документите

Мониторинг (Monitoring) – докато търсим документи по определена тема, попадаме на сродни, но също релевантни

Page 70: 2modul 4tema

Урок 7. Основни техники за търсене

Тема 4. Стратегии и техники за информационно търсене

Page 71: 2modul 4tema

Урок 7. Слайд 71

Основни техники за търсене

Дефинирането на темата става след разговор с потребителя (справочно интервю). От темата зависи какви информационни източници ще изберем, за да търсим в тях.След уточняването на темата и определянето на източниците, прилагаме основни техники за търсене.Те са: Търсене по ключови думи Маскиране Търсене с булеви оператори

Page 72: 2modul 4tema

Урок 7. Слайд 72

Етапите

Ключовите думи трябва да бъдат подходящи за средствата, в които търсим. След избора на ключови думи прилагаме техники за обхващане на всички форми на думите и за свързването им – така можем да получим резултати, които най-точно отговарят на темата, по която търсим. След прилагане на основните техники, можем да приложим и допълнителни.

Прилагането на техниките за търсене се осъществява в условията на два основни режима на търсене – основен и за напреднали.

Page 73: 2modul 4tema

Урок 7. Слайд 73

Търсене по ключови думи

Избор на ключови думи Съставяне на списък от ключови думи, който

включва синоними, варианти на думи, думи с различен правопис, съкращения и абревиатури

Page 74: 2modul 4tema

Урок 7. Слайд 74

Контрол Контролът върху броя на резултатите е основна цел на доброто информационно търсене. То се осъществява чрез: маскиране прилагане на булеви оператори

Page 75: 2modul 4tema

Урок 7. Слайд 75

Маскиране

Маскирането (поставянето на т.нар. маски) е техника, която осигурява намирането на максимален брой релевантни записи; то увеличава броя на резултатите. Прилагането на тази техника се свежда до поставяне на произволен символ/знак след корена на думата, за да се обхванат всички нейни форми и съответно да открием резултати, в които те се съдържат. Най-използваните символи са *, $, #, ?. Някои бази данни имат автоматично маскиране!

Page 76: 2modul 4tema

Урок 7. Слайд 76

Видове маскиране

Крайно (дясно) – бир$ – обхваща бира, бири, бирен и т.н. Вътрешно – позволява буквата, която заместваме, да варира.

Заместваме само един знак! Напр. Чувств?ам открива чувствам и чувствувам

Начално (ляво) Открито/отворено – с една маска заместваме няколко букви;

т.е. няма значение колко са буквите след корена на думата Ограничено – заместваме максимум една допълнителна

буква, напр. котк? намира котка, котки, но не котката. Другият вид ограничено – максимум брой букви, равни на броя на знаците (?), напр. компют?? намира компютър, компютри, но не компютъризация

Page 77: 2modul 4tema

Урок 7. Слайд 77

Маскиране

Едносрични думи не се маскират!

Вариант на маскирането е прилагането на т.нар. wildcard – т.е. поставянето на един или няколко знака (най-често ?), за да заместим една или няколко букви в думата. Така обхващаме всички думи с различен правопис или различни форми. Използва се най-често като маска, т.е. в края на думите, но може да се постави и в средата.

Page 78: 2modul 4tema

Урок 7. Слайд 78

Булеви оператори

Те стесняват или разширяват резултата от търсенето в зависимост от това, кой от тях прилагаме. Булевите оператори са: И, Или, Не. И – свързва две и повече думи така, че в списъка на

резултатите излизат описания, които съдържат всички указани думи – напр. пътуване И Европа – съдържа описания, които включват и двете думи, не всяка от тях поотделно.

Или – в резултатите се съдържа поне една от посочените думи, напр. колеж ИЛИ университет – излизат описания, които съдържат поне една от двете думи. Този оператор разширява търсенето.

Page 79: 2modul 4tema

Урок 7. Слайд 79

Булеви оператори

Не – изключваме едната от думите – напр. телевизия НЕ кабелна – не включва описания за кабелна телевизия, а резултати с единия или другия термин.

Съществуват и т.нар. псевдобулеви оператори – това са + и –. Първият отговаря на И, вторият – на НЕ. Използват се главно при търсачките.

Page 80: 2modul 4tema

Урок 8. Допълнителни техники за търсене. Използване на скоби.

Контекстови оператори

Тема 4. Стратегии и техники за информационно търсене

Page 81: 2modul 4tema

Урок 8. Слайд 81

Използване на скоби (nesting)

Прилагането на тази техника променя реда на изпълнение на операторите. Поставяме израза, който търсим, в скоби и събираме няколко концепции. Така системата търси израза в скоби най-напред.

Page 82: 2modul 4tema

Урок 8. Слайд 82

Контекстови оператори (оператори за близост)

Използват се между два термина за търсене, за да покажат, че те трябва да се срещат в резултата на определено разстояние един от друг.

Контекстовите оператори имат два компонента: буква, която означава посоката цифра, която означава разстоянието между

думите

Wn – W означава, че думата след оператора трябва да стои n (или х) броя думи след думата, която предхожда оператора. Думите се срещат в реда, в който са въведени!

Page 83: 2modul 4tema

Урок 8. Слайд 83

Пример

Пример: качествени W3 предавания – в резултата думата предавания се среща три или по-малко думи след думата качествени

Wx – думи с x броя разстояние между тях в реда, в който са въведени!

Пример: Иван W2 Вазов – в резултата ще получим Иван Вазов, Иван Минчов Вазов, Иван М. Вазов, но няма да получим Вазов Иван

Page 84: 2modul 4tema

Урок 8. Слайд 84

Контекстови оператори

Nn – N означава, че думите от двете страни на оператора трябва да се срещат в n думи една от друга и в двете посоки на записа!

Page 85: 2modul 4tema

Урок 8. Слайд 85

Примери

Примери: спомени N5 общи – това значи, че получаваме резултати, в които думите спомени и общи се срещат в текста в пет или по-малко думи една от друга в двете посоки

Nx – телевизия N2 насилие – това значи, че ще получим резултати, в които между двете думи има една или две други думи, но не повече, а редът на въвеждането няма значение

Page 86: 2modul 4tema

Урок 8. Слайд 86

Други контекстови оператори

При търсачките се използват следните контекстови оператори: Near – за думи, разположени в определена

близост, на определено разстояние Adj (adjacent to) – думите са в непосредствена

близост, без значение от реда

Page 87: 2modul 4tema

Урок 8. Слайд 87

Приложение Контекстовите оператори се използват между

две думи, не между дума и израз в скоби. Булевите оператори се използват за свързване

на отделни концепции, а контекстовите – при свързване на ключови думи във фраза, като определят в каква последователност и на какво разстояние една от друга да са ключовите думи. По сила на изпълнение булевите оператори са след контекстовите.

Page 88: 2modul 4tema

Урок 9. Допълнителни техники за търсене. Използване на цифрови оператори. Използване на тезауруси и индекси.

Търсене по фраза. Търсене в определено полеТема 4. Стратегии и техники за

информационно търсене

Page 89: 2modul 4tema

Урок 9. Слайд 89

Цифрови (numeric) оператори

Тези оператори са следните:< > = или комбинации от тях (по-голямо или равно; по-малко или равно)

По сила на изпълнението операторите са:1. Скоби2. Булеви оператори в следния ред: Не; И;

Или 3. Контекстови оператори4. Цифрови оператори

Page 90: 2modul 4tema

Урок 9. Слайд 90

Използване на тезауруси и индекси

Възможно е думата, която сме избрали, да не даде очакваните резултати. Затова прилагаме друга техника – използване на термини или предметни рубрики, които самата база данни използва, за да характеризира дадена тема. Тези предметни рубрики се намират в тезауруса, който повечето бази данни поддържат – т.е. списък от йерархично подредени термини, които изглеждат като “дърво на предмета”. Това са термини с по-широк обхват, които са сходни термини с по-тесен обхват. Те могат да са във връзка и с други термини от тезауруса.

Page 91: 2modul 4tema

Урок 9. Слайд 91

Индекси

Индексите са списъци на всички думи, по които може да се търси в дадена база данни. Те са полезни, защото в тях може да се провери правопис на думата, изписване на имена, на заглавия на списания и т.н.

Page 92: 2modul 4tema

Урок 9. Слайд 92

Търсене по фраза

Освен търсене по ключови думи, често се търси по фрази. За целта думите за търсене се свързват, да може системата да ги схване именно като фраза, а не двете или повече думи поотделно, където и да е в текста. В търсачките прилагаме поставянето на израза в кавички, за да бъде разбран от системата като фраза.

Page 93: 2modul 4tema

Урок 9. Слайд 93

Търсене в определено поле/полета

Това е друг начин за ограничаване на резултатите. Основава се на факта, че отделните елементи в библиографските записи на документите са организирани в отделни полета, по които може да се търси. (Най-разпространените са: автор, заглавие, сигнатура, език, анотация, дата на публикация, издател, серия, класификационен индекс, предметна рубрика, ключова дума)

Page 94: 2modul 4tema

Урок 9. Слайд 94

Търсене в определено поле/полета

При търсенето в определени полета използваме префикси (наричат се още етикети на полета), напр. автор – ав; заглавие – загл. След префикса се поставя знак за равенство.

При търсенето в търсачките се търси в различните структурирани области/полета на уеб документа – заглавие, URL адрес, домейн и др.

Page 95: 2modul 4tema

Урок 9. Слайд 95

Търсене в определено поле/полета

Например, когато търсим по тема, получаваме много резултати, повечето от различни автори. Можем обаче да ограничим търсенето до определен автор, който ни интересува; или да намерим всички документи от един автор, без значение от техния предмет.

Ако има много автори с едно и също име – търсим и по собственото име.

Page 96: 2modul 4tema

Урок 10. Задачи към уроци 7 – 9

Тема 4. Стратегии и техники за информационно търсене

Page 97: 2modul 4tema

Урок 11. Други техники за търсене. Комбинирано търсене. Търсене по цитиране. Текущо информиране.

Контролиране процеса на търсенеТема 4. Стратегии и техники за

информационно търсене

Page 98: 2modul 4tema

Урок 11. Слайд 98

Търсене по цитиране

За целта са създадени специални бази данни. Търсенето е по автор, заглавие, месторабота на автора и т.н. или комбинация от тях.

Дава възможност да разберем кой автор от кого и къде е цитиран, да се проследи развитието на дадена научна идея, кой работи по нея и т.н., както и да се определи публикационната активност и личният научен индекс на авторите (чрез специална формула – H-index).

Page 99: 2modul 4tema

Урок 11. Слайд 99

Комбинирано търсене

Техника за ограничаване на резултатите. Можем да комбинираме няколко полета, различни оператори и т.н., за да получим релевантни резултати.

Page 100: 2modul 4tema

Урок 11. Слайд 100

Текущо информиране

Можем да разграничим два типа разпространение на информацията: Първият е доставка на документи (document

delivery), като целта е да се доставят всички документи, чието съдържание ще бъде от полза. Задачата на службите, които се занимават с това, приключва в момента, когато доставката бъде предадена в ръцете на ползвателя – независимо дали като книжно копие или електронен документ.

Page 101: 2modul 4tema

Урок 11. Слайд 101

Текущо информиране

Втората концепция е уведомяване (notification) на ползвателя за документи, от които ще има потенциална полза, т.е. периодично подаване на такива документи, без инициативата да е на потребителя. Т.е. документи с вероятна релевантност се изпращат на потребители, за които се предполага, че ще имат интерес.

Page 102: 2modul 4tema

Урок 11. Слайд 102

Текущо информиране

Електронните бази данни създават т.нар. “профили на потребителите” (Current awareness profiles) и създават специализирани услуги, най-често наричани “Alert”, където след направена регистрация от потребителя той получава “известие” за всеки новополучен документ в областта, където са неговите интереси.

Page 103: 2modul 4tema

Урок 12. Особености на информационното търсене в

интернетТема 4. Стратегии и техники за

информационно търсене

Page 104: 2modul 4tema

Урок 12. Слайд 104

Методи и режими

Два основни метода за търсене в интернет: чрез ключови думи чрез избор от йерархично подредени

списъци на предметни рубрики и подрубрики, показвани на екрана

Режими – два основни режима – основно (по една ключова дума или фраза) и комбинирано или разширено – по няколко ключови думи, свързани с логически оператори или други възможности за прецизиране

Page 105: 2modul 4tema

Урок 12. Слайд 105

Някои общи правила за търсене в интернет

Принципни разлики с търсенето в каталози и бази данни няма, но трябва да се имат пред вид някои особености: първо се изписва най-важната по смисъл дума думите се пишат с малки букви (така се

обхващат и тези, които по правило се пишат с главни)

главните букви се схващат само като главни изписва се + вместо AND и – вместо NOT

(изписват се без разстояние между думите). Ако не напишем + или –, системата ги схваща като OR

Page 106: 2modul 4tema

Урок 12. Слайд 106

Някои общи правила за търсене в интернет

маскиране – *. За варианти на думите по-добре е да използваме ИЛИ (самолет ИЛИ самолети)

при търсене на фраза – използваме кавички “ “

използване на филтри за прецизиране на резултатите – например търсене в определени сайтове (Site searching)

Alta Vista – host: Exite, Google, Yahoo – site: AllTheWeb, Lycos – url.host: HotBot, Look Smart – domain:

Page 107: 2modul 4tema

Урок 12. Слайд 107

Ограничаване на резултатите/филтри

Данните в електронните ресурси са организирани в полета. Типичната уеб страница има следните основни полета: заглавие, домейн, host /site, URL, Link.

Когато информацията е въведена в определено поле, повечето търсачки позволяват тя да бъде намерена чрез използване етикета на полето в комбинация с термина, който търсим.

Най-често се използват: търсене по заглавие; по домейн и по хост.

Page 108: 2modul 4tema

Урок 12. Слайд 108

Филтриране

Това ограничаване се нарича още филтриране, т.е. използване на филтри. Филтрите са независими от запитването и освен за полетата, се отнасят още за езика на документите, за изключване на документи с вредно, неточно съдържание и т.н.

Page 109: 2modul 4tema

Урок 12. Слайд 109

Техники

Повечето от търсачките прилагат булеви оператори по подразбиране, т.е. не е нужно да ги въвеждаме

При някои средства за търсене логическите връзки между думите от запитването се задават не поотделно за всяка дума, а общо за всички чрез избор от списък, който съдържа: ALL these words (или само All) – “всички думи”, в намерените

документи да се срещат всички тези думи от запитването, т.е. логически оператор И

Any of these words (any) – да се среща поне една, която и да е дума от запитването, т.е. логически оператор ИЛИ

As exact phrase (phrase) – думите от запитването да се срещат в същата последователност

Може да има и None of these words - т.е. логически оператор НЕ

Page 110: 2modul 4tema

Урок 12. Слайд 110

Техники Маскирането се прилага при двата метода.

Няма унифицирани символи, което затруднява. Затова – използваме помощното меню (Help) на всяка търсачка.

Чувствителност към използването на малки и главни букви – различно, проверяваме дали търсачката ги различава.

Page 111: 2modul 4tema

Урок 12. Слайд 111

Подреждане на резултатите оттърсенето Подреждане на резултатите от търсенето (ranking) е най-често по релевантност (за целта се използва специален алгоритъм), но може азбучно, по брой на попаденията, хронологично и др.

Page 112: 2modul 4tema

Урок 13. Основни стъпки при използване на търсачките и

указателитеТема 4. Стратегии и техники за

информационно търсене

Page 113: 2modul 4tema

Урок 13. Слайд 113

Основни стъпки

“Превеждане“ на потребителския въпрос и превръщането му в термин/дума

комбиниране на термините проучване на получените резултати ново търсене, ако е нужно

“Преводът” на въпроса цели да направи нашето търсене възможно най-просто и най-специфично. Напр. вместо да питате “искам да си купя нов компютър“, трябва да посочите точно какъв. Разделете търсенето на фасети: купя, Pentium и т.н. После комбинирайте. Използвайте синоними (PC, IBM). Използвайте маскиране!

Page 114: 2modul 4tema

Урок 13. Слайд 114

Помнете, че

Комбинирането на термините най-често става чрез:

Phrase searching – винаги се използват кавички! Булеви оператори и ( ) and ( ), псевдобулеви

оператори – + (and) и – (not)

Повечето търсачки поставят автоматично and/or. Not – по-рядко, така се избягват омонимите.

Page 115: 2modul 4tema

Урок 13. Слайд 115

Популярни указатели

Най-популярният е Yahoo Directory. Включва 14 предметни рубрики/категории. Два начина за търсене – чрез избор на предмет от списъка на предметните области и чрез ключова думи – една или повече. Ако изберем ключова дума от предварително подбрана предметна категория, търсенето ще е по-точно. Има възможност за прецизиране на търсенето (функцията Option).

Page 116: 2modul 4tema

Урок 13. Слайд 116

Основни правила за търсене в Yahoo

Маскиране – с * За да се среща търсената ключовата дума, поставяме знак +

За да я изключим – знак – Ако няма + или –, се приема, че операторът е или Търсене на фраза – с “ ” Търсене само по заглавие на документа – с t преди ключовата дума

Популярни указатели – Libraruans’Index, Infomine, Academic Info, Open Directory – http://dmoz.org. Последният е амбициозен проект за създаване на най-пълния уеб каталог от доброволни сътрудници. Има две нива – по географски признак и по предмет. Има сайтовете на български език (World – Bulgaria). Той е реализация на идеите на движението Open Source и е безплатен.

Page 117: 2modul 4tema

Урок 14. Получаване на резултатите. Проучване. Управление. Оценка

Тема 4. Стратегии и техники за информационно търсене

Page 118: 2modul 4tema

Оценка на резултатите

Съществуват различни критерии за оценка на намерените резултати, но най-важните са: релевантност; достатъчно количество; достоверност; актуалност; съответствие на посочения езиков и хронологичен обхват; достъпност.

Урок 14. Слайд 118

Page 119: 2modul 4tema

Оценка на резултатите

Можем да ги обединим в следните групи:1. Отговарят ли на целта на информационното

търсене?2. Колко качествени са намерените източници?3. Съдържание – актуалност, релевантност,

обективност и др.

Урок 14. Слайд 119