Поиск информации в интернете - Сложные запросы в ПС...

Preview:

DESCRIPTION

http://download.yandex.ru/class/pechishev/present8.ppt

Citation preview

Поиск информации в интернете

Занятие 8. Сложные запросы в ПС Яндекс

Неранжирующее «И»

Оператор неранжирующее «И» << очень похож на оператор определения слов в одном документе &&, с той лишь разницей, что слово, которое находится справа, влияет на возможность документов попасть в результаты поиска, но не влияет на ранжирование.

Неранжирующее «И» (пример)

Например, запрос Трутнев && биография

найдет документы, где указанные слова будут расположены в пределах одного документа. При этом одно из первых мест в результатах займет, например, документ, в котором будет словосочетание «биография Трутнева».

Неранжирующее «И» (пример)

А на запрос Трутнев << биография

будут найдены документы, где будут присутствовать оба слова, но слово «биография» не будет влиять на ранжирование и первые места в списке результатов поиска займут документы со словом «Трутнев».

Поиск текста в заголовке страниц

Поиск текста в заголовке страниц (title):

$title (запрос)На запрос Максвелл << $title (биография) будут найдены документы со словом «биография» в заголовке и словом «Максвелл» в тексте. Причем слово «Максвелл» будет определяющим.

Поиск текста на сайте

Поиск ограничивается группой страниц, с заданным адресом.

url=«www.url.ru/cat/*»Пример:«кот Бублик» << url=«www.exler.ru*»Будет найдены все упоминания о коте Бублике на сайте www.exler.ru

Поиск файловПозволяет ограничить поиск определенным типом файла: HTML, PDF, DOC, PPT, XLS, RTF, SWF.

mime=«тип_файла»На запрос:

(инструкция && микроволновая печь) << (mime=«pdf» | mime=«rtf»)

будет найдены документы PDF и RTF, в теле которых присутствуют слова «инструкция» и «микроволновая печь».

Определение языка текста

Можно отобрать для поиска документы, написанные на определенном языке:

• русском (ru),• украинском (uk),• белорусском (be),• английском (en),• французском (fr), • немецком (de).

lang=«язык»Пример: DAAD << lang=«de»

Поиск по дате

Поиск производится только по страницам, дата которых удовлетворяет заданному условию

date=«ГГГГ{*|ММ{*|ДД}}»Пример: date=«200310*»По запросу будет производится поиск документов, датированных октябрем 2003 года.

Сложные запросы: выручат скобки

Вы можете строить сколь угодно сложные конструкции, подставляя в каждом из операторов вместо отдельного слова целые выражения. Чтобы Яндекс при этом правильно понимал вас, заключайте выражения в круглые скобки.

Сложные запросыЧтобы пореже натыкаться на уменьшение количества результатов, вызванные неверным синтаксисом, используйте несколько правил:

1. Всегда ставьте перед стоп-словами «+»; 2. Отделяйте операторы поиска в

элементах от слов запроса символами «&&»;

3. По возможности, используйте в сложных запросах «/+1» вместо кавычек.

Анализ сложных запросов

Пример запроса 1

Общий запрос на тему бокса не совсем релевантен:

(бокс|боксер|боксерский)Очевидно, что по результатам поиска будет найдено довольно много документов в том числе и не относящихся к спорту.Улучшим запрос…

Пример запроса 1

Отсечем анекдоты, собак, чехлы для техники, душевые, больничную тему. Запрос

(бокс|боксер|боксерский) ~~ (анекдот|собака|больничный|медицинский|душевая|чехол)

выдаст более релевантные документы. После нескольких проверок запрос можно улучшить еще.

Пример запроса 2Например, нужно найти резюме жителей Москвы со знанием французского языка, имеющих опыт работы с Windows, Linux. При этом уровень знания французского языка имеет первостепенное значение.

Строим запрос — $title(резюме) && +(москва | !495) && +французский && +linux && +windows

Пример запроса 2

$title(резюме) && +(москва | !495) && +французский && +linux && +windows

=«В заголовке должно быть слово «резюме», а в пределах одного документа – слова: «москва» (или код города 495), «французский», «linux», «windows» в точной словоформе»

Проблема ПС так выбирает слова для аннотации результатов поиска, что слово «французский» попадает в них редко — придется открывать все страницы.Или слово «французский» играет второстепенное значение, так что смысл документов не соответствует запросу.Переформулируем…

Пример запроса 2

Можно воспользоваться оператором <<:

+французский << ($title(резюме) && +(москва | !495) && +linux && +windows)

Теперь слово «французский» будет иметь первостепенное значение для ранжирования, но при этом остальные слова тоже играют роль в результатах поиска.

Пример запроса 3

Если вы ищете описание мумие, но не хотите наталкиваться на прайсы интернет-магазинов, можете задать такой запрос:

мумие << (лечение|лечебный|болезни) ~~ (цена|прайс|рубль|доллар|фирма|магазин)Будут найдены все страницы, где есть слово мумие, а также любое из слов лечение, лечебный или болезни, и нет ни одного из слов, перечисленных после оператора ~~.

Практическое задание

Создайте запрос для поиска резюме жителя Перми, обладающего опытом верстки и предпечатной подготовки, владеющего программами графического пакета Adobe.Создайте запрос для поиска вакансии в пермских СМИ, службах PR и рекламных агентствах для работы по гибкому графику.

Пример запроса 4

«Запрос пресс-службы»: у журналистов и работников служб PR существует необходимость создавать запросы для отслеживания публикаций и документов в интернете, связанных с определенной компанией и ее руководителем.Очевидно, что в запросе должны присутствовать все варианты названия компании и имя руководителя.

Пример запроса 4

Сформулируем запрос для ПГУ:(пгу|пермгу|(пермский /+1

(государственный|классический) /+1 университет)) && (маланин|(владимир /1 маланин)) Как видно, запрос учитывает четыре варианта названия вуза и два варианта упоминания имени ректора.

Пример запроса 4

Существует один нюанс: в результатах поиска присутствуют документы с официального сайта университета www.psu.ruЧтобы отсечь эти документы, добавим в конце запроса

~~ url=«www.psu.ru*»

Практическое задание

Создайте «запрос пресс-службы» для известной Вам компании. Учитывайте русской и английское написание названия, аббревиатуры, сокращенное и полное имя руководителя.Кроме этого, можно ограничить запрос темой документа, упоминанием региона и т.п.

Практическое задание«Переведи запрос»

«Переведи запрос»Сначала перед Вами появится запрос, описанный «естественным» языком. Ваша задача – «перевести» описание на язык запросов.После этого Вы увидите, наоборот, формализованный запрос. Ваша задача – сделать обратный перевод на «естественный» язык.

Запрос 1

Необходимо найти документы со словами «новый» или «анонсировал», или «представил», или «появился» и словами «гаджет» или «устройство», или «девайс», или «аппарат».

Запрос 2

тхэквандо|тэквадно|таэквандо|тхек-вандо

Запрос 3

Необходимо найти документы со словами «биография» или «жизнь» в заголовке, чтобы в тексте были слова «розинг» или «зворыкин» в точной словоформе; слова «изобретение», «телевидение», «электронно-лучевая трубка» в любой словоформе.

Запрос 4

((фехтование|фехтовальщик|фехто-вать) && сабля) | саблист

Запрос 5

Необходимо найти документы со словами «прежнее» и «название» друг за другом или «называлась», или «переименовали» и

словами «советский» и «спорт» друг за другом – в одном предложении.

Запрос 6

(спортивная /1 гимнастика | (гимнаст|гимнастка|гимнастика)) && (конь|кольца|брусья|опорный /1 прыжок)

Источники информации

Язык запросов. Как искать? Помощь Яндекса. http://www.yandex.ru/search/?id=481939

© И.М. Печищев

Recommended