Upload
lappo-andrey-e
View
39
Download
4
Embed Size (px)
DESCRIPTION
http://download.yandex.ru/class/pechishev/present8.ppt
Citation preview
Поиск информации в интернете
Занятие 8. Сложные запросы в ПС Яндекс
Неранжирующее «И»
Оператор неранжирующее «И» << очень похож на оператор определения слов в одном документе &&, с той лишь разницей, что слово, которое находится справа, влияет на возможность документов попасть в результаты поиска, но не влияет на ранжирование.
Неранжирующее «И» (пример)
Например, запрос Трутнев && биография
найдет документы, где указанные слова будут расположены в пределах одного документа. При этом одно из первых мест в результатах займет, например, документ, в котором будет словосочетание «биография Трутнева».
Неранжирующее «И» (пример)
А на запрос Трутнев << биография
будут найдены документы, где будут присутствовать оба слова, но слово «биография» не будет влиять на ранжирование и первые места в списке результатов поиска займут документы со словом «Трутнев».
Поиск текста в заголовке страниц
Поиск текста в заголовке страниц (title):
$title (запрос)На запрос Максвелл << $title (биография) будут найдены документы со словом «биография» в заголовке и словом «Максвелл» в тексте. Причем слово «Максвелл» будет определяющим.
Поиск текста на сайте
Поиск ограничивается группой страниц, с заданным адресом.
url=«www.url.ru/cat/*»Пример:«кот Бублик» << url=«www.exler.ru*»Будет найдены все упоминания о коте Бублике на сайте www.exler.ru
Поиск файловПозволяет ограничить поиск определенным типом файла: HTML, PDF, DOC, PPT, XLS, RTF, SWF.
mime=«тип_файла»На запрос:
(инструкция && микроволновая печь) << (mime=«pdf» | mime=«rtf»)
будет найдены документы PDF и RTF, в теле которых присутствуют слова «инструкция» и «микроволновая печь».
Определение языка текста
Можно отобрать для поиска документы, написанные на определенном языке:
• русском (ru),• украинском (uk),• белорусском (be),• английском (en),• французском (fr), • немецком (de).
lang=«язык»Пример: DAAD << lang=«de»
Поиск по дате
Поиск производится только по страницам, дата которых удовлетворяет заданному условию
date=«ГГГГ{*|ММ{*|ДД}}»Пример: date=«200310*»По запросу будет производится поиск документов, датированных октябрем 2003 года.
Сложные запросы: выручат скобки
Вы можете строить сколь угодно сложные конструкции, подставляя в каждом из операторов вместо отдельного слова целые выражения. Чтобы Яндекс при этом правильно понимал вас, заключайте выражения в круглые скобки.
Сложные запросыЧтобы пореже натыкаться на уменьшение количества результатов, вызванные неверным синтаксисом, используйте несколько правил:
1. Всегда ставьте перед стоп-словами «+»; 2. Отделяйте операторы поиска в
элементах от слов запроса символами «&&»;
3. По возможности, используйте в сложных запросах «/+1» вместо кавычек.
Анализ сложных запросов
Пример запроса 1
Общий запрос на тему бокса не совсем релевантен:
(бокс|боксер|боксерский)Очевидно, что по результатам поиска будет найдено довольно много документов в том числе и не относящихся к спорту.Улучшим запрос…
Пример запроса 1
Отсечем анекдоты, собак, чехлы для техники, душевые, больничную тему. Запрос
(бокс|боксер|боксерский) ~~ (анекдот|собака|больничный|медицинский|душевая|чехол)
выдаст более релевантные документы. После нескольких проверок запрос можно улучшить еще.
Пример запроса 2Например, нужно найти резюме жителей Москвы со знанием французского языка, имеющих опыт работы с Windows, Linux. При этом уровень знания французского языка имеет первостепенное значение.
Строим запрос — $title(резюме) && +(москва | !495) && +французский && +linux && +windows
Пример запроса 2
$title(резюме) && +(москва | !495) && +французский && +linux && +windows
=«В заголовке должно быть слово «резюме», а в пределах одного документа – слова: «москва» (или код города 495), «французский», «linux», «windows» в точной словоформе»
Проблема ПС так выбирает слова для аннотации результатов поиска, что слово «французский» попадает в них редко — придется открывать все страницы.Или слово «французский» играет второстепенное значение, так что смысл документов не соответствует запросу.Переформулируем…
Пример запроса 2
Можно воспользоваться оператором <<:
+французский << ($title(резюме) && +(москва | !495) && +linux && +windows)
Теперь слово «французский» будет иметь первостепенное значение для ранжирования, но при этом остальные слова тоже играют роль в результатах поиска.
Пример запроса 3
Если вы ищете описание мумие, но не хотите наталкиваться на прайсы интернет-магазинов, можете задать такой запрос:
мумие << (лечение|лечебный|болезни) ~~ (цена|прайс|рубль|доллар|фирма|магазин)Будут найдены все страницы, где есть слово мумие, а также любое из слов лечение, лечебный или болезни, и нет ни одного из слов, перечисленных после оператора ~~.
Практическое задание
Создайте запрос для поиска резюме жителя Перми, обладающего опытом верстки и предпечатной подготовки, владеющего программами графического пакета Adobe.Создайте запрос для поиска вакансии в пермских СМИ, службах PR и рекламных агентствах для работы по гибкому графику.
Пример запроса 4
«Запрос пресс-службы»: у журналистов и работников служб PR существует необходимость создавать запросы для отслеживания публикаций и документов в интернете, связанных с определенной компанией и ее руководителем.Очевидно, что в запросе должны присутствовать все варианты названия компании и имя руководителя.
Пример запроса 4
Сформулируем запрос для ПГУ:(пгу|пермгу|(пермский /+1
(государственный|классический) /+1 университет)) && (маланин|(владимир /1 маланин)) Как видно, запрос учитывает четыре варианта названия вуза и два варианта упоминания имени ректора.
Пример запроса 4
Существует один нюанс: в результатах поиска присутствуют документы с официального сайта университета www.psu.ruЧтобы отсечь эти документы, добавим в конце запроса
~~ url=«www.psu.ru*»
Практическое задание
Создайте «запрос пресс-службы» для известной Вам компании. Учитывайте русской и английское написание названия, аббревиатуры, сокращенное и полное имя руководителя.Кроме этого, можно ограничить запрос темой документа, упоминанием региона и т.п.
Практическое задание«Переведи запрос»
«Переведи запрос»Сначала перед Вами появится запрос, описанный «естественным» языком. Ваша задача – «перевести» описание на язык запросов.После этого Вы увидите, наоборот, формализованный запрос. Ваша задача – сделать обратный перевод на «естественный» язык.
Запрос 1
Необходимо найти документы со словами «новый» или «анонсировал», или «представил», или «появился» и словами «гаджет» или «устройство», или «девайс», или «аппарат».
Запрос 2
тхэквандо|тэквадно|таэквандо|тхек-вандо
Запрос 3
Необходимо найти документы со словами «биография» или «жизнь» в заголовке, чтобы в тексте были слова «розинг» или «зворыкин» в точной словоформе; слова «изобретение», «телевидение», «электронно-лучевая трубка» в любой словоформе.
Запрос 4
((фехтование|фехтовальщик|фехто-вать) && сабля) | саблист
Запрос 5
Необходимо найти документы со словами «прежнее» и «название» друг за другом или «называлась», или «переименовали» и
словами «советский» и «спорт» друг за другом – в одном предложении.
Запрос 6
(спортивная /1 гимнастика | (гимнаст|гимнастка|гимнастика)) && (конь|кольца|брусья|опорный /1 прыжок)
Источники информации
Язык запросов. Как искать? Помощь Яндекса. http://www.yandex.ru/search/?id=481939
© И.М. Печищев