Upload
vladimir-burdaev
View
889
Download
1
Embed Size (px)
DESCRIPTION
Поиск информации в Интернете
Citation preview
Лабораторная работа №1
«СРЕДСТВА ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ»
ЦЕЛЬ:
Познакомиться с наиболее известными поисковыми системами сети Интернет. Изучить правила обычного, а также расширенного поиска на примере двух поисковых систем: Google и Rambler.
ПЛАН РАБОТЫ:
I. ВведениеII. Теоретическая часть1. Виды поисковых систем.2. О Google.3. О Rambler.III. Практическая часть1. Поиск ключевых слов с помощью поисковой системы Google. Дополнительные функции Google. Расширенный поиск.2. Поиск с помощью Rambler. Расширенный поиск.IV. Выводы
Теоретическая часть
Бог создал Вселенную, человек создал Интернет!
Интернет (англ. Internet) — всемирная система объединённых компьютерных сетей, построенная на использовании протокола IP и маршрутизации пакетов данных. Интернет образует глобальное информационное пространство, служит физической основой для Всемирной паутины и множества других систем (протоколов) передачи данных. Часто упоминается как «Всемирная сеть» и «Глобальная сеть».
ПОИСКОВАЯ СИСТЕМА— программно-аппаратный комплекс с веб-интерфейсом
предоставляющий возможность поиска информации в Интернете. В просторечии под
поисковой системой подразумевают веб-сайт, на которой размещён интерфейс (фронт-энд) системы.
Все поисковые системы Интернета состоят из трех базовых компонентов:
•веб-паук (web spider);•индексатор;•поисковая машина
Web spider представляет собой программу, которая обходит страницы с заданными URL, скачивает их в базу данных, а затем архивирует и перекладывает в хранилище один раз в сутки. Робот размещается на нескольких машинах, каждая из которых выполняет свое задание. Данные, которые собирает web spider, размещаются в индексной базе.
Индексатор – это программа, которая занимается обработкой страниц, скаченных при помощи веб-паука. Ее задача - "прочесть" все документы, извлечь из них слова и разместить их в специальную базу данных - индекс. Информация, находящаяся в хранилище в сжатом виде, делится на несколько частей. Эти части постепенно распределяются между машинами, на которых запущена программа-индексатор. Как только индексатор на одной из машин заканчивает обработку очередной части страниц, он обращается за следующей порцией.
После того, как вся информация обработана, начинается объединение (слияние) результатов, а также расстановка пометок: откуда взят тот или иной документ. Основная база участвует в анализе как одна из частей нового индекса. Так, если объединяются N новых частей, то в анализе участвует N+1 фрагмент (N новых + основная база предыдущей редакции).
Специальная программа составляет таблицы перенумерации документов базы и объединяет содержимое всех частей. Среди страниц с одинаковыми адресами выбирается наиболее свежая версия. Параллельно осуществляется склейка дублей: страницы, которые имеют одинаковое содержимое, но различные URL, объединяются в один документ.
Поисковая машина – обеспечивает
точность и корректность обработки
данных. От ее особенностей зависит,
насколько быстро и точно пользователь
найдет то, что его интересует. Когда
пользователь вводит свой запрос,
поисковая машина ищет ответ в своей
индексной базе и выводит результаты в
соответствии со своим алгоритмом
поиска.
Апрель 2010 года (Net Applications)
Yahoo
BingBaidu
Ask, AOL, AltaVista, MSN…
По данным аналитической компании comScore все поисковые сайты в декабре 2007 года обработали 66 млрд 221 млн поисковых запросов. Яндекс попал в статистику и находится на 9-ом месте.
ДАННЫЕ LIVEINTERNET
GoogleMail.ru
Рамблер
Яндекс
Одним из первых инструментов поиска в интернете (до WWW) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex».
В 1993 году появилась поисковая система «Aliweb».
Первой полнотекстовой поисковой системой стала «WebCrawler» (1994).
В 1994 был запущен «Lycos». Вскоре появилось множество
других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista».
В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport. 23 сентября 1997 была открыта поисковая машина Яндекс.
Необычные поисковые системы
Koogle С его помощью ортодоксальные иудеи могут найти контент, признанный раввинами удовлетворяющим религиозным требованиям.
Yauba Индийский поиск «для параноиков» — в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера.
TinEye Поисковая система, специализирующаяся на поиске изображений в Интернете.
Генон Поисковая система, собирающая и создающая контент у себя на сайте.
GoogleGoogle — первая по популярности в мире поисковая система,
обрабатывающая более 40 миллиардов запросов в месяц. Поисковой системой Google владеет корпорация Google Inc.
Лидер поисковых машин интернета, занимает более 60 % мирового рынка и индексирует более 8 миллиардов веб-страниц. Google может находить информацию на 191 языках. Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excеl, Microsoft PowerPoint и других.
Гугол – это математический термин, обозначающий единицу со 100 нулями. Этот термин придуман Милтоном Сироттой (Milton Sirotta), племянником американского математика Эдварда Каснера (Edward Kasner), и впервые описан в книге Каснера и Джеймса Ньюмена ""Математика и воображение"" (Mathematics and the Imagination).
На веб-сайте www.google.com или множестве других доменов Google пользователи могут осуществлять поиск информации на различных языках, проверять котировки акций, искать карты и заголовки новостей, просматривать записи телефонных книг по каждому городу США, выполнять поиск по миллиарду изображений и детально просматривать крупнейший в мире архив Usenet, который содержит более 1 миллиарда сообщений, первые из которых датируются 1981 годом.
СПЕЦИАЛЬНЫЕ ФУНКЦИИ GOOGLE
Запросы на каждый день Справочные инструменты Языковые инструменты Локальный поиск Планирование поездки Уточнение запроса
Как искать в Google?
Чтобы выполнить поиск в Google, просто введите несколько информативных поисковых запросов, затем нажмите клавишу Enter или кнопку Поиск.
Другие варианты поиска: Расширенный поиск Google Живой поиск Безопасный поиск Статистика поиска
Расширенный поиск в Google
Вы можете связаться с этой страницей, нажав Расширенный поиск - значок, расположенный рядом с окном поиска на главной странице Google. Вы также можете посетить страницы непосредственно на
http://www.google.com/advanced_search
С помощью функции расширенного поиска можно искать только те запросы, которые:
содержат все условия поиска при вводе в поисковую строку;
содержать фразу, указанную в поисковой строке; содержат хотя бы одно из слов в поисковой
строке; НЕ содержат ни одно из слов в поисковой
строке; написаны на определенном языке; создаются в определенном формате; были обновлен в течение определенного
периода времени; содержащих числа в определенном диапазоне; в течение определенного домена или веб-сайта;
Другие функции расширенного поиска:
Google Local: поиск товаров и услуг в конкретном городе США или почтовый индекс.
Язык: Укажите, на каком языке вы хотели бы разместить результаты.
Дата: Ограничить результаты вашего за последние три, шесть или 12 периодов в месяц.
Место: Укажите, где встречаются условия поиска на странице - в любом месте страницы, в заголовке или в URL.
Домены: поиск только в пределах указанного веб-сайта или исключение сайта из поиска.
Безопасный поиск: исключает сайты для взрослых из результатов поиска.
Операторы Google
Поиск по словосочетанию ("…«)
Поиск в пределах определенного веб-сайта (site:)
Поисковые слова, которые нужно исключить (-)
Заполнение пустых мест (*) Поиск точного соответствия
(+) Оператор OR
Google Живой поиск
По мере того как вы печатаете текст в окне поиска, Google Живой поиск автоматически показывает результаты для популярных запросов, начинающихся с тех букв, которые вы успели ввести.
http://www.youtube.com/watch?v=ElubRNRIUg4&feature=player_embedded
RAMBLER
Rambler Media Group — интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный интернет-портал.
25 ноября 2009 года Rambler стал лауреатом конкурса «Премия Рунета» в номинации «Культура и массовые коммуникации».
В 1991 году в подмосковном городе Пущино сформировалась группа единомышленников, вдохновленных только что появившейся коммуникационной средой Интернет (Дмитрий Крюков, Сергей Лысаков, Виктор Воронков, Владимир Самойлов, Юрий Ершов).
В 1992 году компания запустила собственные ftp- и mail-серверы. Через два года — свой первый www-сервер.
В преводе с английского Rambler означает «скиталец, странник, бродяга»: роботы поисковой машины действительно ходят по сайтам, собирая информацию круглые сутки, не зная покоя.
26 сентября был зарегистрирован домен rambler.ru, а 8 октября система была активизирована.
Также Rambler предлагает пользователю множество других функций:
Почта Rambler-ICQ 7 Знакомства Рrice.ru Дети Недвижимость Гороскопы Игры Афиша Путешествия Ассистент Карты Фото Видео Аудио
РАСШИРЕННЫЙ ПОИСК В RAMBLER
Функции: Поиск по тексту; Искать слова запроса; Расстояние между словами
запроса; Исключить документы,
содержащие следующие слова…;
Язык документа; Формат документа; Дата документа; Искать документы только на
следующих сайтах; Режим вебмастера;
Операторы Rambler
Оператор && (логическое И) Оператор || (логическое ИЛИ) Оператор NOT (логическое НЕ) Модификация оператора И - оператор &&& + означает, что это слово обязательно
должно быть найдено, ? означает, что могут быть также найдены
документы без этого слова. Кавычки Скобки
ПРАВИЛА ПОИСКА ИНФОРМАЦИИ:
Точно представить, что именно Вы хотите найти. Попытаться описать искомое наиболее полно и емко. Ввести поисковый запрос без ошибок. Если Вы
ошибетесь – поисковый сайт может постараться Вас поправить. Но желательно все-таки помнить, как пишется слово, которое Вы ищете.
Использовать уточняющие слова. Использовать синонимы и образные выражения. Применять служебные символы. Использовать функцию расширенного поиска.
Практическая часть
Поиск в Google Для поиска информации в Google вводим в адресную строку
браузера www.google.ru и нажимаем ENTER. В поисковую строку системы вводим необходимые ключевые слова, к примеру «Финансово-кредитная система Украины». Затем кликаем «Поиск в Google» либо снова нажимаем ENTER.
На левой панели инструментов можно выбрать временной отрезок, за который следует показывать найденные статьи, поменять язык либо включить функцию «показывать с картинками»
Расширенный поиск «со всеми словами»
Применение оператора «AND»
Расширенный поиск «с любым из слов»
Расширенный поиск «Без слов»
Использование логического оператора «+»
Поиск «~финансы»
Числовой диапазон
Google Живой поиск Для этого перейдем по ссылке
http://www.google.ru/instant/ и выбираем в правом верхнем углу функцию «Включить Живой поиск».
ПОИСК В RAMBLER
Зайдем на сайт www.rambler.ru. Введем в поисковой строке запрос «Финансово-кредитная система Украины». Нажмем ENTER.
Поиск «любое из слов»
РАСШИРЕННЫЙ ПОИСК «ЛЮБОЕ ИЗ СЛОВ»
Расширенный поиск «точной фразы»
Использование оператора &&
Использование оператора ||
Использование оператора NOT
ВЫВОДЫ:
Поисковая система Google является более удобной в использовании, чем Rambler.
Количество найденных результатов одного и того же запроса значительно больше в Google, чем в Rambler.
При поиске украинских сайтов, мне кажется, лучше пользоваться не google.ru, а google.com.ua для большей точности и количества полученной информации.
Расширенный поиск Google и расширенный поиск Rambler обладают практически одинаковыми функциями, оба поиска удобны и просты в использовании.
Как Google, так и Rambler предоставляют пользователю возможность использования операторов для более быстрого и точного получения результатов запроса.
Функция Google – Живой поиск предоставляет пользователю множество преимуществ:
• Экономия времени • Отдых для пальцев • Умный поиск