ГИА СИУ

 

4. Поиск информации в сети Интернет.

 

 Принципы поиска информации в Интернете.

 

Очень трудно искать черную кошку в темной  комнате, особенно если там ее нет.

 Конфуции

 

Став полноправным пользователем Интернета, вы получаете доступ к огромному числу информационных ресурсов. Например, количество имеющихся в Сети HTML-документов измеряется уже не десятками, а сотнями миллионов. А ведь в Интернете можно найти не только текст, но и программы, изображения, звуковые файлы и т. д. С одной стороны, в этом море информации наверняка найдется и та, которой вы интересуетесь, даже если сфера ваших интересов весьма специфична. С другой стороны, найти среди сотен миллионов Web-страниц именно те, которые вам интересны, — задача не из легких. Облегчить пользователям Сети поиск необходимой информации призваны поисковые системы.

 

Информационно-поисковые системы размещаются в Интернете на общедоступных серверах. Основой поисковых систем являются так называемые поисковые машины, или автоматические индексы. Специальные программы-роботы (известные также как «пауки») в автоматическом режиме периодически обследуют Интернет на основе определенных алгоритмов, проводя индексацию найденных документов. Созданные индексные базы данных используются поисковыми машинами для предоставления пользователю доступа к размещенной на узлах Сети информации. Пользователь в рамках соответствующего интерфейса формулирует запрос, который обрабатывается системой, после чего в окно броузера выдаются результаты обработки запроса. Механизмы обработки запросов постоянно совершенствуются, и современные поисковые системы не просто перебирают огромное число документов. Поиск ведется на основе оригинальных и весьма сложных алгоритмов, а его результаты анализируются и сортируются таким образом, чтобы представленная пользователю информация в наибольшей степени соответствовала его ожиданиям.

 

В настоящее время в развитии поисковых систем наблюдается тенденция объединения автоматических индексных поисковых машин и составляемых вручную каталогов Интернет-ресурсов. Ресурсы этих систем удачно дополняют друг друга, и объединение их возможностей вполне логично.

 

Тем не менее исследования возможностей поисковых машин, даже самых мощных из них, таких как AltaVista или HotBot, показывают, что реальная полнота охвата ресурсов Всемирной паутины отдельной такой системой не превышает 30%. Поэтому не стоит ограничиваться использованием какой-либо одной из них. Если вам не удалось отыскать интересующую вас информацию с помощью одной системы, попробуйте воспользоваться другой.

 

Каждая поисковая система имеет свои особенности, и качество полученного результата зависит от предмета поиска и точности формулировки запроса. Поэтому, приступая к поиску информации, прежде всего нужно четко представлять себе, что именно и где вы хотите найти. Например, зарубежные системы поражают числом проиндексированных документов. Для поиска в области профессиональных знаний, особенно информации на иностранном языке, такие системы, как Alta Vista, HotBot или Northern Light, подходят наилучшим образом.

 

Однако для поиска информации на русском языке, особенно в российской части Интернета, лучше приспособлены русские поисковые машины. Во-первых, они специально ориентированы именно на русскоязычные ресурсы Сети и, как правило, отличаются большей полнотой охвата и глубиной исследования этих ресурсов. Во-вторых, российские системы работают с учетом морфологии русского языка, то есть в поиск включаются все формы искомых слов. Российские системы лучше учитывают и такую исторически сложившуюся особенность российских Интернет-ресурсов, как сосуществование нескольких кодировок кириллицы.

 

Интерфейс всех поисковых систем построен примерно одинаково. Пользователю предлагается ввести запрос в специальное поле, а затем инициировать поиск щелчком на кнопке. Система выполняет поиск и выдает результаты в окно броузера. Кроме того, многими поисковыми системами пользователю предоставляется возможность задать дополнительные критерии поиска. Например, можно искать только в определенной тематической категории или только на определенных серверах. 

 

Успех поиска в значительной степени зависит от формулировки запроса. Вот несколько наиболее общих принципов составления запросов, применимых для большинства поисковых систем.

 

В запрос следует включать несколько слов, определяющих предмет поиска.

 

 Попробуйте задать человеку вопрос, состоящий из одного слова, и получить на него вразумительный ответ. Скорее всего, диалог будет напоминать общение героев старого анекдота, случайно оказавшихся в кабине самолета:

 

— Приборы?

 

— Пятьдесят...

 

— Что «пятьдесят»?

 

— А что «приборы»?

 

 Результат поиска будет намного лучше, если запрос состоит из нескольких связанных друг с другом слов. Старайтесь сформулировать вопрос как можно точнее. Например, запрос «сорта светлого пива» даст более определенный результат, чем «слабоалкогольные напитки».

 

 Используйте синонимы. Если полученный список результатов содержит слишком мало полезных документов, попробуйте заменить искомое слово синонимом. Например, вместо слова «видеоконтроллер» можно попробовать «графический адаптер». Попытайтесь также использовать в запросе оба синонима.

 

 Проверяйте орфографию. Если система не нашла ни одного документа, содержащего заданное слово, то стоит проверить правильность его написания. Например, если по запросу «дрессировка ротвейлеров и бультерьеров» были найдены только сведения по дрессировке ротвейлеров, скорее всего, вы просто допустили ошибку в слове «бультерьеров».

 

Следует также учитывать особенности интерфейса той поисковой системы, с которой вы работаете. Например, некоторые системы ограничивают поиск, если слово было набрано с прописной буквы. То есть, если в запросе набрано мерседес, то будут найдены документы, содержащие слова «мерседес» «Мерседес» и «МЕРСЕДЕС». А по запросу Мерседес будут найдены только те документы, где это слово написано с прописной буквы. В каждой поисковой системе имеется раздел Справка или Help, где можно ознакомиться с особенностями интерфейса этой системы.

 

Расширенный поиск

 

Кроме обычного запроса на естественном языке пользователи большинства систем могут также воспользоваться режимом «расширенного поиска» (в зарубежных системах — Advanced Search), в котором с помощью специальных символов можно задать более точные критерии и область поиска. Русское название этого режима, родившееся, видимо, из не совсем точного перевода с английского, нельзя признать удачным, так как на самом деле расширенным является только набор критериев поиска, а вот область поиска в большинстве случаев существенно сужается.

 

Большинство поисковых систем позволяет использовать весьма развитый и сложный синтаксис запросов. Однако по данным создателей поисковых систем, которые, будучи людьми дотошными, ведут учет посещаемости различных страниц своих серверов, оказывается, что лишь около десяти процентов посетителей добираются до страниц с описанием языка усложненных запросов. Это говорит не столько о том, что пользователи Сети не желают разбираться в специальных символах и составлять некие формулы, сколько о том, что большинство ищущих вполне удовлетворяют результаты, полученные с помощью простого запроса. Тем не менее многие 41ункции расширенного поиска весьма удобны и одинаковы для разных систем, а запомнить правила их использования не сложно.

 

Например, почти все системы имеют поддержку знаков + и -. Если вы хотите, чтобы указанное в запросе слово обязательно присутствовало в найденных документах, поставьте перед ним + (между знаком и словом не должно быть пробела). Так, если по запросу крокодил Гена будут найдены все документы, в которых встречается либо слово «крокодил», либо имя «Гена», то по запросу крокодил+Гена вы получите список документов, где упоминаются только крокодилы по имени Гена. Правда, Геной зовут не только героя популярного мультфильма. Так что, если вы не хотите вместо сказки о симпатичном крокодиле с гармошкой встретить в найденных документах материал о лидере КПРФ, запрос следует уточнить: крокодил-+Гена-Зюганов. В этом случае все упоминания фамилии известного политика, даже если авторы документа фамильярно назвали его Геной, будут из результатов поиска исключены.

 

Удобна также функция поиска только точной фразы. Например, вы хотите найти текст песни, но не помните, как она называется, а вот кто ее написал вы... тоже забыли, но зато точно помните, что в ней есть такие слова: «На поляне траву зайцы в полночь косили». Введите эту фразу в окно запроса и заключите ее в кавычки. Система найдет только документы, содержащие указанную фразу.

 

С помощью усложненных запросов можно задать самые разнообразные режимы поиска, например, ограничить поиск только определенными сайтами или определенными элементами документа. Можно также настраивать способы сортировки результатов поиска, определив более и менее важные слова в запросе. Зачастую создатели системы предоставляют также возможность указания взаимного расположения искомых слов в предложении или документе, например, насколько далеко одно искомое слово может отстоять от другого. Подробное описание синтаксиса запросов для конкретных систем имеется на сайтах этих систем в разделе справочной информации.

 

Поисковые системы

 

Мы редко думаем о том, что имеем, но всегда

 

беспокоимся о том, чего у нас нет.

 

Артур Шопенгауэр

 

Яndex

 

 

 Поисковая система Япаех находится по адресу www.yandex.ru и под- Держивается компанией CompTek International. Дата официального выпуска системы — 23 сентября 1997 года.

 

Компания CompTek International занимается внедрением новых компьютерных и телекоммуникационных технологий и работает на российском рынке с 1989 г. Компания имеет обширный опыт работы в таких областях, как беспроводные компьютерные сети, компьютерная телефония и полнотекстовые поисковые системы.

 

Что же такое Яndex? Вот как отвечают на этот вопрос создатели системы.

 

Яndex — это полнотекстовая информационно-поисковая система (ИПС), учитывающая морфологию русского и английского языков. Система Яndex предназначена для поиска информации в электронных текстах различной структуры и разных способов представления (форматов). Hndex (произносится «япдекс») расшифровывается как Языковый Индекс или, в английском написании, Yandex — Yet Another iNDEX. Также можно рассматривать Andex как частичный перевод слова «Index» с английского на русский язык («I» означает «Я»).

 

В основе поисковой системы Yandex. Ru лежит системное ядро, общее для всех продуктов с префиксом Andex (Hndex.Site, Hndex.Lib, Andex.Dict, Andex.CD).

 

Первые продукты серии Andex (Hndcx.Site, Andex.Dict) были представлены широкой публике 18 октября 1996 года на выставке Netcom'96. Поисковая машина для «русского Интернета» явилась естественным продолжением линии Hndex.

 

Как уже говорилось, в хорошем вопросе содержится половина ответа. Искать и находить нужное в ворохе текстов в Интерпете — умение не только поисковой системы, но и пользователя, задающего запрос.

 

Andex не требует от пользователя знания специальных команд для поиска. Достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны Москвы и московской области»), и вы получите результат — список страниц, где встречаются эти слова.

 

Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос идти, то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т. д. На запрос окно будет выдана информация, содержащая и слово «окон», а на запрос отзывали — документы, содержащие слово «отозвали».

 

Сервер Yandex.Ru был основательно обновлен 31 мая 1999 года — появилась новая поисковая база с новыми возможностями. Новый Япс1ех работает не только с языковыми запросами, но и позволяет выполнять поиск только на определенных серверах или же исключить из поиска заведомо ненужные серверы. Появилась возможность поиска изображений по подписям к ним и по именам файлов. Также стали доступными для поиска такие объекты, как сценарии, апплеты и стили (поиск осуществляется по названию). Удобная работа с новыми возможностями предлагается на странице расширенного поиска, где сложный язык запросов сведен к заполнению полей в форме.

 

Кроме стандартной сортировки результатов — по релевантности (то есть по степени соответствия запросу), можно отсортировать документы по дате обновления (чтобы получить самую свежую информацию). Появилась новая функция — группировка документов по серверам. Эта возможность, дополняющая список серверов, позволяет использовать широкий набор критериев сортировки.

 

Интересной особенностью системы является возможность поиска в Япс1ех из бро-узера без ввода запроса. Для этого нужно с сайта Yandex.Ru (http://yandex.ru/info/ button.html) установить кнопку в Панель ссылок броузера (Personal Toolbar для Netscape Navigator или Ссылки (Links) для Internet Explorer). После этого достаточно выделить нужный текст на просматриваемой странице и щелкнуть на этой кнопке. Запрос будет передан Andex, а результаты поиска появятся в отдельном окне броузера.

 

С 30 июня 1999 года для пользователей Яndex стала доступной новая услуга — бесплатная подписка на запросы.

 

Вы можете оставить свой запрос на сервере Yandex.Ru, a Web-агент будет регулярно высылать вам по электронной почте информацию о появлении новых и (или) измененных документов, соответствующих этому запросу. При каждом обходе Сети робот индексирует найденные документы, а уже известные страницы проверяет на предмет изменения и при необходимости обновляет их в базе индекса. Проверка запросов происходит раз в сутки. Если по запросу было найдено что-нибудь новое, Web-агент отправляет пользователю соответствующее письмо. Можно выбрать, что именно должно приходить в письме — список найденных документов или ссылка на страницу, где этот список хранится.

 

Подписаться на запрос очень просто — нужно заполнить форму по адресу http://yndex.ru/subscribe/regform.html, после чего вы получите по электронной почте имя пользователя и пароль, с которыми сможете зайти на страницу http://yandex.ru/subscribe/. Запросы для подписки создаются так же, как и обычные запросы в Yandex.Ru (4юрма аналогична странице расширенного поиска).

 

На момент подготовки этого материала система Andex имела самую большую базу проиндексированных документов среди российских поисковых систем. Система обрабатывает более 14 000 000 документов с более чем 60 000 серверов русскоязычного Интернета.

 

Апорт

 

 Поисковая система Апорт (www.aport.ru) была создана российской компанией Агама на базе собственных уникальных разработок и действует в Интернете с 1996 года.

 

В 1997 году проект был одобрен московскими представительствами корпораций Intel и Microsoft и обеспечен их постоянной поддержкой.

 

Апорт — уникальная двуязычная поисковая машина. Имея те же основные черты, что и AltaVista, Апорт содержит данные о намного большем числе современных ресурсов российского Интернета. Также Апорт входит в число ведущих поисковых систем, сертифицированных Microsoft как локальные поисковые системы для русской версии броузера Microsoft Internet Explorer. Очередной этап в истории проекта (конец 1998 года) связан с появлением у компании Агама нового стратегического партнера, привлекшего в Апорт иностранные инвестиции. Это еще более ускорило рост поисковой системы. В течение 1999 г. система Апорт несколько раз поменяла свой внешний вид и включила в себя ресурсы Интернет-каталога @Rus (бывшего «Ау!»).

 

К третьему тысячелетию компания Агама выпустила новую, кардинально переработанную версию поисковой системы — Апорт 2000. На ее создание ушло несколько человеко-лет работы квалифицированных программистов.

 

Успех системы Апорт 2000 во многом определяется стратегической линией, выбранной компанией. Важным шагом в этом направлении является новая степень интеграции поисковой машины с каталогом-рубрикатором @Rus: Апорт 2000 использует при выдаче результатов поиска аннотации сайтов, составленные редакторами каталога. Подробная аннотация — один из важных элементов нового формата выдачи, позволяющий системе Апорт 2000 сделать поиск информации в Интернете более быстрым и точным. Ведущие мировые ресурсы, работающие в области поисковых услуг, сегодня также развиваются в этом направлении: все больше и больше внимания навигационные системы уделяют участию человека в обработке информации. Если в начале 1996 года только один из шести ведущих поисковых серверов — Yahoo! — использовал в своей базе, а также при выдаче результатов информацию, обработанную людьми, то сегодня по этому пути пошли также MSN Search, Netscape Search, Lycos и AltaVista.

 

Основные свойства поисковой системы Апорт:

 

 перевод запроса и результатов поиска с русского на английский и наоборот;

 

автоматическая проверка орфографических ошибок запроса;

 

более информативный вывод результатов поиска для найденных сайтов (не только первое предложение!);

 

 возможность поиска в любой грамматической форме (что особенно важно для русского языка);

 

 мощный язык расширенных запросов для профессиональных пользователей.

 

Дополнительные свойства:

 

 поддержка пяти основных кодовых страниц (разных операционных систем) для русского языка;

 

 технология поиска с использованием ограничений по URL (адресу) и дате документов;

 

поиск ведется не только по тексту, но и по заголовкам, комментариям и подписям к картинкам и т. д.;

 

 сохранение параметров поиска и определенного числа предыдущих запросов пользователя;

 

объединение копий документа, находящихся на разных серверах.

 

Новый формат представления информации в системе Апорт 2000 является, пожалуй, одним из самых удобных среди крупнейших поисковых систем российского Интернета. Группировка документов по сайтам и вывод на экран тех предложений, в которых были обнаружены искомые слова, очень помогают ориентироваться в найденных документах. ;-?-

 

AltaVista

 

Alta Vista (www.altavista.com) — одна из старейших поисковых систем в Интернете. Первый Web-индекс был представлен компанией в 1995 году. В настоящее время индекс AltaVista содержит данные о более чем 250 миллионах документов.

 

Ядро поисковой системы обязано своим рождением странной особенности исследовательской лаборатории компании Digital Equipment Corp. Сотрудники этой лаборатории зачем-то хранили всю свою электронную переписку за последние 10 лет. Чтобы эта куча информации не просто занимала дисковое пространство, а приносила хоть какую-то пользу, была создана программа для индексирования документов и поиска нужных слов в ворохе пожелтевшей от времени электронной корреспонденции. Система получилась настолько удачной, что впоследствии с успехом перекочевала на просторы Всемирной паутины.

 

Индекс Alta Vista содержит документы на 25 языках. В область поиска можно включить документы на всех поддерживаемых языках или только в документах на определенном языке, а на специальной странице можно указать несколько языков для поиска на всех выбранных языках одновременно.

 

Окно поиска AltaVista содержит следующие элементы (рис. 4.3).

 

 Поле ввода запроса (Find this:). В это поле вводится запрос для поиска интересующей вас информации. Запрос может представлять собой вопрос, утверждение, фразу или просто несколько слов, определяющих предмет поиска.

 

 Советы и примеры поиска. Под полем ввода запроса на экран выводится совет или пример, показывающий способ более эффективного поиска с помощью AltaVista. Советы и примеры периодически обновляются, поэтому с их помощью можно приобрести ценный опыт в таком непростом деле, как поиск информации в Интернете.

 

Меню выбора языка. С помощью раскрывающегося списка выбора языка можно ограничить область поиска только документами, написанными на указанном языке. В настоящее время поддерживаются 25 языков.

 

 Переключатели области поиска (Find results on:). Переключатели под полем запроса используются для того, чтобы указать системе, где искать интересующую вас информацию. По умолчанию установлен переключатель The Web, означающий, что AltaVista будет искать информацию среди всех ресурсов World Wide Web. В зависимости от предмета поиска можно ограничиться поиском только в новостях (News), зонах предложения товаров через Интернет (Products) или конференциях (Discussion Groups).

 

 Ссылки. В окне поиска имеются ссылки на раздел справочной информации (Help), страницу настройки «семейного фильтра» (Family Filter) и страницу настройки языковых параметров AltaVista (Language Settings).

 

Вкладки. Над полем ввода запроса находится пять вкладок. Первая вкладка (Search) открывается по умолчанию и содержит описанные выше элементы. Вторая вкладка (Advanced Search) предназначена для ввода усложненных запросов. Третья, четвертая и пятая вкладки (Images, Audio/МРЗ и Video) предназначены, соответственно, для поиска изображений, звуковых файлов и видео. Если требуется найти элемент мультимедиа вместо текстовой информации, то следует использовать эти вкладки.

 

AltaVista является одной из крупнейших систем поиска в Интернете. Она обладает развитым языком запросов и отлично подходит для поиска в Сети как специальной информации в определенной области, так и информации более общего характера.

 

Тематические каталоги

 

Тысячи путей ведут к заблуждению; к истине — только один.

 

Жан-Жак Руссо

 

Кроме поисковых систем в Интернете имеются также электронные каталоги документов, которые, в отличие от автоматических индексных систем, составляются и упорядочиваются при участии человека. Конечно, такие системы содержат информацию о меньшем количестве ресурсов, но форма представления и методы сортировки материала выгодно отличают их от большинства индексных поисковых систем. Ресурсы Интернета в каталогах упорядочены и распределены по тематическим категориям, поэтому, если вы интересуетесь какой-то определенной темой, то каталог ресурсов будет для вас полезнее текстовой поисковой системы. Например, если вас интересует творчество поэтов «серебряного века», и вы хотите найти не документы с упоминанием того или иного поэта, а сайт, полностью посвященный именно этой теме, то лучше обратиться к каталогу Интернет-ресур-сов. Обширный тематический каталог российских ресурсов имеется на сервере системы Rambler (http://www.rambler.ru), предлагающей пользователю наряду с обычным текстовым поиском обратиться к самым популярным сайтам, распределенным по разнообразным категориям (рис. 4.5).

 

 Хороший каталог Интернет-ресурсов имеется на сервере http://www. stars, ru, не забудьте также об уже упоминавшемся @Rus (http://www.atrus.ru). Из зарубежных систем для общетематического поиска стоит обратить внимание на Yahoo! (http:// www.yahoo.com), имеющего хороший каталог ресурсов Сети.

 

Полезные ссылки

 

Кроме уже рассмотренной зарубежной поисковой системы AltaVista, стоит посетить также такие системы, как: HotBot (http://www.hotbot.com), Infoseek (http:// www.infoseek.com), Lycos (http://www.lycos.com), MSNWeb Search (search.msn.corn), Northern Light (www.northernlight.com).

 

В зарубежном Интернете имеется большое число специализированных поисковых систем, среди которых можно отметить, например, поисковые узлы для детей: Ask Jeeves for Kids (http://www.ajki'ds.com), Lycos SafetyNet (personal.lycos.com/safetynet/ safetynet.asp), Yahooligans! (http://www.yahooh'gans.com).

 

Кроме того, существует множество разнообразнейших поисковых серверов на все случаи жизни. Можно найти адрес человека, квартиру, гостиницу, адвоката, работу и даже место расположения ближайшего банкомата. Вот, например, серверы для поиска медицинской информации в зарубежной части сети Medical World Search (www.mwsearch.com) и в России (http://www.rusmedsery.com). Техническую информацию можно найти на сайте www.developer.com или на российском сервере ixbt.stack.net.

 

В заключение скажем несколько слов о системах метапоиска (или параллельного поиска). Эти системы передают сформулированный пользователем запрос разным поисковым системам, что позволяет выполнять поиск сразу в нескольких системах. Повторяющиеся ссылки, полученные от разных систем, как правило, исключаются из представляемых пользователю результатов поиска. Вот несколько адресов зарубежных систем метапоиска:

 

 MetaCrawler (http://www.metacrawler.com);

 

 Debriefing (http://www.debriefing.com);

 

 Dogpile (http://www.dogpile.com);

 

 Highway 61 (http://www.highway61.com);

 

 ProFusion (http://www.profusion.com);

 

 SavvySearch (http://www.savvysearch.com).

 

 

 

 

 На начальном этапе развития интернета, число пользователей сети было невелико и количество информации относительно небольшим. В подавляющем большинстве случаев пользователями Интернет были сотрудники различных университетов или научных организаций. В то время поиск нужной информации в сети был не столь актуален, как теперь.

Одной из первых попыток организации доступа к информационным ресурсам сети стало создание тематических каталогов сайтов. Первым, открывшимся в апреле 1994 г, стал Yahoo. Это еще не было поисковой системой, в современном понимании, т.к. возможность поиска информации ограничивалась ресурсами зарегестрированными в каталоге Yahoo.

 Каталоги ссылок ранее использовались довольно широко, но в настоящее время практически утратили свою популярность . Объяснение этому очень простое – даже современные, содержащие огромное количество ресурсов каталоги, представляют информацию лишь о довольно незначительной части сети. Для сравнения - самый полный каталог сети интернет - DMOZ содержит информацию о примерно 12.000.000 ресурсов, в то время как база данных самой полной поисковой системы Google состоит из более чем 28.000.000.000 документов.

 Первой полноценной поисковой системой в 1994г. стал проект WebCrawler. Далее в 1995 году появились поисковые системы AltaVista и Lycos.

 В 1997 году в Стэнфордском университете, в рамках исследовательского проекта, была создана Google - самая популярная поисковая система на данный момент в мире.

 В 1997 году появилась поисковая система - Yandex, лидер в русскоязычной части Интернета.

 На данный момент основными поисковыми системами являются три международных – Google, Yahoo и MSN Search. Остальные, коих не мало, используют целиком или частично базы и(или) алгоритмы выше приведенных систем.

 В Рунете основной поисковой системой является Яндекс, далее по популярности идут Rambler, Google.ru, Mail.ru и Aport

 

Поисковая система - это сумма следующих компонентов

Web server (веб-сервер) – сервер поисковой машины, который осуществляет взаимодействие между пользователем и остальными компонентами системы.

Spider (паук)- программа написанная по принципу браузера, предназначена для скачивания веб-страниц. Браузер предназначен для визуального использования страниц, а паук работает с HTML кодом напрямую. Чтобы посмотреть "сырой" исходник нажмите в меню браузера: Вид- Просмотр HTML кода

Crawler («путешествующий» паук) – программа, которая автоматически уходит по всем внешним ссылкам страницы. Ее задача - поиск не известных (или измененных) документов и в расстановке приоритетов, куда дальше должен идти Spider.

Indexer (индексатор) - программа-анализатор скаченных пауками веб-страниц. Она "разбирает" на части скачанную страницу и анализирует ее элементы, такие как текст, служебные html-теги, заголовки, особенности стилистики и структурные формы

Database (база данных) – хранилище для скачанных и обработанных страниц - общая база данных поисковой машины.

Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных поисковой системы. Именно она решает, какие страницы более соответствуют запросу пользователя и отсортировывает их в нужном порядке. Модуль работает согласно заданным поисковой системой алгоритмам ранжирования

 

Так-же в поиковые ситемы встроены различные модули: определение IP-хоста сайта, WHOIS - определение имени владельца и сроков регистрации, copyscape - проверка "заимственности" содержания сайта и многое многое другое.

 

 

Сайт создан по технологии «Конструктор e-Publish»
Hosted by uCoz