Сейчас на сайте
Сейчас на сайте 0 пользователей и 0 гостей.

Поисковые системы

Поисковая система позволяет находить в Internet документы по заданным словам. ПС – это программы, осуществляющие поиск в БД информации, удовлетворяющей пользователя. Большинство поисковых систем используют различные БД, поэтому используя одни и те же ключевые слова можно получить совершенно различные результаты.

С середины 90-х годов в WWW начали появляться и быстро распространятся поисковые системы, специализирующиеся на выявлении русскоязычных серверов. В настоящее время русскоязычный блок Интернет уже накопил обширный по объему и ценный по содержанию информационный массив и стал полноправной составной частью всемирных интеллектуальных ресурсов.

Первые службы для поиска информации в Интернет использовали ключевые слова или определенные логические конструкции. На базе таких систем, с учетом выявленных их достоинств и недостатков, стали создаваться русскоязычные поисковые средства. Так русскоязычные поисковые средства имеют традиционное деление на электронные справочники по определенным отраслям и тематикам, и на непосредственно поисковые системы, с помощью которых осуществляется поиск источников по узкому профилю.

Определенным препятствием в создании русскоязычных ПС являлась кодировка букв славянского алфавита – кириллицы, которые расположены во второй половине таблиц ASCII. Поэтому первоначально русскоязычные серверы самостоятельно заносили свои страницы в тематические каталоги (YAHOO). К сожалению большинства пользователей Интернет для кириллицы используется четыре вида альтернативной кодировки, а русскоязычная информация не всегда дублируется на каждой из них, поэтому результаты поиска с помощью различных ПС могут сильно зависеть от того, какая кодировка используется в конкретной ПС.

Одной из наиболее важных проблем современности является проблема решения вопроса об обеспечении удобного и свободного доступа к информации.

Первоначальное определение объекта поиска производится с помощью каталога WEB только в том случае, когда интересующая пользователя информация однозначно соответствует рубрикатору данного каталога. Если требуемая информация не имеет четкого соответствия рубрикатору, то для ее поиска рекомендуется использовать поисковый сервер. Для получения максимально полного объема информации поиск следует производить на нескольких серверах.

Помощь в этом вопросе оказывают поисковые машины и каталоги - такие, как Lycos, AltaVista, Infoseek, Excite, Hotbot, Webcrawler и Yahoo (общим числом сегодня около 200). Все они устроены по сходному принципу: копии всех документов, известных этим серверам, хранятся на локальном диске в формате индексированного файла. Когда поступает запрос на поиск документов, содержащих требуемые слова, то поиск ведется в базе местной машины, а в ответ на запрос выдается несколько десятков тысяч адресов во всех концах Паутины.

Отличие Web -каталога от Web -сервера в том, что в каталоге список Web -страниц является организованным по категориям: тема, подтема и т.д. Поисковый сервер использует специальное программное обеспечение, которое позволяет производить поиск в БД Web -страниц.

По мере увеличения в сети Интернет объема информационных ресурсов все острее стоит вопрос об эффективных способах поиска необходимых пользователю сведений. С технической точки зрения все существующие поисковые средства можно разбить на две большие группы - рубрикаторы и средства полнотекстовых поисков.