Тип поисковой машины является достаточно важной характеристикой. ПМ подразделяются на два класса. Полнотекстовые ПМ индексируют каждое слово на Web-странице, исключая стоп-слова – слова, которые очень часто встречающиеся на Web-страницах. Средства полнотекстового поиска автоматически выделяют слова, встречающиеся на страницах сетевых документов. При поиске по этим словам в ответ выдаются адреса соответствующих страниц. Полнотекстовый поиск стал привычным при ограниченных масштабах текстов. Но в условиях, когда обрабатывается несколько миллионов страниц, информационный шум выходит на первый план. Сказываются и отсутствие признака важности слова для конкретного текста, и синонимия, и отсутствие гибкого управления рейтингованием вхождений разных слов из текста запроса. Специалисты отмечают, что пока эффективных систем полнотекстового поиска в Интернет нет. На сегодняшний день трудно вести поиск конкретной информации с помощью известных поисковых систем и получить точный ответ с помощью ключевых слов. Разработчики совершенствуют интерфейсы пользователя с тем, чтобы транслировать естественную для человека форму запроса в конструкцию из ключевых слов, понятную поисковой системе. Такой интерфейс, например, предлагается в системе Яndex. За рубежом недавно была открыта новая служба Electric Monk (www.electrimonk.com), также преобразующая запрос на естественном языке в структуру языка запросов наиболее мощной на сегодняшний день системы поиска AltaVista. Абстрактные ПМ создают некий экстракт каждой страницы с ее содержимым. Некоторые ПМ отображают статистику робота, но пользователю проще проверить непосредственно самостоятельно. Для этого следует задать несколько поисковых запросов, состоящих из одного слова , и посмотреть статистику результатов, выдаваемую различными ПМ. Дополнительный сервис – это дополнительные возможности, которые предоставляет пользователю поисковая машина. К ним могут относиться наличие всевозможных вариантов поиска (специализированные страницы, поиск похожих документов, ограничение области поиска), и список найденных серверов, и поиск по датам и серверам, и удобный интерфейс поисковой машины, и возможность ее персонализации. При использовании поисковых серверов на проведении поиска отрицательно сказываются:
|