Сейчас на сайте
Сейчас на сайте 0 пользователей и 0 гостей.

Характеристики поисковой машины

При выборе поисковой машины из имеющихся в Интернет, следует проанализировать их характеристики:

  • охват – объем базы поисковой машины, который измеряется тремя показателями: общим объемом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Сравнение поисковых машин по этой характеристике проводится путем сравнения статистики результатов поиска, выдаваемых каждой машиной на один и тот же запрос (обычно состоящий из одного слова). Для более полного сравнения рекомендуется слова выбирать из разных областей и иметь разный «вес» - редкие, средние по встречаемости и «тяжелые» - часто встречающиеся. Именно на примере «тяжелых» слов проверяется полнотекстовость (индексация всех слов документа) поисковой машины;

  • глубина – имеется ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере. Для проверки глубины хождения следует выбрать какой-либо сайт с разветвленной структурой архива и проверить, будут ли проиндексированы документы, на которые можно попасть только например, за 5 переходов по ссылкам;

  • скорость обхода Сети показывает, насколько быстро происходит индексация вновь добавленного ресурса и насколько быстро обновляется база информации. Отслеживание состояния охваченных сайтов поисковой машиной является не менее важной ее характеристикой, как и определение новых сайтов. Для сравнения машин по этой характеристике пользователю следует где-нибудь создать страничку текста, добавить ее в поисковики и посмотреть, как быстро она начнет находиться. Для определения актуальности ссылок – проверить документы хотя бы на первой странице списка найденного по нескольким запросам;

  • качество поиска является субъективным показателем. Каждая поисковая машина имеет свои алгоритмы сортировки результатов поиска. Чем ближе к началу списка оказывается требуемый документ, тем лучше работает релевантность. Качество поиска проверяется только экспериментальным путем. Для этого следует сделать запросы разной длины;

  • скорость поиска . Зависит не только от самой поисковой машины, но и от Интернет каналов. Проверка машины на скорость проводится экспериментальным путем – надо поискать запросы разной длины, разной «тяжести» слов и в разное время суток;

  • поисковые возможности – это что именно и как поисковая машина вносит в индекс. Полнотекстовая ПМ индексирует все слова текста на Web-странице (иногда за исключением стоп-слов) и учитывает порядок их расположения. Наличие морфологических возможностей позволяет машине находить искомые слова во всех склонениях и спряжениях. Кроме того, в языке HTML существуют тэги (заголовки, ссылки, подписи к рисункам и т.п.), которые также могут обрабатываться поисковой машиной. К поисковым возможностям относятся условия работы с языком документа и синтаксис языка запросов. Высококачественной может считаться поисковая машина, у которой имеется возможность естественно-языкового запроса, который не требует знания логических операторов.