Сейчас на сайте
Сейчас на сайте 0 пользователей и 0 гостей.

Критерии сортировки документов

Поиск с помощью Апорта может считаться хорошим, если удается найти нужную информацию на одной из первых страниц с результатами поиска. При сортировке документов (сайтов) Апорт использует следующие критерии:

  • количество искомых слов в тексте документа и расстояние между поисковыми словами;

  • место в тексте, где встречаются поисковые слова (заголовок, описание, мета-тэг и т.п.);

  • внешний вид шрифта, которым набраны в тексте искомые слова;

  • количество ссылок в Интернет на данный документ;

  • использование искомого слова в тексте ссылок из Интернета на данный документ;

  • окончательный процент соответствия документа запросу строится как некая обобщенная функция от всех этих показателей.

Свойства данной ПС:

  • развитый логический язык запросов позволяет использовать логические операторы И\ИЛИ;

  • позволяет усекать окончание слов с помощь символа * ;

  • запросы могут задаваться как на русском, так и на английском языке, т.к. ПС обеспечивает автоматический перевод.

ПС способна вычленять сочетание терминов, если они расположены рядом друг с другом. Степень их приближенности указывается непосредственно пользователем;

Имеет богатые возможности формирования запроса, в частности способна переводить запрос и результат поиска (включая полный текст документа) с русского на английский язык и наоборот. Запрос может содержать несколько слов в любой грамматической форме, как на русском, так и на английском языке. Поиск проводится с учетом морфологического анализа. Кроме того в распоряжении пользователя имеется множество фильтров, облегчающих процедуру поиска.

Запрос может быть выполнен в форме: { Х, поисковые системы }, где Х=4 – поиск страниц, у которых промежуток между искомыми словами составляет не более 2-х других слов, при Х=3 расстояние между искомыми словами находится в пределах 3-х соседних предложений;

Результаты поиска ранжируются в зависимости от частоты употребления терминов, приведенных в запросе. При подведении итогов поиска приводятся сведения о времени последнего обновления, размере и кодировке файла, электронном адресе каждого документа.

Согласно запросу в Апорте поиск может производиться по адресу (URL). Например, документ может искаться не только по всему русскоязычному Интернет, а по его части. В самом простом случае – поиск по определенному серверу. В этом случае синтаксис запроса имеет вид: URL=www.ssu.sumy.ua ОПМ, т.е. на сервере ssu.sumy.ua, будут искаться документы, содержащие слово ОПМ.

Оператор И (and),(&),(+) может быть опущен. По запросу с этим оператором будут найдены документы, содержащие слова, объединенные этим оператором, или этими символами.

Оператор ИЛИ (or),(|) позволяет искать документы, содержащие хотя бы одно из перечисленных терминов или любое сочетание этих терминов.

Оператор НЕ (not) ограничивает поиск документами, не содержащими слово, указанное после оператора.

<Круглые скобки задают порядок действия логических операторов .

Двойные (одинарные) кавычки позволяют находить словосочетание, указанное в них, или близкое к нему. Служебные слова и предлоги в кавычках игнорируются.

слn(…) (сn(…)), (wn(…)), ([n,…]) задается ограничение расстояние в словах, где n – количество слов. Порядок, в котором встречаются заданные слова, не важен. Если терминов в запросе вводится несколько, то число в запросе указывает общее число слов между всеми этими терминами.

url= (url:) позволяет произвести ограничение поиска одним или несколькими серверами, или даже частью сервера.

дата= (дата:), (date=) производит ограничение поиска документами, попадающими в заданный интервал дат. Термин запроса вводится перед оператором, а интервал дат вводится через дефис после знака равенство.

<title= (t=),(заг=),(з=) слово(или сочетание слов в круглых скобках) после знака равенства должны искаться в заголовках документов

keywords= (Kw=),(клсл=),(кл=) указанное слово или фраза должны искаться в поле ключевых слов META KEYWORDS

alt= (ф=)б (рис=)б (р=) указанное слово или фраза будут искаться в комментариям к картинкам, т.е. в полях ALT

link= (L=),(ссылка=),(сс=) термины будут искаться в ссылках, имеющихся в HTML-документах. Поиск введется по ссылкам, в которых явно указано имя сервера( путь к конкретному файлу игнорируется.

anchor= термины будут искаться в тексте ссылок

description= термины будут искаться в тексте описания сайтов и в поле META DESCRIPTION документов

text= (x=) термины будут искаться только в обычном тексте. По умолчанию термины запроса ищутся как в тексте, так и во всех указанных выше полях

* звездочка в конце слова символизирует произвольное количество букв

! знак ставится перед термином для указания нормальной формы тех терминов, у которых некоторые формы разных слов совпадают. Например слово «пар», означающее газообразное состояние воды, и слово «пар» – от слова «пара» ( в смысле: двойка, учебные часы, или двойное количество).

К недостаткам данной ПМ можно отнести отсутствие поддержки дополнительных служб.

На основе технологий Апорт фирмой Агама созданы специфические поисковые инструменты. Один из них – локальный вариант Апорт для поиска на отдельном WWW -сервере. Это ПО позволяет поддерживать в автоматическом режиме одну или несколько поисковых баз по страницам данного сервера, что обеспечивает дополнительные возможности навигации его пользователям.