ПС, учитывающие морфологию русского языка, являются ИПС полнотекстового поиска, т.е. осуществляют поиск по текстовым документам разных форматов. Это могут быть текстовые поля БД, тексты стандартных форматов – txt, doc, html, rtf, xls. В этом случае под текстом подразумевается набор слов (выделенная по некоторым правилам последовательность букв), чисел и марок (сочетания букв и цифр или букв различных алфавитов). Полнотекстовые системы работают со слабоструктурированными объектами - текстами. Базовый набор поисковых возможностей полнотекстовых систем таков:
Полное инвертирование текстов предполагает хранение позиции каждого слова в документе. При такой обработке текста добавляются следующие возможности:
|