Сейчас на сайте
Сейчас на сайте 0 пользователей и 0 гостей.

Морфологическая обработка

Важный момент морфологической обработки – выделение основы слова . Основой называется ядерная часть слова, с которой связано его вещественное лексическое значение и которая остается за вычетом из него словоизменительных морфем (окончаний). Основа отличается от частей слова своим неслужебным характером; от корня – тем, что выражает категориальную отнесенность к одной из частей речи; от слова – тем, что не обладает ни завершенностью, ни оформленностью последнего и существует всегда только как часть производного слова или словоформы.

Одной из существенных проблем русского языка – наличие омонимов . С точки зрения автоматического разбора особенно сложны не полные омонимы (они имеют одинаковую словоизменительную схему), а омоформы – это когда разные слова, часто являющиеся разными частями речи, имеют общие формы в парадигме. Например слово «для», которое может выступать в качестве предлога или деепричастия. Или слово раздел – может выступать в качестве существительного ( раздел книги ) и в качестве глагола ( отец раздел ребенка ). Определение таких омоформ может быть произведено только по контексту.

Для изучения контекста применяется грамматический подход – отыскание словосочетаний, в которое входит рассматриваемое слово. Словосочетание образуется на основе подчинительной связи одного из трех видов: согласование, управление или примыкание. Связь согласованием значит, что в зависимом слове повторяются грамматические формы или их часть от главенствующего слова (голубой вагон, белый попугай). Управление – вид связи, при котором главная компонента словосочетания требует постановки зависимого слова в определенные грамматические формы, причем зависимое слово не изменяется при изменении главного. Примыкание – формирование подчиненного компонента не зависит от главного (конец семестра).