Сейчас на сайте
Сейчас на сайте 0 пользователей и 0 гостей.

Запросы в ИПС

Поисковая ситуация может быть осложнена тем, что на многих поисковых серверах отсутствует описание работы операторов языка запроса. При выполнении поисковых процедур необходимо помнить, что при вводе запроса в одной кодировке неминуемо теряются данные, и пользователь должен постоянно контролировать в какой кодировке вводится запрос.

Максимально большое количество полезной информации может быть получено только при создании адекватных и конкретных запросов. Современные требования предъявляемые пользователю к ПМ – наличие возможности составления запроса наиболее простым способом – записью в строке запроса то, что требуется найти. Такой тип запроса называется естественно-языковым запросом Соответствие ответа ПС интересам пользователя зависит не только от свойств ПС, но и от того, насколько удачно пользователь сформулировал запрос. Запросы не должны содержать предлоги и артикли, т.к. большинство поисковых систем их игнорируют. При отсутствии положительного результата поиска требуемой информации, или недостаточного ее количества, следует уменьшить в запросе количество слов или использовать другие термины.

От правильности запроса могут зависеть и результаты. Есть два противоположных подхода к составлению запросов - "строго логический" и эмпирический поиск:

  • строго логический . Задаются максимально точные параметры конкретного документа;

  • эмпирический . Поиск осуществляется по одной фразе, по которой система пытается найти наиболее похожие документы. Одним из вариантов такой поисковой системы может быть поиск по похожим страницам.

Язык запросов в виде стандартных логических операторов существует практически во всех машинах, осуществляющих т.н. логический поиск. Логический поиск – это поиск с помощью операндов булевой алгебры И/ИЛИ/НЕ. Для получения разумного результата важно чтобы ИПС умели искать словосочетания или слова на заданном расстоянии. Дополнительной возможностью поиска является поиск в специальных зонах документа – заголовках, ссылках, ключевых словах и т.д.

Обычно запрос представляет собой одно или несколько слов. Согласно введенного запроса осуществляется поиск документов, в которых встречаются все слова запроса. Если в запросе не использованы логические операторы и\или специальные символы, то будут найдены документы, в которых эти слова встречаются по крайней мере один раз и в любой грамматической форме.

 

Если в результате запроса было получено огромное количество информации ( особенно если она не вполне адекватна запросу) следует уточнить или конкретизировать термины, произвести расширенный запрос – новый запрос, построенный на основе предыдущего при указании определенных критериев. Можно также ограничить варианты поиска.

В большинстве современных ИПС активно используются т.н. стоп-слова , к которым относятся служебные части речи, не несущих смысловой нагрузки, а также наиболее общеупотребительные (тяжелые) слова. При появлении стоп-слов в поисковом запросе ИПС может из не учитывать при поиске и ранжировании результатов. Поэтому не рекомендуется использовать стоп-слова в запросе.

Если же без стоп-слов в запросе нельзя обойтись, то следует включить их во фразу. В отдельных случаях полезно протестировать работу шаблонов простого и расширенного поиска ИПС, в которых техника поддержки стоп-слова может быть различной.