|
InfoStream - система мониторинга СМИ |
Запросы состоят из поисковых слов и операторов. В качестве поисковых слов могут использоваться слова естественного языка или их правые усечения. По умолчанию при отключенной морфологии каждое слово воспринимается как усечение. Система не чувствительна к регистрам букв.
В системе используется следующий набор операторов, расположенных в соответствии с установленными приоритетами:
Оператор контекстного следования (~) отбирает пары поисковых терминов, которые в тексте документа расположены друг за другом, причем учитывается порядок следования терминов.
Оператор контекстной близости (@) отбирает пары поисковых терминов, которые в тексте документа находятся рядом друг с другом, причем порядок следования терминов не важен.
Запрос может быть многоуровневым. Различные уровни либо определяются приоритетами входящих в него операторов, либо фиксируются с помощью круглых скобок.
Например: (кофе | какао) ! (молот | зерн) & раствор
Такому запросу удовлетворяют документы, в которых присутствует термин "растворимый(-ое и т.д.)", а также либо термин "кофе", либо термин "какао", либо оба вместе, но при этом отсутствуют термины "молотый(-ое и т.д.)" и "зерна(-ах и т.д.)".
Ознакомьтесь с примерами сложных запросов, отбирающих новости по основным рубрикам.