Неизвестный Яндекс

Фрагмент учебного курса

Часть 2. Яндекс - национальная поисковая система Интернет.

2.1.4.1. В поисковом языке Яндекс операнд (от латинского operandum) - конкретное понятие, задающее поисковой машине соответствие единиц запроса и единиц текста. Операндами могут быть слова, фразы и выражения.

Слово в языке запросов Яндекс - это единица любого естественного языка (русский, английский ...) и любая иная неразрывная цепочка разрешенных знаков (заглавных и прописных букв русского и английского алфавитов, арабских цифр и некоторых знаков, кроме знаков, ограничивающих слова). Наравне с буквами и цифрами в слово могут входить только знаки апострофы и дефис "-". В частности, допустимы в запросе и Яндекс уверенно находит документы, содержащие слова Д'Эстен и военно-дипломатический.

Границами слова (как отдельного операнда) являются пробелы и разрешенные знаки. При этом слова, между которыми они находятся, ищутся как фраза - неразрывная цепочка слов. Особенностью поиска по такой "фразе" является то, что между словами в найденном тексте допускается как пробел, так и любой разрешенный знак, дефис и апостроф, при этом не всегда выдерживается нужное расстояние между словами.

Упражнение Е02.16. Такими разрешенными знаками - ограничителями слова являются:

 вопросительный знак "?" - подоходный?налог;

 галочка верхняя "^" - tax^free;

 запятая - Нигерия,Камерун;

 знак табуляции - народ безмолвствует;

 нижнее тире (подчеркивание) "_" - подоходный_налог;

 номер "№" - закон№24-ФЗ;

 обратная косая черта "\" - tax\free;

 пробел или группа пробелов - Big Brother;

 процент "%" - Российская%Федерация;

 точка - 28.02.2000;

 точка с запятой - подтасовка;результатов;

 эт / собака "(at)" - diona(at)masterlab.ru.

Выполните приведенные выше запросы и посмотрите, что же поисковая машина Яндекс предлагает в качестве результата.

Границами слова (как отдельного операнда) с сохранением функции самого знака также являются отдельные зарезервированные Яндексом знаки, приведенные в следующем упражнении. Слова, между которыми находятся эти зарезервированные Яндексом знаки, также рассматриваются как фраза.

Упражнение Е02.17. Выполните следующие запросы и прокомментируйте полученные результаты.

 восклицательный знак "!" используется Яндексом в качестве оператора модификации слова (не все формы, а только точная форма следующего за знаком восклицания слова), например, подоходный!налог (модификация слова изменяет порядок его поиска в тексте);

 амперсанд "&" выполняет функцию оператора одновременного присутствия слов в одном предложении, например, знак&амперсанд ;

 плюс "+" - оператор обязательного присутствия следующего за ним слова в одном документе, одновременно выступая в качестве ограничителя первого слова, например, консульское+учреждение ;

 вертикальная черта "|" зарезервирована в качестве оператора альтернативности (обязательное присутствия в одном тексте любого из слов), например, Россия|российский;

 верхняя волнистая черта "~" интерпретируется как оператор исключения второго операнда в предложении, например, рогатый~скот. В таком случае поисковая система должна найти только документы, содержащие слово "рогатый" и не содержащие слова "скот" в одном предложении.

Использование в запросе некоторых знаков внутри слова сразу приводит к сообщению "Синтаксическая ошибка" или неверной диагностике "Искомая комбинация слов нигде не встречается". К запрещенным в словах знакам относятся:

 доллар "$", например, $100 mln income;

 решетка "#", например, #777

 звездочка (астериск/asterisk) "*", например, дипломат*;

 кавычки непарные ", например, "Я помню чудное мгновенье;

 любые квадратные скобки "[" или "]", например, [24];

 знаки "больше" или "меньше" ">" "<", например, <http://www.ya.ru>;

 знак равенства "=", например, Сережа + Наташа = ЛЮБОВЬ;

 двоеточие ":", например, хочу заметить следующее: во-первых.

Также фатально использование в запросе Яндекс следующих запрещенных внутри слов зарезервированных знаков:

 непарных круглых скобок "(" или ")" - парные круглые скобки интерпретируются Яндексом как выражение или оператор "логические скобки" и предназначены для изменения порядка выполнения операндов;

 непарных фигурных скобок "{" или "}" - парные фигурные скобки используются для обозначения границ запроса на естественном языке;

 прямой косой черты "/" - она зарезервирована в качестве начала операторов контекстного ограничения.

Итак, любая попытка употребления в запросе слов, содержащих запрещенные и зарезервированные знаки, приводит к синтаксической ошибке.

Тогда как находить в тексте сложные комбинации символов, содержащие такие знаки?


Copyright Кузнецов Сергей 2001

Опубликовано по адресу: http://www.u-learning.ru/unknowny.htm
Дата последнего редактирования 26.07.2021
© Кузнецов Сергей Валентинович


Услуги: Веб-сервисы поиска
Систематизация знаний
Аналитические отчеты
Обзоры уровня техники
Поиск ниш на рынках
Учебный курс Транспрофессионал
Веб-сервисы документирования знаний:
Сценарий поиска: Определения
Мастер поиска информации (МП)
Каталог веб-сервисов на основе МП
Тестирование: правовых и патентных
баз данных, и еще чат-бота ChatGPT 3.5
Сайты: Базы знаний из открытых источников
Исследование рисков и поиск возможностей
Технологические исследования
Невидимый Интернет
Аналитическая юриспуденция
Об авторе: Резюме и фотогалерея
Публикации и работы
Этический кодекс
Мифы о С.Кузнецове
Авторские технологии
В разработке