Неизвестный
ЯндексФрагмент учебного курса
Часть 2.
Яндекс - национальная поисковая система Интернет.…
2.1.4.1. В поисковом языке
Яндекс операнд (от латинского operandum) - конкретное понятие, задающее поисковой машине соответствие единиц запроса и единиц текста. Операндами могут быть слова, фразы и выражения.Слово в языке запросов Яндекс - это единица любого естественного языка (русский, английский ...) и любая иная неразрывная цепочка разрешенных знаков (заглавных и прописных букв русского и английского алфавитов, арабских цифр и некоторых знаков, кроме знаков, ограничивающих слова). Наравне с буквами и цифрами в слово могут входить только знаки апострофы и дефис "-". В частности, допустимы в запросе и Яндекс уверенно находит документы, содержащие слова Д'Эстен и военно-дипломатический.
Границами слова
(как отдельного операнда) являются пробелы и разрешенные знаки. При этом слова, между которыми они находятся, ищутся как фраза - неразрывная цепочка слов. Особенностью поиска по такой "фразе" является то, что между словами в найденном тексте допускается как пробел, так и любой разрешенный знак, дефис и апостроф, при этом не всегда выдерживается нужное расстояние между словами.Упражнение Е02.16
. Такими разрешенными знаками - ограничителями слова являются:вопросительный знак "?" - подоходный?налог;
галочка верхняя "^" - tax^free;
запятая - Нигерия,Камерун;
знак табуляции - народ безмолвствует;
нижнее тире (подчеркивание) "_" - подоходный_налог;
номер "№" - закон№24-ФЗ;
обратная косая черта "\" - tax\free;
пробел или группа пробелов - Big Brother;
процент "%" - Российская%Федерация;
точка - 28.02.2000;
точка с запятой - подтасовка;результатов;
эт / собака "(at)" - diona(at)masterlab.ru.
Выполните приведенные выше запросы и посмотрите, что же поисковая машина
Яндекс предлагает в качестве результата.Границами слова (как отдельного операнда) с сохранением функции самого знака также являются отдельные
зарезервированные Яндексом знаки, приведенные в следующем упражнении. Слова, между которыми находятся эти зарезервированные Яндексом знаки, также рассматриваются как фраза.Упражнение Е02.17. Выполните следующие запросы и прокомментируйте полученные результаты.
восклицательный знак "!" используется Яндексом в качестве оператора модификации слова (не все формы, а только точная форма следующего за знаком восклицания слова), например, подоходный!налог (модификация слова изменяет порядок его поиска в тексте);
амперсанд "&" выполняет функцию оператора одновременного присутствия слов в одном предложении, например, знак&амперсанд ;
плюс "+" - оператор обязательного присутствия следующего за ним слова в одном документе, одновременно выступая в качестве ограничителя первого слова, например, консульское+учреждение ;
вертикальная черта "|" зарезервирована в качестве оператора альтернативности (обязательное присутствия в одном тексте любого из слов), например, Россия|российский;
верхняя волнистая черта "~" интерпретируется как оператор исключения второго операнда в предложении, например, рогатый~скот. В таком случае поисковая система должна найти только документы, содержащие слово "рогатый" и не содержащие слова "скот" в одном предложении.
Использование в запросе некоторых знаков внутри слова сразу приводит к сообщению "Синтаксическая ошибка" или неверной диагностике "Искомая комбинация слов нигде не встречается". К запрещенным в словах знакам относятся:
доллар "$", например, $100 mln income;
решетка "#", например, #777
звездочка (астериск/asterisk) "*", например, дипломат*;
кавычки непарные ", например, "Я помню чудное мгновенье;
любые квадратные скобки "[" или "]", например, [24];
знаки "больше" или "меньше" ">" "<", например, <http://www.ya.ru>;
знак равенства "=", например, Сережа + Наташа = ЛЮБОВЬ;
двоеточие ":", например, хочу заметить следующее: во-первых.
Также фатально использование в запросе
Яндекс следующих запрещенных внутри слов зарезервированных знаков:непарных круглых скобок "(" или ")" - парные круглые скобки интерпретируются Яндексом как выражение или оператор "логические скобки" и предназначены для изменения порядка выполнения операндов;
непарных фигурных скобок "{" или "}" - парные фигурные скобки используются для обозначения границ запроса на естественном языке;
прямой косой черты "/" - она зарезервирована в качестве начала операторов контекстного ограничения.
Итак, любая попытка употребления в запросе слов, содержащих запрещенные и зарезервированные знаки, приводит к синтаксической ошибке.
Тогда как находить в тексте сложные комбинации символов, содержащие такие знаки?
…
Copyright Кузнецов Сергей 2001
Опубликовано по адресу: http://www.u-learning.ru/unknowny.htm
Дата последнего редактирования 26.07.2021
© Кузнецов Сергей Валентинович