Неизвестный Яндекс

Фрагмент учебного курса

Часть 2. Яндекс - национальная поисковая система Интернет.

2.1.4.1. В поисковом языке Яндекс операнд (от латинского operandum) - конкретное понятие, задающее поисковой машине соответствие единиц запроса и единиц текста. Операндами могут быть слова, фразы и выражения.

Слово в языке запросов Яндекс - это единица любого естественного языка (русский, английский ...) и любая иная неразрывная цепочка разрешенных знаков (заглавных и прописных букв русского и английского алфавитов, арабских цифр и некоторых знаков, кроме знаков, ограничивающих слова). Наравне с буквами и цифрами в слово могут входить только знаки апострофы и дефис "-". В частности, допустимы в запросе и Яндекс уверенно находит документы, содержащие слова Д'Эстен и военно-дипломатический.

Границами слова (как отдельного операнда) являются пробелы и разрешенные знаки. При этом слова, между которыми они находятся, ищутся как фраза - неразрывная цепочка слов. Особенностью поиска по такой "фразе" является то, что между словами в найденном тексте допускается как пробел, так и любой разрешенный знак, дефис и апостроф, при этом не всегда выдерживается нужное расстояние между словами.

Упражнение Е02.16. Такими разрешенными знаками - ограничителями слова являются:

 вопросительный знак "?" - подоходный?налог;

 галочка верхняя "^" - tax^free;

 запятая - Нигерия,Камерун;

 знак табуляции - народ безмолвствует;

 нижнее тире (подчеркивание) "_" - подоходный_налог;

 номер "№" - закон№24-ФЗ;

 обратная косая черта "\" - tax\free;

 пробел или группа пробелов - Big Brother;

 процент "%" - Российская%Федерация;

 точка - 28.02.2000;

 точка с запятой - подтасовка;результатов;

 эт / собака "(at)" - diona(at)masterlab.ru.

Выполните приведенные выше запросы и посмотрите, что же поисковая машина Яндекс предлагает в качестве результата.

Границами слова (как отдельного операнда) с сохранением функции самого знака также являются отдельные зарезервированные Яндексом знаки, приведенные в следующем упражнении. Слова, между которыми находятся эти зарезервированные Яндексом знаки, также рассматриваются как фраза.

Упражнение Е02.17. Выполните следующие запросы и прокомментируйте полученные результаты.

 восклицательный знак "!" используется Яндексом в качестве оператора модификации слова (не все формы, а только точная форма следующего за знаком восклицания слова), например, подоходный!налог (модификация слова изменяет порядок его поиска в тексте);

 амперсанд "&" выполняет функцию оператора одновременного присутствия слов в одном предложении, например, знак&амперсанд ;

 плюс "+" - оператор обязательного присутствия следующего за ним слова в одном документе, одновременно выступая в качестве ограничителя первого слова, например, консульское+учреждение ;

 вертикальная черта "|" зарезервирована в качестве оператора альтернативности (обязательное присутствия в одном тексте любого из слов), например, Россия|российский;

 верхняя волнистая черта "~" интерпретируется как оператор исключения второго операнда в предложении, например, рогатый~скот. В таком случае поисковая система должна найти только документы, содержащие слово "рогатый" и не содержащие слова "скот" в одном предложении.

Использование в запросе некоторых знаков внутри слова сразу приводит к сообщению "Синтаксическая ошибка" или неверной диагностике "Искомая комбинация слов нигде не встречается". К запрещенным в словах знакам относятся:

 доллар "$", например, $100 mln income;

 решетка "#", например, #777

 звездочка (астериск/asterisk) "*", например, дипломат*;

 кавычки непарные ", например, "Я помню чудное мгновенье;

 любые квадратные скобки "[" или "]", например, [24];

 знаки "больше" или "меньше" ">" "<", например, <http://www.ya.ru>;

 знак равенства "=", например, Сережа + Наташа = ЛЮБОВЬ;

 двоеточие ":", например, хочу заметить следующее: во-первых.

Также фатально использование в запросе Яндекс следующих запрещенных внутри слов зарезервированных знаков:

 непарных круглых скобок "(" или ")" - парные круглые скобки интерпретируются Яндексом как выражение или оператор "логические скобки" и предназначены для изменения порядка выполнения операндов;

 непарных фигурных скобок "{" или "}" - парные фигурные скобки используются для обозначения границ запроса на естественном языке;

 прямой косой черты "/" - она зарезервирована в качестве начала операторов контекстного ограничения.

Итак, любая попытка употребления в запросе слов, содержащих запрещенные и зарезервированные знаки, приводит к синтаксической ошибке.

Тогда как находить в тексте сложные комбинации символов, содержащие такие знаки?


Copyright Кузнецов Сергей 2001

Опубликовано по адресу: http://www.u-learning.ru/unknowny.htm
Дата последнего редактирования 30.03.2010
© Кузнецов Сергей Валентинович

Сайты (Сергей Кузнецов / Кузнецов С.В.):
Исследование через Интернет рисков и возможностей бизнеса
Невидимый Интернет для бизнеса
Технологии производства баз знаний
Юридические исследования через Интернет
Бесплатные сервисы (Сергей Кузнецов / Кузнецов С.В.):
Поиск рыночных ниш через Яндекс
Выявление проблем через Яндекс
Поиск определений через Яндекс
Прочие генераторы поисковых запросов
Услуги (Сергей Кузнецов / Кузнецов С.В.):
Тематический мониторинг открытых источников
Профессиональный поиск информации
Поиск и мониторинг ниш на рынках
Технологические исследования через Интернет
Очные компьютерные тренинги
Дистанционное обучение
Об авторе: Резюме Сергея Кузнецова
Фотогалерея Сергея Кузнецова
Публикации и работы Сергея Кузнецова
Правила Сергея Кузнецова
Мифы о Сергее Кузнецове
Технологические работы Сергея Кузнецова
В разработке