|
Помимо использования операторов языка запроса, в поисковой системе Яндекс существует возможность регулировать результаты выдачи по базовому запросу (в URL страницы выдачи ему соответствует значение параметра text) с помощью целого ряда get-параметров формата переменная=значение, используемых в URL страницы выдачи.
Базовый набор этих параметров можно определить с помощью использования фильтров расширенного поиска, а также индивидуальных настроек поиска.
С помощью настройки региона поиска происходит управление параметром
• lr (регион выдачи) – в качестве значения используется номер региона. Числовые значения номеров некоторых распространенных регионов можно найти на странице https://yandex.ru/yaca/geo.c2n , но используемая база значительно полней (в ней по различным оценкам, полученным методом перебора значений, содержится несколько десятков тысяч регионов). Этот параметр не имеет аналога в языке запросов.
Фильтры расширенного поиска активируются по нажатию соответствующей кнопки в поисковой форме: https://yandex.ru/support/search/how-to-search/advanced-search.xml. Также отдельно форма расширенного поиска Яндекса в несколько ином формате находится по адресу https://www.yandex.ru/search/advanced, но, не исключено, что она уже не относится к документированным возможностям поиска, а является позабытым артефактом. С помощью расширенного поиска возможно определить ряд параметров URL страницы выдачи. Некоторые из них по сути дублируют соответствующие операторы языка запросов, а некоторые в языке запросов не имеют аналогов. Следует отметить, что мне представляется более предпочтительным при исследовании выдачи, где это возможно, применять именно get-параметры, а не операторы языка запроса. Так как при этом сам базовый запрос формально остается неизменным, что обеспечивает, на мой взгляд, большую чистоту исследования.
• rstr (поиск по сайтам из заданного региона) – в качестве значения используется номер региона аналогично оператору lr с одним отличием, что перед номером региона необходимо поместить знак «минус», например: rstr=-15. К сожалению, на самом деле в выдаче с использованием этого параметра содержатся не документы, привязанные к заданному региону, а документы, которые содержат в тексте или анкор-файле упоминание заданного региона, т.е. по сути происходит некоторая модификация базового запроса путем добавления к нему названия региона.
• site (поиск на заданном сайте) – в качестве значения используется имя домена или поддомена. По принципу действия аналогичен оператору site:, однако результаты выдачи могут отличаться друг от друга
• lang (язык документа) – принимает значения:
ru (русский)
en (английский)
fr (французский)
de (немецкий)
uk (украинский)
be (белорусский)
tt (татарский)
kk (казахский)
tr (турецкий)
id (индонезийский)
По принципу действия аналогичен оператору lang:, однако результаты выдачи могут отличаться друг от друга
• mime (формат документа) – принимает значения html, pdf, rtf, doc, swf, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx.
По принципу действия аналогичен оператору mime:, однако этот оператор, в отличие от параметра, не поддерживает значение html
• zone (зона документа) – принимает значения
all (где угодно)
title (в заголовке), по принципу действия аналогично оператору title:, однако результаты выдачи могут отличаться друг от друга
• wordforms (употребление слов) – принимает значения
all (в любой форме)
exact (как в запросе), по принципу действия аналогично оператору “” (поиск по цитате), однако результаты выдачи могут отличаться друг от друга
• numdoc (количество результатов на странице выдачи) – принимает значения 10, 20, 30 и 50. При использовании чисел, отличных от этих значений, меньших 50, происходит округление вверх до ближайшего из них. При использовании чисел более 50, происходит округление до 50.
Также существует ряд параметров даты обновления документа, по принципу действия аналогичных оператору date:
• from_date_full (начальное значение диапазона дат) – принимает значения в виде ДД.ММ.ГГГГ
• to_date_full (конечное значение диапазона дат) – принимает значения в виде ДД.ММ.ГГГГ
• within (диапазон дат) – принимает значения
1 (за две недели)
2 (за месяц)
3 (за три месяца)
4 (за полгода)
5 (за год)
6 (за два года)
7 (за сутки)
77 (за сутки)
8 (за трое суток)
9 (за неделю)
Оператор within имеет приоритет над операторами from_date_full и to_date_full при совместном использовании
В основном поиске также поддерживается один из параметров, указанных в документации get-запросов для сервиса Яндекс.XML
• l10n (язык уведомлений) – устанавливает язык интерфейса страницы с результатами поиска, принимает значения:
ru (русский)
uk (украинский)
be (белорусский)
kk (казахский)
Кроме того, в различных служебных сообщениях на странице выдачи можно обнаружить ссылки на страницы выдачи, содержащие следующие параметры:
• page (номер страницы выдачи) – принимает значения от 0 (первая страница) до 18
• noreask=1 – отключение автоматического исправления опечаток, добавления результатов выдачи по схожим запросам
Также продолжают работать некоторые параметры-артефакты, которые некогда содержались в ссылках из различных служебных сообщений на странице выдачи, но со временем эти сообщения перестали показываться:
• nomisspell=1 – в настоящий момент по действию аналогичен параметру noreask=1
• how=tm – сортировка выдачи по дате первичной индексации документа
• rd=0 – отключение фильтра дубликатов (в терминах Яндекса – «слишком похожих страниц»)
• pag=u – разгруппировка результатов выдачи по сайтам
Учитывая тот факт, что при этом также происходит и разгруппировка аффилиатов, этот параметр можно использовать для поиска отфильтрованных аффилиатов в выдаче, правда здесь нужно учитывать, что разгруппированные страницы с некоторых сайтов могут занять много мест в топе, что затруднит поиск аффилиатов.
В завершении стоит, пожалуй, заметить, что есть еще один параметр-артефакт, который некоторым образом изменяет результаты поиска по базовому запросу. Это параметр hodreq, значение которого представляет собой некоторый поисковый запрос. Когда-то это параметр использовался в режиме «Искать в найденном», фиксируя предыдущий поисковый запрос, который ограничивал выборку документов для применения базового запроса. Однако на данный момент корректно интерпретировать действие этого параметра мне, к сожалению, не удалось. |
|
|
|
|