+7(920)124-1506 •

Как Google определяет намерение поиска пользователя?

Источник «Unwrapping the Secrets of SEO: How Google Interprets Search Queries» 

Ори Аллон, технический руководитель Группы качества поиска Google, сказал в интервью IDG :

«Мы очень много работаем над качеством поиска, чтобы лучше понять контекст запроса, каков запрос. Запрос не является суммой всех условий. За запросом стоит смысл. Для простых запросов, таких как «Бритни Спирс» и «Барак Обама», нам довольно легко оценивать страницы. Но когда запрос «Какой препарат следует принимать после операции на глазах?», Это намного сложнее. Нам нужно понять смысл ... »

В конечном счете, Google хочет идентифицировать пользователя, или поиск, намерение.

Как Google определяет намерение поиска

Для этого Google должен понимать контекст. Говоря о контексте, мы должны различать контекст поискового запроса, например отношения между терминами, пользовательский контекст, такие как местоположение и (поиск), исторический и тематический контекст. Некоторые формы контекста являются динамическими и могут меняться со временем. Рассматривая все доступные формы контекста, индивидуальное и твердое понимание намерений пользователя может быть экстраполировано для каждого поискового запроса.

Поэтому Google должен ответить на следующие вопросы:

  • Где находится пользователь?
  • На каком устройстве находится пользовательский поиск?
  • Чем интересовался пользователь в прошлом?
  • Как используемые термины связаны друг с другом?
  • Какие объекты включены в запрос поиска?
  • В каких контекстах используются термины?

Google может быстро ответить на первые два вопроса, используя информацию о клиенте, данные GPS и IP-адреса. На третий вопрос можно ответить, используя историю поиска, клики в результатах поиска и общее поведение в Интернете.
На последние три вопроса , которые связаны с реальным значением поискового запроса, нельзя ответить так легко.

Введение RankBrain

Введение Google RankBrain стало огромным шагом на пути к улучшению масштабирования и производительности.

Чтобы Google мог распознавать значения поисковых терминов, необходимо использовать имитацию семантического понимания с использованием статистических методов. Для этого требуется классификация терминов поиска с использованием комментариев или аннотаций и отображение терминов, которые еще не известны соответствующим темам. Из-за огромного количества поисковых запросов, которые ежедневно вводятся в Google, это невозможно осуществить вручную. Чтобы обеспечить масштабируемость, он должен выполняться с использованием кластерных анализов и автоматической кластеризации.

Google смог сделать это в 2015 году, когда он представил Machine Learning в форме RankBrain. Это помогло Google присоединиться к точкам между масштабируемостью и реконструированным семантическим пониманием поисковых запросов.

Методы интерпретации поисковых запросов

Google использует так называемый анализ векторного пространства для интерпретации поисковых запросов. Он преобразует поисковый запрос в вектор и переводит отношения с другими членами внутри векторного пространства. Сравнивая шаблоны отношений, можно определить намерение или смысл поиска, даже если конкретный поисковый запрос ранее не анализировался.

В связи с этим, пользовательские сигналы, такие как процент перехода по клику к результату индивидуального поиска , играют особенно важную роль. 

В разделе «Изучение взаимодействия с пользователем в личном поиске с помощью параметризации атрибутов» объясняется, как Google может использовать анализ поведения пользователя и отдельных документов для создания отношений семантических атрибутов между поисковыми запросами и документами, на которые нажимали - и даже для поддержки себя - алгоритм ранжирования обучения :

 как Google интерпретирует поисковые запросы

Рисунок 2

«Случай в частном поиске отличается. Обычно пользователи не обмениваются документами (например, электронными письмами или личными файлами), и поэтому непосредственное объединение истории взаимодействия между пользователями становится неосуществимым. Чтобы решить эту проблему, вместо прямого изучения поведения пользователя для данной пары [query, doc], как в веб-поиске, мы вместо этого предпочитаем представлять документы и запросы с использованием семантически когерентных атрибутов, которые каким-то образом указывают на их содержимое.

Этот подход схематически описан на рисунке 2. Оба документа и запросы проецируются в агрегированное пространство атрибутов, а сопоставление выполняется через это промежуточное представление, а не напрямую. Поскольку мы предполагаем, что атрибуты семантически значимы, мы ожидаем, что похожие личные документы и запросы будут разделять многие из одних и тех же агрегированных атрибутов, делая уровень атрибута совпадающим с полезной функцией в модели обучения для ранжирования».

Еще одна научная статья из Google с заголовком «Улучшение кластеризации семантических тем для поисковых запросов с совпадением слов и совместная кластеризация двунаправленных графов» дает несколько интересных сведений о том, как Google теперь, вероятно, классифицирует поисковые запросы в разных кластерах тем.

В этом документе представлены два метода, которые Google использует для создания контента для поисковых запросов. Так называемые «лифтовые баллы» играют центральную роль в первом, озаглавленном «Кластеризация совпадений слов».

надзорное машинное обучение

Эти алгоритмы также часто используются в Google для классификации и кластеризации информации и для составления прогнозов на этой основе. Согласно его собственному заявлению, Google полагается на надзорное машинное обучение, а это означает, что в разные моменты процесса машинного обучения люди предварительно классифицируют и оценивают результаты.

Согласно их собственным заявлениям, Google использует глубокие нейронные сети с не менее чем пятью слоями, которые затем называются Deep Learning. Использование нейронных сетей этой глубины позволяет автоматически и независимо создавать новые группы моделей, что снова значительно увеличивает масштабируемость.

Google также учится благодаря помощи веб-мастеров и оптимизаторов

Разработка семантической базы данных в виде Графа знаний, но в целом с идентификацией сущностей, во многом зависит от внешних лиц, таких как веб-мастера и редакторы Википедии. В целом, однако, долгосрочная цель Google заключается в том, чтобы иметь возможность самостоятельно извлекать данные, которые могут интерпретироваться, чтобы проект Knowledge Graph не останавливался.

Уход структурированных данных

Эта цель четко заявлена Google, Гари Иллис сказал:

«Я хочу жить в мире, где схема не так важна, но в настоящее время она нам нужна.
Если команда в Google рекомендует, вы, вероятно, должны ее использовать, поскольку схема помогает нам понять содержимое на странице и используется в определенных функциях поиска (но не в алгоритмах ранжирования) ...
У Google должны быть алгоритмы, которые могут фигурировать без необходимости схемы ... »
Источник: https://searchengineland.com/gary-illyes-ask-anything-smx-east-285706

За последние несколько лет Google научилась через Machine Learning интерпретировать контент автоматически и независимо от структурированных данных и назначать контент классу. Благодаря этому процессу интернет-магазины были важной помощью, которые последние годы послушно отмечали свои торговые каналы структурированными данными. Проверенные данные обучали голодный алгоритм машинного обучения Google Shopping.

Резюме:

«Сейчас Google действительно хорош с ключевыми словами, и это ограничение, которое мы считаем, поисковая система должна быть в состоянии преодолеть со временем.
Люди должны уметь задавать вопросы, и мы должны понимать их смысл, или они должны иметь возможность говорить о вещах на концептуальном уровне.
Мы видим много концептуальных вопросов, а не только, какие слова будут отображаться на странице, но более похоже на «что это такое?». »
Источник: Google wants your phonemes - InfoWorld


Автор:
Olaf-Kopp Olaf Kopp -соучредитель, руководитель отдела SEO и начальник отдела развития бизнеса (CBDO) в Aufgesang Inbound Marketing GmbH.