Zum Inhalt springen

Googles Core Updates, Neural Matching und RankBrain – Wer wie was wo wann?

a6ac076023cb44ea9c1169a3d545e7ec Googles Core Updates, Neural Matching und RankBrain - Wer wie was wo wann?

Über die Google Core Updates wurden bereits eine Menge Spekulationen angestellt, allesamt wenig überzeugend und immer nur für einen kleinen Teil der Phänomene als Erklärung geeignet. Nun ist auf Search Engine Journal ein Artikel von Roger Montti erschienen, der ein neueres Google Paper als Erklärung für die Core Updates heranzieht. Roger ist seit fast 20 Jahren als SEO-Berater und Webpublisher unterwegs und ich finde seinen Artikel wirklich lesenswert.

Das neue Paper von Google beschreibt nämlich einen vollkommen neuen Weg, das Ranking von Webseiten zu verbessern. Dieser Algorithmus soll mittels Deep Learning signifikante Verbesserungen in der Berechnung der Relevanz liefern. Natürlich weiß niemand, ob diese Technik überhaupt Verwendung findet, oder bereits im Einsatz bei Google ist, aber der Verdacht liegt zumindest sehr nahe.

Bildschirmfoto 2019 03 18 um 15.25.34 Googles Core Updates, Neural Matching und RankBrain - Wer wie was wo wann?

Was ist neu? Ist dieser Algorithmus Teil des Core Updates?

Der neue Algorithmus führt eine Methode zum Ranking von Webseiten ein, die Groupwise Scoring Functions genannt wird. Das Forschungspapier zeigt sehr deutlich Googles Bemühungen, Suchanfragen zu verstehen und zu verstehen, worum es auf einzelnen Webseiten geht. Das ist typisch für die aktuellen Entwicklungen der Google-Suche.

Der Autor des Artikels beim Search Engine Journal, Roger Montti meint, es wäre möglich, dass der Algorithmus als Teil eines mehrteiligen Updates des Suchranking-Algorithmus ausgerollt wurde, aber nicht das Einzige sei, das sich verändert hat. Also er geht konkret davon aus, dass das Core Update vom März 2019 aus einer Reihe von Verbesserungen besteht und die im Paper beschriebenen Methoden Teil dieser Veränderungen sind.

Warum ist dieser Algorithmus denn so wichtig?

Die Forschungsarbeit beginnt mit der Feststellung, dass maschinelle Lernalgorithmen Webseiten einzeln kennzeichnen und jeder Seite eigene Werte zuweisen, also jede Webseite von anderen Webseiten isoliert bewertet wird. Danach erst bewerten die Algorithmen die Webseiten im Vergleich zu den anderen Webseiten, um herauszufinden, welche Webseite am relevantesten ist.

Bisherige Ansätze werden wie folgt in dem Paper beschrieben:

“While in a classification or a regression setting a label or a value is assigned to each individual document, in a ranking setting we determine the relevance ordering of the entire input document list.”

Die Forschungsarbeit schlägt vor, dass angesichts des Alters aller relevanten Webseiten, Rückschlüsse auf die Nutzerintention gezogen werden kann:

“The majority of the existing learning-to-rank algorithms model such relativity at the loss level using pairwise or listwise loss functions. However, they are restricted to pointwise scoring functions, i.e., the relevance score of a document is computed based on the document itself, regardless of the other documents in the list.

[…] the relevance score of a document to a query is computed independently of the other documents in the list. This setting could be less optimal for ranking problems for multiple reasons.”

Es handelt sich also um eine Art dokumentenübergreifenden Vergleich, der an folgendem Beispiel veranschaulicht werden soll:

“Consider a search scenario where a user is searching for a name of a musical artist. If all the results returned by the query (e.g., calvin harris) are recent, the user may be interested in the latest news or tour information.

If, on the other hand, most of the query results are older (e.g., frank sinatra), it is more likely that the user wants to learn about artist discography or biography. Thus, the relevance of each document depends on the distribution of the whole list.”

Das ist super spannend! Denn in diesem Beispiel hilft das Alter der Webseiten tatsächlich, um herauszufinden, welche Antwort die beste Antwort für den Nutzer sein könnte. Wenn Suchmaschinenbenutzer also dazu neigen, Suchergebnisse im Vergleich zu anderen Webseiten zu betrachten, sollte es auch der Ranking-Algorithmus tun:

“…user interaction with search results shows strong comparison patterns. Prior research suggests that preference judgments by comparing a pair of documents are faster to obtain, and are more consistent than the absolute ratings.”

Es zeigt sich scheinbar, dass die Ergebnisse sich nochmal stärker verbessern, wenn Benutzeraktionen modelliert werden, also ganz ähnlich wie ein echter Nutzer der Algorithmus das angeklickte Dokument vor einem Klick mit seinen umliegenden Dokumenten vergleicht!

Spannend ist außerdem der Umstand, dass hier über signifikante Verbesserungen bei gleichzeitig minimalen Kosten berichtet wird, was zu einer höheren Wahrscheinlichkeit führt, in die Algorithmen von Google tatsächlich auch eingesetzt werden. Die Forscher kamen zu dem Schluss, dass diese neue Methode sowohl bei Deep Neural Networks, als auch auch baumbasierten Modelle funktioniert.

Das original Paper findest Du übrigens hier: https://storage.googleapis.com/pub-tools-public-publication-data/pdf/a995c37352b4b7d13923ca945cdcd03227c9023f.pdf

Googles Neuronales Matching versus RankBrain: Wie Google die beiden Technologien in der Suche verwendet

Neuronales Matching hilft Google, Wörter besser mit Suchen in Beziehung zu setzen, während RankBrain offenbar Google hilft, Seiten besser mit Konzepten in Beziehung zu setzen.

In letzter Zeit konnte man erstmals mehr über das neuronale Matching von Google hören, denn Danny Sullivan von Google beantwortete über das @SearchLiaison Twitter-Konto mehrere Fragen um zu klären, was neuronales Matching ist und wie es sich von RankBrain unterscheidet.

Was also ist neuronales Matching? Google erklärte dort, dass es sich beim neuronalen Matching um ein KI-basiertes System handelt, das Google seit 2018 hauptsächlich verwendet, um zu verstehen, wie Wörter mit Konzepten zusammenhängen. Es sei eine Art Super-Synonymsystem. Sullivan sagte außerdem, dass Google seit dem Frühsommer 2018 neuronales Matching verwendet.

Wie funktioniert das neuronale Matching?

Google sagt es hilft, Wörter besser mit der Suche in Verbindung zu bringen. Das Beispiel, das Google uns gab, war eine Suche nach „Why does my tv look strange“ mit dem Konzept des „Soap-Opera Effects“ zusammenhängt. In diesem Fall ist Google nun in der Lage, Seiten über den Seifenoper-Effekt zurückzugeben, selbst wenn diese Wörter garnicht verwendet werden.

Wie viel wird die neuronale Anpassung verwendet?

Google sagte im September 2018, dass neuronales Matching etwa 30 Prozent aller Anfragen betrifft.

Was ist RankBrain? Ist es nicht ähnlich?

Google SearchEngineland 2016 mit, dass RankBrain ebenfalls ein KI- bzw. Machine-Learning System ist, das Google hilft, Anfragen zu verstehen. Google sagte, dass RankBrain in erster Linie dazu dient, zu verstehen, wie Wörter mit Konzepten verbunden sind. Also wie ein Super-Synonymsystem. Wobei Synonyme Wörter seien, die eng mit anderen Wörtern verbunden sind.

Klingt eigentlich genauso wie beim Neural Matching, oder? Worin besteht also der Unterschied zwischen Neural Matching und RankBrain?

Google hat es so ausgedrückt:

RankBrain hilft Google, Seiten besser mit Konzepten in Beziehung zu setzen. Neuronales Matching hilft Google, Wörter besser mit der Suche in Beziehung zu setzen.

Einen spannenden Einstieg in das Thema Learning to Rank (and RankNet, LambdaRank and LambdaMART) findest Du außerdem in diesem Artikel bei Medium. Das Paper „Preference-Based Learning to Rank“ aus dem Jahr 2010 ist in diesem Zusammenhang ebenfalls sehr interessant, ein absolutes Must-Read ist der Artikel TF-Ranking: A Scalable TensorFlow Library for Learning-to-Rank aus dem Ende 2018.

4js Googles Core Updates, Neural Matching und RankBrain - Wer wie was wo wann?