Zum Inhalt springen

Rethinking Search: Google will alle Suchanfragen direkt beantworten!

de695878ddca4af49dd6dd9b54e1c950 Rethinking Search: Google will alle Suchanfragen direkt beantworten!

Die Art und Weise, wie Suchmaschinen funktionieren, hat sich seit Jahrzehnten nicht verändert. Doch Sprachmodelle wie GPT-3 könnten eine vollkommen neue Art von Suchmaschine ermöglichen. Ein neues Paper von Google-Forschern lässt vermuten, dass wir vielleicht bald Antworten von Google bekommen, die so aussehen, als stammen sie von einem Experten.

Die grundlegenden Algorithmen hinter Suchmaschinen wie Google sind alles andere als neu. TF IDF beispielsweise wurde bereits 1972 im Journal of Documentation von Karen Spärck Jones in dem Artikel „A statistical interpretation of term specificity and its application in retrieval” beschrieben. Vor mehr als 20 Jahren, genauer gesagt 1998 veröffentlichten zwei Studenten aus Stanford eine Forschungsarbeit, in der sie eine neue Art von Suchmaschine beschrieben:

In this paper, we present Google, a prototype of a large-scale search engine which makes heavy use of the structure present in hypertext. Google is designed to crawl and index the Web efficiently and produce much more satisfying search results than existing systems.

Aus „The Anatomy of a Large-Scale Hypertextual Web Search Engine“ von Sergey Brin und Lawrence Page

Den Algorithmus der alles änderte, nannten sie PageRank und jeder SEO weiß sofort was damit gemeint ist. Erstmals wurden damit Suchergebnisse nach ihrer Relevanz für die Suchanfrage eines Nutzers auf der Basis der eingehenden Verlinkungen von anderen Webseiten bewertet. Auf der Grundlage dieser Innovation wurde Google zum Tor zum Internet und ermöglichten es Sergey Brin und Larry Page eines der größten Unternehmen der Welt aufzubauen.

Suchmaschinen und allen voran Google sind in den letzten Jahrzehnten schneller und besser geworden, während das Web und dessen Informationgehalt stetig größer wurde. KI wird bereits heute eingesetzt, um Ergebnisse zu bewerten und Google verwendet das Sprachmodell BERT, um Suchanfragen besser zu verstehen. Doch wirklich grundlegend hat sich an der Art und Weise nichts verändert, wie Suchmaschinen das Netz crawlen, indexieren und die Ergebnisse zu einer Suchanfrage anschließend aus dem Index abrufen und sortiert wieder ausgeben.

Kommt die nächste Revolution erneut von Google?

Oft wurde spekuliert, ob es jemals gelingen könnte, Googles Dominanz im Suchmarkt mit einem innovativeren Ansatz zu brechen, doch deren Forscher sind ebenfalls auf der Suche nach „dem nächsten großen Ding“ in Sachen Suche. Dabei könnte Google-Forschern nun etwas gelungen sein, das die Suche und damit auch die Arbeit aller SEOs drastisch verändern könnte.

Das Team um Donald Metzler, Yi Tay, Dara Bahri und Marc Najork hat auf dem Pre-Print-Server Arxiv in ihrem Paper einen Ansatz für ein radikales Redesign der Suche veröffentlicht, das den bisherigen Ranking-Ansatz vollkommen über Bord wirft. Der Kern der Suche wird darin ein einziges großes KI-Sprachverarbeitungsmodell ersetzt, wie beispielsweise GPT-3 bzw. eine zukünftige Version davon.

Diese Forschungsarbeit gibt uns einen beängstigenden Ausblick auf die Zukunft der „Direct Answers“ und „Featured Snippets“ von Google. Denn die zentrale Idee hinter der Arbeit ist, dass die Suchmaschine die Suchergebnisse zu einer Suchanfrage nicht mehr als Liste von Webseiten ausgibt, auf der der Nutzer nach der gewünschten Information suchen muss, sondern ein sehr-komplexes Sprachmodell die Fragen des Nutzers direkt beantwortet.

Dieser Ansatz ist für aufmerksame Beobachter natürlich nicht neu, denn seit langem beantwortet Google einfache Fragen direkt oberhalb der organischen Suchergebnisse. Einer kontrovers diskutierten Studie zufolge werden bereits mehr als 65% der Suchanfragen so gut von Google und dessen Diensten beantwortet, dass es danach zu keinem Besuch mehr auf einer anderen Webseite kommt.

Wie sich Googles Suche ändern könnte

Donald Metzler und seine Kollegen von Google Research schreiben nun in ihrer Arbeit, dass Suchmaschinen, die mit einer Liste von Dokumenten auf eine Suchanfrage antworten ein Problem sind. Denn diie angefragten Informationen wären zwar darin enthalten, jedoch wird die Informationen selbst nicht gefunden. Außerdem sind Suchmaschinen derzeit überhaupt nicht gut darin, auf komplexe Anfragen zu antworten, die Antworten aus mehreren Quellen erfordern. Beispielsweise müsste man für die Beantwortung der Frage nach dem am besten geeigneten Produkt für einen Anwendungsfall, die unterschiedlichen Hersteller-Webseiten und Erfahrungsberichte lesen. Die Forscher vergleichen diese Art von Suchanfragen mit der Frage eines Patienten nach einem Rat des Arztes, bei der der Arzt mit einer Liste von Artikeln antworten würde, die der Patient lesen soll.

Hier wird es also vollkommen offensichtlich: Google ist nicht daran interessiert, Nutzer auf Webseiten zu führen. Dort wird an einer Suchmaschine gearbeitet, die sich wie ein menschlicher Experte verhält. Diese soll Antworten in natürlicher Sprache produzieren, die aus mehr als einem Dokument zusammengesetzt sind und ihre Antworten mit Verweisen auf unterstützende Beweise untermauern, wie es beispielsweise bei Wikipedia-Artikeln der Fall ist.

rethinking search 1 Rethinking Search: Google will alle Suchanfragen direkt beantworten!
Beispiel einer Web-Suche (links), pre-trained language model (Mitte) und Experten (envisioned system; rechts) Antworten für die Suchanfrage „What are the health benefits and risks of red wine?“ Abbildung 3 in „Rethinking Search:
Making Experts out of Dilettantes
“, Metzler et al. 2021

Aus meiner Sicht wäre es sogar denkbar, dass das vortrainierte Modell mit den regulären Suchergebnissen in Echtzeit quasi „on-the-fly“ trainiert wird und dann eine Antwort auf Basis der Informationen dieser Webseiten generiert und ausgibt.

Wann kann man mit einem Update rechnen?

Ganz so schnell wird es nicht gehen. Die Forscher schreiben in ihrem Paper, dass derzeit noch keine Modelle dazu in der Lage sind. Aber sie halten es prinzipiell für möglich und es gibt erste Arbeiten in dieser Richtung.

Große Sprachmodelle wie GPT-3 wurden auf gigantischen Textmengen aus dem Internet und Hunderten von Büchern trainiert. Dadurch können diese viele Fragen bereits heute beantworten, allerdings lässt sich nicht feststellen, aus welcher Quelle die gelieferte Information stammt, geschweige denn, ob diese korrekt ist. GPT-3 könnte auf Desinformation herein gefallen sein, oder selbst erfundenen Unsinn ausspucken.

Die Lösung die die Google-Forscher nun vorschlagen, besteht darin, zukünftige Sprachmodelle so zu bauen und zu trainieren, dass diese Aufzeichnungen darüber führen, woher ihre Ausgaben stammen.

Wenn das wirklich eines Tages funktioniert, würde das unser Sucherlebnis und die Arbeit der SEOs radikal verändern. Denn dann blieben kaum noch Suchanfragen übrig, bei denen Nutzer noch eine Webseite außerhalb von Googles Universum besuchen müssten. Den Bereich Navigational kann man ohnehin nicht sinnvoll optimieren und bei Transactional Queries kleistert Google immer mehr den gesamten sichtbaren Bereich mit bezahlten Anzeigen und Sonderformaten zu.

4js Rethinking Search: Google will alle Suchanfragen direkt beantworten!