Im Juni 2010 überarbeitete Google seinen Suchindex und veröffentliche das sogenannte Caffeine-Update. Was genau dahinter steckt und welche Auswirkungen das für Nutzer wie auch für Webseitenbetreiber hatte, das schauen wir uns im Folgenden mal näher an.

Der Suchindex vor Caffeine

Im Gegensatz zu anderen wichtigen Updates wie bspw. Panda oder Penguin, war Caffeine keine Änderung am Algorithmus, sondern eine Änderung an der Infrastruktur. Caffeine war ein gänzlich überarbeiteter Suchindex. Dieses neue Indexierungssystem brachte ein umfassendes Update der Infrastruktur mit sich und war das Fundament für alle nachfolgenden Updates.

Um zu verstehen, was an Caffeine so besonders war, muss man einen Blick auf den vorherigen Suchindex und die generelle Funktionsweise der Suchmaschine werfen: Googelt ein User eine bestimmte Suchanfrage, dann durchsucht er damit nicht das Internet an sich, sondern einen Index des Webs. Das kann man sich ähnlich dem Inhaltsverzeichnis eines Buches vorstellen. Und dieser Index (das Inhaltsverzeichnis) wird von Google erstellt.

Der Suchindex vor dem Caffeine-Update bestand aus mehreren Schichten, manche Schichten wurden schneller aktualisiert, andere langsamer. Es gab beispielsweise eine Hauptschicht, die alle paar Wochen erneuert wurde. Und die komplette Aktualisierung einer Schicht dauerte eine ganze Weile – dazu musste nämlich das ganze Web analysiert werden. Neue Webinhalte landeten also teilweise mit einer deutlichen Verzögerung im Index. Das bedeutet, dass zwischen dem Moment, in dem Google eine neue Seite entdeckt, und dem Zeitpunkt, zu dem diese Seite dann auch wirklich für den User über die Suche aufzufinden ist, eine ganze Weile vergehen konnte.

Das Caffeine-Update: Weg von statischen Inhalten

Mit Caffeine änderte sich das ganz entscheidend. Der neue Suchindex bestand nicht mehr aus Schichten, die nach und nach komplett aktualisiert wurden, sondern er aktualisierte sich schrittweise (inkrementell) und kontinuierlich: Inhalte wurden andauernd gecrawlt und indexiert. Das Web wird in kleinen Portionen analysiert, gleichzeitig wird der Index ständig aktualisiert, und das weltweit. Findet der Googlecrawler neue Informationen auf bestehenden Seiten oder gar gänzlich neue Webseiten, so werden diese sofort nach Ihrem Auffinden dem Index hinzugefügt – und sind somit auch sofort durch den Nutzer auffindbar, der danach googelt.

Und Caffeine hatte nicht nur Auswirkungen auf statische Inhalte, sondern auf jegliche Form von Inhalten und Angeboten, von News und Foreneinträgen über Bilder und Videos bis hin zu Echtzeitupdates. Für Webseitebetreiber hatte Caffeine den entscheidenden Vorteil, dass nun eine viel höhere Chance bestand, dass neue Inhalte bereits kurz nach Veröffentlichung gecrawlt und indexiert werden.

Mit Caffeine reagierte Google auf die Entwicklungen im Internet und den damit einhergehenden neuen Anforderungen. Das Internet wird weltweit nicht nur minütlich größer und umfangreicher, der Content im Web wird auch immer vielfältiger und komplexer, vor allem auch im Hinblick auf die Art: Es gibt immer mehr Inhalte abseits klassischer Texte, seien es Bilder, Videos, Podcasts, Diskussionen oder Newsfeeds.

Gleichzeitig steigt auch die Erwartungshaltung der Nutzer: Suchergebnisse sollen nicht nur schnell gefunden werden, sondern auch möglichst aktuell und relevant sein. Und Anbieter von Content möchten natürlich, dass ihre neuen Inhalte so schnell wie möglich nach Veröffentlichung im Web von Goolge gefunden werden und dann auch umgehend im Suchmaschinenindex landen.

Mit Caffeine trug Google diesen neuen Bedingungen Rechnung und verkürzte unter anderem deutlich die Zeit zwischen Crawling und der Bereitstellung neuer Inhalte.

Auswirkungen von Caffeine

Caffeine erlaubte es Google, die Indexierung von Webseiten in einem vorher noch nicht dagewesenen Maßstab voranzutreiben. Und das hatte natürlich auch Auswirkungen auf die Suchergebnisse. Laut Carrie Grimes, Software-Ingenieurin bei Google, erhielten die User nach dem Caffeine-Update bis zu 50 Prozent aktuellere Ergebnisse als mit dem vorherigen Suchindex. Caffeine konnte bei seiner Einführung 2010 pro Sekunde Hunderttausende von Seiten verarbeiten, es beanspruchte knapp 100 Millionen Gigabyte Speicher und fügte täglich Hunderttausende von Gigabyten an Informationen dazu. Es war zum Zeitpunkt seiner Veröffentlichung „die größte Sammlung von Webinhalten, die Google jemals anbieten konnte“.

Caffeine war erst der erste Schritt, und gleichzeitig die Grundlage für alle weiteren, folgenden Entwicklungen und Verbesserungen an einer Suchmaschine, die mit der steigenden Informationsflut im Netz mitwächst und es sich zum Ziel gemacht hat, immer am schnellsten die relevantesten und aktuellsten Suchergebnisse zu liefern.

Bedeutende Updates nach Caffeine

Google arbeitet laufend daran, seine Suchmaschine zu verbessern. Ein kurzer Rückblick auf die wichtigsten Updates nach Caffeine: Im August 2011 wurde erstmalig das sogenannte Panda-Update weltweit ausgespielt. Dieses Update war eine Änderung am Googel’schen Such-Algorithmus und richtete sich hauptsächlich gegen Seiten und Angebote mit geringem und qualitativ minderwertigem Content. Seiten mit hochwertigem Content sollten hingegen besser in den SERPs, den Suchergebnissen, positioniert werden. Somit sollte die Qualität der Suchergebisse konstant verbessert und dem Nutzer möglichst nur noch hochwertige und relevante Suchergebnisse präsentiert werden. Vom ersten Panda-Update 2011 waren insbesondere sogenannte Content-Farmen betroffen. Seitdem wurden regelmäßig weitere Panda-Updates ausgespielt, das letzte war die Version Panda 4.1, die im September 2014 ausgerollt wurde.

Im April 2012 wurde das Penguin-Update weltweit und für alle Sprachen ausgerollt. Das Penguin-Update war, genauso wie das Panda-Update, eine Änderung am Ranking-Algorithmus und verfolgte das Ziel, noch radikaler gegen Webspam in den Suchergebnissen vorzugehen. Unter Webspam versteht Google Techniken, die von Webseiteninhabern angewendet werden, um ein möglichst gutes Ranking in den Suchergebnissen zu erzielen – oftmals auch mit Methoden, die gegen die Webmaster-Guidelines von Google verstoßen. Beim Penguin-Update standen die Links im Mittelpunkt, die auf eine Webseite verweisen, sogenannte Backlinks, und deren Qualität und Ausgestaltung. Im Mai 2013 folgte mit Penguin 2.0, eine weitere Verbesserung. Das Penguin-Update hatte einen wahrnehmbaren Effekt auf die Suchergebnisse.

Updates wie Penguin und Panda waren Änderungen am sogenannten Ranking-Algorithmus, der einen Teil des Such-Algorithmus darstellt. Der Such-Algorithmus wiederum bildet die Grundlage der Google-Suche. Und dieser Such-Algorithmus erhielt im August 2013, anlässlich des 15-jährigen Geburtstages von Google, eine umfassende Überarbeitung: Das Hummingbird (Kolibri) Update. Dieses Update stellte eine kleine Revolution in der Veränderung der Google-Suche dar und gilt als die bedeutendste Änderung des Such-Algorithmus seit dem Jahre 2000. Hummingbird betraf die Art und Weise, wie Goolge Suchanfragen versteht. Der überarbeitete Such-Algorithmus war in der Lage, Suchanfragen als Ganzes besser zu interpretieren. Konnte Google vor dem Update nur einzelne Wörter oder Wortkombinationen erkennen und verarbeiten, so war es dank Hmmingbird auf einmal möglich, auch die Verbindung zwischen diesen Wörtern und somit auch die Bedeutung hinter der Suchanfrage und den Kontext zu analysieren und zu bewerten. Laut eigenen Angaben beeinflusste Hummingbird bereits bei Einführung rund 90% aller Suchanfragen.