Die WDF*IDF-Formel ist keineswegs neu. Mittlerweile arbeiten bereits viele Texter und Redaktionen mit einem WDF*IDF-Tool. Für die einen ist es der heilige Gral der Suchmaschinenoptimierung, für andere ist es schlichtweg Unsinn. Und wie immer liegt die Wahrheit irgendwo dazwischen. Wir stellen euch die Formel mal näher vor, erklären, wie man damit umgeht, welche Tools es gibt – und wo die Grenzen liegen.

Kurzer Blick zurück: Die Keyworddichte

Eines ist WDF*IDF auf keinen Fall: Eine Formel, die man einfach nur stupide anwenden muss, und damit dann umgehend große Erfolge erzielt. WDF*IDF ist ein Faktor unter vielen.

Kurzer Blick in die Vergangenheit: Vor einigen Jahren war die Keyworddichte (Keyword Density) eine Zeit lang der Stein der Weisen, wenn es um die Suchmaschinen-Optimierung von Texten ging. Die Keyworddichte steht für die Häufigkeit eines Keywords in einem bestimmten Text, und zwar in Bezug zur Gesamtzahl aller Worte des Textes. Allerdings sagt sie halt leider so überhaupt nichts aus über die Qualität eines Textes. Nur, weil die Keyworddichte bei 5% liegt, heißt das noch lange nicht, dass der Text auch wirklich hilfreich und qualitativ hochwertig ist. Ein weiteres Problem ist der fehlende Bezug zum Kontext. Ein Beispiel: das Wort Rasen. Rasen im Zusammenhang mit Wörtern wie grün, Bewässerungssystem und Garten ist ein anderes Wort als Rasen im Umfeld von Wörtern wie Führerschein, Punkte und Autobahn. Zum Glück ist die Keyworddichte mittlerweile größtenteils Geschichte.

Was bedeutet WDF*IDF?

WDF*IDF ist eine Formel. Auf die werfen wir mal einen näheren Blick: Der erste Teil, WDF, steht für die sogenannte „Within Document Frequency“. WDF ist eine dokumentspezifische Gewichtung eines Wortes innerhalb eines bestimmten Dokuments, also eines Textes oder einer Webseite. Die Formel ist recht kompliziert und enthält unter anderen gleich zwei Logarithmen. Einfach zusammengefasst steht WDF für die Keyworddichte, die durch einen Logarithmus gestaucht wird. Dieser bildet ein Korrektiv und verhindert, dass man nicht einfach endlos Keywords in den Text packen kann, und die Relevanz immer höher wird. Diese WDF wird jedoch nicht nur für ein Keyword, sondern für jedes Keyword im Text berechnet, zumindest für jedes sinntragende Wort. Wörter, die eher grammatikalische oder syntaktische Funktion haben, werden nicht berücksichtigt. Dadurch erhält man eine Ansicht, welches Wort den Text am stärksten beschreibt, welches Wort am zweistärksten usw.

Im Gegensatz zur Keyword-Dichte ist das durchaus ein großer Schritt nach vorne: Während die Keyword-Dichte lediglich die prozentuale Verteilung eines bestimmten Wortes in Bezug auf alle Worte des Textes berechnet, so bezieht WDF auch das Verhältnis aller im Text verwendeten Wörter mit ein.

Das war aber erst die eine Hälfte. Jetzt kommt der zweite Teil der Formel ins Spiel: IDF. Die „Inverse Document Frequency“ bildet ein Korrektiv für die WDF und schaut über den eigenen Tellerrand hinaus: Hier wird die Häufigkeit an Dokumenten zu dem zu untersuchenden Term mit einbezogen. Die Anzahl aller bekannten Dokumente wird ins Verhältnis zur Zahl der Texte gesetzt, die den zu untersuchenden Term enthalten. Es wird also die Frage untersucht: Wie sehr kann der Term überhaupt zur semantischen Identifizierung des Dokumentes beitragen? Die Idee dahinter ist folgende: Ein Wort, dass auf jeder Webseite im Internet vorkommt, kann nur wenig zur Relevanz des eigenen Textes beitragen. Ein Wort, dass jedoch seltener vorkommt, schon eher.
Diese beiden Formeln werden schließlich multipliziert, WDF*IDF, und ergeben somit die relative Termgewichtung eines Dokumentes im Verhältnis zu allen potentiell möglichen Dokumenten, die das gleiche Keyword enthalten.
Indem man den WDF*IDF-Wert für jedes sinntragende Wort im Dokument berechnet, so erhält man quasi die DNA des Textes – und erfährt somit eine ganze Menge über den Text. Informationen, die der Suchmaschine helfen, die besten Dokumente zu einem bestimmten Suchbegriff zu identifizieren. Und Informationen, die einem Redakteur oder SEO helfen, das inhaltlich beste Ergebnis zu erstellen.

Was bringt WDF*IDF?

WDF*IDF ist eine Möglichkeit zur Optimierung von Content. Und zwar, richtig angewendet, eine sehr hilfreiche. Das Ziel ist es ja so gut wie immer, die Texte einer Webseite nicht nur qualitativ hochwertig, sondern auch noch möglichst einzigartig zu gestalten, damit Suchmaschinen dieses Angebot zu einem bestimmten Suchbegriff aufgrund dieser Einzigartigkeit möglichst weit vorne in den SERPs listen.
Mit Hilfe von WDF*IDF-Tools können Texte zum einen hinsichtlich eines bestimmten Keywords optimiert werden. WDF*IDF ist aber auch für eine Themenrecherche gut geeignet, um sich einen Überblick zu verschaffen, welche Themen und Begriffe rund um das Haupt-Keyword noch so auftauchen – und an welche man bisher vielleicht noch gar nicht gedacht hat. Genauso kann es aufzeigen, welche Inhalte in meinem bereits verfassten und nun analysierten Text vielleicht noch fehlen.

Natürlich sollte man sich von der Formel bloß nicht verrückt machen lassen. Im Mittelpunkt steht nach wie vor ein qualitativ hochwertiger, einzigartiger und unterhaltsamer Text. WDF*IDF kann jedoch helfen, die Konkurrenz zu analysieren, Themenfelder abzustecken, sinnvolle und evtl. noch nicht verwendete Nebenkeywords zu identifizieren und somit den eigenen Text noch weiter zu optimieren.

WDF*IDF – und seine Schwächen

Dem aufmerksamen Leser wird es nicht entgangen sein: Bei der Formel IDF wird unter anderem “die Anzahl aller bekannten Dokumente”? Und woher weiß man, wie viel Dokumente es überhaupt gibt? Die Anzahl der Dokumente, in denen das Keyword vorkommt, kann man ja vielleicht noch abschätzen – Google selbst gibt ja beispielsweise bei Suchanfragen immer an “Ungefähr 67.500 Ergebnisse”. Aber woher weiß man, wie viel Dokumente es INSGESAMT sind? Und wie viele Dokumente gibt es, in denen mindestens einer der Terme steht? Nun, das weiß man nicht. Deswegen arbeiten alle WDF*IDF-Tools in diesem Bereich auch nur mit Näherungen.

Weiterhin berücksichtigt die WDF*IDF-Formel natürlich zahlreiche weitere, vor allem semantische Faktoren nicht, die ebenfalls eine Rolle spielen: Verteilung bzw Häufung der Begriffe, Flektieren, Synonyme, Wortkombinationen, etc.

Und schließlich sollte man sich auch unbedingt die Seiten anschauen, auf denen die Ergebnisse der jeweiligen WDF*IDF-Analyse beruhen. Google erkennt anhand der Wortwahl und der Worthäufigkeit, ob der Text gut „zum Thema passt“. Wenn man sich bei der WDF*IDF Analyse immer die am Besten rankenden Beiträge anschaut, geht man davon aus, dass diese Beiträge das Thema auch am Besten beschreiben. Das muss jedoch nicht immer der Fall sein. Das ist vor allem bei allgemeinen und/oder hart umkämpften Keywords der Fall. Bei diesen Keywords spielen andere Ranking-Faktoren eine Rolle, wenn es um die Positionierung auf den ersten Plätzen der SERPS geht. Eine WDF*IDF-Analyse macht hier dann eher keinen Sinn. Die WDF*IDF Analyse eignet sich auch eher weniger für Kategorie- oder Startseiten mit wenig Text.

WDF*IDF funktioniert hingegen gut bei Inhaltsseiten, für komplexe Themen und ganz besonders auch für Longtail-Keywords, für weniger aktuelle Themen, für längere Texte und schließlich für Keywords, die der Information dienen. Transaktionale Keywords, wie bspw. „iPad kaufen“ funktionieren wiederum eher nicht so gut.

Ein erster kurzer Blick auf Seite 1 der Suchergebnisse zum gewählten Keyword kann da schon helfen. Tauchen dort vielleicht nur aktuelle News auf? Oder gar SEO-Müll? Dann kann man sich eine ausführliche WDF*IDF-Analyse und nachfolgende Optimierung in der Tat sparen. Spätestens, wenn man jedoch ein WDF*IDF-Tool anschmeißt, sollte man sich die Ergebnisse immer gut anschauen und niemals blind drauf los optimieren.

Ein frei zugängliches Tool gibt es z.B. von OnpageDoc: http://www.wdfidf-tool.com

Fazit

WDF*IDF ist keineswegs eine Zauberformel. Es ist vielmehr ein recht komplexer Text-Ranking-Faktor, der nicht immer und keinesfalls blind angewendet werden kann und darf. Unter bestimmten Umständen und mit den richtigen Voraussetzungen ist es jedoch ein äußerst hilfreiches Tool zur Optimierung von Content. Und schließlich ist es auch schon viel Wert, die Formel und die zu Grunde liegenden Prinzipien verstanden zu haben – alleine damit hat man bereits einiges über SEO und die Arbeit von Suchmaschinen verstanden.