Bei WDF*IDF handelt es sich um eine Formel, die vor allem im deutschsprachigen Raum in der Suchmaschinenoptimierung verbreitet ist. Im Gegensatz zur Keyworddichte (Keyword Density) steht hier nicht das prozentuale Vorkommen eines Keywords in einem Text im Zentrum. Stattdessen wird die Häufigkeit eines Hauptkeywords und verwandter Begriffe im Verhältnis zu anderen Seiten gestellt.
Die Abkürzung WDF steht für „Within Document Frequency“ und meint die Häufigkeit eines Begriffes (bei WDF*IDF spricht man eher von „Term“ als von „Keyword“) in einem Dokument. Hinter IDF verbirgt sich „Inverse Document Frequency“. Das bedeutet, die Zahl aller bekannten Dokumente wird ins Verhältnis zur Anzahl von Texten mit dem entsprechenden Begriff bzw. Term gesetzt.
Die beiden Formeln sehen folgendermaßen aus:

i: Wort
j: Dokument
L: die gesamte Anzahl der Wörter im Dokument j
Freq(i,j): die Häufigkeit des Wortes i im Dokument j

ND: Gesamtzahl der Dokumente;
ft: Zahl der Dokumente, in denen der Begriff vorkommt.
Ein kurzes Rechenbeispiel macht die Formeln greifbar:
Kommt der Begriff „Suchmaschinenoptimierung“ in nur 5 von 1.000 bekannten Dokumenten vor, ergibt sich ein hoher IDF-Wert (log(1000/5) ist rund 2,3) – der Term ist also selten und damit unterscheidungsstark. Ein Allerweltswort wie „und“, das in fast allen 1.000 Dokumenten steht, erhält dagegen einen IDF-Wert nahe 0 und fällt kaum ins Gewicht. Multipliziert mit der dokumentinternen Häufigkeit (WDF) entsteht so eine Gewichtung, die seltene, themenrelevante Begriffe belohnt.
So funktionieren WDF*IDF-Tools
Um Dokumente einer WDF*IDF-Analyse zu unterziehen, sind entsprechende Tools notwendig. Diese funktionieren in der Regel folgendermaßen:
- Der User gibt ein Hauptkeyword ein und wählt ein Land aus.
- Das Tool untersucht die Seiten aus dem jeweiligen Land, die für das Keyword am besten ranken. Auf dieser Basis ermittelt es relevante Terme (Proofkeywords), die in dem Text enthalten sein sollten, und eine ideale Termgewichtung.
- Gibt der Nutzer nun seinen Text ein, zeigt das Tool an, welche Terme nicht, zu wenig oder zu häufig enthalten sind. Auf dieser Basis kann er den Text korrigieren, bis dieser möglichst dem idealen Verhältnis der Proofkeywords entspricht.
Gängige Tools mit WDF*IDF-Analyse sind unter anderem TermLabs.io, Seobility und SurferSEO. Sie unterscheiden sich vor allem im Umfang der ausgewerteten Vergleichsseiten und in der Aufbereitung der Proofkeywords.
Die Bedeutung von WDF*IDF für SEO
Die Formel existiert bereits seit Jahrzehnten; im Onpage-SEO machte sie vor allem Karl Kratz bekannt. Mittlerweile bieten viele SEO-Tools eine WDF*IDF-Analyse.
Wirksamkeit und Auswirkungen auf das Ranking sind umstritten. Befürworter sehen die Formel als modernen Nachfolger der Keyword Density. Kritiker bemängeln, dass WDF*IDF-Tools viele Synonyme, starke Begriffshäufungen in einem Absatz oder Keywordkombinationen nicht berücksichtigen. Vor allem Lesbarkeit, Tonalität und Formatierung spielen keine Rolle – obwohl sie mitentscheidend dafür sind, dass Texte bei der Zielgruppe ankommen.
Letztlich handelt es sich bei WDF*IDF um mathematische Berechnungen. Diese allein reichen nicht aus, um Texte erfolgreich zu optimieren, können aber wichtige inhaltliche Hinweise geben – etwa, ob ein Autor das Thema verfehlt hat oder wichtige Themenbereiche fehlen. Mehr zur OnPage-Optimierung.
WDF*IDF grenzt sich von TF*IDF ab: TF*IDF (Term Frequency * Inverse Document Frequency) ist der ältere, klassische Ansatz aus dem Information Retrieval und nutzt die einfache, lineare Termfrequenz – ähnlich der Keyworddichte. WDF*IDF staucht die Termhäufigkeit im Dokument dagegen logarithmisch (WDF = Within Document Frequency) und reagiert dadurch weniger empfindlich auf einzelne Ausreißer und reine Wortwiederholungen: Ein zehnfaches Vorkommen wird stark gedämpft gewichtet statt zehnfach. In der Praxis bewertet WDF*IDF also die ausgewogene Verwendung relevanter Terme höher als das bloße Aufblähen eines einzelnen Keywords.
Quellen
- wiki.induux.de, WDF*IDF erklärt (inkl. kurzes Video mit Karl Kratz): https://wiki.induux.de/WDF-IDF
- Wikipedia, tf-idf: https://en.wikipedia.org/wiki/Tf%E2%80%93idf