Was ist der PageRank?

Was ist der PageRank Der PageRank (kurz PR) ist ein von den Google-Gründern Sergey Brin und Larry Page an der Stanford University in Kalifornien entwickelter und 1997 zum Patent angemeldeter Algorithmus. Aufgabe des Algorithmus ist die Bewertung von Internetseiten im World Wide Web anhand der Quantität und Qualität ihrer eingehenden Links (Backlinks). Googles Erfolg ist maßgeblich dem PageRank geschuldet, der rein quantitative Faktoren für das Ranking von Websites abgelöst hat.

Nachdem Google die Veröffentlichung des PageRank-Wertes eingestellt hat, ist der PageRank als Rankingfaktor beinahe in Vergessenheit geraten. Entgegen der vielfachen Annahme ist er aber nicht tot, sondern hat zugunsten neuer Rankingfaktoren lediglich an Bedeutung und damit auch an Aufmerksamkeit verloren.

SEO vor dem PageRank

Die ersten Suchmaschinen waren einfach gestrickt und somit auch leicht manipulierbar. Bevor Google die Websuche mit seinem innovativen Algorithmus revolutionierte, analysierten Suchmaschinen schlicht wie oft die Suchphrase (Keyword) auf einer Seite vorkam. Je häufiger, desto besser wurde die Seite zu diesem Suchbegriff gerankt.

Suchmaschinenoptimierung vor dem PageRank bestand folglich darin, die Keywords, für die man ranken wollte, möglichst oft auf einer Seite zu wiederholen. Weil die Crawler der Suchmaschinen nicht nur den für den Besucher sichtbaren Bereich analysierten, sondern den gesamten Quellcode auf die Suchphrase untersuchten, war es ein Leichtes die Suchergebnisse durch das Verstecken von Keywords im Quelltext zu manipulieren.

Mit der Zeit wurden die besten Positionen beliebter Suchbegriffe von Websites besetzt, die Keyword Stuffing betrieben haben, statt den Nutzern einen echten Mehrwert zu bieten. Sergey Brin und Larry Page schrieben dazu in ihrer Forschungsarbeit an der Stanford University:

 „Jeder, der in letzter Zeit eine Suchmaschine benutzt hat, kann leicht bestätigen, dass die Vollständigkeit des Index nicht der einzige Faktor für die Qualität der Suchergebnisse ist. ‚Junk-Ergebnisse‘ spülen oft alle Ergebnisse aus, an denen ein Benutzer interessiert ist.“

Die damaligen Studenten suchten nach einer Lösung für dieses Problem und entwickelten den PageRank, der ihrer Suchmaschine Google bis heute als Grundlage zur Bewertung von Webseiten dient.

Page meldete den PageRank 1997 zum Patent an, das auf die Stanford University eingetragen war. Damals existierte bereits die von Brin und Page 1996 entwickelte Suchmaschine „BackRub“, die seit dem 15. September 1997 unter dem Namen Google bekannt ist.

Theorie des PageRank

Sergey Brin und Larry Page wollten den Nutzern ihrer Suchmaschine Suchergebnisse zur Verfügung stellen, die nach Relevanz sortiert sind und somit einen echten Mehrwert bieten. Um die Qualität und somit den Wert von Webseiten einzuschätzen, übertrugen sie die wissenschaftliche Zitierpraxis auf ihre Suchmaschine.

In der akademischen Welt wird die Bedeutung wissenschaftlicher Arbeiten durch die Zitierhäufigkeit eingeschätzt (Impact Factor). Je häufiger eine wissenschaftliche Publikation von anderen wissenschaftlichen Publikationen zitiert wird, als desto bedeutsamer gilt sie. Brin und Page übertrugen die Methodik auf das World Wide Web und werten die Hyperlinks zwischen den Websites als Referenzen. Je mehr eingehende Links (Backlinks) eine Internetseite besitzt, desto wichtiger ist diese Seite.

Was so logisch klingt, war eine Revolution der Internetsuche, die Google einen echten Wettbewerbsvorteil verschafft hat und der Grund dafür ist, dass Google innerhalb kürzester Zeit zu einem der bekanntesten und wertvollsten Unternehmen der Welt wurde.

Funktionsweise des PageRank

Die Berechnung des PagerRank ist kein Geheimnis und kann der wissenschaftlichen Arbeit von Brin und Page entnommen werden. Darin heißt es:

 „Wir gehen davon aus, dass Seite A die Seiten T1…Tn hat, die darauf verweisen (d. h. Zitate sind). Der Parameter d ist ein Dämpfungsfaktor, der zwischen 0 und 1 eingestellt werden kann. d ist in der Regel auf 0,85 eingestellt. Weitere Details zu d finden sich im nächsten Abschnitt. Auch C(A) ist definiert als die Anzahl der Links, die von Seite A ausgehen. Der PageRank einer Seite A wird wie folgt ermittelt: 

PR(A) = (1d) + d (PR(T1)/C(T1) + + PR(Tn)/C(Tn)) 

Beachten Sie, dass die PageRanks eine Wahrscheinlichkeitsverteilung über Webseiten bilden, so dass die Summe aller PageRanks aller Webseiten eins ist.“

Die PageRank-Formel sagt aus, dass das Linkziel (A) von Google als umso wichtiger betrachtet wird, je mehr Seiten (Tn) darauf verweisen. Allerdings ist die Quantität der eingehenden Links nicht der einzige Einflussfaktor auf den PageRank-Wert. Je höher der PageRank einer Linkquelle, desto stärker wird sie von Google gewichtet. Ein Backlink der einen hohen PageRank transportiert ist für die Suchmaschinenoptimierung folglich weitaus nützlicher als eine Vielzahl schwacher Verweise.

Eine verweisende Seite gibt ihren PageRank also an die ausgehenden Links weiter (Vererbung des PageRank). Dabei ist zu beachten, dass der Wert auf die ausgehenden Links aufgeteilt wird. Eine Seite mit nur einem externen Link gibt seinen gesamten PageRank an das Linkziel weiter. Gehen von der identischen Seite vier Links aus, bekommt jede Seite ein Viertel des PageRank-Wertes zugewiesen (abzüglich Dämpungsfaktor).

Die Bewertung einer Seite ergibt sich somit rekursiv, indem die auf sie verlinkenden Seiten bewertet werden. Die Linkverfolgung erfolgt nach dem Random Surfer Modell, was einem zufällig durch das World Wide Web surfenden Internetnutzer entspricht. Der Dämpfungsfaktor (d) simuliert die Wahrscheinlichkeit, mit der ein zufälliger Besucher auf einen Link klickt und sorgt letztlich dafür, dass die Linkverfolgung nicht unendlich fortgesetzt wird.

Die Angabe des PageRank-Werts erfolgt auf einer Skala von null bis zehn, wobei zehn der höchste PageRank ist. Er wird für jede einzelne Seite einer Domain individuell und nicht nur für die gesamte Domain errechnet. Lange Jahre hat Google den PageRank in einer Toolbar öffentlich publiziert. Nachdem bereits einige Monate zuvor die öffentliche Aktualisierung des PageRank eingestellt wurde, wurde 2016 die Toolbar endgültig entfernt.

Manipulation des PageRank

Obwohl der PageRank manipulierten Suchergebnissen ein Ende setzen sollte, war der Algorithmus selbst nicht unangreifbar. Aus Keyword Stuffing wurde zu Beginn des 21. Jahrhunderts Link Spamming. Insbesondere Blogs, Foren und Gästebücher wurden dafür als leicht angreifbare Ziele missbraucht. Außerdem wurden mit sogenannten Linkfarmen eigens Websites erstellt, die einzig und allein dem Zweck dienten, möglichst viele Links auf Websites zu setzen, deren Ranking verbessert werden sollte. Zudem florierte der kommerzielle Linkhandel. Durch den Algorithmus und den Linkhandel wurde den Hyperlinks plötzlich ein monetärer Marktwert zugewiesen, der letztlich auch den Linkgeiz förderte.

Um die verschiedenen Arten der PageRank-Manipulation einzudämmen, führte Google 2005 das nofollow-Attribut für Links ein. Verweise, die mit diesem Attribut versehen wurden, werden nicht in die Berechnung des PageRank einbezogen.

Heutige Bedeutung des PageRank

Auch wenn der PageRank längst nicht mehr ausgewiesen wird, bedeutet dies nicht, dass Google ihn nicht mehr nutzt. Er ist – wenn sicherlich auch in veränderter Form – nach wie vor Bestandteil des Google-Algorithmus. Weil in den letzten Jahren aber viele weitere Rankingfaktoren hinzugekommen sind, mit denen Google in der Lage ist die Relevanz und Qualität einer Website zu messen, ist der PageRank bei weitem nicht mehr so bedeutend wie früher.

Die Grundidee, jeden Link als eine Art Empfehlung zu werten, hat nichts an ihrem Reiz verloren, wenngleich es an dieser Methodik durchaus auch Kritik geübt werden kann. Viele Kritikpunkte konnten durch die Einführung weiterer Rankingfaktoren, die zum Beispiel stärker das Nutzerinteresse in den Mittelpunkt stellen, jedoch eliminiert oder zumindest abgeschwächt werden. Und so gehören Backlinks auch heute noch zu den wichtigsten Rankingfaktoren überhaupt.

Mit dem PageRank-Wert ist jedoch auch eine wichtige Kennzahl zur schnellen Einschätzung von Webseiten verschwunden. Diverse SEO-Tools versuchen diesen Verlust mit eigenen Werten (Page Authority von Moz, URL Rating von Ahrefs, etc.) zu kompensieren, die jedoch höchst unterschiedlich ermittelt werden.

Die wichtigsten Fragen und Antworten zum PageRank

Was ist der PageRank?

Der PageRank ist ein von den Google-Gründern Sergey Brin und Larry Page entwickelter und zum Patent angemeldeter Algorithmus zur Bewertung von Webseiten, der die wissenschaftliche Zitierpraxis auf das World Wide Web überträgt. Der PageRank wurde lange Jahre auf einer Skala von 0 bis 10 angegeben.

Wie funktioniert der PageRank?

Um den Wert einer Webseite zu berechnen, berücksichtigt die PageRank-Formel (siehe Artikel) sowohl die Quantität als auch die Qualität von eingehenden Links. Je mehr und vor allem je stärker diese Backlinks sind, desto wichtiger scheint die Seite zu sein und desto besser wird diese vom Algorithmus in den Suchergebnissen gerankt.

Spielt der PageRank heute noch eine Rolle?

Obwohl die Veröffentlichung des PageRank 2016 eingestellt wurde, ist er nach wie vor Bestandteil des Google-Algorithmus. Weil in den letzten Jahren viele weitere Rankingfaktoren hinzugekommen sind, ist seine Bedeutung allerdings bei weitem nicht mehr so hoch wie zu Beginn des 21. Jahrhunderts.

Quellenangaben