permalink

4

Links und immer wieder Links

1. Überblick

Bestenlisten sind beliebt. Wer ist populär? Wer bringt qualitativ hochwertige Inhalte? Wer bewegt die Massen? All das möchte man messen und darstellen. Entsprechend gibt es auch Bestenlisten für Blogs.

Bekannt sind die deutschen Blogcharts. Was diese genau messen, lässt sich im FAQ nachlesen:

Die deutschen blogcharts sind eher gleichzusetzen mit Zitate-Rankings, die man aus den alten Medien kennt. Statt “Welche Tageszeitung wird von anderen Medien am meisten zitiert?” fragen wir “Welches Blog wird von anderen Blogs am meisten zitiert?”.

Ebenfalls dort wird erwähnt, welche Alternativen sich für jene bieten, denen Zitate-Rankings nicht reichen. Dem Autor, genauso wie vielen Lesern dürfte jedoch klar sein: Es gibt praktisch keine Alternativen, denn die angegebenen Seiten stellen die Wirklichkeit noch verzerrter dar als oder haben aus verschiedenen Gründen viel zu wenige teilnehmende Blogs und somit unzureichende Daten zur Verfügung.

Ähnlich einseitig ist die Abdeckung durch Suchmaschinen. Google dominiert die Suche im Netz, alle anderen Mitspieler (Microsoft mit Live Search, Yahoo-Suche mit etc.) spielen eine untergeordnete Rolle).

Daraus folgt: Das Maß aller Dinge ist das System, das Technorati und Google diktieren: Links und Relevanz in ihrem Sinn.

Technorati zählt (mit einigen Einschränkungen) Links von Blogs zu anderen[1]. Diejenigen mit den meisten Referenzen landen oben in den Charts.

Die Google-Suche durchforstet, speichert und indiziert Webseiten und weist diesen einen Relevanz-Rang zu (der Google PageRank).Auch hier werden hauptsächlich Links gezählt.

2. Was man über die „Top-Blogs“ sagen kann

Zur Übersicht eine Tabelle mit ein paar allgemeinen Informationen zu den derzeit[2] fünf „populärsten“ Blogs:

Tabelle 1. Übersicht

Blog Position Wortanzahl Ausgehende Links Zeitraum Weiterreiche
Basic Thinking 1 204 54 2 7/10
Spreeblick 2 83 33 2 9/10
Nerdcore 3 205 70 1 9/10
Bildblog 4 218 52 8 -
Netzpolitik 5 218 30 2 5/10

Für jedes Blog habe ich die letzten zehn Einträge angeschaut. Keines der Blogs kommt über einen Durchschnitt von ca. 220 Wörtern pro Eintrag hinaus (wobei die Beiträge oft weiter ober- oder unterhalb des einfachen Durchschnitts liegen). Viele Artikel enthalten zahlreiche Referenzen auf andere Blogs und Quellen. Besonder auffällig ist die hohe Anzahl an Quellverweisen (oft mit „via“ angegeben).

Das führt zum Punkt „Weiterreiche“. Der größte Teil der Artikel sind nicht viel mehr als Wiederholung/Aufgreifen einer Neuigkeit oder eines Hinweises. Eigenes Gedankengut wird häufig nur zur Garnierung benutzt.

Auffällig ist außerdem, dass die ersten Plätze durch sehr aktive Blogs mit ständig neuen Inhalten gestellt werden. Zwischen ein und zwei Tage dauert es, bis so ein Blog zehn Beiträge liefert.

Zusammenfassend kann man also sagen: Die populärsten Blogs sind oft (aber nicht immer) jene, die oft neue Inhalte in Form recht kurzer und verdaulicher Form anbieten. Dabei werden verhältnismäßig selten eigene Inhalte erstellt[3], sondern Inhalte anderer weiter gegeben. Kurzum: Diese Blogs haben das Format einer Nachrichtenseite mit dazu gehörenden Vor- und Nachteilen.

3. Qualität

Die Frage nach Qualität im kreativen Sinn ist durch die geringe Anzahl kreativer Beiträge bei vielen Blogs größtenteils irrelevant. Entscheidend für eine Nachrichtenseite ist es, möglichst früh etwas für den Leser interessantes vorzustellen und sprachlich halbwegs sauber zu übermitteln. In wiefern die verbleibenden Artikel etwas zur Qualität eines Top-Blogs soll nicht Gegenstand dieses Beitrags sein und ist sicherlich eine subjektive Sache.

4. Das richtige Zählen

Für Leute aus dem IT-Bereich mag das Zählen von Links auf andere Seiten als Maß aller Dinge zum Erkennen der Relevanz einer Seite Sinn ergeben. Technorati selbst sieht dieses System scheinbar völlig unkritisch[4]Allerdings bleibt unberücksichtigt, dass Links nicht identisch mit Verweisen sind, sondern nur eine Untermenge.

Man verweist nicht nur auf andere, wenn man Links setzt, sondern auch, wenn man sie zum Beispiel schlichtweg erwähnt oder ihre Ideen so aufgreift, dass der Leser einen Bezug herstellen kann. Es besteht für einen Leser, der Sven Honigwaldt und seinen Blog kennt, kaum ein Unterschied zwischen: „Auf Sven Honigwaldts Blog habe ich gelesen, dass [...]“ und „Auf Svens[5] Blog habe ich gelesen, dass [...]“. Für Suchmaschinen hingegen ist die erste Variante äußerst problematisch, so wie Sprache grundsätzlich ein schwieriges Unterfangen für Computer ist. Links machen es Suchmaschinen überhaupt erst möglich, halbwegs sinnvolle Daten zu sammeln.

Ähnlich problematisch verhält es sich mit der Relevanz von Webseiten. Google und Co können Webseiten nicht verstehen, sondern nur anhand relativ simpler Regeln erraten und mutmaßen, dass eine Seite Sinn ergibt oder nicht. Besucherbewusste Seitenbetreiber legen großen Wert darauf, sich nach diesen Regeln zu richten. Aus dieser Grundidee heraus hat sich ein kräftig florierendes Geschäft entwickelt, die Suchmaschinenoptimierung.

Diese Form der „Optimierung“ ist ein Rückschritt, ähnlich wie das maschinen-freundliche Programmieren in den 60ern. Damals waren Rechner teuer und langsam, Entwickler im Verhältnis billiger. Es wurde in Programmiersprachen geschrieben, die nicht an den Anforderungen des Programmierers, sondern an denen des teuren Computers ausgerichtet waren. Um einem Computer Anweisungen zu geben, musste sich der Programmierer an die zum Teil abstrusen Einschränkungen des Computers und der Programmiersprache anpassen[6].

Heutzutage sind Computer so preiswert, dass Programmierer im Verhältnis teuer sind. Daher hat sich der Fokus verändert. Programmiersprachen richten sich nach den Bedürfnissen der Programmierer. Computerprogramme sollen leicht zugänglich sein, idealerweise für jedermann.

Im Bereich der Suchmaschinen hingegen sind wir praktisch so weit wie Programmierer in den 60ern. Webseitenbetreiber müssen jede Menge seltsame Regeln lernen und anwenden, um im Wettkampf um die Aufmerksamkeit der Leserschaft zu bestehen. Wer diese Regeln zu sehr verinnerlicht, schreibt Texte unter Umständen nicht mehr besucher- und inhaltsgerecht, sondern im zweifelhaften logischen Sinne sprachlich unbegabter Suchbots[7].

5. „Blogosphären-Inzest

Im Gegensatz zu traditionellen Printmedien kann jeder, der ein Blog besitzt, Informations-Verteiler werden. Das ist so, als würde jeder seine eigene Zeitung drucken und leicht verteilen können.

Da aber allein durch diese Möglichkeit kein höheres Aufkommen von tatsächlichen Nachrichten entsteht, kommt es zu massiver Informationsverdopplung. Die Blogosphäre befruchtet sich zu einem erheblichen Teil selbst.

Als Beispiel siehe Abbildung 1, „Quellen, Medien und Abnehmer (Beispiel)“. Das Top-Blog (das „Medium“) bezieht von verschiedenen Quellen Informationen und stellt diese zur Verfügung. Verschiedene andere Seiten und Blogs greifen die Informationen vom Medium ab und stellen sie ebenfalls zur Verfügung. Für jeden Abnehmer, der die Informationen bereit stellt, kann es nun weitere Abnehmer geben. Der Baum kann noch sehr weit verzweigen.

Abbildung 1. Quellen, Medien und Abnehmer (Beispiel)

Quellen, Medien und Abnehmer (Beispiel)

Klicke hier für eine vergrößerte Ansicht

6. Zusammenfassung

Die Top-Blogs der deutschen Blogcharts und Technorati allgemein sind Führer im Bereich Zitate-Rankings. Viele Leute lesen und kommentieren diese Blogs. Dennoch besteht kein direkter Zusammenhang zwischen Qualität und Zitate-Ranking-Position. Meine winzige empirische Studie legt nahe, dass es bei vielen Top-Blogs (bei weitem aber nicht bei allen) gar nicht darum geht, eigene Inhalte zu schaffen, sondern mehr um simple Nachrichtenverteilung.

Wer über solche oberflächlichen Informationsquellen hinaus Texte und Artikel mit mehr selbst erdachten Inhalten lesen möchte, wird wohl bis auf Weiteres nicht darum herum kommen, sich z.B. Tipps geben zu lassen, vermeintliche Blog-Charts zu durchgraben oder Querfeldein zu googeln und sich über Blogrolls von Blog zu Blog zu hangeln.


[1] Wie man hier nachlesen kann, funktioniert Technorati in etwa so (Trennung der Punkte von mir):

1) We spider blogs, and match up their links to your blog – to anywhere on your blog

2) In the inbound blog list, we use the outbound links from the blog homepage, not from the archives

3) We do process RSS feeds an other metadata, but that doesn’t affect your inbound blog stats

4) Nightly, we go through the database and re-calculate the number of inbound blogs and links, which helps us double-check our work and also allows us to create the interesting newcomers list, the interesting recent blogs list, etc.

[2] Stand: 27.02.09

[3] Ausnahme: bildblog; Hier kann man wegen des ungwöhnlichen Konzepts der Seite nicht mit den gleichen Maßstäben arbeiten wie bei den anderen

[4] Von einer Technorati-Hilfeseite (Hervorhebung durch mich):

The relevance of a site on the Web can be determined by how often a source is cited and therefore considered an authority. Links in the world of weblogs are even more important since bloggers frequently link to and comment on other blogs, creating a sense of timeliness and back-and-forth one would have in a conversation. Technorati tracks the number of links and the unique source of links to determine the breadth and readership of any author or site.

[5] Sven ist zugegeben fiktiv.

[6] Als Beispiel: Ein Cobol-Programm

[7] Um ein Beispiel zu nennen: In traditionellen Medien ist es üblich, Titel nicht immer direkt auf den Inhalt zu beziehen. So kann der Titel eine Andeutung enthalten, die in diesem Wortlaut nicht im Text aufgegriffen wird und auch sonst nicht auf den ersten Blick mit dem folgenden Texte verbunden ist.

Ein Kritiker des Films „Pulp Fiction“ könnte den Titel „Im Anzug tötet es sich besser“ verwenden und danach kein Wort aus dem Titel oder stattdessen Umschreibungen verwenden. Für Suchmaschinen schwer verdaulich.

4 Kommentare

  1. Schöner Artikel.
    Fasst die wesentlichen Punkte zusammen.
    Allerdings finde ich, das der Punkt der Selbstbefruchtung noch viel umfangreicher ist als beschrieben. Die Informationen laufen schlimmstenfalls im Kreis und uralte Infos werden (unwissend?) als neue verkauft.

  2. Hi Frank,

    Danke für deinen Kommentar. Zugegeben kratzt der Artikel nur an der Oberfläche. Und die größte Schwachstelle hast du natürlich gleich entdeckt :-)
    Zur Selbstbefruchtung muss ich mir mal noch ein paar mehr Gedanken machen …