Wissenswertes über Webseitenstatistik

Winston Churchill soll einmal gesagt haben, „ich traue keiner Statistik, die ich nicht selbst gefälscht habe“. Das sagt schon einiges zu Statistiken allgemein aus, die zwar Zahlen transportieren, aber auch interpretieren. Selbst wenn alle Zahlen richtig sind, also nicht gefälscht, ist es vor allem also die Grundlage der Erfassung und die Interpretation, die wir nachvollziehen sollten, um aus einer Statistik positives oder negatives ableiten zu können, mit dem wir dann auch zuverlässig arbeiten können.

Zunächst ist einmal sehr wichtig, zu wissen, wie eine Statistik zu ihren Zahlen kommt, was genau erfasst wird und ob die Statistik überhaupt dazu in der Lage ist, alles nötige zu erfassen. Daraus können wir dann ableiten, ob diese Statistik für unsere Zwecke überhaupt brauchbar ist. Gerade bei Webseitenstatistiken gibt es extreme Unterschiede und Statistiken für einunddieselbe Webseite können höchst unterschiedlich ausfallen und um mehrere hundert Prozent variieren. Wirklich zuverlässige Statistiken sind also zum einen davon abhängig, wie eine Statistik zustande kommt.

Eine ganze Reihe von verschiedensten Statistikdiensten und Tools kann schon online genutzt werden. Dabei sollten wir immer bedenken, dass diese Tools keinen Zugriff auf die Server haben, nur auf ausgelöste Zählimpulse oder Schätzungen beruhen und teilweise völlig unterschiedliche Dinge erfassen und zählen. Die einfachste Lösung ist der Counter, der jedoch nur erfasst, was auch Zählimpulse liefert, die zuvor eingebaut werden müssen. Was bei statischen Webseiten vielleicht noch halbwegs funktioniert, ist für komplexere Webprojekte mit dynamischen Seiten und integrierten Diensten oder Funktionen wie Blogs, Foren, Votings, Community-Funktionen und einigem mehr schon deshalb völlig ungeeignet, weil der für den Zählimpuls nötige Code nur in einen kleinen Bruchteil des Angebots integriert werden kann, also nur ein winziger Teil überhaupt gezählt wird, wenn nicht gar nur anhand nicht einmal näher bekannter Grundlagen lediglich geschätzt. Externe Statistiktools kann man also komplett ausschliessen, wenn man auf zuverlässige Ergebnisse wert legt.

Dynamische Projekte wie Seiten mit CMS-System, Blogs, Foren, Shops, Communities oder soziale Netzwerke basieren zumeist auf einer bestimmten Software, die mitunter bereits über eine integrierte Statistikfunktion verfügt oder mit Plugins aufgerüstet werden kann. Auch hier kommt es jedoch zuallererst darauf an, was genau erfasst wird. Oft berücksichtigt eine Statistik nur einen Teil der Grundfunktionen, während beispielsweise durch weitere Plugins zusätzlich implementierte Funktionen überhaupt nicht erfasst werden. Selbst die Grundfunktionen werden mitunter von verschiedenen Statistik-Plugins völlig unterschiedlich erfasst und noch unterschiedlicher ausgewertet. Das stellen wir leicht fest, indem wir einfach mehrere dieser Plugins probieren und die Ergebnisse miteinander vergleichen.

Bei beiden bisher beschriebenen Varianten wird lediglich ein Bruchteil der tatsächlichen Aktionen tatsächlich erfasst. So kann es beispielsweise vorkommen, dass statische oder gar dynamische Contentseiten durchaus gezählt werden, jedoch weder Forenbeiträge noch Kommentare, Activity-Streams, Userprofile, Aktions-Pages oder Votings, oft nicht einmal Blogbeiträge. Heraus kommt so lediglich ein unvollständiges und verzerrtes Gesamtbild.

Schliesslich bleibt noch die servergestützte Erfassung

Seitens des Hosters werden je nach Hostingpaket alle Aktionen in den originalen Server-Logfiles protokolliert. Hierbei handelt es sich um eine Textdatei, die absolut alles und jede einzelne Aktion mit Herkunft, Adresse, Dauer und diversen weiteren Daten wie IP-Adresse und verwendetem Browser protokolliert. Die Server-Logfiles enthalten tatsächlich als einzige Dokumentation wirklich alle tatsächlich getätigten Aktionen und Zugriffe und können daher auch als einzige wirklich zuverlässige Grundlage für eine Statistik angesehen werden. Hier gibt es zwei Möglichkeiten, die auf einer Auswertung der originalen Serverlogfiles beruhen:

Statistikfunktion des Webhosters

Die meisten Webhoster bieten von sich aus eine eigene Statistikfunktion an und stellen dem User die fertige Auswertung von aus den Logfiles generierten Daten an. Dabei bedient sich der Hoster einer eigenen servergestützten Software, auf die der Seiteninhaber entweder aus seinem Kundenmenü oder mittels gesonderter Zugangsdaten zugreifen kann. Eine Auswahl an Daten und Auswertungen kann dann direkt in fertigen Tabellen und grafischer Anzeige abgerufen werden. Die Statistik des Hosters erfasst grundsätzlich alle Zugriffe, es gehen also keine zum Teil sehr wichtigen Einzelheiten verloren und die Daten werden kontinuierlich erfasst und über einen längeren Zeitraum in miteinander vergleichbarer Form bereitgestellt, um Entwicklungen nachvollziehen zu können. Erfasst werden in der Regel die folgenden Eckdaten: Gesamte Zugriffe, Besucher, Seitenaufrufe, Einstiegs- und Ausstiegsseiten, häufigste Seiten, Suchmaschinen, häufigste Suchbegriffe, vom User verwendeter Browser und Herkunft des Besuchers (Land). Zugriffe werden nach Monaten, Tagen und Stunden angezeigt.

Achtung: Diese Funktion ist dann unzuverlässig, wenn mehrere Domains in einem Paket gehostet werden und die Software keine für jede Domain einzeln abrufbare Auswertung anbietet!

Auswertung mit eigener Analyse-Software

Meist bietet der Hoster neben der Statistikfunktion auch den Download der originalen Logfiles an. Diese Logfiles können mit einer speziellen Analysesoftware sehr umfangreich selbst ausgewertet werden. Software zur Auswertung von Logfiles ist zwar auch kostenlos im Internet erhältlich, jedoch meist in englisch, mitunter für ungeübte Anwender sehr umständlich zu bedienen. Gute Webanalysesoftware in deutsch ist recht teuer, es sollte also vor dem Einsatz gründlich geprüft werden, ob die Anschaffung solcher Software überhaupt nötig ist. Die Auswertung über eigene Software bringt mit Sicherheit die umfangreichsten Ergebnisse und erlaubt je nach Software auch die Analyse von einzelnen Promotionaktionen oder Teilbereichen, ist in der Handhabung jedoch auch sehr zeitaufwändig, erfordert eine gute Organisation und viel Speicherplatz für die Auswertungen. Eine umfangreiche Monatsauswertung kann schon einmal an die hundert Seiten stark sein und man verliert schnell den Überblick.

Achtung: Auch hier sind mehrere Domains in einem Paket problematisch und werfen ein unzuverlässiges Ergebnis aus. Eine eigene Auswertung macht nur Sinn für grosse professionelle Webauftritte, um die erfassten Ergebnisse direkt in Aufbau und Content der Seiten und Marketingmassnahmen einfliessen zu lassen. Wegen des hohen Aufwands lohnt sich das nur für Webauftritte mit mehreren Millionen Besuchern im Monat, über die auch mindestens fünfstellige Umsätze generiert werden.

Die beste Lösung

Am besten sind wir in den allermeisten Fällen tatsächlich mit dem Auswertungsangebot unseres Hosters bedient, das zum einen wirklich alle Zugriffe zuverlässig erfasst und gleich noch eine Reihe der wichtigsten Daten und Auswertungen zur Verfügung stellt, ohne dass wichtige Teile unter den Tisch fallen oder der Aufwand unverhältnismässig hoch wird.

© 08.2010 by Norbert Warnke für nowa.biz

Print Friendly, PDF & Email