Besucher & Logfiles

Die verschiedenen Fachausdrücke im Zusammenhang mit der Erfolgskontrolle eines Webauftritts werden meist falsch angewandt. Hier ist ein kurzer Überblick über Logfiles und die wichtigsten Fachbegriffe.

  1. Logfiles
  2. Begriffe


1. Logfiles

Diese Dateien protokollieren alle Zugriffe auf den Webserver. Anhand dieser kann man den Erfolg seines Webauftritts kontrollieren. Es gibt zwei verschiedene Formate die meist genutzt werden: das Common/Extended Logfile Format und das des Microsoft Webservers.
Normalerweise stellt der Webhoster die Logfiles täglich oder wöchentlich dem Webmaster zur Verfügung (meist unter "/logs/access.log"). Diese kann man dann herunterladen und in einem geeigneten Analyseprogramm betrachten. Die Provider stellen im allgemeinen ein solches Programm zur Verfügung.

Apache-Webserver verwenden meist das im folgenden beschriebene Common Logfile Format:

IP - LOGINNAME [DATETIME] "KOMMANDO DATEI PROTOKOLL" CODE BYTES DOMAIN "REFERER" "SYSTEM INFO"

Beispiele:

212.93.16.112 - - [22/Jun/2000:04:47:57 +0200] "GET /prog/down/guldrad.exe HTTP/1.1" 200 629257 www.rendle.de "http://www.freeload.de/spiele1.html" "Go!Zilla 3.5 (www.gozilla.com)"
64.236.160.205 - - [22/Jun/2000:05:43:18 +0200] "GET / HTTP/1.1" 200 7419 www.rendle.de "http://www.spartipps.com/news/content/down114.html" "Mozilla/4.0 (compatible; MSIE 5.01; Windows 98; QXW0332z)"

Standard:

IP: entweder IP oder DNS-Adresse des zugreifenden Computers. Meist werden die IPs nicht aufgelöst, da sich die Hoster die zusätzlichen Serverkosten sparen wollen.
LOGINNAME: Name des zugreifenden Users; bei passwortgeschützten Accounts
DATETIME: die Zeit des Zugriffs im Format dd/mmm/yyyy:hh:mm:ss +MEZ
KOMMANDO: Art des Zugriffs: z.B. GET, HEAD
DATEI: Pfad und Name der Datei vom "root" aus gesehen
PROTOKOLL: das Protokoll mit Version
CODE: Rückgabecodes des Webservers z.B. 200 OK, 404 nicht gefunden, ...
BYTES: Anzahl der übertragenen Bytes

Zusätzlich:

DOMAIN: nicht in der Spezifikation, aber bei Puretec-Logfiles gesetzt
im Extended-Logfile Format (meist verwendet):
REFERER: die URL, von der der Zugriff erfolgt
SYSTEM INFO: Informationen über das System wie Browserversion, Betriebssystem, ...

2. Begriffe:

Hit / Zugriff:
Ein Hit ist ein Zugriff auf den Webserver; also jeder Eintrag in der Logfile wird als Hit gezählt. Es ist also egal, ob auf eine Seite, Grafik, ZIP-Datei, oder sonstiges zugegriffen wird. (Manche Analyseprogramme zählen fehlerhafte Zugriffe nicht mit.)

PageView:
Ein PageView wird registriert, wenn eine HTML-Seite angefordert wird. PageViews werden meist jeweils für einzelne Seiten und für alle Seiten zusammen gezählt.

Visits / Besucher:
Als Visit wird der gesamte Aufenthalt eines Besuchers auf dem Web-Angebot gezählt. Der Besucher wird anhand seiner IP identifiziert, d.h. alle Zugriffe die eine IP macht, gelten als ein Visit. Der Visit wird erst ausgelöst, wenn der Besucher "Inhalt" - d.h. eine HTML-Seite - aufruft. Wenn 30min kein Zugriff von dieser IP mehr kommt, dann kann ein neuer Visit von dieser IP ausgelöst werden.

OnePageViews:
Anzahl der Besucher, die nur eine Seite abgerufen haben.

PageExits:
Die Häufigkeit mit der eine bestimmte Seite, vor dem Verlassen des Besuchers abgerufen wurden. Ist diese Zahl bei einer Seite hoch, so weiß man, wo der Webaufritt den Besucher abschreckt und was man somit verbessern muß.

Counter:
Ein Counter wird meist auf der Startseite oder in einem dauerhaft sichtbaren Bereich eines Framesets plaziert. Dieser Counter zählt je nach Programmierung die "Visits" oder Seitenabrufe. Mit einem Counter muß man seine Logfiles nicht auswerten, sondern ruft eine Zusammenfassung per Webinterface oder per E-Mail ab. Counter sind CGI-Skripts, die in den HTML-Code eingebaut werden.


Autor: Steffen Rendle - http://www.rendle.de
Datum: 13. Februar 2001