Auf den Spuren von Webseitenbesuchern – Sammlung, Analyse und Verwendung personenbezogener Daten im Internet – Teil 3

2.2 Werkzeuge

Google Analytics ist das am häufigsten eingesetzte Web-Analyse-Werkzeug . Der Grund dafür ist zum einem der freien Verfügbarkeit und kostenlosen Verwendung und zum anderen der einfachen Implementierung und intuitiven Bedienung geschuldet. Außerdem bietet Google Analytics hochinnovative Features, die ihresgleichen suchen, z.B. die Funktion „Radar“, die automatisierte Benachrichtigungen versendet, sobald etwas Außergewöhnliches vorfällt.

Auch wenn für Einbau und Verwendung kaum Kosten anfallen, ist der Preis für den Einsatz von Google Analytics nicht zu vernachlässigen: Zum einen gewährt der Webseitenbetreiber Google kompletten Einblick in seine Daten, was bei kommerziellen Seiten  Einsicht in wesentliche Teile der Buchhaltung bedeutet (neben Kundendaten werden z.B. Umsatzzahlen und Marketingdaten gespeichert), zum anderen geht der Webseitenbetreiber – zumindest in Deutschland – rechtlich ein großes Risiko ein; bislang ist nicht eindeutig geklärt, ob es sich bei der gespeicherten IP-Adresse um ein personenbezogenes Datum handelt. Alle erhobenen Daten werden automatisch und ohne Einwilligung des Besuchers in die USA zu Google übertragen und auf deren Servern gespeichert, was einen mehrfachen Verstoß gegen das Bundesdatenschutzgesetz darstellt , setzt man voraus, dass die IP-Adresse personenbezogen ist.

Zwei Funktionen von Google Analytics stellen Besonderheiten dar, die in dieser Form von keinem anderen Anbieter zu Verfügung gestellt werden können. Zum einen ist Google adwords – das SEM-Werkzeug zur Erstellung und Verwaltung von Textanzeigen im Internet – komplett in Google Analytics integriert, was ein einfaches Controlling der SEM-Maßnahmen ermöglicht, zum anderen kann Google durch die hohe Verbreitung seiner Software branchenübergreifend Vergleichs-Werte zur Verfügung stellen, sodass ein direkter Vergleich der eigenen Webseite mit dem weltweiten Branchendurchschnitt möglich ist.

Während die beiden letztgenannten Funktionen in dieser Ausprägung Google vorbehalten sind, bieten andere Anbieter, die Software verkaufen oder vermieten, den Vorteil die Daten nach aktueller Rechtsprechung rechtskonform zu erheben und zu speichern.

Desweiteren sind diese Softwares deutlich flexibler, sodass die Software genau die Daten zur Verfügung stellt, die das Unternehmen benötigt.

Beispielsweise bietet die Software Omniture SiteCatalyst von Adobe die Möglichkeit zielgruppengenaue Auswertungen zu erstellen, was weitere Erkenntnisse mit sich bringt und sehr spezifische Marketingaktivitäten ermöglicht.

Alle modernen Werkzeuge zur Webseitenanalyse verwenden Cookies als Trackingmethode.

2.3 Welche Daten werden erhoben?
2.3.1 Benutzerdaten

Jeder Anbieter greift auf dieselben Quellen zu. Die wichtigsten Metriken unterscheiden sich softwareübergreifend nicht.

Anhand von Cookies und IP-Adressen lassen sich Besucherdaten sammeln. Jede IP-Adresse verrät den ungefähren Standort des verwendeten Computers, sodass Land, Region und Stadt problemlos dargestellt werden können. Anhand der Tatsache, ob der Nutzer bereits einen Cookie besitzt, lässt sich erkennen, ob es sich um einen neuen oder wiederkehrenden Nutzer handelt. Liegt ein Cookie vor, lässt sich der Zeitraum errechnen, der seit dem letzten Besuch vergangen ist. Mit diesen Daten lassen sich bereits weitreichende Aussagen treffen und Trends erkennen. Die Anzahl der Besucher, die Anzahl der Seitenaufrufe, und die durchschnittliche Anzahl an Seitenaufrufen sind bekannt. Wird die Zeit ausgewertet, die zwischen Öffnen der Seite und dem Öffnen der nächsten Seite vergeht, lässt sich die Besuchszeit auf der Webseite und die Absprungrate erkennen. Die Sprache des Users lässt sich aus der Zugriffsquelle oder der Verweildauer auf der jeweiligen Sprachversion der Webseite erschließen. Die Besuchertreue – entspricht der Besuchshäufigkeit – und die Besuchstiefe sind weitere Kennzahlen, die sich leicht berechnen lassen. Über Javascript lässt sich der verwendete Browser, das Betriebssystem, grafische Eigenschaften, wie die Anzahl der Farben, die Bildschirmauflösung, die Flash-, bzw. Java-Version, der Provider, den Hostnamen und die Verbindungsgeschwindigkeit auslesen. Verwendet der User ein mobiles Gerät lassen sich zusätzlich der Name des Geräts und der Mobilfunkbetreiber auslesen.

2.3.2 Zugriffsquellen

Neben den Daten, die Rückschlüsse auf die Webseitenbenutzer zulassen, werden die Zugriffsquellen, also die Webseiten, die ein User jeweils als letzte besucht hatte zur Analyse verwendet. Existiert keine Zugriffsquelle, erhält man die Anzahl der direkten Zugriffe, also der manuellen Eingaben der URL in den Browser, bzw. Aufrufe über Lesezeichen. In allen anderen Fällen erhält man die Anzahl der Zugriffe und den Namen der Verweis-Webseiten. So ergibt sich z.B. ein Bild über den Erfolg von Suchmaschinenoptimierung und Suchmaschinenmarketing. Es lässt sich zwischen organischen Suchergebnissen (manuellem Suchen) und bezahlten Suchergebnissen unterscheiden. Alle Suchmaschinen liefern über die URL die verwendeten Suchbegriffe mit, sodass zusätzlich erfasst werden kann, mit welchen Begriffen die Suche erfolgreich war.

Weitere wichtige Zugriffsquellen sind Kampagnen. Dabei handelt es sich um die Auswertung der Klickhäufigkeit, z.B. in Verbindung mit Marketingaktionen auf einer Webseite, in einer eMail oder einer Anwendung. An die angebotenen Links werden vorher festgelegte IDs angehängt, so dass die Analysesoftware erkennt, dass der entsprechende Besucher über eben diesen Link auf die Webseite gelangt ist und kann eine entsprechende Verknüpfung herstellen.

Im Sonderfall Google Analytics existiert zusätzlich die Zugriffsquelle Google adwords. Hier kann nachvollzogen werden, welche Anzeige und welches verwendete Keyword am meisten Besucher auf die Webseite gebracht hatte.

2.3.3 Content

Im Bereich Content werden die einzelnen Unterseiten einer Webseite bewertet. So lässt sich z.B. ein Ranking der beliebtesten Seiten erstellen, die erfolgreichsten Webseitentitel (häufige Öffnungsrate) und erfolgreichsten Seiteninhalte (lange Verweildauer) darstellen oder die häufigsten Ausstiegsseiten erkennen.

Viele Anbieter stellen Klickpfade zur Verfügung. Da jeder Seitenbesuch im Cookie gespeichert wird, lässt sich die genaue Spur erkennen, die ein Besucher (im Cookie) hinterlässt. So lassen sich „Irrwege“ erkennen, also unerwünschte Pfade, die z.B.  durch Fehlfunktionen der Webseite von Besuchern eingeschlagen werden.

Mit der Trichteranalyse lässt sich feststellen, wie viele Besucher den geplanten Weg, z.B. bis zur Kontaktanfrage oder der Newsletteranmeldung, gehen und wie viele ihn wo verlassen.

2.3.4 eCommerce

Handelt es sich bei der Webseite um einen Internetshop, stehen zusätzliche Daten zur Verfügung. Zur Datenerhebung wird eine Übertragung der Transaktionsdaten von der Webseite zur Analysesoftware benötigt. Üblicherweise geschieht dies über versteckte Formularfelder.

Über die Transaktionsdaten lassen sich der Umsatz, die Conversion-Rate (das Verhältnis zwischen eindeutigen Besuchern und Transaktionen), der durchschnittliche Bestellwert und Rankings der erfolgreichsten Produkte und Kategorien darstellen. Darüber hinaus kann jede Transaktion anonym oder mit Shop-Bestellnummer dargestellt werden. Unter Zuhilfenahme von Cookies lassen sich zusätzlich die Besuche bis zum Kauf und die Tage bis zum Kaufzeitpunkt darstellen.

Die Speicherung und Darstellung der Bestellnummer stellt derzeitig datenschutzrechtlich eine Grauzone dar – zwar werden keine personenbezogene Daten gespeichert, doch die Zuordnung ist relativ einfach, schließlich liegen zu jeder Bestellnummer persönliche Daten vor – wenn auch meist in anderen Systemen.

Auf den Spuren von Webseitenbesuchern – Sammlung, Analyse und Verwendung personenbezogener Daten im Internet – Teil 2

2 Sammlung
2.1 Methoden
2.1.1 Logfile-Auswertung

Im „Logfile“ eines Servers werden alle Serverzugriffe protokolliert. Jeder Dateizugriff führt zur Erweiterung des Logfiles um eine Zeile. Alle Log-Dateien sind ähnlich aufgebaut, unabhängig vom Servertyp (z.B. Apache, IIS). Die Organisation w3.org hat einen weltweiten Standard für den Aufbau von Logfiles festgelegt.

Abbildung 1: Typischer Aufbau eines Logfile

Abbildung 1: Typischer Aufbau eines Logfile

Nach der IP-Adresse des zugreifenden Rechners folgen Benutzername und Passwort, falls keine existieren, werden wie in Abbildung 1 Bindestriche dargestellt. Es folgt der Zeitpunkt des Zugriffs, die Zugriffsmethode (hier „GET“), die angeforderte Datei, das Übertragungsprotokoll, der Status (200 = Ok) und die Dateigröße (hier 628 Byte).

Mithilfe dieser Daten kann die Popularität einzelner Webseiten und Webseitenelemente ermittelt werden. Kommt es zu Konversionen auf der Webseite (z.B. Bestellungen, Teilnahme an Gewinnspielen, Anmeldungen zu Newslettern), können mithilfe der Log-Daten betriebswirtschaftliche Kennzahlen gewonnen werden, wie der Umsatz pro Besucher (allgemein: Konversion pro Besucher = Konversionsrate) oder die Kosten pro Besucher, falls kostenpflichtige Werbung für die Webseite geschaltet wird.

Zu berücksichtigen ist, dass kein Eintrag in die Log-Datei erfolgt, wenn die komplette Webseite aus dem Cache-Speicher des Clients aufgerufen wird. Zur Logfile-Auswertung steht kostenlose Software in großem Umfang bereit.

Aufgrund der sehr beschränkten Daten findet diese Form der Datensammlung in der Praxis kaum statt, eine Protokollierung von Klickpfaden ist beispielsweise nicht möglich.

2.1.2 Zählpixel

Beim Zählpixel handelt es sich um ein transparentes Bild mit den Abmessungen 1×1 Pixel, das sich irgendwo auf der Webseite befindet und beim Webseitenaufruf für den Besucher unauffällig automatisch mitgeladen wird. Über entsprechenden HTML-Code kann der Aufruf des Zählpixels erzwungen werden, sodass auch die Seitenaufrufe registriert werden, die über den Cache des Clients stattfinden.

Durch den Einsatz von Javascript lassen sich neben den Informationen, die im Logfile gespeichert werden auch Informationen zur technischen Ausstattung des Clients sammeln, z.B. verwendeter Browser, Bildschirmauflösung, Java-, Flash-Version. Hier wird mit Aufruf des Zählpixels ein Skript ausgeführt, das die entsprechenden Daten ausliest und zum Server übermittelt.

Eine praktische Anwendung findet die Datensammlung mit Zählpixeln vor allem im Affiliate- und eMail-Marketing, da dort die Möglichkeit Logfiles auszulesen nicht unmittelbar besteht. In der klassischen Webanalyse spielt das Zählpixel heutzutage nur noch in Kombination, z.B. mit Cookies eine Rolle, da wie bei den Logfiles keine Rückschlüsse über vorher besuchte Seiten möglich sind.

2.1.3 Cookie

Cookies sind die am weitesten verbreitete Technik um Daten zur Webanalyse zu erheben. Ein Cookie ist eine Textdatei, die z.B. beim Aufruf einer Webseite auf dem Client-Rechner gespeichert wird.

Man unterscheidet Session-Cookies und permanente Cookies. Im Session-Cookie werden üblicherweise ausschließlich Wiedererkennungsdaten gespeichert, z.B. eine eindeutige ID, um seitenübergreifend während der kompletten „Session“ auf gespeicherte Daten Zugriff zu behalten. In Webshops findet so beispielsweise die Zuordnung zwischen Warenkorb und Client-Rechner statt. Session-Cookies werden nach Beendigung der Session automatisch vom Browser gelöscht. Die Identifikation des Client-Rechners ist nur während der Session möglich.
Permanente Cookies werden für ein vom Webseitenbetreiber festgelegten Zeitraum auf dem Client-Rechner gespeichert. Dadurch ist eine Wiedererkennung des Client-Rechners auch nach mehreren Tagen, Wochen oder Monaten möglich. Vorteil für den User ist der sitzungsübergreifende Login. Allerdings besteht die Gefahr, dass bei der Rechnernutzung durch mehrere Personen Nutzerdaten für andere einsehbar bleiben. Der Webseitenbetreiber hat den Vorteil, dass der Client-Rechner schon beim ersten Seitenaufruf erkannt wird und die Webseite entsprechend gestaltet werden kann, z.B. mit Werbung, die den bisher festgestellten User-Interessen entsprechen. Außerdem lassen permanente Cookies Rückschlüsse auf die Besuchshäufigkeit und den Zeitraum zu, der vergeht, bis eine Transaktion stattgefunden hat.

2.1.4 Weitere Methoden

Neben den oben beschriebenen gängigen Methoden existieren noch weitere, die in der Praxis allerdings keine große Rolle spielen.

Z.B. lässt sich der Klickpfad auch über die URL mitgeben. Dazu hängt jede besuchte Seite einen weiteren Wert an die URL der Folgeseite dynamisch an.

Die wahrscheinlich effektivste, aber auch umstrittenste Möglichkeit der Datenerhebung ist die Zwangsregistrierung auf einer Webseite. Hier können Klickverlauf, Verweilzeiten und technische Daten einer konkreten Person zugeordnet werden. Obwohl diese Technik nach § 4 (1) BDSG unzulässig ist („Die Erhebung, Verarbeitung und Nutzung personenbezogener Daten sind nur zulässig, soweit … der Betroffene eingewilligt hat.“), wird sie eingesetzt.

Auf den Spuren von Webseitenbesuchern – Sammlung, Analyse und Verwendung personenbezogener Daten im Internet – Teil 1

In diesem und den folgenden fünf Blogbeiträgen möchte ich eine Studienarbeit veröffentlichen, die ich im Herbst 2010 zum Thema Webanalytics verfasst habe.

Webseitenbesucher hinterlassen Spuren. Diese Spuren gilt es zu sammeln, zu analysieren und sinnvoll zu nutzen. Diese Einführung zum Thema Webanalyse gibt einen Überblick über Methoden zur Datenerhebung, Marketing-Maßnahmen und aktuelle informationstechnische Werkzeuge. Dabei stehen der praktische Nutzen und die Anwendbarkeit im Vordergrund.

1 Einführung

Seit jeher ist es von grundlegender Wichtigkeit, seine Zielgruppe genau zu kennen, um deren Bedürfnisse zu erkennen und diese befriedigen zu können. Diese Kenntnis wird einerseits durch Erfahrung aus dem Umgang mit der Zielgruppe, andererseits durch Marktforschung und -analyse gewonnen.Der Leiter eines dörflichen Supermarkts erlangt seine Kenntnisse durch den persönlichen Kundenkontakt, das städtische Kaufhaus durch die Ermittlung und Auswertung  der Verkaufszahlen und der Betreiber einer Webseite durch die Auswertung von Bewegungsdaten. Sowohl die Änderung der Öffnungszeiten eines Supermarktes wegen Flaute im Mittagsgeschäft, als auch das Angebot neuer Getränkesorte im Kiosk aufgrund mehrfacher Kundenbitte – die Erkenntnis der Notwendigkeit dieser Maßnahmen wird mithilfe von mehr oder wenigen präzisen Kundendaten erlangt. Bei Web-Analyse handelt es sich um die Weiterentwicklung klassischer Informationsauswertungsmethoden. Es geht immer darum, Daten zu sammeln, auszuwerten und daraus Schlüsse zu ziehen. Beim Surfen im Internet hinterlässt der Webseitenbesucher  Spuren. Es werden Dateizugriffe zusammen mit dem Zugriffszeitpunkt protokolliert, technische Daten des Computers des Webseitenbesuchers ausgelesen oder Klickpfade des Besuchers aufgezeichnet. Einsatzmöglichkeiten sind z.B. die Ermittlung hoher Abbruchraten zur Aufdeckung von System-Problemen, die Erfolgsmessung von Werbemaßnahmen oder die Bestimmung der inhaltlichen Relevanz einzelner Seiten.

« Vorherige Seite
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.
(c) 2013 eCommerce advanced | powered by WordPress with Barecity