Auf den Spuren von Webseitenbesuchern – Sammlung, Analyse und Verwendung personenbezogener Daten im Internet – Teil 3
2.2 Werkzeuge
Google Analytics ist das am häufigsten eingesetzte Web-Analyse-Werkzeug . Der Grund dafür ist zum einem der freien Verfügbarkeit und kostenlosen Verwendung und zum anderen der einfachen Implementierung und intuitiven Bedienung geschuldet. Außerdem bietet Google Analytics hochinnovative Features, die ihresgleichen suchen, z.B. die Funktion „Radar“, die automatisierte Benachrichtigungen versendet, sobald etwas Außergewöhnliches vorfällt.
Auch wenn für Einbau und Verwendung kaum Kosten anfallen, ist der Preis für den Einsatz von Google Analytics nicht zu vernachlässigen: Zum einen gewährt der Webseitenbetreiber Google kompletten Einblick in seine Daten, was bei kommerziellen Seiten Einsicht in wesentliche Teile der Buchhaltung bedeutet (neben Kundendaten werden z.B. Umsatzzahlen und Marketingdaten gespeichert), zum anderen geht der Webseitenbetreiber – zumindest in Deutschland – rechtlich ein großes Risiko ein; bislang ist nicht eindeutig geklärt, ob es sich bei der gespeicherten IP-Adresse um ein personenbezogenes Datum handelt. Alle erhobenen Daten werden automatisch und ohne Einwilligung des Besuchers in die USA zu Google übertragen und auf deren Servern gespeichert, was einen mehrfachen Verstoß gegen das Bundesdatenschutzgesetz darstellt , setzt man voraus, dass die IP-Adresse personenbezogen ist.
Zwei Funktionen von Google Analytics stellen Besonderheiten dar, die in dieser Form von keinem anderen Anbieter zu Verfügung gestellt werden können. Zum einen ist Google adwords – das SEM-Werkzeug zur Erstellung und Verwaltung von Textanzeigen im Internet – komplett in Google Analytics integriert, was ein einfaches Controlling der SEM-Maßnahmen ermöglicht, zum anderen kann Google durch die hohe Verbreitung seiner Software branchenübergreifend Vergleichs-Werte zur Verfügung stellen, sodass ein direkter Vergleich der eigenen Webseite mit dem weltweiten Branchendurchschnitt möglich ist.
Während die beiden letztgenannten Funktionen in dieser Ausprägung Google vorbehalten sind, bieten andere Anbieter, die Software verkaufen oder vermieten, den Vorteil die Daten nach aktueller Rechtsprechung rechtskonform zu erheben und zu speichern.
Desweiteren sind diese Softwares deutlich flexibler, sodass die Software genau die Daten zur Verfügung stellt, die das Unternehmen benötigt.
Beispielsweise bietet die Software Omniture SiteCatalyst von Adobe die Möglichkeit zielgruppengenaue Auswertungen zu erstellen, was weitere Erkenntnisse mit sich bringt und sehr spezifische Marketingaktivitäten ermöglicht.
Alle modernen Werkzeuge zur Webseitenanalyse verwenden Cookies als Trackingmethode.
2.3 Welche Daten werden erhoben?
2.3.1 Benutzerdaten
Jeder Anbieter greift auf dieselben Quellen zu. Die wichtigsten Metriken unterscheiden sich softwareübergreifend nicht.
Anhand von Cookies und IP-Adressen lassen sich Besucherdaten sammeln. Jede IP-Adresse verrät den ungefähren Standort des verwendeten Computers, sodass Land, Region und Stadt problemlos dargestellt werden können. Anhand der Tatsache, ob der Nutzer bereits einen Cookie besitzt, lässt sich erkennen, ob es sich um einen neuen oder wiederkehrenden Nutzer handelt. Liegt ein Cookie vor, lässt sich der Zeitraum errechnen, der seit dem letzten Besuch vergangen ist. Mit diesen Daten lassen sich bereits weitreichende Aussagen treffen und Trends erkennen. Die Anzahl der Besucher, die Anzahl der Seitenaufrufe, und die durchschnittliche Anzahl an Seitenaufrufen sind bekannt. Wird die Zeit ausgewertet, die zwischen Öffnen der Seite und dem Öffnen der nächsten Seite vergeht, lässt sich die Besuchszeit auf der Webseite und die Absprungrate erkennen. Die Sprache des Users lässt sich aus der Zugriffsquelle oder der Verweildauer auf der jeweiligen Sprachversion der Webseite erschließen. Die Besuchertreue – entspricht der Besuchshäufigkeit – und die Besuchstiefe sind weitere Kennzahlen, die sich leicht berechnen lassen. Über Javascript lässt sich der verwendete Browser, das Betriebssystem, grafische Eigenschaften, wie die Anzahl der Farben, die Bildschirmauflösung, die Flash-, bzw. Java-Version, der Provider, den Hostnamen und die Verbindungsgeschwindigkeit auslesen. Verwendet der User ein mobiles Gerät lassen sich zusätzlich der Name des Geräts und der Mobilfunkbetreiber auslesen.
2.3.2 Zugriffsquellen
Neben den Daten, die Rückschlüsse auf die Webseitenbenutzer zulassen, werden die Zugriffsquellen, also die Webseiten, die ein User jeweils als letzte besucht hatte zur Analyse verwendet. Existiert keine Zugriffsquelle, erhält man die Anzahl der direkten Zugriffe, also der manuellen Eingaben der URL in den Browser, bzw. Aufrufe über Lesezeichen. In allen anderen Fällen erhält man die Anzahl der Zugriffe und den Namen der Verweis-Webseiten. So ergibt sich z.B. ein Bild über den Erfolg von Suchmaschinenoptimierung und Suchmaschinenmarketing. Es lässt sich zwischen organischen Suchergebnissen (manuellem Suchen) und bezahlten Suchergebnissen unterscheiden. Alle Suchmaschinen liefern über die URL die verwendeten Suchbegriffe mit, sodass zusätzlich erfasst werden kann, mit welchen Begriffen die Suche erfolgreich war.
Weitere wichtige Zugriffsquellen sind Kampagnen. Dabei handelt es sich um die Auswertung der Klickhäufigkeit, z.B. in Verbindung mit Marketingaktionen auf einer Webseite, in einer eMail oder einer Anwendung. An die angebotenen Links werden vorher festgelegte IDs angehängt, so dass die Analysesoftware erkennt, dass der entsprechende Besucher über eben diesen Link auf die Webseite gelangt ist und kann eine entsprechende Verknüpfung herstellen.
Im Sonderfall Google Analytics existiert zusätzlich die Zugriffsquelle Google adwords. Hier kann nachvollzogen werden, welche Anzeige und welches verwendete Keyword am meisten Besucher auf die Webseite gebracht hatte.
2.3.3 Content
Im Bereich Content werden die einzelnen Unterseiten einer Webseite bewertet. So lässt sich z.B. ein Ranking der beliebtesten Seiten erstellen, die erfolgreichsten Webseitentitel (häufige Öffnungsrate) und erfolgreichsten Seiteninhalte (lange Verweildauer) darstellen oder die häufigsten Ausstiegsseiten erkennen.
Viele Anbieter stellen Klickpfade zur Verfügung. Da jeder Seitenbesuch im Cookie gespeichert wird, lässt sich die genaue Spur erkennen, die ein Besucher (im Cookie) hinterlässt. So lassen sich „Irrwege“ erkennen, also unerwünschte Pfade, die z.B. durch Fehlfunktionen der Webseite von Besuchern eingeschlagen werden.
Mit der Trichteranalyse lässt sich feststellen, wie viele Besucher den geplanten Weg, z.B. bis zur Kontaktanfrage oder der Newsletteranmeldung, gehen und wie viele ihn wo verlassen.
2.3.4 eCommerce
Handelt es sich bei der Webseite um einen Internetshop, stehen zusätzliche Daten zur Verfügung. Zur Datenerhebung wird eine Übertragung der Transaktionsdaten von der Webseite zur Analysesoftware benötigt. Üblicherweise geschieht dies über versteckte Formularfelder.
Über die Transaktionsdaten lassen sich der Umsatz, die Conversion-Rate (das Verhältnis zwischen eindeutigen Besuchern und Transaktionen), der durchschnittliche Bestellwert und Rankings der erfolgreichsten Produkte und Kategorien darstellen. Darüber hinaus kann jede Transaktion anonym oder mit Shop-Bestellnummer dargestellt werden. Unter Zuhilfenahme von Cookies lassen sich zusätzlich die Besuche bis zum Kauf und die Tage bis zum Kaufzeitpunkt darstellen.
Die Speicherung und Darstellung der Bestellnummer stellt derzeitig datenschutzrechtlich eine Grauzone dar – zwar werden keine personenbezogene Daten gespeichert, doch die Zuordnung ist relativ einfach, schließlich liegen zu jeder Bestellnummer persönliche Daten vor – wenn auch meist in anderen Systemen.