ComScore – Whitepaper zur Löschung von Cookies veröffentlicht

Im März kochte die aufgrund einer Studie von ComScore ausgelöste Cookie-Debatte in der Web Analytics-Szene ziemlich hoch. Was viel Diskussionsstoff auslöste, lies aber auch viele Fragen offen und die Forderung nach näheren Erläuterungen kamen auf. Nun hat ComScore ein Whitepaper zur Cookie-Löschung veröffentlicht.

Was untersucht die Studie?

Alle modernen Webanalyse-Tools nutzen Cookies zur Messung der Besucher. Anhand des Cookies wird ein User wiedererkannt und mehrere Besuche können so einem “Unique Visitor” zugeordnet werden. Wenn ein User nun diesen Cookie löscht, so wird er beim nächsten Besuch erneut als “Unique Visitor” gezählt und somit ist das Ergebnis verfälscht.

Eine gewisse Löschrate haben alle Webanalysten auf der Rechnung und lebten damit bisher auch sehr gut. ComScore hat nun aber in der Studie die These aufgestellt, dass die Löschrate viel Höhe ist als bisher immer angenommen.

Das Ergebnis der Studie

31 % alle US-Computer-User löschen Ihre First-Party-Cookies einmal im Monat oder lassen Sie regelmäßig automatisch von einer Software löschen.
Im Durchschnitt wurden pro Computer 2,5 Cookies verzeichnet, was bedeutet, dass die gemessene Zahl der Unique Visitors um den Faktor 2,5 höher angenommen wird, als sie wirklich ist.

Was ist ein Cookie ?

Es handelt sich bei einem Cookie um eine kleine Textdatei, die auf dem Computer des Besuchers gespeichert wird. Anhand dieser Textdatei wird ein Besucher bei einem erneuten Besuch der Webseite, die den Cookie gesetzt hat, wiedererkannt.

Cookies werden von dem Browser verwaltet. Internet Explorer und Firefox speichern Cookies an unterschiedlichen Orten. Besucht man mit zwei Browsern die gleiche Seite, wird man also auch als “zwei Besucher” gezählt.

Jedesmal, wenn man die Seite erneut besucht, werden die Daten des Cookies abgefragt. Existiert der Cookie und ist er gültig, so liefert er die Daten zurück. Existiert er nicht oder ist er abgelaufen, so wird versucht den Cookie neu zu setzen. Hat man nun seinen Browser so eingestellt, dass Cookies abgelehnt werden, so wird jedesmal versucht den Cookie zu setzen.

Die Löschung von Cookies

Cookies werden gelöscht wenn

  • der User die Cookie-Dateien auf seiner Festplatte löscht
  • der User benutzt die eingebauten Browser-Funktionen zum löschen des Cookies
  • der User setzt spezielle Sicherheitssoftware ein, die regelmäßig die Cookies löscht

First-Party vs. Third-Party-Cookies

Von einem First-Party-Cookie spricht man, wenn der Cookie von der gleichen Domain gesetzt wird auf der ich auch gerade surfe. Ich bin z.B. auf www.heise.de und der Cookie wird auch von heise.de gesetzt.

Ein Third-Party-Cookie liegt vor, wenn der Cookie von einer anderen Domain gesetzt wird. Beispiel: www.heise.de schickt bei jedem Seitenaufruf eine Anfrage an einen Zählserver mit der Domain zaehlserver.de. Dieser setzt nun einen Cookie um den User später wiederzuerkenn. Da der Absender des Cookies ein andere ist, als die Domain auf der ich surfe, handelt es sich um einen Third-Party-Cookie.

Die ComScore-Methode – Überblick

Es gibt zwei Möglichkeiten der eindeutigen Identifizierung über Cookies.

  1. Log-In-Cookies, die den User als unique beim Login-Prozess identifizieren
  2. Passive Cookies, die ohne spezielle Aktion des Users gesetzt werden und daher oassiv die Eindeutigkeit des Users identifizieren.

Die beiden Cookie-Typen unterscheiden sich hauptsächlich dadurch, wie die Site reagiert, wenn der Cookie nicht gesetzt ist. Beim Login-Cookie wird ein Formular für die Anmeldung angezeigt und eine eindeutige Beziehung zu dem User hergestellt, da eine Identifizierung stattgefunden hat. Beim passiven Cookie muss mit jedem Setzen eines Cookies angenommen werden, dass es sich um einen neuen User handelt.

Die Datensammlungs-Methode

Nun geht es ans Eingemachte. Jeder fragt sich natürlich, wie ComScore wissen kann, dass ein User den Cookie gelöscht hat. Woher wissen die Jungs, dass es nicht wirklich ein neuer User ist?

Ich hoffe, ich verstehe die Studie richtig. Wenn nicht, haut mir in den Kommentaren auf die Finger.

ComScore hat die ausgelieferten Cookies von Doubleclick und Yahoo untersucht, auf die sie offensichtlich Zugriff oder zumindest einen technologischen Einfluss haben. Mit einer speziellen Technik werden nun aus dem “Get Cookie”-Event und den Daten des Cookies spezielle Daten erzeugt, die dann zusammen mit einer ID des Teilnehmers und einem Timestamp gespeichert werden.

Ändern sich nun die aus dem Get-Cookie-Event generierten Daten über den Erhebungszeitraum, so ist davon auszugehen, dass ein neuer Cookie gesetzt wurde und der alte zuvor gelöscht wurde. Wird der Cookie nicht gelöscht, so bleiben die erzeugten Daten über den gesamten Zeitraum gleich.

Wenn ich das also richtig verstehe, erkennt ComScore einen User wieder, auch wenn der Cookie gelöscht wurde. Für mich bleibt die Frage offen, wie das genau funktioniert. Entweder ich bin zu blöd oder ich hab das Whitepaper nicht richtig gelesen. Wenn das geht, müsste diese Methode doch wiederum für die Anylse-Tool-Hersteller funktionieren um die Unique Visitors besser identifizieren zu können.

Evtl. wurde ja auch ein Flash LSO-Object eingesetzt um den User zu identifizieren, was wiederum einiges erklären würde. Aus dem Whitepaper geht dies jedoch nicht eindeutig hervor.

Alternativ könnten auch Teilnehmer an der Untersuchung speziell rekrutiert worden sein, die z.B. ein Fenster eingeblendet bekommen haben, in dem sie der Untersuchung zugestimmt haben. Über so einen Mechanismus wäre es auch denkbar die Studie durchzuführen, aber auch das geht nicht klar hervor. Es ist lediglich die Rede von 400.000 Teilnehmern.

Fazit

Es bleibt eine gewisse Unsicherheit, ob die Studie wirklich verlässliche Zahlen liefert. Wenn dem so ist, dann sollte man sich die Ergebnisse genauer anschauen und zukünftig die Besucherzahlen mit einem Unsicherheitsfaktor versehen. Aber auch dann bleibe ich bei meiner Grundeinstellung, dass die absoluten Zahlen nicht der Punkt sind. Es geht darum Trends eindeutig aufzuzeigen und auf Veränderungen zu reagieren. Wenn ich weiß, dass die Zahlen einen Unsicherheitsfaktor haben, bin ich immer noch in der Lage Äpfel mit Äpfeln zu vergleichen :-)

5 Gedanken zu „ComScore – Whitepaper zur Löschung von Cookies veröffentlicht“

  1. > Wenn ich das also richtig verstehe, erkennt ComScore einen
    > User wieder, auch wenn der Cookie gelöscht wurde.

    Ja das kann sicher zusätzlich über die Flash-Cookies geschehen – aber wenn ich Yahoo höre, dann loggen sich die Nutzer vielleicht hin und wieder mal in den einen oder anderen Dienst ein und voila hat man wieder das Matching von “unbekanntem User/Cookie” und dem exakten User.

  2. ComScore bietet Reichweitenmessung auf Basis eines recht großen Panels an. Dazu werden alle Panelisten mit Browser Extension ausgestattet, die Browseraktivitäten detailliert aufzeichnen [1]. Die Methode ist m.E. recht valide und stellt nicht das Problem dar. Schwierig ist eher die Befangenheit der Auftraggeber, die ein großes Interesse daran habe dürften, zu demonstrieren, dass Messungen auf Basis eines Panels validere Zahlen liefern als die gängige Zählung auf Basis von Cookies.

    [1] http://www.comscore.com/method/tech.asp

  3. Viel wichtiger finde ich, dass einzelne Anbieter die comscore Zahlen nicht pimpen können, so dass die Verhältnisse und Unterschiede bei comscore schon sehr valide sind (Anbieter A hat X% mehr als Anbieter B). Die absoluten Zahlen sind m.E. weder bei einer Nielsen/Comscore noch bei IVW/AGOF als valide anzusehen.

  4. Für viel erheblicher als Cookielöschung halte ich die Mehrfachnutzung von Browsern und verschiedenen Rechnern.

    Wenn man eine Lieblingsseite hat, wird man sie von überall angucken, d.h. vom Rechner im Büro, vom Laptop, vom iPhone, vielleicht aus dem Internet-Cafe.

    Dieser Nutzer ist also 4 Uniqe User.

    Wenn er auch noch verschiedene Browser auf dem gleichen Rechner (ff, ie, chrome, so wie ich) benutzt, wäre er also schon 5-10 UU für die gleiche Seite….

    Für die meisten Seiten ist leider ein einlogg-Prozess keine gangbare Lösung…

Kommentare sind geschlossen.