Befragung versus technische Messung

Durch die besonderen Bedingungen der digitalen Werbung ist eine Erhebung von Kontaktchancen durch eine Befragung nach Einschätzung der Vertreter der Gattung Digitale Medien nicht möglich. Auch wenn es in der Vergangenheit in der Marktforschung Versuche gegeben hat, generische Nutzungs-Abfragen für das Internet allgemein oder reichweitenstarke Online-Werbeträger zu etablieren, so hat sich doch mittlerweile selbst in vielen Studien der anderen Mediengattungen die Erkenntnis durchgesetzt, dass für digitale Werbung eine technische Messung notwendig ist.

 

Das hat mehrere Gründe:

  • Die Anzahl der möglichen Werbemöglichkeiten und Werbekontakte im Internet ist immens und größer als bei allen anderen Mediengattungen. Selbst die Abfrage nur der wichtigsten Online-Werbeträger würde eine Befragung überfrachten.
  • Aus dem Werbeträger-Kontakt alleine kann noch kein Werbemittel-Kontakt abgeleitet werden. Denn durch Targeting, Frequency Capping und andere Besonderheiten der digitalen Werbung ist es wahrscheinlich, dass unterschiedliche Nutzer eines Werbeträgers (z.B. Facebook) selbst bei identischer Nutzungs-Dauer und Nutzungsdatum völlig unterschiedliche Werbung ausgespielt bekommen.
  • Das fragmentierte Nutzungsverhalten im Internet führt dazu, dass Nutzer eine Vielzahl von Websites nutzen – viele davon nur gelegentlich oder selten. Im Gegensatz zu Medien wie Radio oder Publikumszeitschriften, bei denen es ein begrenzteres Repertoire an genutzten Werbeträgern und ritualisierte oder regelmäßige Nutzungsgewohnheiten gibt, landen Online-Nutzer auch auf Websites, die sie durch Links oder Suchmaschinen gefunden haben und an deren Nutzung sie sich nicht automatisch bei einer Befragung erinnern können. Ein großer Teil der Werbekontakte wird bei einer Befragung deshalb nicht erfasst.
  • Das zunehmend an Bedeutung gewinnende Programmatic Advertising verstärkt die oben genannten Punkte, da u.U. die Plattformen, auf denen die Kampagne ausgeliefert wird, vor Kampagnenstart zum Teil gar nicht bekannt sind.

Eine Ermittlung von Kontakten oder Kontaktwahrscheinlichkeiten durch Befragungen ist deshalb nicht möglich, dementsprechend wird hierzu auch keine methodische Empfehlung gegeben.

Technische Messung

Das angemessene Verfahren ist eine technische Messung, die beim Nutzer den konkreten Kontakt mit einem Werbemittel misst. Dabei können verschiedene Technologien zum Einsatz kommen:

Login-Daten

Dies sind die Login-Protokolle, die den Plattformbetreibern direkt zur Verfügung stehen und die eine device-übergreifende Identifikation von Usern auf der Plattform erlauben, da User sich mit demselben Nutzerprofil mobil, am Arbeits- oder Ausbildungsplatz sowie zu Hause bei der Plattform einloggen.

Üblicherweise speichert die Plattform die Werbekontakte der Person und kann die Daten dann eindeutig zur Verfügung stellen.

Cookie & Tag

Browserbasierte Werbung kann mit Pixeln/Scripten versehen werden, die wiederum Cookies auslesen können. Online Panels können beispielsweise Ihre Befragten mit Cookies ausstatten, die diese als Panelist kenntlich machen. Kommt ein Panelist in Kontakt mit einer zu messenden Kampagne auf einer beliebigen Plattform, lesen Pixel/Script den Cookie Inhalt und können Zeitstempel und Panelisten ID des Kontaktes in eine Datenbank schreiben.

Diese Methode funktioniert allerdings nur bei browserbasierter Werbung, da Cookie Technologie mit Apps inkompatibel ist. Außerdem können nur Geräte gemessen werden, auf denen das Cookie gesetzt ist, was bei Multidevice- und at-work-Nutzung oder auch regelmäßiger Cookie Löschung ein Problem sein kann.

Advertising Device ID

Smartphones sind mit individuellen IDs ausgestattet, die zu Werbetrackingzwecken ausgelesen werden können. Bei iOS handelt es sich um die IDFA (Identifier for Advertising), bei Android um die Google Advertising ID. Diese IDs sind eindeutig pro Device und können sowohl von Apps, die Werbung ausliefern als auch von Panelisten Apps, über die beispielsweise Befragungen und Panelprofilverwaltung erfolgen, ausgelesen werden.

In-App-Werbung kann mit Makros versehen werden, die die IDs der Geräte mit Kontakten auslesen, wenn der Betreiber der App dies zulässt, was allerdings nicht immer gegeben ist.

An der Verbesserung der Methoden der technischen Messung wird kontinuierlich gearbeitet.

Arten von Studien

Neben Intermedia-Studien mit Kontaktmessung, wie sie von den anderen Mediengattungen eingesetzt werden, gibt es zahlreiche andere Methoden zur Erforschung der Werbewirkung. Die Vermarkter Digitaler Werbung setzen im stärkeren Maße Experimente, A/B-Tests, Zeitreihen-Analysen und Marketing-Mix-Modellings ein. Diese Methoden werden an anderer Stelle erörtert. [z.B. künftiges Kompendium Modellings oder Kompendium Experimentelle Forschung]

Der BVDW verfügt mit der „Branding Effects Database“ über eine Kampagnendatenbank, in der Studien mit unterschiedlichen Methoden eingegangen sind. Derzeit liegen Daten für mehr als 230 Kampagnen von über 270.000 Befragten vor.

Dadurch lassen sich einige Aussagen über die Unterschiede zwischen technischer Messung und Befragung aufstellen. Basis sind Befragte, für die ein technisch gemessener Kontakt sicher zuordnen war und gleichzeitig eine Recognition-Abfrage des entsprechenden Werbemittels vorliegt. Über alle Kampagnen hinweg fällt auf, dass diese Gruppe eine Recognition zwischen 10% bis 80% haben. Der Mittelwert liegt bei ca. 25 - 35% Recognition einer Kampagne. Das zeigt, dass die abgefragte Recognition nicht den tatsächlichen Kontakt zuverlässig abbildet.

Messung der Kontakte durch technische Messung

Einige der von Online-Vermarktern häufig eingesetzten Methoden der technischen Kontaktmessung sind die folgenden:

Browserbasierte Plattformen

  • Die User werden beim Werbemittelkontakt mit Cookies markiert, die Informationen zur Plattform, Frequenz und Ad Format enthalten.
  • In Panels werden die Cookies ausgelesen und so Art, Platzierung und Häufigkeit der Kontakte den Paneldaten (Befragung zu Brandlift, Consumer-Panel im Fall von Saleslift) zugeordnet.
  • Analysen können Pre/Post Campaign erfolgen, über Regressionsanalysen oder Vergleiche von strukturgleichen Test- und Kontrollgruppen (idealerweise experimentell z. B.: über Retargeting aufgesetzt)

Brandlift

  • Plattformspezifische experimentelle Designs, bei denen randomisierte Kontrollgruppen gebildet werden, denen die Werbung nicht ausgespielt wird, obwohl sie von den Adserving-Mechanismen dazu ausgewählt wurden. Eine entsprechende Testgruppe bekommt die Werbung wie üblich ausgespielt. Mit einem bestimmten Zeitversatz (z.B. 4-48 Stunden später) werden Test- und Kontrollgruppen zu bestimmten Brand-KPIs befragt, die Unterschiede der Gruppen zeigen den Uplift.
  • Die Identifizierung der User erfolgt über plattformeigene Daten, wie z.B. Login-Daten oder device spezifische Identifier wie mobile advertiser device-ID für Smartphone-Apps und Cookies für Browser basierte Plattformen.

Experimentelle Conversion Lifts (nur Online Sales)

  • Plattformspezifische experimentelle Designs, bei denen randomisierte Kontrollgruppen gebildet werden, denen die Werbung nicht ausgespielt wird, obwohl sie von den Adserving-Mechanismen dazu ausgewählt wurden. Eine entsprechende Testgruppe bekommt die Werbung wie üblich ausgespielt. User werden bei Werbekontakten über Cookies oder SDKs identifiziert und conversion Pixel /SDKs ermöglichen eine (anonymisierte) Identifikation der User auf der Bestätigungsseite der Online-Shops.
  • Die Identifizierung der User erfolgt über plattformeigene Daten, wie z.B. Login-Daten oder device spezifische Identifier wie mobile advertiser device-ID für Smartphone-Apps und Cookies für Browser basierte Plattformen.

Cross-device

  • Wenn die Möglichkeit besteht, ein oder mehrere identifizierende Merkmale der User mit Panels zu sharen, können device-übergreifende Kontakte von Panelmitgliedern an Panels überspielt werden und anschließend mit Paneldaten zu Brand oder Sales in Bezug gesetzt werden. Hierzu muss sichergestellt werden, dass die teilnehmenden Plattformen eine device-übergreifende Identifikation haben (z.B. Login-Daten).
  • Analysen können Pre/Post Campaign erfolgen, über Regressionsanalysen oder Vergleiche von strukturgleichen Test- und Kontrollgruppen (idealerweise experimentell, z.B. über Retargeting aufgesetzt).

Problem: „In-app“-Messung

Beim Einsatz von 3rd-Party-Messungen besteht die Herausforderung in der Erfassung der Werbekontakte “in-app” – dies ist bisher nicht möglich. Dies gilt für alle Formen digitaler Werbung „in-app“, wie bspw. video, audio etc. Gängige Verfahren der Messung von browserbasierter Nutzung (wie etwa der Einsatz von Mess-Software auf dem Endgerät des Befragten oder das Tagging der Werbemittel) funktionieren „in-app“ bislang nicht.

Die Messung von Werbekontakten „in-app“ gelingt aktuell nur über die Advertising Device ID (siehe oben) sowie einer Kooperation mit dem Anbieter der App. Damit gibt es keine einfache Lösung für eine „in-app“ Werbekontaktbestimmung. Allerdings wird in der Branche kontinuierlich an der Lösung des Problems gearbeitet.

Besonderheiten, auf die bei der Erhebung geachtet werden muss

Folgende Besonderheiten von Online Werbung müssen bei der Messung und Interpretation von Kontakten berücksichtigt werden:

  • Online-Werbung ist meist nicht-linear - z. B. gibt es keinen Zeitbezug oder Buchungszeitraum. Die Werbemittel werden dynamisch ausgeliefert.
  • Auslieferung auf unterschiedlichen Devices. Dies ist relevant, wenn es zu unterschiedlichem Nutzungsverhalten pro Device innerhalb eines Online-Werbeträgers/Plattform kommt.
  • Targeting: beschreibend: demo, device, geo (Gebiete bis hin zu einzelnen Geschäften), context; basierend auf Verhalten: re-targeting; abgeleitet: affinity/ interest, emotional, look-alike audiences; etc.
  • frequency capping (cross-platform, Kontaktmengen/ -klassen)
  • dynamisches Pricing (z.B. Auktionsmodelle)
  • verhaltensbasierte Auslieferung (z. B. unterschiedliches Werbeinventar pro Nutzer)

Typische Fehler, die bei der Erhebung vermieden werden sollen

Die komplexen und detaillierten Möglichkeiten des Targetings und programmatisch/auktionsbasierter Auslieferung von digitaler Werbung erschweren häufig die Auswahl von Test- und Kontrollgruppen bzw. ein Modelling.

Allgemein gilt, dass zwischen den Gruppen Strukturgleichheit über alle Variablen herrschen sollte, die bei der Auslieferung der zu messenden Kampagne eine Rolle spielen, bzw. diese Variablen in einem Modeling berücksichtigt werden sollten. Hier kann es beispielsweise um folgende Punkte gehen:

  • Demografisches, regionales und/oder Interessenbasiertes Targeting
  • Nutzungshäufigkeit der werberelevanten Plattformen (kein Vergleich von „exposed“=heavy user vs „unexposed“=Low or non user!), dies sollte u.a. auch bei der Auswertung verschiedener Kontaktklassen berücksichtigt werden.
  • Spezielle Targeting Kriterien, wie z.B.
    • Vorheriger Besuch einer Website oder Betrachtung einer anderen vorgeschalteten Werbung beim Retargeting.
    • Allgemeines Lookalike Targeting, beim dem User, die einer z.B. aus CRM Daten bekannten Kerngruppe über eine große Anzahl verschiedenster Merkmale ähnlich sind, angesprochen werden sollen.
    • Optimierungs-Kriterien, bei denen Algorithmen über die Zeit lernen, User anzusprechen, die eine höhere Wahrscheinlichkeit haben, eine gewisse Reaktion auf die Werbung zu zeigen, wie z.B. anschließende Websitebesuche, App-Installationen, Conversions.

Falls diese genannten Merkmale bei einer Kampagne eine Rolle spielen, sollte darauf geachtet werden, dass zwischen Kontroll- und Testgruppen über alle Punkte Ähnlichkeit herrscht, da ansonsten verzerrte Ergebnisse zustande kämen. Wenn z.B. über Retargeting einem Produkt gegenüber sowieso schon affine Personen angesprochen werden, darf man diese Personen nicht mit einer Kontrollgruppe vergleichen, die diese Affinität nicht haben.

Ein Weg, dies sicherzustellen, ist eine Randomisierung schon bei der Werbeauslieferung, d.h. ein Auslieferungsalgorithmus könnte die Auslieferung an Personen unterdrücken, die alle Kriterien für die Auslieferung erfüllen und würde diese dann der Kontrollgruppe für die Werbewirkungsforschung zuweisen.

Weiterhin ist sicherzustellen, dass parallele Werbekontakte in ggf. nicht messbaren Medien unterschiedlich verteilt sein können und somit auch Unterschiede zwischen Kontroll- und Testgruppe erzeugen könnten, die nicht am eigentlich gemessenen Medium liegen. Der oben beschriebene Randomisierungsansatz würde für eine entsprechende Strukturgleichheit sorgen, da auf diese Weise die Wahrscheinlichkeit für Kontakte in anderen Medien zwischen beiden Gruppen zwar unbekannt, aber zumindest identisch ist.

Berechnung der Kontakte / ggf. Gewichtung an Währungs-Studien

Für digitale Medien wird empfohlen, Kontakte direkt zu messen. Damit ist eine Kontaktberechnung – anders als bei anderen Medien – nicht nötig; es liegt über die Messung eine 0/1 Information vor.

Eine Kalibrierung oder Gewichtung an externen Vorgaben (wie bspw. einer Währungs-Studie) ist nicht üblich.

Fusionen

Zur Fusion einer technischen Werbekontaktmessung mit einem Befragungsdatensatz liegen bislang kaum Erfahrungswerte vor. Fusionen von digitaler Nutzung mit anderen Datenquellen werden durchgeführt, allerdings vor allem im Bereich der Nutzung von digitalen Inhalten, nicht Werbung.

Die Besonderheiten digitaler Werbung (siehe oben) schränken die Umsetzbarkeit von Datenfusionen deutlich ein. Die Identifikation von geeigneten Bindegliedern ist aufgrund von frequency capping, targeting Optionen etc. deutlich schwieriger als bei anderen Medien.

Grundsätzlich geeignet ist eine technische Messung von digitalen Werbekontakten. Aufgrund der aufgeführten Besonderheiten von digitaler Werbung wird eine Befragung des Werbekontaktes nicht empfohlen.

Beim Einsatz von 3rd party Messungen besteht die Herausforderung in der Erfassung der Werbekontakte “in-app”.

Es ist zu überlegen, ob andere Methoden der Werbewirkungsforschung nicht geeigneter sind als Kontakt-bezogene Intermedia-Studien. Zum Beispiel empfehlen sich Werbewirkungs-Experimente sowie Marketing-Mix-Models (MMMs).

Digitale Medien – auf was man achten sollte

Bei Werbewirkungsstudien, die Kontakte für digitale Medien messen, sollten folgende Punkte beachtet werden:

1. Eine technische Messung der Kontakte ist notwendig, wobei es verschiedene Möglichkeiten gibt (Login-Daten, Cookies & tags, Advertising Device ID).

2. Falls Targeting bei einer Kampagne eine Rolle spielt, sollte darauf geachtet werden, dass zwischen Kontroll- und Testgruppen über alle Punkte Ähnlichkeit herrscht.

3. Die Erfassung von Werbekontakte „in-app" – wie sie z.B. bei Video- und Audio-Werbung, die in Player-Apps integriert sind, vorkommen – ist noch ein ungelöstes Problem, an dessen Lösung derzeit mit Hochdruck gearbeitet wird.

Guidelines für die Abbildung von Kampagnenkontakten

pdf | 971 KB

Download

Guidelines für die Abbildung von Kampagnenkontakten Anhang

pdf | 747 KB

Download

Fernsehen