nach oben

Erschienen in:

2012 | OriginalPaper | Buchkapitel

Empirische Untersuchung der Markenprofilierung und des Shopperverhaltens unter Wirkung einer multisensualen Atmosphäre Marken- und shopperverhaltenstheoretische Grundlagen

verfasst von : Jenny Müller

Erschienen in: Multisensuale Gestaltung der Ladenatmosphäre zur Profilierung von Store Brands

Verlag: Gabler Verlag

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Zusammenfassung

Die sorgfältige Planung und die möglichst valide Durchführung eines Experiments sind von großer Bedeutung für die anschließende Datenanalyse und deren Interpretation. Daher wird der genaue Ablauf des Experiments zur Prüfung der beschrie-benen Hypothesen und Experimente im Folgenden dargestellt.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Marken- und shopperverhaltenstheoretische Grundlagen

Nächstes Kapitel Zusammenfassung und Ausblick

Eine experimentelle Untersuchung oder ein Experiment kann dabei als „eine wiederholbare, unter kontrollierten, vorher festgelegten Umweltbedingungen durchgeführte Versuchsanordnung verstanden [werden], die es mithilfe der Messung von Wirkungen eines oder mehrerer unabhängiger Faktoren auf die jeweilige(n) abhängige(n) Variable(n) gestattet, aufgestellte Hypothesen empirisch zu überprüfen“; Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 161.

Vgl. Rack, O./Christophersen, T. (2007), S. 17.

Kausale Zusammenhangshypothesen beschreiben den schlichten Zusammenhang zweier oder mehrerer Merkmale: Die Veränderung eines Merkmals verändert ein anderes Merkmal der Tendenz nach gleichsinnig oder gegenläufig; vgl. Bortz, J./Döring, N. (2006), S. 517.

Unterschiedshypothesen beziehen sich auf die Wirksamkeit einer Maßnahme oder eines Treatments (Experimentbedingung); vgl. ebenda, S. 524. Unterschiedliche Variablenausprägungen auf der Seite der UV werden als „Stufen“, „Bedingungen“ oder „Treatments“ bezeichnet; vgl. Hager, W. (1987), S. 51.

Vgl. Bortz, J./Döring, N. (2006), S. 517.

Vgl. ebenda, S. 524.

Ein Pretest dient der Überprüfung des Experimentdesigns und des Fragebogens; vgl. Miller, Y. (2009), S. 65; Bürgmayr, A. (2009), S. 19f..

“Experimente, bei denen die Messung der Ursache-Wirkungs-Beziehungen in einer natürlichen, realistischen Umgebung vollzogen wird,“ werden hingegen als Feldexperimente bezeichnet; Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 162. Der Vorteil von Feldexperimenten im Vergleich zu Laborexperimenten besteht in ihrer Realitätsnähe und Natürlichkeit sowie in der Tatsache, dass sie verallgemeinerungsfähige Ergebnisse liefern; vgl. Weis, H. C. (2001), S. 159; Theis, H.-J. (2008), S. 268. Jedoch treten im Feld wesentlich mehr unbekannte oder nicht kontrollierbare Störgrößen auf als in Laborexperimenten, was sie komplexer und schwerer kontrollierbar macht; vgl. Bortz, J./Döring, N. (2006), S. 505ff..

Auf diese Weise können Befragten-Effekte wie eine zusätzliche Interpretation und Rationalisierung des eigenen Verhaltens durch die Testelemente umgangen werden; vgl. Wiswede, G. (2007), S. 46.

Für nähere Ausführungen hierzu vgl. Lamnek, S. (2005), S. 556ff..

Beobachtung, apparative und andere Verfahren können im Gegensatz zur Befragung keine Auskunft über die inneren Vorgänge von Probanden geben; vgl. Pepels, W. (2007), S. 112; Wetzel, C. (2007), S. 29. Aus diesem Grund ist es sinnvoll mehrere Methoden zu verknüpfen; vgl. Pepels, W. (2007), S. 112.

“Bei der standardisierten Befragung wird ein detailliert ausgearbeiteter Fragebogen verwendet, in dem sowohl die Formulierung der einzelnen Fragen wie auch die Reihenfolge der Fragen fixiert ist. Jedes Abweichen davon ist unzulässig und würde die Reizstandardisierung und damit die Akkumulierung der Daten und die Generalisierung der Dateninterpretation problematisch machen.“; Lamnek, S. (2005), S. 556ff..

Da die Beobachtungsdaten mit den Befragungsdaten in Verbindung gebracht werden müssen, wurde ein Vorgehen mit nur einem Forscher gewählt, weil so die beiden Datenerhebungsmethoden am leichtesten verknüpft werden können. Zudem sollte möglichst wenig Aufmerksamkeit der Shopper auf die Befragung gezogen werden.

Die Ansprache der Shopper erfolgte randomisiert und standardisiert: Die Shopper wurden freundlich gefragt, ob sie an einem Forschungsprojekt für die Promotion des Befragers (der über den gesamten Zeitraum der gleiche blieb) teilzunehmen. Einschränkend ist an dieser Stelle allerdings zu erwähnen, dass maximal fünf Shopper zur gleichen Zeit einen Fragebogen ausfüllen konnten. Somit gab es Personen, die im Zeitraum vieler „Befragten“ nicht angesprochen wurden. Im Fall der Teilnahme an der Befragung wurde der Zeitpunkt des Anfangs der Befragung substitutiv als Ausgangszeit des Probanden verwendet. Dies ist zu vertreten, da zwischen dem Ort der Befragung und dem Ausgang ca. 2 Schritte liegen.

Für nähere Ausführungen hierzu vgl. ebenda.

Dieses Forschungsdesign wurde auf Wunsch der Geschäftsführung gewählt.

Bei einem Simultanexperiment werden die Variablen zum gleichen Zeitpunkt vermessen. Es werden lediglich die Ergebnisse zwischen Experimental- und Kontrollgruppe verglichen. Vgl. Theis, H.-J. (2008), S. 262; Hüttner, M./Schwarting, U. (2002), S. 170.

Vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 163. Die Abkürzungen EA und CA stehen für „Experimental group After“ bzw. „Control group After“. Die Faktorwirkung wird in diesem Studienaufbau durch die Differenz zwischen Experiment- und Kontrollgruppe zum Zeitpunkt 1 ermittelt; vgl. ebenda.

Hierzu wurde ein Workshop zur Erarbeitung der Markenidentität der Store Brand abgehalten. Zudem wurden die MPFNs von der Geschäftsführung einzeln nach ihrem Passen (auf einer Skala von 1-5 mit 1 = „beschreibt die Marke sehr treffend“, 5 = „beschreibt die Marke nicht treffend“) zur Soll-Markenpersönlichkeit der Store Brand bewertet und hierauf noch einmal nach demselben Kriterium gerankt. Daraus ergibt sich in der Reihenfolge nach Wichtigkeit folgende Soll-Markenpersönlichkeit: zuverlässig, charmant, männlich, ehrlich und führend.

Hier der wichtigsten MPFN „zuverlässig“ ausgedrückt. Die Farbe passt zudem auch auf den gewünschten MPFN führend.

Die Auswahl der einzelnen musikalischen Stücke erfolgt in beiden Fällen über das System einer Agentur, die auf die Beschallung von Läden mit Hintergrundmusik spezialisiert ist. Die Lautstärke wird mittels des örtlichen Lautsprechersystems konstant auf dem gewohnten Level gehalten. Aufgrund einer Studie Bruhn, kann davon ausgegangen werden, dass die Zielgruppe des Herrenausstatters es gewohnt ist Klassik zu hören; vgl. Bruhn, H. (erscheint 2011).

Hehn, P./Silberer, G. (2009), S. 43.

Ein Nachteil dieser Umsetzung des Duftstimulus ist, dass keine theoretische Fundierung oder Verankerung zur Wahl des Duftes besteht. Dadurch können mögliche unvorhergesehene Wirkungen des Stimulus nicht theoretisch begründet werden. Allerdings ist dem Autor keine Theorie zur Wahl eines Raumduftes bekannt.

Eine Abbildung findet sich in Appendix 20. Mittels einer einzigartigen Mikrozerstäubungstechnik kann die optimale Duftintensität reguliert werden. Reine ätherische Öle werden durch eine hochentwickelte Düsentechnologie in feinste Partikel zerstäubt, welche sich aufgrund natürlicher Luftzirkulation homogen im gesamten Raum verteilen; vgl. Dumatec AG (o.J.). Die optimale Dosierung wurde von dem Experten eingestellt.

Vgl. Bortz, J./Döring, N. (2006), S. 537: Ähnliche Versuchsaufbauten finden sich bei Morrison, M. et al. (2011), S. 560; Chebat, J.-C./Chebat, C. G./Vaillant, D. (2001), S. 117; Schmitt, B. H./Shultz, C. J. (1995), S. 435. Bei zwei- und mehrfaktoriellen VersuchspIänen werden zwei oder mehr Experimentvariablen (UV), die jeweils mehrere Ausprägungen haben können, simultan variiert. Böhler, H. (2004), S. 47; Theis, H.-J. (2008), S. 265ff.. Bei zwei- und mehrfaktoriellen VersuchspIänen werden zwei oder mehr Experimentvariablen (UV), die jeweils mehrere Ausprägungen haben können, simultan variiert. Sie gelten als weniger restriktiv im Vergleich zu einfaktoriellen Experimenten; vgl. Böhler, H. (2004), S. 47; Theis, H.-J. (2008), S. 265ff..

Für die praktische Umsetzung ergab sich ein Trade-Off zwischen der Stichprobengröße und der Konstanthaltung der Bedingungen, da nur eine gewisse Zeitspanne zur Verfügung stand, in der das Sortiment und der Ladenaufbau vergleichbar sind. Zudem wären zusätzliche Kosten für Datenerhebung entstanden. Auch die Störung des Betriebsablaufs durch die Befragung sollte zeitlich begrenzt bleiben.

Ein projektives Experiment ist ein kontrolliertes Experiment, bei dem der Versuchsleiter die experimentellen Bedingungen bewusst steuert. Die Untersuchungseinheiten werden mit den geschaffenen Bedingungen konfrontiert. Der Versuchsablauf wird über den gesamten Zeitraum ab der Veränderung der unabhängigen Variablen bis hin zu den erfolgten Auswirkungen untersucht; vgl. Berekoven, L./Eckert, W./Ellenrieder, P. (2009), S. 148ff.; Theis, H.-J. (2008), S. 260ff..

Die Öffnungszeiten des Ladens sind von 10:00 bis 20:00 Uhr. In der Zeit zwischen 13:00 und 14:00 macht der Forscher täglich eine halbe Stunde Pause. Der genaue Zeitpunkt der Pause wurde aufgrund der Befragung flexibel gehalten, um den Rücklauf nicht zu stören. Es wurden zwar nur vier Experimentbedingungen und eine Kontrollbedingung durchgeführt, dennoch wurde an sechs Tagen beobachtet und befragt um den ausreichenden Umfang der Stichprobe zu sichern.

Randomisierung beschreibt die Zuweisung von Testelementen auf die einzelnen Experimentalbedingungen nach dem Zufallsprinzip; vgl. Berekoven, L./Eckert, W./Ellenrieder, P. (2009), S. 147.

Dies ist ein zulässiges Vorgehen der Randomisierung; vgl. Theis, H.-J. (2008), S. 258. Areni und Kim randomisieren ebenso auf diese Art und Weise; vgl. Areni, C. S./Kim, D. (1993).

Elimination ist die wirksamste Technik zur Neutralisierung der Einflüsse von Störvariablen. Dabei werden störende Einflüsse beseitigt, so dass keine Beeinflussung des Untersuchungsergebnisses erfolgt; vgl. Berekoven, L./Eckert, W./Ellenrieder, P. (2009), S. 257.

Vgl. Parsons, A. G. (2001), S. 81.

So wurden die Studien in zwei aufeinanderfolgenden Wochen Mitte September, jeweils donnerstags, freitags und samstags durchgeführt. In diesen Wochen lag kein Feiertag. Stets denselben Tag über einen längeren Zeitraum zu betrachten, hätte Veränderungen in der Ladengestaltung mit sich gebracht.

Wetter kann als situative Variable verortet werden; vgl. Belk, R. W. (1975), S. 159. Es beeinflusst das Shopperverhalten; vgl. Cunningham, M. (1979); Griffitt, W. (1970), S. #901. Allerdings ist es regional verschieden, in welcher Art und Weise; vgl. Parsons, A. G. (2001), S. 81. Die Art des Einflusses hängt auch von den persönlichen Merkmalen der Shopper ab; vgl. Cawthorn, C. P. (1998). Auch die Stimmung der Shopper wird durch das Wetter beeinflusst; vgl. Parsons, A. G. (2001), S. 81.

Einbau von Störvariablen in das Untersuchungsdesign: Störvariablen werden als unabhängige Variablen (experimentelle Bedingungen) in der Versuchsanordnung berücksichtigt, ihre Wirkung wird dadurch aktiv erforscht; vgl. Berekoven, L./Eckert, W./Ellenrieder, P. (2009), S. 257. Der Autorin ist keine Studie zum Shopperverhalten bekannt, die den Einfluss des Wetters in Deutschland auf das Shopperverhalten berücksichtigt; daher können im Voraus keine Aussagen über die Art des Wettereinflusses gemacht werden.

Yalch und Spangenberg kategorisieren Shoppertypen anhand ihrer Einkaufszeiten; vgl. Yalch, R. F./Spangenberg, E. R. (1990).

Da der Ablauf des Gewinnspiels vorsah, dass angeschriebene Stammkunden einen Schlüssel erhalten und diesen im Kassenbereich des Ladens in ein Schloss stecken, konnte durch Beobachtung ausgemacht werden, wer aufgrund des Gewinnspiels in den Laden kam. Somit konnte eine zusätzliche Kontrollgruppe eingeführt werden. Dies kann zwar in der Hinsicht kritisch gesehen werden, dass nur Stammkunden und nicht alle Kunden angeschrieben wurden. Daher wird im empirischen Teil untersucht werden, ob die Teilnehmer des Gewinnspiels in den übrigen Merkmalen mit anderen Shoppern vergleichbar sind. Durch die Konstanthaltung ist jedoch davon auszugehen, dass das Gewinnspiel keinen Einfluss auf die verschiedenen Gruppen hat, solange in allen Gruppen der gleiche Anteil an Gewinnspielteilnehmern ist und gleiche Beschaffenheit aller Gruppen angenommen werden kann.

Vgl. Bitner, M. J. (1992).

Das Geschäftsmodell des Herrenausstatters ist auf dem Kontinuum der Tangibilität der markierten Leistung relativ nahe der Dienstleistung und entfernt von den Markenartikeln zu verorten (siehe Kapitle A.2).

Kontrollierte Variablen lassen sich definieren als „die nicht untersuchten, vom Unternehmen direkt beeinflussbaren Variablen, deren möglicher Einfluss auf die abhängige Größe durch Beibehaltung des jeweilig vorhandenen Ausprägungsgrades (Ceterisparibus-Bedingung) ausgeschaltet wird;“ vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 162.

Die Wissenschaftlichkeit von Beobachtungen trennt wissenschaftliche von alltäglichnaiven Beobachtungen. Wissenschaftliche Beobachtungen heben sich von naiven Beobachtungen dadurch ab, dass sie systematisch geplant, aufgezeichnet und analysiert werden und einer Prüfung auf Zuverlässigkeit und Gültigkeit unterzogen werden können; vgl. Lamnek, S. (2005), S. 556ff..

Die Servicekräfte sahen den Fragebogen öfters als Teil der Verabschiedung der Shopper an und blieben noch während des Ausfüllens neben den Shoppern stehen.

Es wird somit die Eliminationstechnik angewandt; vgl. Berekoven, L./Eckert, W./Ellenrieder, P. (2009), S. 257.

Die durch den Forscher beobachteten Daten können um die Kassendaten ergänzt werden. Diese stehen allerdings nur auf stark aggregiertem Niveau (Umsatz pro Tag und Anzahl der gekauften produkte pro Stunde) zur Verfügung. Neben den objektiven Kassendaten wurden vom Beobachter zudem Einkaufsdaten (Bonhöhe, Stückzahl und Art der gekauften Artikel) registriert. Aufgrund der Komplexität der Beobachtungsaufgabe ist hier allerdings keine Vollständigkeit gegeben. Auch die Menge der Shopper führt dazu, dass nur ca. 85% aller den Laden besuchenden Shopper erfasst wurden.

Da für die Durchführung von ANOVAs annähernd gleichgroße Datensätze nötig sind (für nähere Ausführungen siehe Kapitel C.2.2), wurde der Datensatz hinsichtlich des Vergleichs zwischen Kontrollgruppen- und Experimentgruppengröße und ihrer Soziodemograpgie harmonisiert. Zudem wurden alle von ex ante nicht vorhergesehenen und schwerkontrollierbaren Störeffekten betroffenen Probanden aus dem Datensatz entfernt. Die so neu errechneten deskriptiven Werte finden sich in den Klammern.

70,5% (70,3%) der Shopper sind männlich. Ein Anteil von 56,7% (56,9%) der Shopper geht in Begleitung einkaufen. Von der Gesamtheit der Shopper sind 40,9% (41,1%) mit ihrer Partnerin, 0,2% (0,3%) mit Hund, 15,5% (15,7%) mit Freunden und 4,4% (4,6%) mit Kind im Laden.

Cronbachs Alpha liegt bei sieben der acht Itembatterien über dem kritischen Wert von 0,7 oder gleicht ihm. Sieben der acht Itembatterien haben auch alle Trennschärfekoeffizienten über dem kritischen Wert von 0,3. Diese beiden Kriterien erfüllt die Itembatterie der Musikbewertung nicht. Da diese Itembatterie aber in Analogie zur Duft- und Farbenbewertung gebildet wird, wird sie aus Gründen der Konsistenz und auch zur Erleichterung der Fragenbeantwortung nicht verändert. Für die Ergebnisse der Analyse siehe Appendix 21.

In Appendix 22 ist zu sehen, dass die Mehrheit der MPFN bei einer Faktoranalyse nach dem Vorgehen in Kapitel C.2.2 den Merkmalen von Aaker zugeordneten werden. Es stellt sich zudem heraus, dass Shopper mit geringer Vertrautheit mit dem Laden diesen bei der Wirkung von Farbe und klassischer Musik vornehmer wahrnehmen. Dies entspricht dem musikalischen Ausdrucksmodell aus Kapitel B.5.2: Weitere Veränderungen der Markenpersönlichkeit werden in Appendix 232 dargestellt.

Vgl. Salzmann, R. (2007), S. 175ff.; Bortz, J./Döring, N. (2006), S. 77; Cohen, J. (1990), S. 1308.

“Die statistische Signifikanz eines Effekts [hängt] vom Umfang der untersuchten Stichprobe ab;“ Bortz, J./Döring, N. (2006), S. 600. Eine ausführliche Diskussion hierzu überschreitet den Rahmen dieser Arbeit; für weiterführende Ausführungen vgl. ebenda, S. 491ff..

Vgl. ebenda, S. 130.

Eine Stichprobe hat einen „optimalen“ Stichprobenumfang, wenn er gerade groß genug ist, um einen für praktisch bedeutsam erachteten Effekt mit einer vorgegebenen Teststärke statistisch absichern zu können; vgl. ebenda, S. 601.

Die Teststärke bezieht sich auf den Fehler zweiter Ordnung (Betafehler). Dieser wird begangen, wenn eine nicht zutreffende Nullhypothese angenommen wird; vgl. Hiddemann, T. (2007), S. 110. Die Teststärke (Power) beschreibt die „Wahrscheinlichkeit, mit der eine richtige Alternativhypothese durch einen Signifikanztest entdeckt wird. Sie entspricht der Wahrscheinlichkeit 1-β;“ Bortz, J./Dφring, N. (2006), S. 742.

Die Effektgröße oder Effektstärke gibt die Stärke der Beziehungen zwischen den Variablen der Grundgesamtheit an; vgl. Hiddemann, T. (2007), S. 110.

Das Signifikanzniveau bezieht sich auf den Fehler erster Ordnung (Alphafehler). Dieser wird begangen durch die Entscheidung für die Alternativhypothese, obwohl in der Population die Nullhypothese gilt. Die Wahrscheinlichkeit, einen α-Fehler zu begehen, heißt Alphafehlerwahrscheinlichkeit, Irrtumswahrscheinlichkeit oder p-Wert; vgl. Bortz, J./Döring, N. (2006), S. 723. Das Signifikanzniveau entspricht der festgelegten Höchstgrenze der α-Fehler-Wahrscheinlichkeit; vgl. ebenda, S. 740. Ein Signifikanzniveau von 1% kann als „sehr signifikant“ (»***«), ein 5%iges-Niveau als „signifikant“ (»**«) und eine Signifikanz auf dem 10%-Niveau als „schwach signifikant“ (»*«) bezeichnet werden; vgl. Bolz, A. E. (2008); Bortz, J./Döring, N. (2006), S. 740; Breschi, S./Malerba, F./Orsenigo, L. (2000), S. 403; Hair, J. F. (1992), S. 173f..

Signifikanzniveau, Teststärke, Effektgröße sowie der Stichprobenumfang sind wechselseitig funktional verknüpft; vgl. Bortz, J./Döring, N. (2006), S. 627. Daher müssen zur Festlegung der Stichprobengröße zunächst die anderen Parameter fixiert werden; vgl. ebenda, S. 627ff..

Ein 5%-Signifikanzniveau ist üblich; vgl. ebenda, S. 740. Die Teststärke von Signifikanztests sollte in Sozialwissenschaften mindestens 80% aufweisen; ebenda, S. 742.

Vgl. Salzmann, R. (2007), S. 200.

Vgl. Bortz, J./Döring, N. (2006), S. 52ff..

Diese Unterteilung gilt für eine Vielzahl statistisch Hypothesen testender Verfahren, wie Korrelation oder Chi-Quadrattest. Die Grenzen der Abstufungen sind jedem einzelnen Verfahren angepasst; vgl. Cohen, J. (2009). Die Einteilung von Cohen ist weit verbreitet; vgl. Bortz, J./Döring, N. (2006), S. 627.

Vgl. Cohen, J. (1990), S. 1310f..

Die Beschreibung von Hypothesen ohne Effektgrößen findet sich u.a. bei Spangenberg, E. R. et al. (2006); Spangenberg, E. R./Crowley, A. E./Henderson, P. W. (1996); Areni, C. S./Kim, D. (1993).

Salzmann sowie Spies et al. ziehen auch Effektgrößen für ihre Analysen heran; vgl. u.a. Salzmann, R. (2007); Spies, K./Hesse, F./Loesch, K. (1997).

Die Effektgrößen bei Salzmann liegen zwischen 0,953 und 0,051; vgl. Salzmann, R. (2007), S. 228ff.. Kleine Effekte werden in diesem Zusammenhang mit ε =0,2 und große Effekte mit ε =0,8 gemessen; vgl. ebenda, S. 202. Spies et al. fanden kleine positive Effekte in Korrelationen R²=0,1 aber auch starke Effekte mit R²= 0,48; vgl. Spies, K./Hesse, F./Loesch, K. (1997), S. 8f..

Vgl. Bortz, J./Döring, N. (2006), S. 627.

Vgl. ebenda, S. 631f.. Im Rahmen dieses Experiments werden 1 Freiheitsgrad (df) und 8 Möglichkeiten der Stimuliausprägungskombinationen (nKombi) identifiziert. Der optimale Stichprobenumfang (n) ist abhängig von den Freiheitsgraden, der Effektgröße und der Analysemethode zu ermitteln; vgl. ebenda, S. 628ff.. Für eine Varianzanalyse auf einem Signifikanzniveau von 5% entspricht n einer kleinen Effektgröße 393 und einer mittleren Effektgröße 87; vgl. ebenda, S. 628. Bei mehrfaktoriellen Studiendesigns ist es üblich Varianzanalysen zu nutzen; vgl. ebenda, S. 632ff.. Aus diesem Grund wird diese Analysemethode für die Auswertung und Stichprobengrößenberechnung in der vorliegenden Arbeit herangezogen.

Vgl. Bad Krozingen (2010).

Der Forscher stand an einem Bistrotisch neben dem Eingang des Ladens. Dieser Tisch wurde auch von den Befragten zum Ausfüllen der Fragebogen genutzt. Dies führt dazu, dass maximal fünf Befragte zeitgleich einen Fragebogen ausfüllen konnten.

Somit wurden die Shopper beim Eintritt in den Laden nunmehr freundlich angesprochen, ob sie an einem Gewinnspiel teilnehmen wollen.

Außerdem kann dieser Selektionseffekt dazu führen, dass die Stichprobe weniger homogen ist und damit eine höhere Stichprobengröße benötigt wird. Diese Erhöhung wird allerdings als gering eingeschätzt, so dass die errechnete Stichprobengröße als ausreichend gelten kann.

In einem Sukzessivexperiment wird die Messung der Variablen zu verschiedenen Zeitpunkten vorgenommen. Bspw. wird das Verhalten einer Experimentalgruppe vor und nach Veränderung der unabhängigen Variablen gemessen; vgl. Theis, H.-J. (2008), S. 262; Hüttner, M./Schwarting, U. (2002), S. 170.

Die Ansprache zu Beginn des Einkaufs könnte die Aufmerksamkeit der Shopper auf ungewöhnliche Ereignisse erhöht haben, zumal das Experiment sich in einer Kleinstadt, in der sich viele der Shopper kennen, abspielte. Ex post kann gesagt werden, wie Gespräche mit Shoppern gegen Ende des letzten Tags gezeigt haben, dass sie nicht sensibilisiert wurden und sich auch keine Unterschiede der Treatments herumgesprochen haben.

Ein EBA-CBA Forschungsdesign beschreibt, dass die Messung der Werte der abhängigen Variablen vor und nach Einsatz der unabhängigen Variablen in der Experimentgruppe sowie Vorher- und Nachher-Messung in der Kontrollgruppe, die nicht dem Einfluss der unabhängigen Variablen ausgesetzt ist, durchgeführt wird; vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 163. Die Faktorwirkung kann bei diesem Design über die Differenz zwischen den gemeinsamen Unterschieden in Experiment- und Kontrollgruppe berechnet werden; vgl. ebenda.

Die Dekoration umfasste Stoffbahnen, die die Trennung des Schaufensters von dem inneren Verkaufsraum darstellten, Umdekorierung der Schaufensterpuppen und Puppen im Geschäft sowie das Hinterlegen und Bespannen großer Flächen mit Stoff. Ziel dieser Dekoration war, mehr Lila in den Verkaufsraum zu bringen, teils im Lilafarbton der Voruntersuchung (P 5/8), aber auch in dessen Nuancen. Durch die Umdekorierung des Schaufensters und das Fehlen einer klaren optischen Trennung zwischen Verkaufsraum und Schaufenster wirkte dieser Stimulus teils auch schon in der Vorbefragung, so dass hier in der Analyse ein Abgleich mit einer Kontrollgruppe vorgenommen werden muss.

Hierbei handelt es sich um ein Internetprogramm, das automatisch Musiktitel nach Vorgaben zu Aktualität, Genre und Stimmung selektiert; vgl. Vincent Casteignet (o.J.).

Eine Vielzahl der Titel war in den dem Experiment vorausgehenden Monaten in den Charts und im Radio zu hören, so dass von einer Bekanntheit bei den Shoppern ausgegangen werden kann.

Änderungen in den Schaufenstern sind in dem Filialsystem des kooperierenden Ladens Mitte jeder Woche üblich. Die Umdekoration wurde in der Woche des Experiments allerdings nur im Sinne der markenadäquaten Umdekoration zu fixierten Zeitpunkten vorgenommen.

Die Öffnungszeiten des Ladens sind montags bis samstags 9:00 bis 18:00.

Aufgrund der anderen Bevölkerungsstruktur des Ortes sind laut Geschäftsführung alle Wochentage vergleichbar. Aus diesem Grund und um die Störung des Sortimentswechsels möglichst gering zu halten, wurden sechs aufeinander folgende Tage Anfang Oktober ausgewählt. Es wurde eine Woche zu Beginn des Monats gewählt, da nach der Erfahrung des Personals in diesem Zeitraum die Frequenz der Kunden aufgrund von Gehaltsauszahlungen höher ist.

Da der vorgestellte Laden weniger servicebedürftige Ware anbietet, ist von einer geringeren Interaktion zwischen Personal und Shoppern auszugehen. Damit sollte die potenzielle Störung geringer ausfallen.

Die Wand hinter der Kasse war rot (R 4/9) gestrichen.

Shopper konnten sich an der Kasse kleine Päckchen mit Gummibärchen nehmen. Da dies aber konstant angeboten wurde, kann dieser Effekt als kontrolliert betrachtet werden.

Die Störung des Sortimentswechsels kann aufgrund der Durchführung des Experiments an sechs aufeinander folgenden Tagen als vernachlässigbar angesehen werden.

Da der Laden an einer (wenn auch sehr wenig) befahrenen Straße liegt, ist nicht mit Straßenmusikanten zu rechnen.

Die Vertagung eines Einkaufs von einem der untersuchten Tage (Montag bis Samstag) auf den verkaufsoffenen Sonntag durch die Shopper könnte allerdings negative Auswirkungen auf die Stichprobengröße haben.

Theis, H.-J. (2008), S. 265.

Vgl. Bortz, J./Döring, N. (2006), S. 58. Dies ist das beste Ergebnis, das für experimentelle Designs im Voraus erreicht werden kann; ebenda.

Rack, O./Christophersen, T. (2007), S. 19.

Vgl. ebenda; Hager, W. (1987), S. 53.

Vgl. Rack, O./Christophersen, T. (2007), S. 19; Hager, W. (2004), S. 43f..

Vgl. Rack, O./Christophersen, T. (2007), S. 19.

Vgl. McClelland, D. C. et al. (1953), S. 44; zusammenfassend Spangenberg, E. R./Crowley, A. E./Henderson, P. W. (1996), S. 69.

Der Duftexperte arbeitet seit sieben Jahren in der Raumbeduftung und gab das Niveau der optimalen Raumbeduftung im Verhältnis zu der Größe des Geschäfts unter Berücksichtigung des Luftzuges und der Technik an. Die Lautstärke wurde in Zusammenarbeit mit Experten, die seit über 10 Jahren im Einzelhandel tätig sind und die Wünsche der Zielgruppe bezüglich dieses Themas kennen bestimmt.

Im Pretest wurden halbstündige Wetterdaten (Lufttemperatur und Niederschlag) für die Einkaufsstraße, in der sich der Laden befindet, vom Amt für Umweltschutz der Landeshauptstadt Stuttgart zur Verfügung gestellt. Im Experiment maß Meteomedia GmbH stündlich Wetterdaten (Windgeschwindigkeit, Windböen, Lufttemperatur, Niederschlagsmenge und Sonnenscheindauer) von zwei Städten, die sich 7,7, km nord-nord-östlich und 6,4 km süd-süd-westlich von Bad Krozingen befinden. Die Daten dieser beiden Städte werden in der Analyse gemittelt um das Wetter in Bad Krozingen abzubilden.

Die Frage, mit wie vielen Begleitpersonen ein Shopper einkaufen geht, ist auch im Fragebogen vorgesehen. Allerdings hat sich während der Befragung herausgestellt, dass die Formulierung missverständlich ist und daher der Beobachtung mehr Gewicht zukommt.

Reliabilität bedeutet die Reproduzierbarkeit von Ergebnissen unter identischen Bedingungen; vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 146. Anzumerken ist allerdings, dass dieses Kriterium nicht unstrittig ist; vgl. ebenso für nähere Ausführungen Bortz, J./Döring, N. (2006), S. 327. Dennoch ist es ein übliches Kriterium, um Fragebögen zu beurteilen; vgl. Bruner, G. C./Hensel, P. J. (1992). Der meist verbreitete Reliablitätskoeffizient ist Cronbach’s Alpha α_c; vgl. Herr, C. (2007), S. 215.. Ein hohes Alpha indiziert eine hohe Reliabilität der Skala; vgl. ebenso für nähere Ausführungen ebenda, S. 215f..

Validität „bringt zum Ausdruck, inwieweit ein Messergebnis tatsächlich auch auf den zu untersuchenden Sachverhalt Bezug nimmt bzw. inwieweit inhaltlich jene Information gemessen und wiedergegeben wird, die zu messen beabsichtigt war“; Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 146.

Vgl. Schaefer, K. (2006), S. 70.

Die Experten (3 Professoren und 2 Doktores) haben alle Erfahrung in der Durchführung von Befragungen, die zum Teil auch im Zusammenhang von Experimenten gesammelt wurden.

100

Vgl. für nähere Ausführungen zu Motivations- und Ermüdungseffekten Bortz, J./Döring, N. (2006), S. 198.

101

Dies wurde bereits in C.1.1 dargelegt.

102

Im Pretest wurde innerhalb der BPS zudem ein Kontrollitem „zuverlässig“ doppelt eingefügt um die interne Validität des Fragebogens zu überprüfen. Da dies allerdings einer Vielzahl von Probanden störend auffiel, wurde dies während des Experiments unterlassen.

103

In den Fragebögen des Experiments wurden einige Konstrukte vor und nach dem Einkauf abgefragt, um so Veränderungen dokumentieren zu können.

104

Vgl. u.a. Zentes, J./Morschett, D. (2005), S. 144ff.; Morschett, D. (2000), S. 119ff..

105

Vgl. ebenso für weitere Ausführungen Zentes, J./Morschett, D. (2005), S. 144ff.; Morschett, D. (2000), S. 119ff..

106

Vgl. Zentes, J./Morschett, D. (2005), S. 144ff.; Morschett, D. (2000), S. 119ff..

107

Vgl. Dickson, J./Albaum, G. (1977).

108

Sie wird u.a. genutzt bei Vaccaro, V. et al. (2008); Sherman, E./Smith, R. B. (1987). Daneben vermessen auch Wu und Petroshius das Store Image; vgl. Wu, B./Petroshius, S. (1987); zusammenfassend Bruner, G. C./Hensel, P. J. (1992), S. 582f.. Allerdings wurde diese Itembatterie nicht auf ihre Validität überprüft; vgl. ebenda, S. 582.

109

Vgl. Sherman, E./Smith, R. B. (1987), S. 252. Sie verwenden eine siebenstufige Likertskala und finden α_c=0,9; vgl. ebenda. Auch die Autoren der Skala bestätigen über Spearmans Rangkorrelationskoeffizient deren Reliabilität; vgl. Dickson, J./Albaum, G. (1977).

110

Vgl. ebenda, S. 89. Ein semantisches Differential lässt die Befragten ein Einstellungsobjekt anhand einer Reihe von Adjektiven beschreiben, die angeordnet als Gegensatzpaare eine Liste bilden. Ein bipolares Adjektivpaar kann als eine einfache „Skala“ aufgefasst werden, deren Endpunkte die Adjektive markieren. Sowohl die Endpunkte als auch die Zwischenstufen sind nummeriert, verwendet werden meistens die Zahlen 1 bis 7; vgl. Schnell, R./Hill, P. B./Esser, E. (2008), S. 175. Wie auch bei den Likertskalen gibt es keine allgemeingültige Meinung zur optimalen Stufenanzahl der Skalen. Die Skalen eines semantischen Differenzials zählen zu den Ratingskalen, die die befragten Personen dem Untersuchungsobjekt (Einstellungsobjekt) auf einer vorgegebenen Antwortskala einen Messwert zuordnen; vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 150.

111

Kriterien für die Auswahl sind das Passen zu den beiden Leistungsangeboten der beiden Experimentläden und die rationale Orientierung des Items. Zudem wurde als Vergleich und auch für die Übersetzung auf die bewährte Fragebatterie zur Vermessung der Zufriedenheit mit einem Laden von Fuchs zurückgegriffen; vgl. Fuchs, A. (2010), S. 202.

112

Hierzu wird die deutsche Übersetzung aus Aakers Veröffentlichung herangezogen; vgl. Aaker, J. L. (2000).

113

Das vorrangige Ziel einer Skala ist es, die Validität eines Fragebogens sicherzustellen; vgl. Clark, L./Watson, D. (1995), S. 309. Die wissenschaftliche Diskussion ist allerdings hinsichtlich der optimalen Länge einer Skala noch zu keinem abschließenden Ergebnis gekommen; vgl. Kästner, E. (2009), S. 140. Vgl. zu verschiedenen Ansichten Friedman, H. H./Amoo, T. (1999) sowie Cox, E. P. (1980). Nach McKelvie und Cox III gibt es keine optimale Anzahl für Antwortmöglichkeiten: sie hängt vielmehr davon ab, was gemessen werden soll; vgl. ebenda; McKelvie, S. J. (1978). Dennoch empfiehlt McKelvie fünf bis sechs Antwortmöglichkeiten für optimale Distinktheit und Validität. Zudem bieten fünf Abstufungen mit jeweils zwei Stufen der Ablehnung bzw. Zustimmung und einem neutralen Mittelpunkt ein breites Spektrum an Antwortmöglichkeiten; vgl. Kirchhoff, S./Kuhnt, S./Lipp, P. (2010), S. 22. Daher werden auch in dieser Arbeit fünfstufige Skalen verwendet.

114

Likertskalen sind die in der empirischen Sozialforschung am häufigsten verwendete Skallierungsmethode. Sie wurde 1932 von Rensis Likert vorgestellt und als Methode der summierten Ratings definiert; vgl. Schnell, R./Hill, P. B./Esser, E. (2008), S. 187. Likertskalen bestehen aus mehreren mindestens fünfstufigen Items; vgl. Brosius, H.-B./Koschel, F./Haas, A. (2009), S. 62. An den jeweiligen Extrempunkten der Skala befinden sich jeweils Ablehnung und Zustimmung; vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 149. Likertskalen gehören ebenfalls zu den Ratingskalen.

115

Vgl. Aaker, J. L. (1997), S. 350.

116

Sich bei der Abfrage der Markenpersönlichkeit nach Aaker auf die Facettennamen zu beschränken, ist durchaus üblich; vgl. Brakus, J. J./Schmitt, B. H./Zarantonello, L. (2009); Beldona, S./Wysong, S. (2007). Somit umfasst die Skala im Experiment 23 Adjektive.

117

Da es auch im Forschungsinteresse dieser Arbeit steht, zu ermitteln, ob durch Faktorenbildung die Facettennamen aus den MPFN repliziert werden können, werden die Facettennamen, die Teil der Soll-Markenpersönlichkeit nach Unternehmensverständnis sind, inklusive der zugehörigen MPFN abgefragt.

118

“Bei Reihenfolgeeffekten handelt es sich wahrscheinlich um weitgehend unbewusste Reaktionen der Befragten, die sich aus der Position einer Frage im Fragebogen ergeben, aus der Position einer Antwortkategorie innerhalb einer Frageformulierung oder aus der Zahl der vorgegebenen Antwortkategorien, und zwar unabhängig vom konkreten Inhalt der Frage“; Petersen, T. (2002), S. 165.

119

Vgl. Grewal, D. et al. (2003), S. 267. Zwar kann dieses Item nach Grewal et al. die Vermessung der Einstellung zur Atmosphäre erleichtern; vgl. ebenda. Dennoch beeinflusst die Atmosphäre zum Teil die Gesamtattraktivität eines Ladens (Einstellung zur Store Brand), siehe hierzu die Ausführungen in Kapitel B.2. Aus diesem Grund wird die Itembatterie zur Atmosphäre vor dem Hintergrund der Definitionen, die dieser Arbeit zu Grunde liegen, als zwei gesonderte Konstrukte interpretiert: Einstellung zur Store Brand und Einstellung zur Atmosphäre. In der gleichen Itembatterie fragen Grewal et al. zudem die Verhaltensabsicht der Shopper ab. Auch diese separat vermessene Itembatterie wird als reliabel ausgewiesen; vgl. ebenda. Grewal et al. vermessen alle Items auf siebenstufigen Likertskalen; vgl. ebenda.

120

Siehe hierzu Kapitel C.1.

121

Nominalskalen dienen lediglich der Klassifikation von Untersuchungsgegenständen und stellen die einfachste Form des Messens dar; vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 150.

122

Mattila and Wirtz ermitteln auf einer Likertskala, ob ein Duft den Shoppern gefällt; vgl. Mattila, A. S./Wirtz, J. (2001), S. 281. Validität und Reliabilität dieser Skala werden allerdings nicht ermittelt; vgl. ebenda.

123

Kellaris et al. vermessen mit ihrer Itembatterie den Fit zwischen Musik und Werbespots; vgl. Kellaris, J. J./Cox, A. D./Cox, D. (1993), S. 118. Sie erzielen für die Skala α_c=0.92; vgl. ebenda. Vaccaro et al. übernehmen die Itembatterie in leicht veränderter Form in den Kontext des Handels; vgl. Vaccaro, V. et al. (2008). Für die Messung wurden die fünf Items von Vaccaro et al. auf vier reduziert, da ein Item in der deutschen Übersetzung (Musik und Geschäft ließen mich an das Gleiche denken) von den Experten als unüblich und schwer verständlich erachtet wurde.

124

Mattila und Wirtz nutzen eine siebenstufige Likertskala; vgl. Mattila, A. S./Wirtz, J. (2001), S. 281. Die Likertskala von Kellaris et al. ist fünfstufig; vgl. Kellaris, J. J./Cox, A. D./Cox, D. (1993), S. 118.

125

Vgl. Fisher, J. D. (1974). Crowley verwendet diese Skala als erster im Kontext des Shopperverhaltens; vgl. Crowley, A. E. (1993). Spangenberg et al. sowie Matilla und Wirtz nehmen kleine Anpassungen an der Itembatterie vor; vgl. Mattila, A. S./Wirtz, J. (2001); Spangenberg, E. R./Crowley, A. E./Henderson, P. W. (1996). Matilla und Wirtz kürzen die Batterie auf sieben Items und errechnen hierfür α_c=0,92; vgl. Mattila, A. S./Wirtz, J. (2001), S. 280. Weder Fisher noch Crowley oder Spangenberg et al. geben Hinweise auf Validität oder Reliabilität der Skala; vgl. Fisher, J. D. (1974); Spangenberg, E. R./Crowley, A. E./Henderson, P. W. (1996). Da es zum einen eine häufig herangezogene Skala ist und das Konstrukt der Ladenatmosphäre eine zentrale Rolle in der Arbeit spielt und umfassend beleuchtet werden soll, wird zunächst die ausführlichere Variante von Spangenberg et al. für den Fragebogen gewählt. Die Reliabilität der Skala wird in einem mehrstufigen Testverfahren überprüft.

126

Dementsprechend findet sie auch oft Verwendung zur Vermessung der Atmosphäre im Kontext des Shopperverhaltens; vgl. u.a. Mattila, A. S./Wirtz, J. (2001); Spangenberg, E. R./Crowley, A. E./Henderson, P. W. (1996).

127

Siehe Ausführungen zu „Einstellung zur Store Brand“ in diesem Kapitel. Die Frage, ob die Atmosphäre eher angenehm ist, wurde auch schon in der multidimensionalen Abfrage gestellt, so dass hier eine Konsistenzprüfung vorgenommen werden kann. Die Gesamteinschätzung der Atmosphäre wird über diese beiden Items vorgenommen.

128

Eine visuelle Analogskala ist eine optische Skala, auf der Probanden ihr persönliches Befinden schriftlich oder mündlich vermerken; vgl. Krause, M. A. (2010), S. 91; Harth, W./Gieler, U./Harth-Gieler (2006), S. 230. Die Skala geht meist von 1 bis 10; vgl. ebenda. Die beiden Endpunkte werden durch zwei gegensätzliche Befindlichkeiten definiert; vgl. Windgassen, K. (1989), S. 14ff..

129

Vgl. Krause, M. A. (2010), S. 91.

130

Vgl. Richter, G./Richter, J. (1995), S. 88. Im Kontext des Shopperverhaltens nutzt Baron ebenfalls zur Vermessung von Stimmung ein semantisches Differenzial (very good - very bad), das nur ein Item beinhaltet; vgl. Baron, R. A. (1997), S. 499.

131

Vgl. Lumpkin, J. (1985); Hawes, J./Lumpkin, J. (1984); Dickerson, M. D./Gentry, J. W. (1983), S. 592ff.; zusammenfassend Bruner, G. C./Hensel, P. J./American Marketing associaltion (1992); Putrevu, S./Ratchford, B. T. (1997) zusammenfassend Bruner, G. C./Hensel, P. J./James, K. E. (2001), S. 633.

132

Vgl. Lumpkin, J. (1985); Hawes, J./Lumpkin, J. (1984); Dickerson, M. D./Gentry, J. W. (1983), S. 592ff.; zusammenfassend Bruner, G. C./Hensel, P. J./American Marketing associaltion (1992).

133

Vgl. Putrevu, S./Ratchford, B. T. (1997).

134

Hierzu war der Autorin keine Skala bekannt, so dass die Skala selbst entwickelt wurde.

135

Vgl. Witte, E. H./Janetzki, E. (2004). Die Itembatterie zeichnet sich dadurch aus, dass ihre Autoren umfassend ihre Validität und Reliabilität geprüft und bestätigt haben.

136

Vgl. Springer, C. (2008). Allerdings ist der Fragebogen von Springer in Teilen sehr lang, so dass manche Antworten zu Kategorien zusammengefasst und einzelne Fragen weggelassen wurden. Die Frage nach dem Alter ist eine offene Frage und metrisch skaliert: Neben Äquidistanz hat das Alter auch einen natürlichen Nullpunkt; vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 148. Die restlichen Variablen der Soziodemographie sind nominalskaliert. Das Nettohaushaltseinkommen wurde auf Wunsch der Geschäftsführung im Pretest nicht abgefragt.

137

Vgl. Herz, R. S./Schankler, C./Beland, S. (2004), S. 367.

138

Dieses Vorgehen lehnt sich an das Studiendesign von Inman et al. an, die ebenfalls Shopper nach ihrer Einkaufsliste befragten; vgl. Inman, J. J./Winer, R. S./Ferraro, R. (2009). Allerdings wurde diese Befragung mündlich vorgenommen, so dass kein genauer Wortlaut verfügbar ist; vgl. ebenda, S. 21.

139

Siehe hierzu „Begleitung“ im selben Kapitel.

140

Auf die Relevanz dieser Faktoren hinsichtlich des Shopperverhaltens sowie auf eine Forschungslücke dazu weisen Grewal et al. hin; vgl. Grewal, D. et al. (2003), S. 266.

141

Dieses Vorgehen entspricht der Methode von Inman et al.; vgl. Inman, J. J./Winer, R. S./Ferraro, R. (2009). Im Gegensatz dazu versuchen einige Autoren Impulskäufe ex post direkt zu ermitteln; Mattila, A. S./Wirtz, J. (2001), S. 279; Vanecek, E. (1991), S. 85. Dies birgt allerdings das Risiko, dass die Shopper nachrationalisieren und denken, sie wollten von Beginn an diese Produkte kaufen.

142

Über die beobachtete Zeit, in der der Shopper an der Kasse ist, und die Abrechnungszeiten der Kasse können die Daten verbunden werden. Allerdings kommt es zu einigen Unschärfen, da durch Beobachtung nur der Zeitraum, in dem der Shopper an der Kasse steht, festgestellt werden kann und nicht der exakte Zeitpunkt der Bezahlung. Hinzu kommt, dass die Kassendaten belegen, dass die Beobachtungen nicht vollständig sind. Dies ist darauf zurückzuführen, dass der Forscher neben der Beobachtung auch noch die Befragung durchführen musste.

143

Nähere Ausführung hierzu in Kapitel C.1.

144

Nähere Ausführung hierzu in Kapitel B.2.3.

145

Diese Frage wurde an die Fragestellung von Vanecek angepasst; vgl. ebenda, S. 86. Die Frage von Vanecek war geschlossen und wurde von den Experten als wenig konsistent eingschätzt, so dass sie offen umformuliert wurde. Gleichzeitig kann die Frage auch als Vertrautheit mit dem Laden und somit auch der Store Brand interpretiert werden; vgl. Inman, J. J./Winer, R. S./Ferraro, R. (2009), S. 24.

146

Grewal et al. fragen die Verhaltensabsicht der Shopper ab; vgl. Grewal, D. et al. (2003), S. 267. Siehe hierzu „Einstellung zur Store Brand“ im selben Kapitel.

147

Kontexteffekte beschreiben die inhaltliche Beeinflussung der Antwort der Befragten auf eine Frage durch eine vorhergehende Frage; vgl. Petersen, T. (2002), S. 103.

148

Dies ist ein übliches Vorgehen, da die zu frühe Erfassung der Soziodemographie bspw. Irritationen hervorrufen kann; vgl. Buchhester, S. (2006), S. 76.

149

Meinungsfragen beziehen sich primär auf die Einstellung der Befragten, z.B. Meinung zu Produkten, wohingegen Faktfragen mehr Wissen und Fakten abfragen, wie bspw. Alter, tatsächliches Verhalten und Einkommen; vgl. Wiswede, G. (2007), S. 46.

150

Die einzigen Faktfragen innerhalb des Fragebogens beziehen sich auf die Soziodemographie und das tatsächliche Verhalten (geschätzte Aufenthaltsdauer, geschätzte Einkaufshäufigkeit beim Laden X in den letzten 12 Monaten).

151

Es finden sich folgende Reliabilitäten: Markenpersönlichkeit nach Aaker: α_c=0,93; Einkaufssituation (Eile) α_c=0,51; Markenimage rational α_c=0,82; Lebensstil: α_c=0,79; Loyalität (zukünftige Komponente) α_c=0,89; Duftfit α_c=0,566. Für Fragen mit nur einer Itemkategorie sowie zu kleinem Rücklauf kann Cronbach’s Alpha nicht berechnet werden.

152

Diese Zahl wurde noch um 17 Shopper reduziert, da im Laufe des Experiments sich neue Störeinflüsse ergaben, die a priori nicht absehbar waren. So kam es zweimal zu einer kurzen Störung der Musik: Durch Staubsaugergeräusche im Laden und durch laute Musik aus einem Wohnhaus an der Straße. Zudem wurde am Tag der Beduftung der Laden mit Zitrusputzmittel geputzt. Da aber alle Störungen nur kurzzeitig auftraten, wäre es theoretisch möglich, mittels Kontrollgruppen der gleichen Stimulusbedingungen die Auswirkungen der Störungen zu ermitteln. Praktisch wird allerdings die kritische Größe der gestörten Stichprobe nicht erreicht, um die Unterschiede zwischen der gestörten und der Experimentgruppe auf ihre Signifikanz zu überprüfen. Daher werden die Probanden, die Störungen ausgesetzt waren, von den Auswertungen exkludiert.

153

Diese Beobachtungsdaten beinhalten zum einen die Kassendaten und zum anderen die Beobachtungsdaten des Forschers. Der Abgleich zwischen den Kassen- und Beobachtungsdaten zeigt, dass die Beobachtungen nicht vollkommen sind. So können einzelne Bezahlvorgänge nicht beobachteten Kassenzeiten zugeordnet werden. Es ist demnach davon auszugehen, dass die Beobachtungsdaten zwar den größten Teil der Shopper in den sechs Tagen des Experiments abdecken, allerdings nicht 100%. Da aber geschätzte 95% aller Shopper in der Studie berücksichtigt wurden, kann von einer hohen Repräsentativität ausgegangen werden. Auch einzelne Beobachtungsdaten sind nicht vollständig, so dass in einigen Fällen die Ausgangszeiten fehlen. Insgesamt kann in 7% der Fälle aufgrund fehlender Beobachtungsdaten keine Aufenthaltszeit berechnet werden.

154

Siehe hierzu Appendix 265.

155

92,3% aller Shopper sind weiblich und 66,4% aller Shopper sind allein. Die Shopper, die nicht alleine sind, gehen zu 45% mit Freunden oder Verwandten (, die nicht offensichtlich als Partner zu erkennen sind), zu 36,7% mit Partner, zu 21,3% mit Kind(ern) und in 1,8% der Fälle mit Hund einkaufen.

156

Für nähere Ausführungen zu ANOVA siehe Kapitel C.2.2.

157

Im Vergleich zu 20 überprüften Items sind die maximal fünf signifikanten Unterschiede zwischen der jeweiligen Treatmentgruppe und der Kontrollgruppe vernachlässigbar. Zudem ist auch die Effektstärke der Abweichung stets klein. Des Weiteren zeigen Analysen mit kleineren, homogeneren Gruppen keine wesentlichen Unterschiede im Ergebnis.

158

Der Anteil der Shopper, die in einer festen Beziehung leben, schwankt über die Stimulusbedingungen hinweg um die 80%. Auch der Raucheranteil liegt in einem engen Rahmen um die 15%.

159

Die Items „Die Musik/der Duft/die Farbe gefällt mir“ finden im Schnitt alle Zustimmung.

160

Die Shopper finden unabhängig und unter Berücksichtigung des persönlichen Gefallens der Stimuli, dass sowohl die markenadäquate als auch die nicht markenadäquate Musik, der Duft und die Farbe zum Laden passt: Der Durchschnitt über alle Shopper liegt zwischen 2,143 für den Duft und 1,744 der markenadäquaten Musik, was Zustimmung der Shopper zur Passung zwischen allen Stimuli und dem Laden gleich kommt. Diese Erkenntnisse werden auch von den Items zur Stimmung und dem umgekehrt skalierten Fit unterstützt (siehe Tabelle 9).

161

Stimuli, die den Shoppern gefallen führen u.a. zu einer positiveren Einstellung zur Marke, zu längeren Aufenthaltszeiten im Laden und mehr Impulskäufen; vgl. hierzu Kap. B.4.

162

Siehe hierzu Kap. B.4.

163

Vgl. Aaker, J. L. (1997), S. 350.

164

Die Übersicht der Gütekriterien wurde von Greven zusammengetragen; vgl. ebenso für erklärende Ausführungen zu den Kriterien Greven, G. (2011), S. 145. Allerdings werden aufgrund der Vorgabe eines analogen Vorgehens zu Aaker einige Kriterien wie bspw. der Screeplot nicht berücksichtigt.

165

Die Faktorenanalyse wird über 81 gültige Fälle durchgeführt. Das KMO-Kriterium beträgt 0,882. Das Chi-Quadrat des Bartlett-Test auf Sphärizität beträgt 1223,756 (p = 0,000). Die Faktoren erklären 66,96% der Varianz des Modells. Cronbach’s Alpha beträgt α_c=0.91. Der Trennschärfekoeffizient beträgt im schlechtesten Fall 0,898. Die Faktoren erklären 66,9% der Varianz des Modells.

166

Vgl. Zentes, J./Morschett, D./Schramm-Klein, H. (2008), S. 176. Zentes et al. entfernen aufgrund mangelnder Verständlichkeit des Wortes im Deutschen „kleinstädtisch“ aus der BPS. Da es allerdings sehr trennscharf ist, wird von diesem Vorgehen im Rahmen der vorliegenden Arbeit Abstand genommen.

167

Zudem zeigen weiterführende Analysen zu Einzelauswertungen der einzelnen Treatmentgruppen, dass die Ergebnisse verhältnismäßig instabil sind. Dies kann zum einen auf die Itembatterie, zum anderen aber auch auf die Wirkung der Stimuli, die im weiteren Verlauf besprochen wird, zurückgeführt werden.

168

Vgl. Meffert, H./Burmann, C./Kirchgeorg, M. (2008), S. 163. 1139 Vgl. ebenda.

169

Vgl. ebenda.

170

Vgl. Bortz, J./Döring, N. (2006), S. 546. MANOVA steht für „Multivariate Analysis of Variance“ (multivariate Varianzanalyse; vgl. ebenda, S. 733.

171

ANOVA (Analysis of Variance) oder Varianzanalyse überprüft Mittelwertunterschiede zwischen den Gruppen; vgl. ebenda, S. 744.

172

Vgl. ebenda, S. 530.

173

Vgl. ebenda, S. 627.

174

Dieses Vorgehen kann ex post besonders mit Hinsicht auf die vorwiegend kleinen Effekte, die erzielt werden, als sinnvoll erachtet werden.

175

Vgl. Backhaus, K. (2008), S. 177; Maxwell, S. E./Delaney, H. D. (2004), S. 129f..

176

Vgl. ebenda, S. 130.

177

Vgl. ebenda.

178

Die Unabhängigkeit der Stichproben wird über das Experimentdesign sichergestellt. Die Überprüfung einer Normalverteilung kann bei quasimetrischen Skalen visuell mittels Q-Q-Diagrammen vorgenommen werden; vgl. Nitzl, C. (2010), S. 20. Hier kann beinahe ausnahmslos von einer Normalverteilung der Variablen des Datensatzes ausgegangen werden. Die Gleichheit der Varianzen (Homoskedastizität) der Variablen kann mittels des Levene-Tests geprüft werden; vgl. Brosius, F. (2008), S. 394. Die Nullhypothese des Tests lautet auf homogene Varianz; vgl. Kähler, W.-M. (1998), S. 180. Die Homoskedastizität kann für die Mehrheit der betrachteten Variablen bestätigt werden. Die Minimalbedingung einer vergleichbaren Größe der einzelnen Stichproben ist zudem für alle betrachteten Auswertungen gegeben.

179

Die Effektgröße (ε) misst den Zusammenhang zwischen der abhängigen und der unabhängigen Variablen; vgl. Brosius, F. (2008), S. 419. Den Anteil der erklärten Varianz beschreibt ε². Die Grö-ße der Effekte wird durch die Werte 0,1/0,25/0,40 als kleine/mittlere/große Effekte abgegrenzt; vgl. Bortz, J./Döring, N. (2006), S. 606.

180

Vgl. ebenso im Folgenden Kapitel B.5.3.

181

Das multisensuale Ausdrucksmodell der Aakerschen Markenpersönlichkeit zeigt nur, über den Einsatz welcher Stimuli einzelne MPFN in der Wahrnehmung der Shopper verstärkt werden können. Sie zeigen allerdings nicht wie die Wahrnehmung einzelner MPFN in der Wahrnehmung vermindert werden können. Daher kann aufgrund der Abnahme einzelner MPFN in der Wahrnehmung der Shopper keine Aussage über die Qualität des multisensuale Ausdrucksmodell der Aakerschen Markenpersönlichkeit getroffen werden.

182

Diese Annahme kann anhand des MPFN „modern“ demonstriert werden, da ein Vergleich innerhalb der einzelnen Treatmentgruppen zeigt, dass Musik modern wirkt und die Farbe weniger modern. Letzterer Effekt ist im Vergleich zur Kontrollgruppe nicht mehr signifikant, scheint aber bei der simultanen Wirkung als Interaktionseffekt wieder zu wirken. Für Auswertungen der Vorher-Nachher-Effekte innerhalb der Gruppen siehe Appendix 28.

183

An dieser Stelle muss allerdings erwähnt werden, dass die Abfrage der Markenattribute mittels des semantischen Differenzials einer Vielzahl von Probanden Schwierigkeiten bereitete. Erschwert wurde dies noch durch den Wechsel der positiven und negativen Seite der Skala nach zwei Items. Die Ergebnisse dieser Messung sollten daher vorsichtig interpretiert werden. Dies ist im Pretest nicht aufgefallen. Der Grund hierfür könnte in dem unterschiedlichen Bildungsniveau zwischen Pretest- und experimental Gruppe gesehen werden.

184

Die Attraktivität des Geschäfts (auf einer Skala von 1-5 mit 1 = „trifft voll und ganz zu“ und 5 = „trifft überhaupt nicht zu“) wird im Durchschnitt von der Kontrollgruppe mit 1,4259, unter dem Einfluss von markenadäquater Musik mit 1,5294, unter dem Einfluss von Farbe mit 1,3750, unter dem Einfluss von Duft mit 1,5000 und unter simultaner Wirkung aller Stimuli mit 1,7941 bewertet.

185

Ein übersichtlicher Ladenaufbau und das Preis-Leistungsverhältnis weisen keinen klaren, linearen Zusammenhang mit der Einstellung zur Store Brand auf.

186

Der Zusammenhang zwischen der Einstellung zum Laden und seinem wahrgenommenen Temperament ist nicht linear. Hier scheint das optimale Level zwischen den Shoppern stark zu variieren.

187

Zwischen einer zähen Markenpersönlichkeit und dem Globalimage findet sich kein linearer Zusammenhang.

188

Vgl. Spangenberg, E. R./Crowley, A. E./Henderson, P. W. (1996), S. 75.

189

Wie angenehm die Atmosphäre ist, wird (auf einer Skala von 1-5 mit 1 = „trifft voll und ganz zu“ und 5 = „trifft überhaupt nicht zu“) im Durchschnitt von der Kontrollgruppe mit 1,3091 und unter simultaner Wirkung aller Stimuli mit 1,4714 bewertet.

190

Im Gegensatz zu den anderen Items der Wahrnehmung der dekompositionellen Atmosphäre ist die Freundlichkeit umgekehrt skaliert. Dies hat teils zu Verwirrungen bei den Shoppern während des Ausfüllens der Fragebögen geführt. Dadurch könnte erklärt werden, dass im Gegensatz zu allen anderen Items hier kein linearer Zusammenhang zur Einstellung zur Atmosphäre zu finden ist. Dagegen spricht allerdings der hohe Erklärungsanteil und es könnte eben diese Verwirrung dazu geführt haben, dass sich die Shopper nicht dem Effekt der sozialen Erwünschtheit unterworfen sahen. Allerdings kann keine der beiden Thesen im Rahmen dieser Arbeit abschließend belegt oder widerlegt werden.

191

Dies beantwortet die vorangehend gestellte Frage, ob eine Atmosphäre maximal interessant sein sollte, positiv.

192

Allerdings werden keine signifikanten Unterschiede zwischen dem Passen der markenadäquaten und der nichtmarkenadäquaten Musik wahrgenommen. Dies könnte darauf zurückgeführt werden, dass sie beide vom gleichen Genre sind. Dennoch wird die markenadäquate Musik weniger passend wahrgenommen (siehe Appendix 30).

193

Dieser Zusammenhang scheint aber nicht linear zu verlaufen, da über alle Items hinweg ein extrem schlechter Fit dennoch zu einem positiveren Globalimage führt als weniger schlecht beurteilte Fits. Zudem enthielt die Itembatterie ein Item mit doppelter Verneinung, hier sind die Zusammenhänge nicht so klar erkennbar, was auf die Komplexität der Fragestellung zurückzuführen sein könnte.

194

Da die Wahrnehmung der dekompositionellen Atmosphäre auf einer 7stufigen Skala abgefragt wurde, wird hier der Mittelwert über alle atmosphärischen Items auf eine 5-Skala skaliert und hierauf von dem MPFN subtrahiert.

195

Von den vier Items zum Zeitdruck hat nur „Ich habe mehr als genug Zeit“ (auf einer Skala von 1-5 mit 1 = „trifft voll und ganz zu“ und 5 = „trifft überhaupt nicht zu“) einen signifikanten Einfluss auf die Aufenthaltszeit. Shopper, die diese Frage mit 1-2/3/4-5 beantwortet haben, werden hier als nicht/neutral/unter Zeitdruck bezeichnet.

196

Da in der Beobachtung meist nur die Verwandtschaftsverhältnisse von Partnern sowie Eltern und Kindern erkenntlich waren, wurde jede weitere Verwandtschaft unter Verwandtschaft oder Freundschaft subsumiert.

197

Wird etwas gekauft? Ja oder Nein.

198

Kreuztabellen dienen der Analyse von Zusammenhängen zwischen nominal skalierten Variablen; vgl. Backhaus, K. (2008), S. 298. Die Signifikanz wird entweder über das Chi-Quadrat oder den Fisher-Exakt-Test (in beiden Fällen beidseitig) berechnet; vgl. ebenda.

199

Für diese Betrachtung wurden jeweils die drei meist gekauften Farben und Artikel herangezogen. Da sie die Anforderungen an eine kritische Menge für die Auswertungen zumeist erfüllten.

200

In diesem Zusammenhang wurde kein signifikanter Zusammenhang zwischen der Farbe schwarz und Hosen gefunden.

201

In der Kontrollgruppe kauften 5 Shopper, was sie vorhatten, unter dem Einfluss von Farbe nur 3 und in allen anderen Stimulusbedingungen nur 2 Personen.

202

Die Operationalisierung des Begriffs „Shoppervehalten“ wird in Kapitel C.1.3 erläutert.

203

Zur Vereinfachung der Darstellung werden nur die Signifikanzen und die Effekte aufgeführt, da es sich bei der Darstellung der einzelnen Zusammenhänge um sehr große Tabellen handelt.

204

Selbst weiterführende Analysen (u.a. Clusteranalysen) können hier kein klares Muster aufzeigen.

205

In Modezeitschriften liest man regelmäßig: Schwarz ist eine Farbe, die kaschiert und mit viel kombinierbar ist, das Risiko ein Geschenk zu kaufen, was dann nicht gut aussieht sinkt somit. Auch die Farbe Weiß wird in diesen Zeitschriften meist mit Sonne und Sommer in Verbindung gebracht.

206

Die einzelnen Änderungen sind alle mit p = 0,000 signifikant. Die Wirkung aller Stimuli senkt signifikant (p = 0,000) die Stimmung der Shopper.

207

Dieser Zusammenhang ist besonders deutlich bei der Auswirkung von als „trüb“ bis „sonnig“ wahrgenommener Atmosphäre auf die Stimmung zu erkennen. Aber auch die Items „negativ“ und „freundlich“ reflektieren dies.

208

Die Bonhöhe hängt signifikant (p = 0,027) von der Stimmung bei Verlassen des Ladens ab (ε=0,463). Dieser Zusammenhang ist nicht linear: Zwar ist die Bonhöhe der extrem heiteren Käufer höher als die der extrem betrübten Käufer, dennoch finden sich auf der Mitte der Stimmungsskala die höchsten Bons.

209

Die drei Items „Ich komme wahrscheinlich wieder zum Einkauf bei Geschäft X.“, „Ich könnte es mir vorstellen, wieder Kleidung/Accessoires bei Geschäft X zu kaufen.“ und „Ich würde Geschäft X meinen Freunden empfehlen.“ (auf einer Skala von 1-5 mit 1 = „trifft voll und ganz zu“ und 5 = „trifft überhaupt nicht zu“) werden von den Treatmentgruppen im Durchschnitt mit größeren Werten bewertet.

210

Es konnte nicht bestätigt werden, dass die Musik auf die dekompositionelle Wahrnehmung der Atmosphäre wirkt. Allerdings konnte unter simultaner Wirkung der drei markenadäquaten Stimuli eine Veränderung der dekompositionellen Wahrnehmung der Atmosphäre belegt werden.

211

Für eine ausführliche Literaturübersicht, die zu dieser Zusammenfassung kommt, siehe Kap. B.4.

212

Vgl. Springer, C. (2008), S. 36f..

213

Dies wird in den Abbildungen 25 und 26 verdeutlicht.

214

Zwei Überlegungen lassen die Anzahl der Cluster theoretisch auf zwei festlegen: Zum einen sollte die Anzahl der Cluster aufgrund der geringen Fallzahl möglichst klein gehalten werden, um eine möglichst große Gruppenstärke innerhalb der Cluster zu erzielen. Zum anderen soll lediglich zwischen Clustern, die durch die Wirkung der markenadäquaten Stimuli näher an das Unternehmenskonzept der SOLL-Markenpersönlichkeit gerückt werden kann, und Clustern, bei denen eben dies nicht mehr möglich ist, eine Clusteranalyse durchgeführt werden. Bestehen bereist theoretische Überlegungen zur Anzahl der Cluster, liegt es nahe eine Clusterzentrenanalyse durchzuführen; vgl. Brosius, F. (2008), S. 721f..

215

Diese Abweichung wird durch Subtraktion eines Wertes, der auf den Angaben des Managements der betrachteten SOLL-Markenpersönlichkeit der Store Brand basiert, von der IST-Markenpersönlichkeit aus Konsumentensicht ermittelt. Das Ergebnis dieser Subtraktion kommt einer Standarisierung gleich: Entspricht es -15, heißt dies, dass vor Betreten des Ladens das Unternehmenskonzept der SOLL-Markenpersönlichkeit und die IST-Markenpersönlichkeit aus Konsumentensicht übereinstimmen. Ist der Wert größer als -15, wurde der MPFN aus Konsumentensicht weniger treffend eingestuft als in dem Unternehmenskonzept der SOLL-Markenpersönlichkeit. Ist der Wert kleiner als -15 wird der besagte MPFN aus Konsumentensicht treffender eingestuft als in dem Unternehmenskonzept der SOLL-Markenpersönlichkeit.

Titel: Empirische Untersuchung der Markenprofilierung und des Shopperverhaltens unter Wirkung einer multisensualen Atmosphäre Marken- und shopperverhaltenstheoretische Grundlagen
verfasst von: Jenny Müller
Verlag: Gabler Verlag
Buch: Multisensuale Gestaltung der Ladenatmosphäre zur Profilierung von Store Brands
Print ISBN: 978-3-8349-3645-5

Electronic ISBN: 978-3-8349-3646-2

Copyright-Jahr: 2012
DOI: https://doi.org/10.1007/978-3-8349-3646-2_3