JDKRUEGER&COAcademyAnmelden
Modul 1 von 8 · A/B-Testing Mastery

A/B-Testing für Nicht-Statistiker

125 Min · Sie erkennen, was einen echten A/B-Test auszeichnet, verstehen, warum paralleles Testen unter gleichen Bedingungen zuverlässiger ist als ein Vorher-Nachher-Vergleich, und formulieren eine eigene, falsifizierbare Testhypothese auf Entscheider-Ebene.
← A/B-Testing Mastery A/B-Testing für Nicht-Statistiker 1 / 24
Start

A/B-Testing für Nicht-Statistiker

Entscheidungen treffen, die der Wirklichkeit standhalten — nicht dem Bauchgefühl.

Von der Vermutung zur belegten Entscheidung
Lernziel

Lernziel

Sie erkennen, was einen echten A/B-Test auszeichnet.

Sie verstehen, warum paralleles Testen unter gleichen Bedingungen zuverlässiger ist als Vorher-Nachher.

Sie formulieren eine eigene, falsifizierbare Testhypothese.

1 Hypothese formulieren 2 Zufällig aufteilen 3 Parallel messen 4 Mit Daten entscheiden
Selbstcheck

Vorwissen aktivieren

Wie unterscheiden Sie heute im Shop zwischen einer erfolgreichen Änderung und einem Zufallstreffer?

Wann war das letzte Mal, dass eine neue Variante „offensichtlich besser“ schien — aber niemand die Zahlen geprüft hat?

Konzept

Das Geschäftsproblem: siebzig Prozent Abbruch

Das Baymard Institute ermittelte aus über einhunderttausend Checkout-Prozessen eine durchschnittliche Warenkorbabbruchrate von neunundsechzig Komma acht Prozent.

Jeder zweite Shop-Betreiber unterschätzt diesen Wert, weil er im Tagesgeschäft nicht sichtbar ist.

Die Folge: Tausende Besucher verlassen die Seite kurz vor dem Kauf.

70% — Abbruch 30% — Kauf
Durchschnittliche Warenkorbabbruchrate im E-Commerce
Konzept

Warum mehr Traffic kein Hebel ist

Bei einer Conversion Rate von drei Prozent und einem Abbruch von siebzig Prozent brauchen Sie dreißig Klicks für einen Kauf.

Mehr bezahlter Traffic bei gleicher Conversion-Rate frisst nur Marge und verschärft den Druck auf die Kosten.

Der echte Hebel liegt im bestehenden Traffic, nicht in neuem.

Zehntausend Besucher → dreitausend Warenkörbe → neunhundert Käufe
Konzept

Was ein echter A/B-Test tut

Der vorhandene Traffic wird nach dem Zufallsprinzip in zwei gleich große Gruppen aufgeteilt.

Gruppe A sieht die aktuelle Version, Gruppe B sieht die veränderte Version.

Beide Gruppen surfen zur gleichen Zeit unter denselben Bedingungen.

1 Zufällige Aufteilung 2 Variante A Kontrolle 3 Variante B Änderung 4 Gleichzeitige Messung
Konzept

Was ein A/B-Test nicht ist

Es ist kein Designwettbewerb, bei dem die schönere Variante gewinnt.

Es ist keine Plattform für Meinungen wie „bei mir klickt niemand auf Grün“.

Es ist auch keine Methode, um jede Woche eine neue Idee durchzuwirbeln.

VORHER NACHHER +
Daten vs. Meinung
Konzept

Anatomie eines Experiments: die Hypothese

Eine Hypothese sagt, welche Änderung Sie warum testen und welche Auswirkung Sie erwarten.

Schwach: „Wir testen einen neuen Button.“

Stark: „Wenn wir den CTA-Button im Warenkorb vergrößern, steigt die Conversion Rate um fünf Prozent, weil die Handlung deutlicher wird.“

1 Beobachtung 2 Annahme 3 Erwartete Veränderung 4 Messgröße
Konzept

Kontrolle, Variante und Randomisierung

Die Kontrolle ist die aktuelle Version — Ihr Status quo, gemessen unter den aktuellen Bedingungen.

Die Variante enthält genau eine gezielte Änderung.

Randomisierung sorgt dafür, dass Nutzer nicht selbst wählen, sondern zufällig zugeordnet werden.

VORHER NACHHER +
Kontrolle vs. Variante
Konzept

Metrik und Traffic-Split

Die Primärmetrik ist die eine Kennzahl, an der Sie Erfolg oder Misserfolg messen — meist Conversion Rate oder Umsatz pro Besucher.

Der Traffic-Split bestimmt, welcher Anteil der Besucher welche Variante sieht, typischerweise fünfzig zu fünfzig.

Eine ungleiche Aufteilung verlängert die Testlaufzeit oder schwächt die Aussagekraft.

50 Variante A 50 Variante B
Typischer fünfzig zu fünfzig Traffic-Split
Beispiel

Warum Vorher-Nachher lügt: ein konkretes Szenario

Montag: Regen, dreitausend Besucher, Conversion Rate zwei Komma eins Prozent.

Dienstag: Sonne, dreitausend Besucher, neuer Header live, Conversion Rate zwei Komma vier Prozent.

Schlussfolgerung: Der Header bringt fünfzehn Prozent mehr Umsatz.

Wahrscheinlichkeit: Das Wetter und der Wochentag haben das Ergebnis verzerrt.

2.12.4MontagDienstag
Vorher-Nachher mit externem Störfaktor
Konzept

Kampagnen, Feiertage und Werbeaktionen

Am Black Friday steigt die Conversion Rate fast überall — unabhängig davon, was Sie am Shop ändern.

Eine Retargeting-Kampagne kann die Kontrollgruppe anders ansprechen als die Variante.

Wer Vorher-Nachher misst, blendet diese Störfaktoren aus statt sie zu kontrollieren.

VORHER NACHHER +
Störfaktoren wirken ungleich auf Zeitvergleiche
Konzept

Paralleles Testen eliminiert Störfaktoren

Bei einem A/B-Test laufen beide Varianten zur gleichen Zeit.

Wetter, Wochentag, Kampagnen und saisonale Effekte wirken sich auf beide Gruppen gleich aus.

Der einzige systematische Unterschied bleibt die getestete Änderung.

1 Gleicher Zeitraum 2 Gleiche Besucher 3 Gleiche externe Faktoren 4 Eine einzige Differenz
Zwischen-Check

Zwischen-Check: Die drei Säulen

Echte Hypothese: Was ändert sich, warum und an welcher Metrik gemessen?

Zufällige Aufteilung: Die Gruppen müssen vergleichbar sein.

Parallele Messung: Nur so werden externe Störfaktoren neutralisiert.

1 Hypothese 2 Randomisierung 3 Parallelität
Konzept

Primärmetrik vs. Guardrail-Metriken

Die Primärmetrik entscheidet, ob die Variante gewinnt — zum Beispiel Umsatz pro Besucher.

Guardrail-Metriken schützen vor Nebenwirkungen: Rücklaufquote, Support-Anfragen, durchschnittlicher Bestellwert.

Eine Variante kann die Conversion steigern und gleichzeitig den Bestellwert senken.

VORHER NACHHER +
Primärmetrik und Guardrails im Blick
Beispiel

Geschäftsmetriken, die Sinn ergeben

Conversion Rate: Anteil der Besucher, die kaufen.

Umsatz pro Besucher: Kombiniert Conversion und Bestellwert.

Customer Lifetime Value: Zeigt langfristige Wirkung, besonders bei Abonnements.

Beispiel: Bei fünfzigtausend Besuchern pro Monat und einem durchschnittlichen Bestellwert von fünfzig Euro steigt der Umsatz pro Besucher um fünfzig Cent bereits um fünfundzwanzigtausend Euro pro Monat.

3.2 Conversion Rate 4.8 Umsatz pro Besucher 12.5 Lifetime Value
Beispielhafte Geschäftsmetriken
Konzept

Qualität einer Hypothese

Falsifizierbar: Das Gegenteil muss theoretisch möglich sein.

Eine Variable: Ändern Sie nur ein Element pro Variante.

Erwartete Wirkung: Nennen Sie Richtung und Größenordnung der erwarteten Veränderung.

1 Falsifizierbar 2 Eine Variable 3 Erwartete Wirkung 4 Messbare Metrik
Häufiges Missverständnis

Häufige Fehler, die Tests ungültig machen

Peeking: Sie schauen täglich auf das Ergebnis und beenden den Test, sobald etwas Signifikantes blinkt.

Zu früh stoppen: Varianten schwanken zufällig, bis genügend Daten vorliegen.

Zu viele Varianten: Bei zehn Varianten gewinnt fast immer zufällig eine.

VORHER NACHHER +
Peeking, Frühstoppen, Varianten-Inflation vermeiden
Übung

Ihre Übung: eine falsifizierbare Hypothese

Wählen Sie eine Seite oder ein Element in Ihrem Shop.

Formulieren Sie: Wenn wir X ändern, dann steigt oder sinkt Y um Z, gemessen an Metrik M.

Prüfen Sie: Ist nur eine Variable verändert? Ist das Gegenteil denkbar?

1 Element wählen 2 Wenn-dann-sätze formulieren 3 Falsifizierbarkeit prüfen
Zusammenfassung

Zusammenfassung: die wichtigsten Punkte

Siebzig Prozent aller Warenkörbe werden online nicht gekauft — mehr Traffic löst das Problem nicht.

Ein echter A/B-Test teilt Traffic zufällig auf und testet parallel unter gleichen Bedingungen.

Vorher-Nachher wird durch Wetter, Wochentag und Kampagnen verzerrt.

1 Problem erkennen 2 Hypothese formulieren 3 Parallel testen 4 Mit Daten entscheiden
Zusammenfassung

Was Sie mitnehmen

Definieren Sie vor dem Test eine klare Primärmetrik und passende Guardrails.

Formulieren Sie Hypothesen so, dass das Gegenteil möglich ist und nur eine Variable verändert wird.

Vermeiden Sie Peeking, Frühstoppen und zu viele Varianten.

VORHER NACHHER +
Von der Vermutung zur validen Entscheidung
Zwischenschritt

Das JDKRUEGER-Versprechen

Wir führen in DACH mehr A/B-Tests durch als klassische Agenturen verkaufen — und beweisen jede Empfehlung mit Daten.

Messbar. Skalierbar. Belegt.
Quiz

Quiz

Testen Sie Ihr Wissen.

Ein Shop hat eine Conversion Rate von drei Prozent und eine Warenkorbabbruchrate von etwa siebzig Prozent. Was ist die sinnvollste Schlussfolgerung für die Strategie?

Ein Shop startet eine neue Startseite am ersten März. Im April stellt das Team fest, dass die Conversion Rate gestiegen ist. Gleichzeitig lief aber eine große Frühjahrs-Kampagne. Warum ist der Schluss „die Startseite wirkt“ fragwürdig?

Welche Hypothese ist für einen A/B-Test am besten geeignet?

Eine Variante steigert die Conversion Rate um acht Prozent, senkt aber den durchschnittlichen Bestellwert um zwanzig Prozent. Was zeigt dies?

Ein Team prüft jeden Morgen die laufenden Testdaten und stoppt, sobald die Signifikanz erreicht ist. Welches Problem entsteht dadurch?

Transkript dieser Folie

Übung

Wenden Sie das Gelernte direkt an.
1
Ihre erste falsifizierbare Hypothese
mini-audit
Wählen Sie ein Element in Ihrem Shop, das Sie verändern möchten, zum Beispiel eine Headline, einen Button oder eine Produktseite. Formulieren Sie die Hypothese nach dem Schema: Wenn wir X ändern, dann steigt oder sinkt Y um Z Prozent, gemessen an Metrik M. Prüfen Sie, ob nur eine Variable verändert wird und ob das Gegenteil prinzipiell möglich ist.
2
Parallelität in Ihrem Unternehmen prüfen
benchmark
Suchen Sie die letzten drei größeren Shop-Änderungen in Ihrem Unternehmen heraus. Entscheiden Sie für jede, ob sie als reine Live-Schaltung, als Vorher-Nachher-Vergleich oder als paralleler A/B-Test umgesetzt wurde. Markieren Sie, bei welchen Entscheidungen heute noch Unsicherheit besteht, ob die Änderung wirklich gewirkt hat.

Quellen & Weiterführendes

Materialien zum Vertiefen.

Zusammenfassung & Reflexion

Kurz zurückschauen, bevor Sie weiterlernen.

Feedback

War dieses Modul hilfreich für Ihren Shop?
A/B-Testing für Nicht-Statistiker