A/B-Testing für Nicht-Statistiker
Entscheidungen treffen, die der Wirklichkeit standhalten — nicht dem Bauchgefühl.
AcademyAnmeldenEntscheidungen treffen, die der Wirklichkeit standhalten — nicht dem Bauchgefühl.
Sie erkennen, was einen echten A/B-Test auszeichnet.
Sie verstehen, warum paralleles Testen unter gleichen Bedingungen zuverlässiger ist als Vorher-Nachher.
Sie formulieren eine eigene, falsifizierbare Testhypothese.
Wie unterscheiden Sie heute im Shop zwischen einer erfolgreichen Änderung und einem Zufallstreffer?
Wann war das letzte Mal, dass eine neue Variante „offensichtlich besser“ schien — aber niemand die Zahlen geprüft hat?
Das Baymard Institute ermittelte aus über einhunderttausend Checkout-Prozessen eine durchschnittliche Warenkorbabbruchrate von neunundsechzig Komma acht Prozent.
Jeder zweite Shop-Betreiber unterschätzt diesen Wert, weil er im Tagesgeschäft nicht sichtbar ist.
Die Folge: Tausende Besucher verlassen die Seite kurz vor dem Kauf.
Bei einer Conversion Rate von drei Prozent und einem Abbruch von siebzig Prozent brauchen Sie dreißig Klicks für einen Kauf.
Mehr bezahlter Traffic bei gleicher Conversion-Rate frisst nur Marge und verschärft den Druck auf die Kosten.
Der echte Hebel liegt im bestehenden Traffic, nicht in neuem.
Der vorhandene Traffic wird nach dem Zufallsprinzip in zwei gleich große Gruppen aufgeteilt.
Gruppe A sieht die aktuelle Version, Gruppe B sieht die veränderte Version.
Beide Gruppen surfen zur gleichen Zeit unter denselben Bedingungen.
Es ist kein Designwettbewerb, bei dem die schönere Variante gewinnt.
Es ist keine Plattform für Meinungen wie „bei mir klickt niemand auf Grün“.
Es ist auch keine Methode, um jede Woche eine neue Idee durchzuwirbeln.
Eine Hypothese sagt, welche Änderung Sie warum testen und welche Auswirkung Sie erwarten.
Schwach: „Wir testen einen neuen Button.“
Stark: „Wenn wir den CTA-Button im Warenkorb vergrößern, steigt die Conversion Rate um fünf Prozent, weil die Handlung deutlicher wird.“
Die Kontrolle ist die aktuelle Version — Ihr Status quo, gemessen unter den aktuellen Bedingungen.
Die Variante enthält genau eine gezielte Änderung.
Randomisierung sorgt dafür, dass Nutzer nicht selbst wählen, sondern zufällig zugeordnet werden.
Die Primärmetrik ist die eine Kennzahl, an der Sie Erfolg oder Misserfolg messen — meist Conversion Rate oder Umsatz pro Besucher.
Der Traffic-Split bestimmt, welcher Anteil der Besucher welche Variante sieht, typischerweise fünfzig zu fünfzig.
Eine ungleiche Aufteilung verlängert die Testlaufzeit oder schwächt die Aussagekraft.
Montag: Regen, dreitausend Besucher, Conversion Rate zwei Komma eins Prozent.
Dienstag: Sonne, dreitausend Besucher, neuer Header live, Conversion Rate zwei Komma vier Prozent.
Schlussfolgerung: Der Header bringt fünfzehn Prozent mehr Umsatz.
Wahrscheinlichkeit: Das Wetter und der Wochentag haben das Ergebnis verzerrt.
Am Black Friday steigt die Conversion Rate fast überall — unabhängig davon, was Sie am Shop ändern.
Eine Retargeting-Kampagne kann die Kontrollgruppe anders ansprechen als die Variante.
Wer Vorher-Nachher misst, blendet diese Störfaktoren aus statt sie zu kontrollieren.
Bei einem A/B-Test laufen beide Varianten zur gleichen Zeit.
Wetter, Wochentag, Kampagnen und saisonale Effekte wirken sich auf beide Gruppen gleich aus.
Der einzige systematische Unterschied bleibt die getestete Änderung.
Echte Hypothese: Was ändert sich, warum und an welcher Metrik gemessen?
Zufällige Aufteilung: Die Gruppen müssen vergleichbar sein.
Parallele Messung: Nur so werden externe Störfaktoren neutralisiert.
Die Primärmetrik entscheidet, ob die Variante gewinnt — zum Beispiel Umsatz pro Besucher.
Guardrail-Metriken schützen vor Nebenwirkungen: Rücklaufquote, Support-Anfragen, durchschnittlicher Bestellwert.
Eine Variante kann die Conversion steigern und gleichzeitig den Bestellwert senken.
Conversion Rate: Anteil der Besucher, die kaufen.
Umsatz pro Besucher: Kombiniert Conversion und Bestellwert.
Customer Lifetime Value: Zeigt langfristige Wirkung, besonders bei Abonnements.
Beispiel: Bei fünfzigtausend Besuchern pro Monat und einem durchschnittlichen Bestellwert von fünfzig Euro steigt der Umsatz pro Besucher um fünfzig Cent bereits um fünfundzwanzigtausend Euro pro Monat.
Falsifizierbar: Das Gegenteil muss theoretisch möglich sein.
Eine Variable: Ändern Sie nur ein Element pro Variante.
Erwartete Wirkung: Nennen Sie Richtung und Größenordnung der erwarteten Veränderung.
Peeking: Sie schauen täglich auf das Ergebnis und beenden den Test, sobald etwas Signifikantes blinkt.
Zu früh stoppen: Varianten schwanken zufällig, bis genügend Daten vorliegen.
Zu viele Varianten: Bei zehn Varianten gewinnt fast immer zufällig eine.
Wählen Sie eine Seite oder ein Element in Ihrem Shop.
Formulieren Sie: Wenn wir X ändern, dann steigt oder sinkt Y um Z, gemessen an Metrik M.
Prüfen Sie: Ist nur eine Variable verändert? Ist das Gegenteil denkbar?
Siebzig Prozent aller Warenkörbe werden online nicht gekauft — mehr Traffic löst das Problem nicht.
Ein echter A/B-Test teilt Traffic zufällig auf und testet parallel unter gleichen Bedingungen.
Vorher-Nachher wird durch Wetter, Wochentag und Kampagnen verzerrt.
Definieren Sie vor dem Test eine klare Primärmetrik und passende Guardrails.
Formulieren Sie Hypothesen so, dass das Gegenteil möglich ist und nur eine Variable verändert wird.
Vermeiden Sie Peeking, Frühstoppen und zu viele Varianten.
Wir führen in DACH mehr A/B-Tests durch als klassische Agenturen verkaufen — und beweisen jede Empfehlung mit Daten.
Testen Sie Ihr Wissen.
Nächstes Modul: Signifikanz verstehen — wann ist ein Test wirklich sicher?