Stripe Radar ist hervorragend in dem, was es tut: Es bewertet eine Transaktion in dem Moment, in dem Geld fließt. Doch genau dort, wo kein Geld fließt, lag unser Problem.

Wir bieten eine 7-day Testphase an. Um sie zu starten, hinterlegt ein Nutzer eine Karte, wird aber nie belastet. Im Hintergrund steckt dahinter ein Stripe SetupIntent, keine Zahlung. Keine Belastung bedeutet kein Ereignis zum Zeitpunkt der Belastung, und das wiederum heißt: Radars stärkste Regeln haben nichts zu bewerten, gerade in dem Moment, der am meisten zählt, wenn ein betrügerisches Konto angelegt wird und beginnt, Trial-Guthaben zu verbrennen.

Das ist die Geschichte, wie wir vom Krisenmanagement in einzelnen Chats zu einer automatisierten, minutengenauen Betrugsabwehr gekommen sind, aufgebaut auf unserem eigenen Produkt: Zero.

Radar ist großartig. Aber "großartig" ist nicht "perfekt".

Stripe Radar ist wirklich gut in dem, was es tut. Trainiert auf mehr als $1 trillion an jährlichem Zahlungsvolumen, erkennen seine Modelle eine bereits gesehene Karte in 92% der Fälle wieder, und laut Stripe senkt Radar Betrug im Schnitt um 32% bei den Unternehmen, die es einsetzen.

Lesen Sie diese Zahl ruhig noch einmal: senkt, nicht beseitigt. Eine durchschnittliche Reduzierung um 32% ist beachtlich, aber sie bedeutet eben auch, dass ein großer Teil des Betrugsdrucks weiterhin vor Ihrer Tür landet. Und Stripe ist erfrischend ehrlich, warum das so ist. In ihren eigenen Worten: "reducing the number of false positives often increases the likelihood of more true fraud slipping through the cracks." Durchsickern ist kein Fehler im Modell, sondern der bewusst in Kauf genommene Preis dafür, Ihre echten Kunden nicht auszusperren. Jedes Betrugsteam entscheidet ganz bewusst, wie viel es durchlässt.

Bei einem Trial-getriebenen Produkt ist dieses Leck breiter, als die Schlagzeilenzahl vermuten lässt, denn der mächtigste Teil von Radar läuft hier nie.

Warum ein Gate immer nur reduzieren kann

Es gibt einen tieferen Grund, warum eine Engine zum Zeitpunkt der Belastung Betrug zwar reduzieren, aber nie beenden kann, und der liegt nicht an Stripes Modellen, sondern an Timing und Information. In dem Augenblick, in dem eine Karte hinterlegt wird, hat der Kunde noch nichts getan. Keine Login-Historie, kein Produktverhalten, kein Nutzungsmuster, aus dem man lernen könnte, nur eine Karte und eine Handvoll Netzwerksignale. Radar trifft seine bestmögliche Entscheidung auf der dünnstmöglichen Beweislage, ausgerechnet in dem Moment, in dem es am wenigsten Anhaltspunkte hat.

Das ist die eigentliche Obergrenze. Man kann ein Gate feinjustieren, aber man kann ihm keine Daten geben, die noch gar nicht existieren. Die Informationen, die einen Missbraucher tatsächlich von einem Kunden unterscheiden, entstehen größtenteils erst nachdem das Gate bereits entscheiden musste.

Phase 1: Krisenmanagement im Chatfenster

Unsere erste Reaktion war komplett manuell. Wenn eine Missbrauchswelle anrollte, öffnete jemand ein Gespräch mit unserem Agenten und arbeitete den Vorfall live ab: die jüngsten Anmeldungen abrufen, sich die Karten ansehen, das Muster finden, die Konten von Hand sperren.

Das funktionierte, aber es skalierte nicht. Jeder Vorfall begann bei null. Das Wissen, wie sieht dieser Betrugsring aus, welche Signale sind verlässlich, steckte in einem einzigen Kopf und einem einzigen Chat-Thread und verflüchtigte sich in dem Moment, in dem das Fenster geschlossen wurde.

Auf der guten Seite des Funnels haben wir außerdem eine teure Lektion gelernt: Wenn wir echte Nutzer zurückgewinnen wollten, die den Checkout abgebrochen hatten, richtet eine unbedachte Outreach-E-Mail an eine betrügerische Adresse echten Schaden an, weil sie bestätigt, dass die Adresse aktiv ist. Jede Automatisierung, die wir bauen würden, müsste den Unterschied zwischen einem echten Interessenten und einem untergeschobenen erkennen.

Phase 2: Die Eingangstür mit Radar absichern

Unser nächster Schritt war, alles, was möglich war, stromaufwärts in Radar zu verlagern: Blocklisten und Velocity-Regeln beim Hinterlegen der Karte, abgestimmt auf den Druck, den wir gerade sahen. Das ist der richtige erste Schritt, und er stoppte die plumpesten Angriffe.

Doch zwei Obergrenzen zeigten sich schnell. Die erste benennt Stripe selbst: Eine Engine zum Zeitpunkt der Belastung ist ein Abwägungsregler, keine Mauer. Dreht man auf, sperrt man echte Kunden aus, dreht man ab, schlüpft mehr Betrug durch. Die zweite ist struktureller Natur und für Testphasen typisch: Diese 32% werden zum Zeitpunkt der Belastung erzielt, und eine SetupIntent-Testphase hat keine Belastung, die sich bewerten ließe. Solange man Radar nicht ausdrücklich für gespeicherte Zahlungsmethoden aktiviert, läuft die Engine überhaupt nicht, und selbst wenn sie läuft, greifen bei einem SetupIntent nur Block-, Allow- und 3DS-Regeln. Die "Review"-Aktion, die einem Menschen einen zweiten Blick verschafft, wird nie ausgelöst.

Die mit Abstand leistungsstärkste Schicht im Stack sitzt also standardmäßig genau in dem Moment auf der Ersatzbank, in dem wir sie am dringendsten brauchten. Radar ist ein Tor an der Eingangstür. Wir brauchten eine Streife dahinter.

Phase 3: Eine zweite Schicht, gebaut auf Zero

Nach der Anmeldung dreht sich das Informationsbild. Das Konto beginnt, eine Spur zu hinterlassen, und der reichhaltigste Teil dieser Spur liegt in einem System, das der Zahlungsdienstleister nie zu Gesicht bekommt: unser Identity Provider, Clerk.

Also gaben wir Zero Zugriff darauf. Clerk weiß Dinge, die Stripe nicht weiß: wie das Konto erstellt wurde, die Anmeldemethode und E-Mail-Adresse, die Session und das Gerät dahinter und das genaue Timing relativ zu jeder anderen Anmeldung an diesem Tag. Stripe kennt die Karte. Keines der beiden Systeme erzählt für sich allein die ganze Geschichte, aber der Agent kann beide lesen und systemübergreifend in Beziehung setzen. Der Missbrauch, der am Tor unsichtbar ist, wird im direkten Vergleich offensichtlich: ein brandneues Konto, dessen Login-Identität nicht zu seiner Abrechnungsidentität passt, erstellt nur Augenblicke nach einer ganzen Traube täuschend ähnlicher Konten. Genau diese systemübergreifende Verknüpfung kann ein Gate zum Zeitpunkt der Belastung nicht leisten, und genau das kann ein Agent, der auf beiden Systemen sitzt.

Auf dieser reichhaltigeren Beweisbasis lassen wir alle paar Minuten geplante Zero-Tasks gegen Live-Daten zu Anmeldungen und Abrechnung laufen. Drei Prinzipien prägen sie:

1. Patrouillieren, nicht nur abriegeln. Statt einen einzelnen Moment zu bewerten, durchkämmt der Agent in einer kurzen Schleife jede aktuelle Anmeldung, setzt Kontodaten und Zahlungs-Metadaten in Beziehung und bringt so Konten ans Licht, die an der Eingangstür durchgerutscht sind.

2. Die Reaktion nach Konfidenz abstufen. Nicht jedes Signal verdient dieselbe Aktion. Hochsichere Muster werden automatisch behandelt: Das Konto wird sofort gesperrt und seine Testphase abgebrochen, weil die Aktion umkehrbar ist und Warten echte Kosten verursacht. Signale mit geringerer Konfidenz werden nie automatisch bearbeitet, sondern in einem Report gesammelt, den ein Mensch prüft. Entschlossen, wo es sicher ist, zurückhaltend, wo es das nicht ist.

3. Eine nachvollziehbare Spur für Menschen hinterlassen. Jede automatische Aktion protokolliert das exakte Signal, das sie ausgelöst hat, sodass sie sich in Sekunden prüfen und rückgängig machen lässt. Automatisierung, die man nicht auditieren kann, ist Automatisierung, der man nicht trauen kann.

Dieselbe Sorgfalt haben wir auf die freundliche Seite des Funnels angewendet. Ein separater Task findet echte Nutzer, die den Checkout abgebrochen haben, und entwirft eine Win-back-E-Mail, die ein Mensch freigibt, hinter einem bewusst strengen Betrugsfilter, damit wir nie eine schlechte Adresse bestätigen. Dieselbe Engine, das entgegengesetzte Ziel.

Was es mit der Ökonomie machte

Sobald die Streife live war, bewegten sich die Zahlen sofort. Schauen Sie sich die Anmeldung im 90. Perzentil an, die schweren Konten, die den eigentlichen Schaden anrichteten. Die Trial-Rechenleistung, die eines davon in seinen ersten Stunden verbrannte, fiel von etwa $4 auf etwa $0.25, ein Rückgang um 94%. Gemittelt über jede neue Anmeldung im selben Zeitraum sank der Verlust pro Konto um rund 85%.

Die Form der Veränderung ist der eigentliche Hinweis. Die meisten Anmeldungen kosteten uns nie etwas; der Verlust konzentrierte sich immer auf einen langen, schweren Schwanz von Konten, die nur existierten, um Trial-Guthaben abzusaugen. Die Streife hat den Funnel nicht verkleinert, sie hat diesen Schwanz abgeschnitten. Nicht weniger Anmeldungen. Sondern sauberere.

Warum ein Agent und kein Skript

Wir hätten einen Cronjob schreiben können. Wir haben es aus einem Grund nicht getan: Die Bedrohung verändert sich schneller als ein Release-Zyklus. Wenn ein Angreifer seine Taktik wechselt, aktualisieren wir die Anweisungen eines Tasks in einfacher Sprache, und die neue Logik ist beim nächsten Lauf live: kein Deploy, keine Schema-Migration, kein Ticket. Die "Regeln" sind ein Prompt, und der Prompt lässt sich so schnell ändern, wie der Angreifer es ist.

Das ist die eigentliche Lektion. Radar ist das richtige Werkzeug für Risiken zum Zeitpunkt der Belastung, und wir verlassen uns stark darauf. Aber ein Trial-getriebenes Geschäft hat einen strukturellen blinden Fleck, den kein Tool zum Zeitpunkt der Belastung abdecken kann, und die Lösung ist keine größere Regel-Engine. Es ist eine schnelle, auditierbare, immer aktive zweite Schicht, die Sie im Tempo der Bedrohung neu programmieren können.

Erkenntnisse für Trial-getriebene Teams

Kartieren Sie Ihre belastungsfreien Momente. Überall, wo ein Nutzer Wert erhält, bevor eine Zahlung bewertet wird, klafft eine Lücke, die ein Tool zum Zeitpunkt der Belastung nicht sehen kann.
Ergänzen, nicht ersetzen. Behalten Sie Radar an der Eingangstür. Setzen Sie eine kontinuierliche Streife dahinter, die nach der Anmeldung greift.
Verknüpfen Sie über Systeme hinweg. Ihr Zahlungsdienstleister und Ihr Identity Provider halten jeweils die Hälfte des Bildes. Der Betrug wird in der Überschneidung sichtbar.
Stufen Sie Ihre Aktionen nach Konfidenz ab und protokollieren Sie jede einzelne. Handeln Sie nur dort automatisch, wo die Aktion umkehrbar und das Signal stark ist, den Rest leiten Sie an einen Menschen weiter.
Optimieren Sie auf Anpassungsgeschwindigkeit. Beim Betrug gewinnt das Team, das seine Regeln am schnellsten ändern kann.

Neugierig, was ein immer aktiver Agent in Ihrem eigenen Stack automatisieren könnte? Zero entdecken.

Hinweise: Die Radar-Zahlen sind Stripes eigene veröffentlichte Werte (stripe.com/radar; "A primer on machine learning for fraud detection"). Die Verlustzahlen spiegeln die Rechenkosten pro neuer Anmeldung in den ersten Stunden nach der Registrierung wider, gemessen über vergleichbare Zeiträume vor und nach dem Start, ohne interne Konten; die Stichprobe nach dem Start ist noch jung und wird sich mit der Zeit festigen.

Wenn Stripe Radar nicht reicht: Die Free-Trial-Betrugslücke mit einem KI-Agenten schließen

Radar ist großartig. Aber "großartig" ist nicht "perfekt".

Warum ein Gate immer nur reduzieren kann

Phase 1: Krisenmanagement im Chatfenster

Phase 2: Die Eingangstür mit Radar absichern

Phase 3: Eine zweite Schicht, gebaut auf Zero

Was es mit der Ökonomie machte

Warum ein Agent und kein Skript

Erkenntnisse für Trial-getriebene Teams

Verwandte Artikel

Drei Monate, um die Lücke zu benennen. Ein Nachmittag, um sie zu schließen.

Claude Opus 4.8 und Workflows sind jetzt in Zero

Was ist neu in Zero — Woche vom 18. Mai

Bleiben Sie auf dem Laufenden