Claude Sabotage-Klausel: Was Anthropic für Finanz-KI bedeutet

Was diese Woche passiert ist

Ein viel diskutierter Blog-Post auf Hacker News (über 600 Punkte, 300 Kommentare) zerlegt eine Klausel in Anthropics Nutzungsbedingungen für Claude. Der Vorwurf des Autors Jon Ready: Anthropic behält sich vor, Claude bei Anfragen aus konkurrierenden Produkten weniger hilfreich antworten zu lassen. Ohne Hinweis an den Endnutzer.

Die betreffende Passage erlaubt es Anthropic laut Analyse, Antwortqualität in Konkurrenzkontexten zu reduzieren. Kein Banner, kein Log-Eintrag, kein Fehlercode. Der Nutzer sieht eine plausibel klingende Antwort. Ob diese Antwort die beste war, die Claude geben könnte, weiß er nicht.

Ich nenne das im Folgenden bewusst „Sabotage-Klausel”, auch wenn Anthropic den Begriff zurückweisen würde. Funktional läuft es darauf hinaus.

Für Consumer-Apps ist das ärgerlich. Für Finanz-KI ist das ein Problem auf einer ganz anderen Ebene.

Warum das für Banken, Asset-Manager und FinTechs zählt

Die meisten KI-Projekte im Finanzsektor, die ich aktuell in DACH sehe, laufen über genau drei Anbieter: OpenAI, Anthropic, Google. In Wealth-Management-Pilotprojekten ist Claude besonders beliebt, weil die Modelle bei langen Dokumenten (Prospekte, Geschäftsberichte, KYC-Dossiers) gut performen.

Jetzt der unbequeme Teil. Wenn ein Vermögensverwalter Claude über die API in seine Beratungs-Software einbaut, und Anthropic stuft diese Software als Konkurrenz zu einem eigenen Anthropic-Produkt ein (heute oder in zwei Jahren), dann darf laut Klausel die Antwortqualität sinken. Stillschweigend.

Drei konkrete Szenarien, in denen das brandgefährlich wird:

Portfolio-Reporting an Privatkunden. Die KI fasst Monatsperformance, Risikokennzahlen und Allokation zusammen. Wenn das Modell selektiv schlechter zusammenfasst, fällt es im Backtest nicht auf. Es fällt erst auf, wenn ein Kunde klagt, weil eine Klumpenrisiko-Warnung fehlte, die das Modell drei Monate zuvor noch sauber generiert hat.

KYC- und AML-Prüfung. Das Modell scannt Onboarding-Dokumente auf Red Flags. Eine reduzierte Antwortqualität heißt hier: übersehene Auffälligkeiten, die in einer BaFin- oder FMA-Prüfung später erklärt werden müssen. „Wir wussten nicht, dass das Modell uns benachteiligt” ist keine Verteidigung.

Loan-Underwriting. Die KI fasst Bonitätsunterlagen für den Kreditausschuss zusammen. Subtil weniger Sorgfalt bei der Extraktion negativer Indikatoren ändert die Kreditentscheidung. Im Schadensfall haftet das Institut, nicht Anthropic.

In allen drei Fällen gilt: das Problem ist nicht, dass ein Modell Fehler macht. Modelle machen Fehler, das wissen wir. Das Problem ist die fehlende Beobachtbarkeit. Sie können kein Qualitäts-Monitoring bauen, wenn die Qualitätsdegradation vom Anbieter selbst eingebaut wurde und keinen Fehlercode wirft.

Der Compliance-Hebel: DORA und EU-AI-Act

Für regulierte Finanzdienstleister wird die Klausel zum Vertragsrisiko. DORA verpflichtet Sie seit Januar 2025, kritische ICT-Dienstleister zu überwachen und vertraglich abzusichern. Ein API-Anbieter, der sich das Recht vorbehält, die Leistung unangekündigt zu reduzieren, ist nach DORA-Lesart problematisch. Die Frage Ihres Auditors wird sein: „Wie stellen Sie sicher, dass die Modellqualität konstant ist?” Ihre ehrliche Antwort wäre: gar nicht.

Der EU-AI-Act stuft viele Finanz-Use-Cases als Hochrisiko ein. Bonitätsprüfung steht explizit in Annex III. Hochrisiko-Systeme brauchen technische Dokumentation, Logging und nachvollziehbare Entscheidungen. Eine versteckte Qualitätsstellschraube beim Foundation-Model-Anbieter zerstört diese Nachvollziehbarkeit.

Der EU-AI-Act schiebt einen Teil der Verantwortung explizit auf den Foundation-Model-Anbieter (GPAI-Regime). Aber: der Operator, also Ihre Bank oder Ihr Asset-Manager, bleibt für das Gesamtsystem haftbar.

Mein Rat: drei konkrete Schritte für die nächsten 30 Tage

Schritt 1: Vertragsklauseln aller LLM-Anbieter durchsehen lassen. Nicht nur Anthropic. OpenAI und Google haben ähnliche Reservierungs-Klauseln in ihren Terms. Lassen Sie Ihre Rechtsabteilung gezielt nach Formulierungen suchen, die Anbieter-seitige Qualitätsanpassungen ohne Notice erlauben. Bestehende Verträge mit Enterprise-Anbietern (Azure OpenAI, AWS Bedrock, Google Vertex) sind oft besser, weil die Hyperscaler eigene SLAs darüberlegen. Direkt-API-Zugriffe sind das größere Risiko.

Schritt 2: Eval-Pipeline mit goldenem Testset etablieren. Sie brauchen einen automatisierten Test, der täglich oder wöchentlich gegen die produktive API läuft. 50 bis 200 repräsentative Anfragen aus Ihrem realen Use-Case, mit bekannten Soll-Antworten. Qualität wird über Embedding-Similarity, Schlüsselbegriff-Coverage und (für Zahlen) exakte numerische Übereinstimmung gemessen. Wenn die Scores driften, sehen Sie es vor dem Kunden. Das ist heute schon Best Practice, wird aber selten konsequent gemacht. Die Anthropic-Diskussion macht es unverhandelbar.

Schritt 3: Multi-Provider-Architektur einplanen. Wer heute nur auf Claude oder nur auf GPT setzt, hat ein Klumpenrisiko. Bauen Sie Abstraktionslayer (LiteLLM, LangChain oder eigene Wrapper), die einen Provider-Wechsel innerhalb von Tagen ermöglichen. Für kritische Pfade (Compliance, Kreditentscheidung, Reporting) sollten Sie zwei Modelle parallel laufen lassen und Abweichungen flaggen. Das verdoppelt die Token-Kosten, aber Sie kaufen sich damit Beobachtbarkeit.

Was ich nicht empfehle

Ich empfehle nicht, Claude jetzt panisch aus allen Projekten zu reißen. Anthropic ist technisch weiterhin einer der stärksten Anbieter, gerade bei langen Finanzdokumenten. Die Klausel existiert auch bei den Wettbewerbern in ähnlicher Form.

Ich empfehle ebenfalls nicht, alles auf On-Premise-Modelle umzustellen. Llama-3.1-70B oder Mistral Large sind für viele Standardaufgaben gut genug, aber die operative Komplexität ist hoch und das Personal in DACH knapp.

Was ich empfehle: die Annahme zu begraben, dass ein API-Aufruf an einen Foundation-Model-Anbieter eine konstante Funktion ist. Es ist eine vertragliche Beziehung mit einem Anbieter, der seine Leistung legal anpassen darf. Behandeln Sie das System entsprechend.

Fazit

Die Anthropic-Klausel ist nicht der Skandal, als der sie auf Hacker News diskutiert wird. Sie ist branchenüblich. Genau das ist das Problem. Die ganze Finanz-KI-Industrie hat sich auf eine Handvoll Anbieter konzentriert, die sich das Recht herausnehmen, die Modellqualität ohne Hinweis zu verändern.

Für einen Privatnutzer, der Claude zum Brainstormen verwendet, ist das ein Schulterzucken. Für eine regulierte Bank ist das ein dokumentierbares Risiko, das in der nächsten DORA-Prüfung auf den Tisch kommt. Wer jetzt nicht beginnt, Eval-Pipelines und Multi-Provider-Strategien aufzubauen, wird in 18 Monaten erklären müssen, warum sein Hochrisiko-KI-System auf einer Black Box mit einseitiger Änderungsklausel basiert.

Das ist eine Geschichte, die niemand der Aufsicht erzählen möchte.

Claude darf sabotieren: Was Anthropics Klausel für Finanz-KI bedeutet