← Zurück zum Blog

Dokumente schwärzen, DSGVO-konform: Warum Unternehmen auf KI-gestützte Redaktion setzen

Wer Dokumente manuell schwärzt, arbeitet langsam und macht Fehler. Eine übersehene Personalnummer, ein nicht erkannter Name im Anhang — und die Weitergabe des Dokuments wird zum Datenschutzproblem. Safe AI Redact automatisiert die Erkennung, behält aber den Menschen im Review-Prozess. Das Ergebnis: weniger Aufwand, nachweisbare DSGVO-Konformität, keine Abhängigkeit von Cloud-Diensten.

On-Premise — Ihre Daten bleiben bei Ihnen

Safe AI Redact läuft vollständig in Ihrer eigenen Infrastruktur. Kein Dokument verlässt Ihre Server. Das ist kein Marketing-Versprechen, sondern eine technische Eigenschaft: Die Software wird als Self-Hosted-Lösung betrieben, es gibt keine Cloud-Anbindung für die Dokumentenverarbeitung.

Für Behörden, Kanzleien und Unternehmen, die unter DSGVO-Auflagen arbeiten, ist das entscheidend. Sie müssen gegenüber Datenschutzbehörden nachweisen können, wo Ihre Daten verarbeitet werden. Mit einer Self-Hosted-Lösung ist diese Frage klar beantwortet. Externe SaaS-Dienste erfordern Auftragsverarbeitungsverträge, regelmäßige Überprüfungen und erzeugen Abhängigkeiten, die On-Premise-Betrieb vermeidet.

Dreischichtige KI-Erkennung

Die KI-Erkennung arbeitet auf drei Ebenen, die sich gegenseitig ergänzen. Die erste Ebene ist die automatische PII-Erkennung über Azure AI Language: Namen, Adressen, IBAN-Nummern, E-Mail-Adressen und ähnliche Standardentitäten werden ohne Konfiguration erkannt. Die zweite Ebene sind projektspezifische Prompts — benutzerdefinierte KI-Anweisungen, die für alle Dokumente eines Projekts gelten. Die dritte Ebene sind Prompts auf Dokumentenebene, die einzelne Schwärzungssätze feiner steuern.

In der Praxis bedeutet das: Eine Anwaltskanzlei kann auf Projektebene festlegen, dass Mandantennamen immer erkannt werden sollen, und für einen bestimmten Dokumenttyp zusätzlich die Streichung von Gerichtsorten anweisen. Die drei Ebenen lassen sich kombinieren oder einzeln aktivieren, je nach Anforderung.

Custom Detectors für branchenspezifische Muster

Standard-PII-Erkennung kennt Namen und Adressen, aber kein Aktenzeichen im Format „Az. 3 Ca 123/24", keine internen Kundennummern und keine branchenüblichen Vertragskennungen. Custom Detectors schließen diese Lücke. Sie definieren einen Entitätstyp, geben einige Beispiele an — das System lernt das zugrundeliegende Muster und wendet es auf alle folgenden Dokumente an.

Typische Einsatzfälle: Anwaltskanzleien schwärzen Aktenzeichen und Mandantennummern, Versicherungen entfernen Schaden- und Vertragsnummern, Behörden bereinigen Vorgangsnummern. Jeder Detektor ist einem Projekt zugewiesen und kann separat aktiviert oder deaktiviert werden.

OCR-Unterstützung für Scan-Dokumente

Eingescannte PDFs und Bild-PDFs enthalten keinen durchsuchbaren Text. Safe AI Redact extrahiert den Inhalt per OCR (Mistral) als strukturiertes Markdown, bevor die KI-Erkennung läuft. Das bedeutet: Die Schwärzung funktioniert nicht nur bei digital erstellten PDFs, sondern auch bei Scans aus Aktenschränken, eingescannten Verträgen oder fotografierten Dokumenten.

Nach der OCR-Extraktion mappt ein Python-Service (PyMuPDF) die erkannten Textstellen auf genaue Pixelkoordinaten im PDF. Fuzzy Matching gleicht Unterschiede zwischen der OCR-Engine und dem Original aus, sodass die geschwärzten Bereiche präzise platziert werden.

Vier-Augen-Prinzip und Review-Workflow

KI-Vorschläge werden nicht automatisch übernommen. Im integrierten Editor sehen Sie das Original-PDF neben der Vorschau mit Schwärzungen. Jeder Vorschlag kann einzeln bestätigt, abgelehnt oder manuell ergänzt werden. Erst nach der Bestätigung wird die permanente Schwärzung angewendet.

Der Workflow legt fest, wie ein Dokument durch die Organisation läuft: neu → in Bearbeitung → zur Prüfung → geprüft. Dokumente können einem zweiten Bearbeiter zur Kontrolle übergeben werden. Statusänderungen und Zuweisungen lösen Benachrichtigungen aus, sodass kein Dokument in der Pipeline liegen bleibt.

Audit Trail und Nachverfolgbarkeit

Jede Aktion wird protokolliert: welche Schwärzung wann bestätigt wurde, von wem, auf welcher Grundlage (KI-Vorschlag oder manuell). Bei Datenschutzprüfungen oder internen Audits können Sie nachweisen, wie ein Dokument bearbeitet wurde. Das ist besonders relevant für regulierte Branchen, in denen die Nachvollziehbarkeit von Redaktionsentscheidungen gefordert wird.

Einmallizenz ohne laufende Kosten

Safe AI Redact wird einmalig lizenziert. Es gibt keine Gebühren pro Benutzer und keine Gebühren pro Dokument. Wer monatlich tausende PDFs schwärzt, zahlt nicht mehr als wer hundert schwärzt. Das macht die Kosten planbar und verhindert, dass Nutzungsanreize durch steigende Gebühren unterlaufen werden.

Für wen ist Safe AI Redact geeignet?

Die Software richtet sich an Organisationen, die regelmäßig schutzwürdige Informationen aus Dokumenten entfernen müssen, bevor sie diese weitergeben, archivieren oder veröffentlichen:

  • Behörden und Ämter, die Akten nach IFG-Anfragen oder für Gerichtsverfahren schwärzen müssen
  • Anwaltskanzleien, die Mandantenunterlagen vor der Weitergabe an Gutachter oder Gerichte bereinigen
  • Versicherungen und Finanzdienstleister, die Personenbezug aus Schadensunterlagen entfernen
  • Krankenhäuser und Gesundheitseinrichtungen, die Patientenakten für Forschung oder Qualitätssicherung anonymisieren
  • Unternehmen, die Verträge oder interne Berichte vor der Archivierung oder Weitergabe an externe Prüfer bereinigen

Gemeinsam ist allen: Sie brauchen eine nachweisbare, wiederholbare Methode — keine manuelle Einzellösung, die von Person zu Person unterschiedlich angewendet wird.