March 26, 2026

Juristische und technische Dokumente Englisch-Deutsch übersetzen: Wo KI-Engines bei Fachbegriffen versagen

Ab dem 9. Dezember 2026 gilt in Deutschland die neue EU-Produkthaftungsrichtlinie (EU) 2024/2853. Sie erweitert den Produktbegriff auf Software und digitale Inhalte. Das bedeutet: Fehlerhafte Übersetzungen in Bedienungsanleitungen, Sicherheitshinweisen oder Compliance-Dokumenten können als Instruktionsfehler gewertet werden. Unternehmen haften verschuldensunabhängig.

Für jedes Unternehmen, das juristische oder technische Dokumente von Englisch nach Deutsch übersetzen lässt, stellt sich damit eine neue Frage: Wie zuverlässig ist die KI-Übersetzung bei den Fachbegriffen, die den rechtlichen Unterschied machen?

Wir haben das auf MachineTranslation.com getestet. Die Antwort: Bei 4 von 9 Schlüsselbegriffen in einer DSGVO-Klausel waren sich 22 KI-Engines nicht einig.

Inhaltsverzeichnis

Was passiert, wenn KI-Engines bei juristischen Begriffen abweichen?
Der DSGVO-Test: 22 Engines, eine Compliance-Klausel
Technische Dokumente: Warum Komposita ein Zuverlässigkeitstest sind
Ein Entscheidungsrahmen für juristische und technische Übersetzungen
Die neue Produkthaftungsrichtlinie und ihre Folgen für Übersetzungen
Wie der SMART-Konsensansatz funktioniert
Häufig gestellte Fragen

Was passiert, wenn KI-Engines bei juristischen Begriffen abweichen?

Im allgemeinen Sprachgebrauch sind Synonyme akzeptabel. Im deutschen Rechtstext nicht. Juristische Terminologie folgt etablierten Konventionen aus Gesetzgebung, Rechtsprechung und regulatorischen Rahmenwerken. Ein Synonym kann die Rechtswirkung einer Klausel verändern.

Das englische "appropriate safeguards" aus Artikel 46 der DSGVO hat eine feststehende deutsche Übersetzung: *angemessene Garantien*. Das Wort *angemessen* impliziert Verhältnismäßigkeit, ein zentrales Konzept im deutschen Verwaltungsrecht.

In unserem Test auf dem KI-Übersetzer für Englisch-Deutsch von MachineTranslation.com wählten 57 % der Engines korrekt *angemessene Garantien*. Die restlichen 43 % entschieden sich für *geeignete Garantien*. Im Deutschen bedeutet *geeignet* „tauglich" oder „passend", nicht „verhältnismäßig". In einer DSGVO-Prüfung ist das ein relevanter Unterschied.

Der DSGVO-Test: 22 Engines, eine Compliance-Klausel

Wir haben eine 50 Wörter lange DSGVO-Klausel zu Verantwortlichenpflichten und grenzüberschreitenden Datenübermittlungen durch 22 KI-Engines auf MachineTranslation.com verarbeiten lassen.

Wo genau weichen die Engines ab?

Englischer Begriff	Mehrheitsübersetzung	Konsens	Minderheitsübersetzung	Minderheit
appropriate safeguards	angemessene Garantien	57 %	geeignete Garantien	43 %
fairness	Fairness	86 %	Redlichkeit	14 %
General Data Protection Regulation	Datenschutz-Grundverordnung	50 %	DSGVO	50 %
data controller	(kein klarer Konsens)	—	drei verschiedene Varianten	variiert

Die Begriffe mit 100 % Übereinstimmung: *personenbezogene Daten*, *Rechtmäßigkeit*, *Transparenz*, *Drittland*, *Kapitel V*. Das sind grundlegende Rechtsbegriffe, die in der deutschen Gesetzgebung fest verankert sind.

Das Muster ist eindeutig: Je mehr Interpretationsspielraum ein Begriff bietet, desto stärker weichen die Engines ab. Genau bei diesen Begriffen liegt das Haftungsrisiko.

Der Fall „Fairness" vs. „Redlichkeit"

86 % der Engines behielten das englische Lehnwort *Fairness* bei, das im DSGVO-Kontext Standard ist. 14 % wählten *Redlichkeit*, einen älteren deutschen Rechtsbegriff, der das sprachliche Register in Richtung vormodernes Gesetzesdeutsch verschiebt.

Für ein modernes Compliance-Dokument ist *Fairness* die richtige Wahl. Für ein Dokument, das sich auf das alte Bundesdatenschutzgesetz bezieht, könnte *Redlichkeit* angemessen sein. Eine einzelne Engine trifft diese kontextabhängige Entscheidung nicht. Das Key-Term-Translations-Panel zeigt beide Optionen mit ihren Konsenswerten.

Technische Dokumente: Warum Komposita ein Zuverlässigkeitstest sind

Deutsche Fachdokumentation lebt von Komposita. Diese Wortverbindungen sind keine sprachliche Spielerei, sondern präzise Bezeichner, die auf bestimmte Normen, Verordnungen oder Produktklassifikationen verweisen.

Der Kompositum-Stresstest

Wir übersetzten einen Satz über einen Bundesdatenschutzbeauftragten, der neue Richtlinien zur Mitarbeiterdatenverarbeitung unter der Telekommunikationsüberwachungsverordnung herausgibt.

Die Mehrheit der Engines verwendete *Mitarbeiterdaten*. Claude wählte *Arbeitnehmerdatenverarbeitung*, ein grammatisch korrektes, aber im deutschen Unternehmenskontext ungebräuchliches Kompositum. Ein deutscher Datenschutzbeauftragter würde bei dieser Formulierung sofort erkennen, dass der Text maschinell übersetzt wurde.

Beim Begriff „data protection officer" lag der Konsens bei nur 63 %. Die Mehrheit bevorzugte *Bundesbeauftragte für den Datenschutz*, Alternativen waren *Bundesdatenschutzbeauftragter* und *Datenschutzbeauftragter*. Jede Variante ist in einem anderen Kontext korrekt: Die erste bezieht sich auf den Bundesbeauftragten, die zweite ist ein informelleres Kompositum, die dritte der generische Begriff für den betrieblichen Datenschutzbeauftragten.

Interne Benchmarks von MachineTranslation.com zeigen, dass der SMART-Konsensansatz Übersetzungsfehler um bis zu 90 % reduziert. Bei Fachtexten konzentriert sich diese Reduktion auf genau die terminologischen Entscheidungspunkte, die ein einzelnes Tool nicht sichtbar macht.

Ein Entscheidungsrahmen für juristische und technische Übersetzungen

Nicht jeder Begriff in einem Rechts- oder Fachdokument trägt dasselbe Risiko. Ein praxistauglicher Rahmen:

Stufe 1: Über 90 % Konse: Direkte Verwendung des SMART-Outputs. Betrifft Standardbegriffe wie *personenbezogene Daten* oder *Transparenz*.
Stufe 2: 70 bis 89 % Konse: Key-Term-Panel prüfen, kontextgerechte Variante wählen. Beispiel: *Fairness* (86 %) vs. *Redlichkeit* (14 %).
Stufe 3: 50 bis 69 % Konse: Zur menschlichen Fachprüfung markieren. Beispiel: *angemessene Garantien* (57 %) vs. *geeignete Garantien* (43 %).
Stufe 4: Unter 50 % oder kein klarer Konse: Obligatorische menschliche Übersetzung. Beispiel: *Datenverantwortlicher* (keine Mehrheit).

Dieser Rahmen verwandelt ein subjektives Qualitätsurteil in eine datengestützte Entscheidung. Statt zu fragen „Ist diese Übersetzung gut genug?" fragt man: „Auf wie viel Prozent der 22 Engines einigen sich bei diesem Begriff?"

Die neue Produkthaftungsrichtlinie und ihre Folgen für Übersetzungen

Die EU-Richtlinie (EU) 2024/2853 muss bis zum 9. Dezember 2026 in nationales Recht umgesetzt werden. Sie bringt drei Änderungen, die für Übersetzungen relevant sind:

Erweiterter Produktbegrif: Software und digitale Inhalte fallen erstmals unter das Produkthaftungsrecht. Das schließt fehlerhafte Übersetzungen in digitalen Bedienungsanleitungen, Sicherheitsdatenblättern und Compliance-Dokumenten ein.
Erweiterter Schadensbegrif: Neben Sach- und Personenschäden umfasst der Schadensersatz künftig auch psychische Beeinträchtigungen und Datenverluste.
Verschärfte Beweislas: Unternehmen können künftig gezwungen werden, Beweismittel offenzulegen. Wer nicht nachweisen kann, wie die Übersetzung zustande kam, riskiert die gesetzliche Vermutung eines Produktfehlers.

Für Unternehmen, die auf einen einzigen KI-gestütztes Übersetzungstool setzen, entsteht ein konkretes Problem: Sie können nicht nachweisen, dass die Terminologie geprüft wurde. Wer dagegen mit MachineTranslation.com arbeitet, hat einen dokumentierbaren Prozess: 22 Engines konsultiert, Konsensgrade sichtbar, Abweichungen markiert.

Ofer Tirosh, CEO von Tomedes, dem Mutterunternehmen von MachineTranslation.com: „Die Frage ist nicht mehr, ob KI übersetzen kann. Die Frage ist, ob Sie nachweisen können, dass Ihre KI-Übersetzung die richtigen Begriffe gewählt hat. Genau dafür wurde der Konsens-Ansatz entwickelt."

Wie der SMART-Konsensansatz funktioniert

SMART vergleicht die Ausgaben von bis zu 22 KI-Engines für denselben Text. Es identifiziert Übereinstimmungen und Abweichungen und erzeugt eine Konsensübersetzung, die das widerspiegelt, worauf sich die Mehrheit einigt.

Jede Engine erhält einen Score von 1 bis 10. Ein Score von 9,4 bedeutet nahezu perfekte Übereinstimmung mit dem Konsens. Ein Score von 8,5 zeigt Abweichungen bei einem oder mehreren Schlüsselbegriffen an.

Das Key-Term-Translations-Panel zeigt zu jeder Übersetzung, wie jeder einzelne Fachbegriff von jeder Engine wiedergegeben wurde. Für den DSGVO-Test zeigte es: *Rechtmäßigkeit* und *Transparenz* hatten 100 % Übereinstimmung. *Angemessene Garantien* hatte nur 57 %. Diese Differenz ist auf keiner anderen Übersetzungsplattform sichtbar.

Häufig gestellte Fragen

1. Kann KI juristische Texte korrekt von Englisch nach Deutsch übersetzen?

KI liefert einen soliden Erstentwurf, aber unser Test zeigt, dass bei 4 von 9 juristischen Schlüsselbegriffen kein einheitlicher Konsens unter 22 Engines besteht. Die Begriffe mit der höchsten Abweichung betreffen genau die Stellen, die rechtliche Konsequenzen haben. SMART markiert diese Stellen, sodass menschliche Prüfung gezielt dort eingesetzt werden kann.

2. Was ist das größte Risiko bei technischen Übersetzungen ins Deutsche?

Die Kompositum-Konvention. Deutsche Fachliteratur folgt strikten terminologischen Normen. Ein unübliches Kompositum, selbst wenn grammatisch korrekt, signalisiert dem Leser, dass das Dokument nicht von einem Fachmann geprüft wurde. In unserem Test stimmten nur 63 % der Engines bei „data protection officer" überein.

3. Welche Begriffe erfordern immer menschliche Prüfung?

Begriffe mit einem Konsenswert unter 70 % sollten grundsätzlich von einem Fachübersetzer geprüft werden. In unserem DSGVO-Test betraf das „appropriate safeguards" (57 %), „General Data Protection Regulation" (50 %) und „data controller" (keine Mehrheit).

4. Was ändert sich durch die EU-Produkthaftungsrichtlinie 2026?

Ab Dezember 2026 fallen Software und digitale Inhalte unter die Produkthaftung. Fehlerhafte Übersetzungen in Produktdokumentationen können als Instruktionsfehler gewertet werden. Unternehmen, die KI-Übersetzungen ohne dokumentierten Qualitätsprozess veröffentlichen, tragen ein direktes Haftungsrisiko.

5. Wie funktioniert der SMART-Konsens bei MachineTranslation.com?

SMART vergleicht die Ausgaben von bis zu 22 KI-Engines, bewertet jede Engine nach Übereinstimmung mit dem Gesamtkonsens und zeigt im Key-Term-Translations-Panel die Konsenswerte für jeden einzelnen Fachbegriff. Interne Benchmarks zeigen eine Fehlerreduktion von bis zu 90 % im Vergleich zur Nutzung einer einzelnen Engine.