Content-Souveränität: Was jetzt auf dem Spiel steht

Im November 2025 hat das Landgericht München I entschieden, dass das Training von KI-Modellen auf urheberrechtlich geschützten Inhalten eine Urheberrechtsverletzung sein kann. Es war das erste Urteil dieser Art in Europa. Und in den Wochen danach haben die wenigsten Verlage und Bildungsorganisationen ihre robots.txt aktualisiert.

Content-Souveränität – die Fähigkeit, über die eigenen Inhalte tatsächlich zu verfügen – steht für Verlage und Bildungsorganisationen gerade auf dem Prüfstand. Das Münchner Urteil war der Anlass, aber hinter diesem Prüfstand steht mehr: eine Kombination aus technologischer Entwicklung, regulatorischem Druck und struktureller Abhängigkeit, die sich über Jahre aufgebaut hat. Leise, Schritt für Schritt. Oder wie es oft heißt: „Historisch gewachsen.“

Drei Kanäle, durch die Kontrolle verschwindet

Kontrolle geht selten durch einen einzelnen, sichtbaren Moment verloren. Bei Content-Souveränität verliert sie sich in drei stillen Kanälen. In den meisten Organisationen ist das mindestens einer davon.

1. Plattformabhängigkeit und Vendor Lock-in

Europäische Organisationen überweisen jährlich rund 265 Milliarden Euro an US-amerikanische Cloud- und Softwareanbieter. 80 Prozent dieser Wertschöpfung verbleiben außerhalb Europas.

Die Mechanik dahinter: Systeme werden implementiert, Workflows passen sich an, Mitarbeitende gewöhnen sich an Oberflächen, Daten sammeln sich im Ökosystem eines Anbieters. Mit der Zeit wird der Wechsel immer teurer und damit auch unwahrscheinlicher.

Wer seinen gesamten Content-Workflow auf proprietären CMS-Systemen aufgebaut hat, die keinen vollständigen Datenexport in einem offenen Format erlauben, übergibt faktisch die Kontrolle über seine wertvollsten Assets. Als Ergebnis vieler kleiner Entscheidungen, die einzeln vernünftig (weil schnell und bequem) wirkten – und in der Summe Abhängigkeit schufen.

2. KI-Training auf Ihren Inhalten

Generative KI-Systeme wurden auf riesigen Textmengen trainiert. Ein erheblicher Teil davon bestand aus öffentlich zugänglichen Inhalten: von Verlags-Websites, aus digitalen Bibliotheken (auch Schatten-Bibliotheken), von Bildungsplattformen. Ohne Vergütung und häufig ohne wirksames Opt-out.

Das Urteil des Landgerichts München I vom November 2025 (Az. 42 O 14139/24) ist deshalb ein Wendepunkt: Es stellt klar, dass dieses Vorgehen eine Urheberrechtsverletzung sein kann. Noch ist das kein höchstrichterliches Grundsatzurteil, das bundesweit gilt. Aber es ist das erste seiner Art in Europa – und das Europäische Parlament hat inzwischen einen Bericht über Urheberrecht und generative KI eingeleitet, der weitere Regulierungen ankündigt.

Die Signalwirkung ist klar: Die Rechtslage bewegt sich. Und wer jetzt nicht handelt, verliert möglicherweise Ansprüche, die in einigen Jahren durchsetzbar wären. Und Achtung: Ein Opt-out wirkt nicht rückwirkend. Was bereits verarbeitet wurde, ist verarbeitet.

Seriöse Crawler wie GPTBot von OpenAI oder ClaudeBot von Anthropic respektieren einen expliziten Widerspruch in der robots.txt-Datei. Das macht diesen Widerspruch zur einfachsten verfügbaren Schutzmaßnahme – aber leider auch zur am häufigsten unterlassenen.

3. KI-Tools im Alltag – ohne Richtlinien

„Schatten-KI“ ist der Kanal, der am wenigsten sichtbar ist und am meisten unterschätzt wird. Nicht der offizielle Schritt in die Cloud und auch nicht ein strategisch beschlossenes KI-Projekt. Es ist das, was jeden Tag passiert: Irgendjemand in der Redaktion schickt einen Text durch ChatGPT, das Lektorat nutzt ein Zusammenfassungs-Tool, ein Bildungsteam speist Lernmodule in ein externes KI-System ein. Meistens mit guten Absichten – und ohne genaue Kenntnis der Vertragsbedingungen.

Consumer-APIs von OpenAI, die kostenfreien Varianten von ChatGPT, erlauben explizit die Nutzung von Eingaben für Modellverbesserungen. Erst die kostenpflichtigen Business- und Enterprise-Tarife bieten ein Opt-out. Viele Organisationen nutzen die günstigen Consumer-Endpunkte für interne Workflows – meistens weil die KI-Adoption schlicht schneller lief als die Governance dazu.

Das Ergebnis: Proprietäre Inhalte verlassen die Organisation. Täglich, ohne Protokoll und ohne gesicherte Rechtsgrundlage.

Was der EU AI Act jetzt konkret verlangt

Seit August 2025 sind wesentliche Teile des EU AI Act anwendbar. Das Gesetz unterscheidet zwischen denen, die KI-Systeme entwickeln, und denen, die sie einsetzen. Letztere heißen im Gesetz „Deployer“ – und dazu gehören alle Verlage und Bildungsorganisationen, die KI-Tools in ihren Prozessen nutzen, egal ob für Texterstellung, Lektorat, Recherche oder Lerndesign.

Was das konkret bedeutet: Deployer sind zur Risikobewertung der eingesetzten Systeme verpflichtet, müssen menschliche Aufsicht über KI-Outputs sicherstellen und alle Mitarbeitenden schulen, die mit KI arbeiten. Artikel 4 des EU AI Act schreibt diese Schulungspflicht explizit fest – und sie gilt bereits.

Ab dem 2. August 2026 kommt die Kennzeichnungspflicht hinzu: KI-generierte Texte, Bilder und Videos müssen als solche maschinenlesbar ausgewiesen werden. Aktuell haben erst 44 Prozent der deutschen Verlage eine KI-Kennzeichnung eingeführt, weitere 27 Prozent planen es – das sind Zahlen aus der MVFP-KPMG-Verlagsstudie 2025. Sie zeigen, dass mehr als ein Viertel der Branche auf eine gesetzliche Pflicht zusteuert, ohne sich darauf vorbereitet zu haben.

Parallel hat die Rundfunkkommission der Länder Ende 2025 einen gesetzlichen Vergütungsanspruch für Inhalteanbieter gefordert und verschärfte Transparenzpflichten für KI-Unternehmen verlangt. Die Richtung der Regulierung ist eindeutig: Sie bewegt sich zugunsten derjenigen, die Inhalte produzieren – aber nur, wenn diese ihre Position aktiv einnehmen.

Was Content-Souveränität bedeutet – und was nicht

Der Begriff digitale Souveränität kommt aus der EU-Digitalpolitik. Das Joint Research Centre der Europäischen Kommission definiert digitale Souveränität als die Kapazität, strategische Unabhängigkeit im digitalen Bereich auszuüben – einschließlich Datengovernance, Infrastrukturkontrolle und Innovationsfähigkeit. Eine übersichtliche Zusammenfassung der Bedeutung der digitalen Souveränität findet sich auf den Seiten der Bundeszentrale für politische Bildung.

Auf Organisationsebene heruntergebrochen bedeutet das: die Fähigkeit, eigene Inhalte in ihrem gesamten Lebenszyklus zu steuern. Das bedeutet: Von der Struktur und Lizenzierung über die KI-Nutzbarkeit bis zur technischen Infrastruktur, auf der Inhalte gespeichert und verarbeitet werden.

Was Content-Souveränität dabei nicht ist: ein einmaliges IT-Projekt, das man abhakt. Es ist eine Organisationsfähigkeit – und keine Frage, die die IT-Abteilung allein beantwortet. Sie beginnt in der Geschäftsleitung, mit Entscheidungen über Verträge, Systeme und Lizenzmodelle. Dann erst kommt die Technik.

Was das konkret bedeutet

Für Fachverlage steht eine Kernfrage im Mittelpunkt: Wer darf meine Inhalte zu welchen Bedingungen für KI-Zwecke nutzen? Die MVFP-KPMG-Studie 2025 zeigt, dass 39 Prozent der deutschen Verlage in der Lizenzierung ihrer Inhalte als KI-Trainingsdaten ein Potenzial sehen. Das ist der konstruktive Blick auf das Thema:

Wer Content-Souveränität aufbaut, schützt bestehende Erlösmodelle – und schafft die Grundlage für neue. Wer seine Inhalte aktiv schützt, Opt-out-Maßnahmen ergreift und gleichzeitig strategisch entscheidet, unter welchen Bedingungen KI-Lizenzen erteilt werden, positioniert sich als handelnder Akteur. Statt als Datengeber ohne Mitsprache.

Für Bildungsmedien kommen besondere Dimensionen hinzu

Lernmanagementsysteme verarbeiten hochwertige Nutzungsdaten: Lernpfade, Kompetenzprofile, Prüfungsergebnisse. Diese Daten sind oft die wertvollsten Informationen, die eine Bildungsorganisation besitzt. Sie dürfen nicht beim Systemanbieter eingeschlossen bleiben – weder als proprietäre Datenformate noch als Nutzungsrecht, das beim Vertragsende endet.

Prüfungsfragen sind ein besonders sensibler Fall. Als urheberrechtlich und pädagogisch schützenswertes Gut gehören sie nicht in extern zugängliche KI-Systeme, weder in Zusammenfassungs-Tools noch in KI-Assistenten, die auf externe Infrastruktur zurückgreifen.

Für beide – Verlage und Bildungsorganisationen – gilt: Der Einstieg ist kleiner, als er von außen aussieht. Er beginnt nicht mit einer Infrastrukturmigration, sondern damit, heute die richtigen Fragen zu stellen:

Welche Inhalte liegen auf welchen Systemen – unter welcher Jurisdiktion? Welche KI-Tools werden täglich eingesetzt, und was sagen die Vertragsbedingungen dazu? Gibt es eine interne Richtlinie, die regelt, was mit proprietären Inhalten in KI-Workflows passieren darf?

Wer diese Fragen beantwortet, hat den ersten Schritt gemacht.

Vier Dimensionen

Content-Souveränität lässt sich entlang von vier Dimensionen strukturieren:

Rechtliche Souveränität fragt: Wer darf meine Inhalte wie nutzen?
Technische Souveränität fragt: Wo liegen meine Daten – und unter welcher Kontrolle?
Strukturelle Souveränität fragt: Ist mein Content KI-ready und portabel?
Institutionelle Souveränität fragt: Haben wir das Know-how intern, um diese Fragen dauerhaft zu beantworten?

Diese vier Dimensionen zeigen schnell, wo blinde Flecken liegen. Die meisten Organisationen haben sie in mindestens zwei davon. Das Denkmodell dahinter beschreibe ich im nächsten Artikel dieser Serie.

Mit diesen vier Dimensionen beschäftigt sich der zweite Teil der Serie.

Häufig gestellte Fragen zur Content-Souveränität

Was bedeutet Content-Souveränität für Verlage und Bildungsanbieter konkret?

Content-Souveränität bezeichnet die Fähigkeit einer Organisation, eigene Inhalte in ihrem gesamten Lebenszyklus zu steuern: von der Struktur und Lizenzierung über die KI-Nutzbarkeit bis hin zur technischen Infrastruktur, auf der Inhalte gespeichert und verarbeitet werden. Für Verlage bedeutet das konkret, zu wissen, wer ihre Inhalte verarbeitet, unter welchen Bedingungen externe KI-Tools Zugriff haben – und eine aktive Urheberrechtsstrategie zu verfolgen, die sowohl den Schutz bestehender als auch die Entwicklung neuer Lizenzierungsmodelle ermöglicht.

Was besagt das LG-München-Urteil vom November 2025?

Das Urteil des Landgerichts München I (Az. 42 O 14139/24) stellt klar, dass das Training von KI-Modellen auf urheberrechtlich geschützten Inhalten eine Urheberrechtsverletzung darstellen kann – als erstes Urteil dieser Art in Europa. Es ist noch kein höchstrichterliches Grundsatzurteil und gilt nicht automatisch bundesweit. Es signalisiert aber eine Richtung, in die sich die Rechtsprechung bewegt, und macht deutlich, dass proaktive Schutzmaßnahmen – wie ein Opt-out in der robots.txt – rechtlich und strategisch sinnvoll sind.

Was verlangt der EU AI Act von Verlagen und Bildungsorganisationen?

Organisationen, die KI-Systeme einsetzen, gelten als „Deployer“ und unterliegen seit August 2025 Compliance-Pflichten: Risikobewertung der eingesetzten KI-Systeme, Sicherstellung menschlicher Aufsicht sowie Schulungen für alle Mitarbeitenden, die mit KI arbeiten (Artikel 4). Ab dem 2. August 2026 gilt die Kennzeichnungspflicht für KI-generierte Texte, Bilder und Videos. Das betrifft alle, die KI-Tools in Redaktion, Lektorat, Übersetzung oder Lerndesign einsetzen.

Wie fange ich mit Content-Souveränität an?

Der erste Schritt ist eine Bestandsaufnahme: Welche Inhalte liegen auf welchen Systemen, unter welcher Jurisdiktion, unter welchen Vertragsbedingungen? Welche KI-Tools werden im Alltag eingesetzt – und erlauben ihre Nutzungsbedingungen die Verarbeitung proprietärer Inhalte? Eine interne Richtlinie, die Consumer-APIs für vertrauliche Inhalte ausschließt, und ein robots.txt-Opt-out für KI-Crawler (GPTBot, ClaudeBot, Amazonbot) sind Maßnahmen, die innerhalb weniger Wochen umsetzbar sind und keine Infrastrukturprojekte erfordern.