De snelle opmars van generatieve AI dwingt de rechtspraktijk om de grenzen van het auteursrecht opnieuw te definiëren. In een belangrijke uitspraak van 10 december 2024 heeft het Hanseatisches Oberlandesgericht in Hamburg geoordeeld dat het downloaden van auteursrechtelijk beschermde afbeeldingen voor het creëren van trainingsdatasets is toegestaan onder de uitzonderingen voor tekst- en datamining (TDM). Voor rechthebbenden is de boodschap helder: een geschreven verbod in algemene voorwaarden volstaat niet; een “machineleesbare” opt-out is technisch noodzakelijk.
De feiten en juridische context
Deze zaak draait om een conflict tussen de fotograaf Robert Kneschke en LAION e.V., een non-profitorganisatie die open-source datasets voor AI-training ontwikkelt.
LAION creëerde de dataset “LAION-5B”, die links en beschrijvingen bevat van 5,85 miljard afbeeldingen. Om deze dataset te bouwen, downloadde en analyseerde LAION miljarden beelden van het internet om te controleren of de beschrijvingen overeenkwamen met de beelden. Hierbij werd ook een foto van de eiser gedownload van een stockfotosite.
De fotograaf stelde dat dit een inbreuk was op zijn auteursrecht. Hij verwees specifiek naar de gebruiksvoorwaarden van de website, waarin in “natuurlijke taal” stond vermeld dat geautomatiseerde programma’s (bots, scrapers) de content niet mochten downloaden of indexeren.
De fotograaf stelde dat dit een inbreuk was op zijn auteursrecht en stapte naar de rechter. In eerste aanleg oordeelde het Landgericht Hamburg echter al in het voordeel van LAION en wees de vordering af. De fotograaf legde zich hier niet bij neer en ging in beroep bij het Hanseatisches Oberlandesgericht.
De kernvraag in dit hoger beroep bleef of deze handelingen vielen onder de uitzonderingen voor tekst- en datamining (TDM) zoals ingevoerd in de Duitse auteurswet (UrhG) naar aanleiding van de implementatie van de Europese DSM-richtlijn (2019/790).
De beslissing
Het Hof van Beroep in Hamburg bevestigde het vonnis uit eerste aanleg en verwierp het beroep van de fotograaf. De beslissing rust op twee pijlers:
- Wetenschappelijk onderzoek: Het Hof oordeelde dat LAION kwalificeert als een onderzoeksorganisatie en dat het creëren van de dataset zelf een vorm van wetenschappelijk onderzoek is. Hierdoor kon LAION zich beroepen op de specifieke TDM-uitzondering voor onderzoek (§ 60d UrhG), die geen opt-out mogelijkheid kent voor rechthebbenden. Dat commerciële partijen de dataset later gebruiken, doet hier geen afbreuk aan.
- De algemene TDM-uitzondering en de ongeldige opt-out: Zelfs zonder het wetenschappelijke doel zou de handeling toegestaan zijn onder de algemene TDM-uitzondering (§ 44b UrhG). Hoewel de fotograaf (via de website) een voorbehoud had gemaakt, oordeelde het Hof dat dit voorbehoud niet geldig was omdat het niet “machineleesbaar” was. Een verbod in de algemene voorwaarden, geschreven in menselijke taal, volstaat niet om geautomatiseerde scrapers tegen te houden.
Juridische analyse en duiding
Hoewel dit een Duits vonnis is, is de impact voor de Belgische rechtspraktijk direct relevant. De Duitse wetgeving in kwestie is immers een implementatie van de Europese DSM-richtlijn. In België zijn de relevante bepalingen terug te vinden in artikel XI.190, 20° (algemene TDM) en artikel XI.191/1, §1, 7° (wetenschappelijke TDM) van het Wetboek van Economisch Recht (WER).
De definitie van “machineleesbaar”
Het meest belangrijke aspect van dit arrest is de interpretatie van een geldig rechtsvoorbehoud (opt-out). Net zoals in Duitsland stelt artikel XI.190, 20° WER dat bij online content, dit voorbehoud enkel als passend wordt beschouwd indien hierbij machinaal leesbare middelen worden gebruikt. Het hof van beroep te Hamburg stelt nu een strenge lezing: het is niet voldoende dat een machine de tekst kan lezen (zoals via OCR of tekstherkenning); de machine moet het verbod kunnen interpreteren en automatisch kunnen uitvoeren. Het Hof oordeelde dat in 2021 (het moment van de feiten) de technologie nog niet zover was dat AI-crawlers complexe juridische teksten in algemene voorwaarden feilloos konden begrijpen. Dit betekent dat rechthebbenden technische maatregelen moeten nemen, zoals het gebruik van een robots.txt-bestand of specifieke protocollen.
De reikwijdte van “wetenschappelijk onderzoek”
Het Hof hanteert een ruime definitie van onderzoek. Het louter samenstellen en valideren van een dataset wordt gezien als een fundamentele stap in AI-onderzoek. Bovendien verliest een non-profitorganisatie haar status niet louter omdat ze samenwerkt met commerciële spelers of omdat commerciële bedrijven profiteren van de open-source resultaten, zolang die bedrijven geen beslissende invloed hebben op de organisatie. Dit opent de deur voor structuren waarbij VZW’s datasets bouwen die vervolgens door de industrie worden gebruikt.
De driestappentoets
Het Hof toetste de uitzondering ook aan de fameuze driestappentoets (zie art. XI.192/3 WER). Er werd geoordeeld dat de normale exploitatie van de foto niet in het gedrang komt, aangezien de dataset slechts links en metadata bevat en niet de afbeelding zelf permanent opslaat voor publieke weergave. Dat AI-modellen later beelden kunnen genereren die concurreren met de fotograaf, werd als te abstract en in de toekomst liggend beschouwd om de dataset-creatie zelf te verbieden.
👉Lees ook onze eerdere blog over AI-training en de driestappentoets.
Wat dit concreet betekent
Deze uitspraak verschuift de verantwoordelijkheid aanzienlijk richting de rechthebbende.
- Voor fotografen, uitgevers en content creators: Een waarschuwing in uw footer of algemene voorwaarden (“Verboden te scrapen voor AI”) heeft juridisch geen waarde als opt-out onder de algemene TDM-uitzondering. U moet technische barrières implementeren die door bots erkend worden als een stopteken. Denk aan het correct configureren van uw robots.txt bestand of het implementeren van nieuwe standaarden zoals het TDM Reservation Protocol. Zonder deze technische maatregelen staat uw content in essentie “open” voor AI-training door commerciële partijen.
- Voor AI-ontwikkelaars en tech-bedrijven: Dit arrest biedt meer rechtszekerheid bij het scrapen van het openbare internet. Zolang u respect toont voor machineleesbare protocollen (zoals robots.txt), lijkt de weg vrij om data te verzamelen onder de algemene TDM-uitzondering. Voor organisaties die zich kunnen kwalificeren als onderzoeksorganisatie is de speelruimte nog groter, aangezien zij zich zelfs niets hoeven aan te trekken van een opt-out.
- Voor juridische adviseurs: Zij moeten hun cliënten adviseren om hun IE-strategie te digitaliseren. Een juridische clausule zonder technische implementatie is in de context van AI-training een ‘papieren tijger’ geworden.
FAQ (Veelgestelde Vragen)
Geldt deze uitspraak ook in België?
Hoewel het een Duitse uitspraak is, is het gebaseerd op geharmoniseerde Europese wetgeving (de DSM-richtlijn). Belgische rechtbanken zullen bij de interpretatie van art. XI.190, 20° WER waarschijnlijk sterk naar deze redenering kijken, zeker bij gebrek aan eigen precedenten.
Is een vermelding “No AI Training” in de metadata van mijn foto voldoende?
Dat is onzeker. Het Hof eist dat de opt-out “automatisch gevonden, begrepen en correct toegewezen” kan worden. Als crawlers die metadata in 2021 niet standaard lazen, was het onvoldoende. Voor de toekomst wordt verwacht dat standaarden die metadata uitlezen (zoals C2PA) wel als machineleesbaar zullen gelden.
Is dit de definitieve beslissing?
Nee, het Hof heeft de revisie (cassatieberoep) bij het Duitse Bundesgerichtshof toegelaten vanwege het fundamentele belang van de zaak. Het laatste woord is hierover dus nog niet gezegd.
Conclusie
Het LAION-arrest bevestigt dat het auteursrecht geen absolute muur vormt tegen AI-training. De rechter kiest voor een pragmatische, technologische benadering: wie niet wil dat zijn werk gebruikt wordt, moet “de taal van de machine” spreken. Voor rechthebbenden is passiviteit geen optie meer.



