De auteursrechtelijke implicaties van ChatGPT

02 feb 2023

Het schrijven van een scriptie is voor veel studenten een grote opgave, en voor menig werkende een onprettige herinnering aan de studietijd. Maar stel je voor: een systeem dat binnen seconden antwoord geeft op jouw hoofdvraag, met logische argumenten en nette paragrafen. Het klinkt bijna te mooi om waar te zijn.

In de blog van mijn collega Britt van 15 december schreef ze over een nieuwe ontwikkeling op het gebied van AI: ChatGPT. Zij legt daarin uit wat deze technologie kan, namelijk volledig en goed geschreven antwoorden formuleren op uiteenlopende en complexe vragen. Afhankelijk van de vraag kan het antwoord bijvoorbeeld uit een essay, code, e-mail of zelfs wetgeving bestaan. In deze blog zal ik ingegaan op de implicaties van deze technologie op het auteursrecht, zowel wat betreft de trainingsdata als het antwoorden van ChatGPT.

Trainingsdata

ChatGPT is getraind met behulp van allerlei soorten bronnen, zoals webpagina’s, boeken en gesprekken met mensen. ChatGPT kopieert de teksten uit deze bronnen niet letterlijk of in substantiële mate in de antwoorden, maar maakt gebruik van de documenten om te leren hoe (goede) antwoorden eruit horen te zien. Om een antwoord goed te noemen is misschien wat kort door de bocht, want ook slechte antwoorden op vragen kunnen tot de trainingsdata behoren.

ChatGPT leert hoe patronen en structuren in de menselijke taal werken, zodat het lijkt alsof de antwoorden door een mens geschreven zijn. Het trainen van het algoritme moet wel gebeuren aangaande de regels over tekst- en datamining. Dat betekent dat OpenAI bronnen mag gebruiken waar ze rechtmatig toegang toe heeft en waarbij dit niet expliciet is verboden. Als het goed is, heeft OpenAI hier rekening mee gehouden tijdens het verzamelen van haar trainingsbronnen. Dat is op dit moment lastig vast te stellen, omdat we niet de mogelijkheid hebben om onder de motorkap te kijken van ChatGPT. Het antwoord van ChatGPT zelf:

The data that ChatGPT uses is sourced from a variety of publicly available sources and is pre-processed and curated by OpenAI. While the data is not proprietary, it is protected by copyright, trademark, and other intellectual property laws. OpenAI has a license to use the data for the purpose of training and providing the ChatGPT model as a service, but this license does not extend to other uses of the data without permission from the rights holders.

De antwoorden van ChatGPT zijn dus gebaseerd op deze bronnen. Is het gebruik van deze bronnen door ChatGPT een inbreuk op het auteursrecht van, bijvoorbeeld, de auteur van een boek wat wordt gebruikt? Nee, niet zolang de tekst uit de bron niet (direct) wordt gekopieerd in het antwoord. Het is wel mogelijk dat de toestemming van de maker nodig is wanneer specifieke delen worden gekopieerd, zoals passages uit een boek. Hierbij kan de vraag van de gebruiker een groot verschil maken: een samenvatting vragen van een boek leidt niet snel tot inbreuk op het auteursrecht van de maker, maar als de gebruiker vraagt naar een hele pagina uit een boek, dan ligt dit anders. Het hangt dus af van de situatie en zal per geval moeten worden beoordeeld.

De antwoorden

Een andere vraag is of auteursrecht rust op een antwoord van ChatGPT en, zo ja, wie het verkrijgt. Hiervoor is het van belang of een antwoord van ChatGPT een ‘werk’ is in de zin van de Auteurswet. Een werk is een originele expressie afkomstig van een menselijke maker. De maker moet een mens zijn, waardoor ChatGPT geen ‘werk’ in de zin van de Auteurswet kan maken. Als een gebruiker van ChatGPT een mens is, maar het antwoord van ChatGPT alsnog direct kopieert,  dan zijn er geen creatieve keuzes gemaakt waardoor het stuk alsnog geen ‘werk’ is. Dit kan mogelijk anders zijn als de gebruiker het antwoord nog aanpast, hierbij creatieve keuzes maakt en uiteindelijk een origineel werk creëert dat zijn persoonlijke stempel draagt. Dan is de gebruiker de maker van het werk. Ook hier ligt het dus aan de omstandigheden van het geval.

ChatGPT in de praktijk: de student en de werknemer

Dan twee praktische situaties: een student die zijn scriptie laat schrijven door ChatGPT en een werknemer die code laat schrijven door ChatGPT. Welke auteursrechtelijke implicaties komen naar voren in zulke scenario’s?

Buiten plagiaat, wat in het ergste geval leidt tot verwijdering van de onderwijsinstelling, kan de student zich mogelijk schuldig maken aan auteursrechtinbreuk. Plagiaat houdt in dat een student werk inlevert wat niet zelf gemaakt is, zonder vermelding van de bron. Dit is een breder begrip dan auteursrechtinbreuk, wat het gebruik van andermans werk is zonder toestemming. Ook bij een scriptie hangt auteursrechtinbreuk af van het antwoord van ChatGPT, zoals hierboven uitgelegd. Om ook zelf een auteursrecht te krijgen op de scriptie, zal de student veranderingen aan de antwoorden van ChatGPT aan moeten brengen. Hiervoor zal de student dus alsnog zelf creatief na moeten denken over het scriptieonderwerp en ook de nodige aanpassingen moeten doen. Het probleem is dat de grens van een nieuw auteursrecht bij dit soort zaken bijzonder vaag is. Desondanks zal voornamelijk plagiaat de crux zijn van deze gevallen, want van een ChatGPT geschreven tekst met terugwerkende kracht de bronnen achterhalen zal nog steeds lastig en tijdrovend zijn (als er al een enkele bron is die feitelijk stelt wat ChatGPT aanlevert!), aangezien ChatGPT zelf niet aangeeft welke bron bij welke zin of paragraaf hoort.

En wat als een werknemer een stuk code laat schrijven door ChatGPT, om dit vervolgens in de software van zijn werk te gebruiken? OpenAI geeft aan dat het in het algemeen toegestaan is om de output van ChatGPT commercieel te gebruiken, zolang de gebruiker de benodigde toestemmingen en licenties heeft. Het kan dus nodig zijn om, afhankelijk van de omstandigheden, een licentie van OpenAI of de relevante houders van de IE-rechten te verkrijgen. OpenAI verduidelijkt echter niet wanneer dat dan nodig is. Ook hier ligt het dus aan het antwoord van ChatGPT of er sprake is van auteursrechtinbreuk, en of er toestemming of licentie nodig is van de maker van het werk of van OpenAI zelf. Het moge overigens duidelijk zijn dat in veel gevallen deze vraag ook nu al relevant is, zelfs zonder het gebruik van ChatGPT, aangezien er verschillende hulpmiddelen zijn om software te ontwikkelen, variërend van websites die complete antwoorden bevatten op (veel) gestelde vragen, tot AI-gebaseerde hulpmiddelen die gedurende het schrijven van code direct proberen de code automatisch aan te vullen.

Conclusie

De auteursrechtelijke implicaties van ChatGPT zijn nog niet duidelijk. De antwoorden kunnen inbreuk maken op het auteursrecht van de maker van de bron(nen), indien een stuk tekst wordt gekopieerd, maar dat hoeft lang niet altijd het geval te zijn. ChatGPT heeft in ieder geval geen auteursrecht op de antwoorden die worden gegeven, en ook een gebruiker zal niet automatisch het auteursrecht op een antwoord krijgen. Alleen wanneer een gebruiker nog veranderingen aanbrengt die creatief en origineel zijn en zijn persoonlijke stempel drukken op een antwoord, zal die gebruiker een auteursrecht krijgen.

Heeft u vragen? Neem contact op met één van onze specialisten!

Frederick Droppert nieuw 1