Is Open Source-AI vrijgesteld van transparantie eisen?

29 feb 2024

De verplichtingen van de AI Act zijn in beginsel niet van toepassing op AI-modellen die onder vrije en open source licenties worden vrijgegeven. Maar wat is Open Source-AI precies en welke uitzonderingen gelden? In deze blog nemen we je mee.

Definitie

Één duidelijke, vaste definitie van ‘open-source’ wordt niet gegeven in de AI Act, maar in de tekst van de Verordening kunnen we wel een aantal aanknopingspunten vinden:

  • AI-modellen voor algemene doeleinden, die onder een vrije en open source licentie worden vrijgegeven, worden geacht hoge niveaus van transparantie en openheid te garanderen door hun parameters, met inbegrip van de gewichten, de informatie over de modelarchitectuur en de informatie over het gebruik van het model openbaar te maken.
  • Een licentie wordt geacht vrij en open source te zijn wanneer de gebruikers de software en gegevens, inclusief modellen, kunnen runnen, kopiëren, verspreiden, bestuderen, wijzigen en verbeteren op voorwaarde dat de oorspronkelijke leverancier van het model vermeld wordt en de identieke of vergelijkbare distributievoorwaarden worden gerespecteerd.

Uitzonderingen

De verplichtingen van de AI Act zijn zoals gezegd in beginsel niet van toepassing op AI-modellen die onder vrije en open source licenties worden vrijgegeven (oftewel: ‘Open Source AI-modellen). Dit is anders wanneer het Open Source AI-systeem op de markt wordt gebracht of in gebruik wordt genomen als AI-systeem met een hoog risico of als het een AI-systeem is dat onder de titels II en IV valt. Hierbij gaat het om verboden AI-toepassingen, GPAI-modellen en ‘bepaalde AI-systemen’ (zoals AI-systemen die beeld-, audio- of video-inhoud genereren of manipuleren om een deep fake te creëren, emotieherkenningssystemen en biometrische categorisatiesystemen).

Om het wat ingewikkelder te maken, geldt op de uitzondering van GPAI-modellen (waardoor de AI Act toch wél van toepassing is op Open Source AI-modellen), weer een uitzondering die blijkt uit overweging 60f van de AI Act:

AI-modellen voor algemene doeleinden die onder een vrije en open source licentie worden vrijgegeven (hierna: ‘Open Source GPAI’) en waarvan de ‘parameters, including the weights, the information on the model architecture, and the information on model usage’ openbaar worden gemaakt, zijn uitgezonderd van de transparantievereisten die aan GPAI’s worden gesteld (in art. 52 van de AI Act). Dus: de verplichtingen uit de AI Act gelden wel voor de Open Source GPAI’s, maar de transparantieverplichtingen niet.

Maar, wanneer deze Open Source GPAI’s een systeemrisico inhouden, gaat die vlieger niet meer op. Het feit dat het model transparant is en onder een open source licentie wordt vrijgegeven is dan niet voldoende reden om de naleving van de verplichtingen van de AI Act uit te sluiten.

Een systeemrisico

Een systeemrisico is een risico specifiek voor GPAI’s met grote gevolgen voor de interne markt vanwege de reikwijdte ervan, en met daadwerkelijke of redelijkerwijs te verwachten negatieve gevolgen voor de volksgezondheid, de openbare veiligheid, de openbare veiligheid, de grondrechten of de samenleving als geheel, die zich op grote schaal in de waardeketen kunnen verspreiden.

Het kan dus zo zijn dat een Open Source GPAI een systeemrisico inhoudt, waardoor de transparantieverplichtingen voor GPAI’s uit art. 52 alsnog gelden.

Bovendien, onthullen Open Source GPAI’s niet noodzakelijkerwijs substantiële informatie over de dataset die is gebruikt voor het trainen of afstemmen van het model. Hetzelfde geldt voor de informatie over de wijze waarop daarbij de naleving van het auteursrecht is gewaarborgd. De transparantie uitzondering voor Open Source GPAI’s, geldt daarom dus niet ten aanzien van de verplichting om een samenvatting te maken van de inhoud die is gebruikt voor de modeltraining en de verplichting om een beleid in te voeren om het auteursrecht van de Unie te respecteren.

Dit betekent dat dus in ieder geval, ook als er geen sprake is van een systeemrisico, zal een Open Source GPAI dus een samenvatting moeten maken van de inhoud die is gebruikt voor de modeltraining en een beleid moeten voeren om het auteursrecht te respecteren.

Samengebracht in een schematisch overzicht ziet het er zo uit:

Tabel Open Source AI

Verder worden de ontwikkelaars van Open Source instrumenten, diensten, processen of AI-componenten anders dan GPAI worden aangemoedigd om algemeen aanvaarde documentatiepraktijken toe te passen, zoals modelkaarten en gegevensbladen, als een manier om het delen van informatie langs de AI-waardeketen te versnellen, waardoor de bevordering van betrouwbare AI-systemen mogelijk wordt.

Waarom worden Open Source AI-modellen uitgezonderd?

Software en gegevens, met inbegrip van modellen, die worden vrijgegeven onder een open source-licentie waardoor ze openlijk kunnen worden gedeeld en gebruikers ze of gewijzigde versies ervan vrij kunnen openen, gebruiken, wijzigen en verspreiden, kunnen bijdragen aan onderzoek en innovatie op de markt en kunnen aanzienlijke groeikansen bieden voor de economie van de Unie. Dit is een afweging die de Europese wetgever heeft gemaakt, om een chilling effect op open-source ontwikkeling te voorkomen.

Een open einde

Hoewel Open Source AI-modellen in beginsel zijn vrijgesteld van de verplichtingen van de AI Act, zijn er ook belangrijke uitzonderingen. Vooral wanneer deze systemen worden beschouwd als hoog-risico of vallen onder specifieke categorieën die strengere transparantie- en compliance-eisen stellen. De vrijstelling van Open Source AI-modellen onderstreept het belang dat de Europese wetgever hecht aan het bevorderen van transparantie, innovatie en groei binnen de AI-sector.

Voor ontwikkelaars en gebruikers van Open Source AI-modellen is het van belang dat zij zich bewust zijn van de relevante wettelijke kaders en de waarde van best practices in documentatie en naleving, zelfs in de open-source context. Heb je vragen over de impact van de AI Act op Open Source AI-systemen, de specifieke uitzonderingen of hoe je kunt vaststellen of jouw AI-systeem hoog-risico is? Neem dan contact op met Jos van der Wijst.

Jos van der Wijst