Van wie is het model?

26 okt 2020

Hoe kan men de juridische relatie tussen een ontwikkelaar van machine learning (‘ML’) of artificial intelligence (‘AI’) modellen en zijn klanten vormgeven? De klant heeft in deze casus eigen data(set) en een specifieke vraag die ze graag beantwoord wil zien worden. De ontwikkelaar beantwoordt de vraag krijgt hier een vergoeding voor. Hoe kunnen ze hun samenwerking regelen? In dit blog zet ik drie mogelijke relatievormen uiteen die bij verschillende doelen van klant en ontwikkelaar passen. In dit artikel wordt met model een gekozen machine learning model met genoeg instellingen om getraind te worden bedoeld en met algoritme een getraind model.

1. Algoritme als een Dienst
De klant komt bij de ontwikkelaar en levert daar haar data aan en de vraag die ze beantwoord wil zien worden. De ontwikkelaar gaat aan het werk. Hij schoont de data op, verduidelijkt de vraagstelling en kiest vervolgens een model. Met dit model en de voorbereidende stappen kan hij met meer data in de toekomst nieuwe algoritmes trainen. De ontwikkelaar heeft nu een algoritme wat op basis van nieuwe data een voorspelling kan gaan doen. Dit algoritme zet de ontwikkelaar op een server waardoor de klant via een website of een API nieuwe data kan sturen en de resultaten krijgt. In dit geval heeft de klant dus alleen een dienst gekocht en heeft de ontwikkelaar in ieder geval een kopie van de data(set).

2. Algoritme als Software
De klant komt bij de ontwikkelaar op dezelfde manier als hiervoor. De klant heeft echter een extra eis. Ze wil het algoritme zelf kunnen inspecteren en op haar eigen servers zetten. De redenen om het algoritme te willen inspecteren kan voortkomen uit een wettelijke verplichting of een ethische vereiste met betrekking tot de verantwoording van de resultaten van het algoritme.

De ontwikkelaar heeft hier nog steeds toegang nodig tot de data en zal ook de voorbewerking daarvan waarschijnlijk doen. Hierna kiest hij weer een model en daarmee kan hij met de data een algoritme trainen. Nu zal hij echter dit algoritme aan de klant moeten verstrekken onder een licentie. De klant kan dan zelf het algoritme gebruiken voor voorspellingen. Ze kan ook de vereiste analyse en uitleg van het algoritme zelf doen.

3. Detachering
Als meest extreme geval kan het ook zo zijn dat de klant wel de expertise van de ontwikkelaar wil, maar dat ze controle over haar data wil houden. In dit geval zal de ontwikkelaar fysiek of digitaal naar de klant moeten gaan. Daar gaat de ontwikkelaar bij de klant het ontwikkelingsproces doorlopen en dan zal de klant dus zowel controle over de data(set), het model als het algoritme houden. De klant zal nu het grootste deel van de verantwoordelijkheid (en aansprakelijkheid) voor het algoritme moeten dragen.

Conclusie

De partijen zullen samen moeten overleggen over welke inrichting het handigst is voor hen en hoe zaken als toegang tot data, beveiliging van data en verwijdering van data geregeld wordt.

Verder moet de ontwikkelaar erop bedacht zijn dat zelfs als hij de ruwe data van de klant schoonmaakt, indexeert, ordent en vervolgens bewerkt om de data klaar te maken voor het trainen van het model, hij deze data niet zomaar voor andere projecten mag gebruiken. Er is een goede kans dat de klant namelijk een databankrecht op deze bewerkte data heeft.

Tips voor opdrachtgevers
  • Bepaal hoeveel toegang je nodig hebt tot het algoritme voor bijvoorbeeld wettelijke vereisten van het uitleggen van de analyses
  • Bedenk hoeveel verantwoordelijkheid je zelf wil dragen als organisatie
  • Bepaal of je eenmalig een algoritme wil of dat je steeds met nieuwe data(sets) het algoritme wil upgrade
  • Ga na of je voldoende waarborgen hebt gekregen om ethisch verantwoord met het algoritme te kunnen werken
Tips voor ontwikkelaars
  • Bespreek met de opdrachtgever hoe die het algoritme willen gebruiken
  • Bepaal de verdeling van verantwoordelijkheden met de opdrachtgever
  • Bedenk welke diensten je aan wil bieden aan de klant, van expertise tot volledige hosting of er tussenin
  • Voor de auteursrechtelijke bescherming van je algoritmes en modellen is het van belang of er persoonlijke keuzes zijn gemaakt en het model voldoende complex is. Het model wat je hebt gekozen moet dan dus niet de enige zijn die aan de technische eisen van het probleem voldoet.
Wat kunnen wij voor u betekenen?

AI/ML zijn niet in de wet verankerd. Dit betekent dat partijen die gaan werken met AI/ML technologie over verschillende aspecten van de opdracht afspraken moeten maken om de onderlinge juridische posities alsnog te bepalen. Onderwerpen zoals de selectie van data(sets), hoe wordt een model getraind, hoe kan je je model en algoritmes beschermen, wie is waar verantwoordelijk / aansprakelijk voor, wie mag wat met het algoritme, wat mag er verwacht worden van het algoritme en (hoe) kunnen de uitkomsten van het model uitgelegd worden.

Voor vragen kunt u contact opnemen met Jos van der Wijst.
Dit artikel is geschreven door Robin Verhoef en Jos van der Wijst.