KB beperkt toegang collecties voor trainen commerciële AI

De KB wil niet dat commerciële bedrijven zonder toestemming digitale bronnen gebruiken voor het trainen van AI. Dit past niet bij de AI-principes die de KB heeft opgesteld. De KB heeft inmiddels maatregelen genomen om dit gebruik te beperken en brengt hierover vandaag een statement naar buiten.

Generatieve AI

Generatieve Artificial Intelligence (AI) is een vorm van kunstmatige intelligentie die automatisch nieuw materiaal kan genereren. Zo’n AI-model wordt getraind met bestaande data zoals tekst of afbeeldingen. Hieruit haalt het model veel voorkomende patronen zoals bepaalde woordcombinaties. Een chatbot als ChatGPT gebruikt dit vervolgens om een nieuwe tekst te schrijven aan de hand van de input die je geeft. Hoe meer trainingsdata zijn gebruikt, hoe beter de resultaten van het AI-model.

Auteursrecht en privacy respecteren

De KB maakt veel werk van schrijvers, illustratoren en uitgevers online toegankelijk. Deze digitale bronnen worden door commerciële AI-bedrijven op grote schaal binnengehaald om AI-modellen te trainen.

‘Wij vinden dat AI-toepassingen op een ethisch verantwoorde manier tot stand moeten komen. Zo vinden wij het belangrijk dat het auteursrecht wordt gerespecteerd, dat er aan bronvermelding wordt gedaan en dat persoonsgegevens worden beschermd’, licht KB-directieteamlid Martijn Kleppe toe. ‘Dat is bij veel commerciële AI-bedrijven niet het geval. Zij vragen geen toestemming voor het binnenhalen van deze data en zijn niet transparant over de manier waarop deze data worden gebruikt.’

Om het gebruik van digitale bronnen door commerciële AI-bedrijven te beperken heeft de KB de gebruiksvoorwaarden voor de websites Delpher en DBNL aangepast en technische maatregelen genomen. Kleppe: ‘We zullen er uiteraard voor zorgen dat regulier gebruik van onze digitale bronnen niet zal worden gehinderd.’

Toegang zo open mogelijk

Volgens Kleppe blijft het KB-beleid om zo open mogelijk toegang te bieden tot informatie. ‘Een belangrijk doel van de KB is om onderzoek op basis van onze collecties zoveel mogelijk te stimuleren. Daarbij omarmen we digitale ontwikkelingen en de mogelijkheden van AI. Maar dan wel op een manier die past bij de AI-principes die we als KB in 2020 hebben opgesteld.’

Op 12 januari neemt de KB deel aan Publiek Domeindag in Beeld & Geluid. De vraag of rechtenvrij erfgoed beschikbaar gesteld moet worden voor AI-training zal op deze dag tijdens een paneldiscussie worden behandeld. Kijk voor meer informatie op de site van Publiek Domeindag.

De KB draagt ook bij aan de ontwikkeling van het Nederlandse open taalmodel GPT-NL. Daarmee wordt een belangrijke stap gezet richting transparant, eerlijk en toetsbaar gebruik van AI.

Meer weten over wat wij doen op gebied van AI?

Generatieve AI

Auteursrecht en privacy respecteren

Toegang zo open mogelijk

Meld je aan voor de KB-nieuwsbrief

Meer nieuws

Programmalijn Verbonden digitaal erfgoed van start

We publiceren de Schadeatlas ontwerptekeningen

Samenwerking tussen bibliotheken, Belastingdienst en Dienst Toeslagen met 4 jaar verlengd