Het is het gesprek van de dag onder juristen: het AI-programma ChatGPT is voor het eerst als bron genoemd in een uitspraak door een Nederlandse rechter. Zo vatte het FD de ophef van de dag (van vorige week samen). In een vonnis over rendementsverlies van zonnepanelen schatte de rechter de gemiddelde levensduur van zonnepanelen uit 2009 met behulp van ChatGPT.

Een keer moet de eerste keer zijn, en op zich is dit niet héél spannend. Het ging niet om een feitenonderzoek of het opbouwen van een juridische redenering (dit zou een hoogrisico-toepassing onder de AI Act zijn), maar om het achterhalen van een schatting. Om precies te zijn:

De kantonrechter schat, mede met behulp van ChatGPT, de gemiddelde levensduur van zonnepanelen uit 2009 op 25 à 30 jaar; die levensduur wordt daarom hier op 27,5 jaar gesteld.

Dit is nodig om het rendementsverlies over de resterende levensduur te kunnen berekenen. Dat is verder niet zo belangrijk, waar het hier om gaat is: kun je ChatGPT voor zo’n feitenonderzoek inzetten?

Enerzijds: we weten allemaal dat dit soort grote taalmodellen nog geen feit zou herkennen als het zichzelf paars had geverfd en naakt zou dansen op een klavecimbel. Het systeem genereert een stelsel van woorden op basis van waarschijnlijkheden, en dat is het. Geen redeneerregels, geen rekencapaciteit en geen besef van concepten. Na ‘gemiddelde’ komt vaak ‘levensduur’ en na ‘levensduur’ komt vrijwel altijd ‘van’.

Anderzijds: die waarschijnlijkheden komen niet uit de lucht vallen maar zijn gebaseerd wat Mensen Op Het Internet allemaal vinden. Je zou dan dus kunnen zeggen, de uitvoer van ChatGPT is grofweg de consensus over hoe je iets zegt, dit is gemiddeld wat men vindt. En op internet zégt iedereen dat de gemiddelde levensduur van zonnepanelen 25 à 30 jaar is, dus dat zal dan wel de consensus zijn.

Waarom deed de rechter dit eigenlijk? De eiser had een “moeilijk volgbare eigen berekening in de dagvaarding opgenomen” over wat de schade is (onder meer iets met gemiste subsidie). Wat de gedaagde aan schade had geschat zie ik niet terug. Het had mij dan logisch geleken om te zeggen, de schade is niet goed onderbouwd dus niet aangetoond, maar mogelijk dat de rechter dat te cru vond.

Echter, al in 2011 bepaalde de Hoge Raad dat rechters niet mogen googelen:

[de rechter mag geen] eigener beweging verkregen feitelijke gegevens aan zijn beslissing ten grondslag mag leggen zonder partijen in de gelegenheid te stellen daarvan kennis te nemen en zich daarover desgewenst uit te laten.

Als dit was gebeurd, had ik het een stuk minder opmerkelijk gevonden: heren, dit is de consensus voor wat betreft de levensduur, en dan kom je uit op dit schadebedrag, graag uw commentaar. Wie dan vindt dat de GPT-schatting van de consensus niet klopt, kan daar dan op reageren.

Arnoud