Het Amerikaanse technologiebedrijf IBM heeft zonder toestemming van de gefotografeerden een miljoen foto’s van fotosite Flickr gebruikt om kunstmatige intelligentie op gezichtsherkenning te trainen, ontdekte nieuwszender NBC. IBM biedt de database ook aan voor gebruik door andere onderzoekers.

Yahoo, de eigenaar van Flickr, bood in 2014 een pakket van 100 miljoen foto’s aan voor onderzoekers. Er zijn veel van dergelijke datasets in de omloop: ze worden veel gebruikt voor onderzoek naar gezichtsherkenning. De gefotografeerden worden lang niet altijd om toestemming gevraagd.

IBM zou de foto’s met duidelijke gezichten uit het aanbod hebben gehaald, zo’n één miljoen. Aan die foto’s werden bijna tweehonderd mogelijke eigenschappen toegekend, waaronder huidskleur, leeftijd en geslacht.

NBC benaderde verschillende mensen die in de foto-database voorkomen. Sommige waren “geschokt en ontdaan” dat hun foto’s op deze manier werden gebruikt.

Mensen die in de dataset zitten, kunnen aan IBM vragen om hun foto’s uit het aanbod te verwijderen. IBM maakt het echter niet mogelijk om in te zien óf je in het aanbod zit: NBC heeft daarvoor een tool gemaakt.

Diverse gezichten

De foto’s biedt het bedrijf nu aan als onderdeel van de dataset ‘Diversity in Faces’ . Volgens IBM is de dataset bedoeld om gezichtsherkenningssystemen ‘eerlijker’ te maken, door netwerken te trainen op meer diverse gezichten.

Eerder deze maand publiceerde Georgia Tech onderzoek waaruit bleek dat zelfrijdende auto’s mensen met een zwarte huidskleur minder goed herkennen. Privacywaakhonden maken zich zorgen dat de technologie ook misbruikt kan worden door de politie, bijvoorbeeld voor racial profiling.

https://www.nu.nl/internet/5787516/ibm-biedt-zonder-toestemming-fotodatabase-gezichtsherkenning-aan.html