Actualités
Actualités Tech

Les chercheurs qui brouillent le visage ont mis au point un millier d’algorithmes


En 2012, artificiel Les chercheurs intellectuels ont fait un énorme pas en avant dans la vision par ordinateur, en partie grâce à un ensemble d’images inhabituellement volumineux – des milliers d’objets quotidiens, de personnes et de scènes dans des images découpées à partir du Web et de l’étiquetage manuel. Cet ensemble de données s’appelle ImageNet, est toujours utilisé par milliers QUI recherches et expériences actuelles.

Mais la semaine dernière, chaque visage humain dans ImageNet a soudainement disparu – après que les chercheurs en gestion des ensembles de données ont décidé de les brouiller.

Tout comme ImageNet a contribué à inaugurer une nouvelle ère de l’IA, les efforts pour la surmonter reflètent les défis qui affectent d’innombrables programmes, ensembles de données et produits d’IA.

« Nous sommes préoccupés par les problèmes de confidentialité », a déclaré Olga Russakovsky, professeur adjoint à l’Université de Princeton et l’une des personnes responsables de la gestion d’ImageNet.

ImageNet a été créé dans le cadre de un défi a invité des informaticiens à développer des algorithmes capables d’identifier des objets dans des images. En 2012, c’était une tâche très difficile. Puis une technique a été appelée étudier soigneusement, lié à « enseigner » un réseau neuronal en lui fournissant des exemples étiquetés, démontrant une plus grande maîtrise de la tâche que les approches précédentes.

Depuis lors, l’apprentissage en profondeur a alimenté une renaissance de l’IA, tout en soulignant également les lacunes du domaine. Par exemple, reconnaissance de visage l’utilisation de l’apprentissage en profondeur est particulièrement populaire et lucrative, mais elle est également controversée. Plusieurs villes des États-Unis ont le gouvernement interdit l’utilisation de la technologie sur les préoccupations concernant les atteintes à la vie privée ou les préjugés en matière de citoyenneté, en raison de ces programmes moins précis du côté non blanc.

Aujourd’hui, ImageNet contient 1,5 million d’images avec environ 1 000 étiquettes. Il est principalement utilisé pour évaluer les performances du apprentissage automatique algorithmes ou pour former des algorithmes pour effectuer des tâches de vision par ordinateur spécialisées. Le flou du visage affecte 243 198 photos.

Russakovsky a déclaré que l’équipe ImageNet voulait déterminer s’il était possible de brouiller les visages dans l’ensemble de données sans modifier son niveau de reconnaissance d’objets. « Les gens ont été aléatoires dans les données depuis leur apparition sur des photos Web représentant ces objets », a-t-elle déclaré. En d’autres termes, dans une image montrant une bouteille de bière, même si le visage du buveur est une tache rose, la bouteille elle-même reste intacte.

Dans un article de recherche, publié avec une mise à jour sur ImageNet, l’équipe derrière l’ensemble de données explique qu’il brouille le visage en utilisant les services d’intelligence artificielle d’Amazon Reconnaissance; après ça, ils ont payé Turc mécanique travailleurs pour confirmer les options et les ajuster.

Les chercheurs affirment que le flou du visage n’affecte pas les performances de certains algorithmes de reconnaissance d’objets formés par ImageNet. Ils montrent également que d’autres algorithmes construits avec de tels algorithmes de reconnaissance d’objets ne sont pas affectés de la même manière. «Nous espérons que cette preuve de concept ouvrira la voie aux méthodes de collecte de données visuelles pour avoir une conscience plus claire de la vie privée sur le terrain», déclare Russakovsky.

Ce n’est pas la première tentative de peaufiner la célèbre galerie d’images. En décembre 2019, l’équipe ImageNet ont supprimé les termes biaisés et offensants introduit par les étiqueteurs après un projet appelé Découvrez l’IA attirer l’attention sur le problème.

En juillet 2020 Vinay Prabhu, un scientifique en apprentissage automatique chez UnifyID et Abeba Birhane, doctorant à l’University College Dublin en Irlande, recherche publiée montre qu’ils peuvent identifier des individus, y compris des chercheurs en informatique, dans des ensembles de données. Ils y ont également trouvé des images érotiques.

Prabhu a déclaré qu’il était bon de brouiller le visage, mais il était déçu que l’équipe ImageNet n’ait pas reconnu le travail que lui et Birhane ont accompli.

Le flou de visage peut encore avoir des conséquences indésirables sur les algorithmes entraînés sur les données ImageNet. Par exemple, les algorithmes peuvent apprendre à rechercher des visages flous lors de la recherche d’objets spécifiques.

«Un problème important à prendre en compte est ce qui se passe lorsque vous déployez un modèle entraîné sur un ensemble de données de flou de visage», déclare Russakovsky. Par exemple, un robot entraîné sur l’ensemble de données pourrait être jeté par des visages dans le monde réel.


Les histoires avec WIRED sont plus étonnantes



Source link

Laissez un commentaire