
Intelligence artificielle(IA) se révèle très habile dans certaines tâches - commeinventer des visages humainsqui n'existent pas réellement, ougagner des parties de poker– mais ces réseaux ont encore du mal quand il s'agit de quelque chose que les humains font naturellement : imaginer.
Une fois que les êtres humains savent ce qu'est un chat, nous pouvons facilement imaginer un chat d'une couleur différente, ou un chat dans une pose différente, ou un chat dans un environnement différent. Pour les réseaux d'IA, c'est beaucoup plus difficile, même s'ils peuvent reconnaître un chat quand ils le voient (avec suffisamment d'entraînement).
Pour tenter de débloquer la capacité d'imagination de l'IA, des chercheurs ont mis au point une nouvelle méthode permettant intelligence artificielle systèmes pour déterminer à quoi un objet devrait ressembler, même s'ils n'en ont jamais vu un exactement comme celui-ci auparavant.
'Nous nous sommes inspirés des capacités de généralisation visuelle humaine pour essayer de simuler l'imagination humaine dans les machines', dit l'informaticien Yunhao Ge de l'Université de Californie du Sud (USC).
«Les humains peuvent séparer leurs connaissances acquises par des attributs – par exemple, la forme, la pose, la position, la couleur – puis les recombiner pour imaginer un nouvel objet. Notre article tente de simuler ce processus à l'aide de réseaux de neurones.
La clé est l'extrapolation - être capable d'utiliser une grande banque de données de formation (comme des images d'une voiture) pour ensuite aller au-delà de ce qui est vu dans ce qui est invisible. C'est difficile pour l'IA en raison de la façon dont elle est généralement formée pour repérer des modèles spécifiques plutôt que des attributs plus larges.
Ce que l'équipe a mis au point ici s'appelle l'apprentissage de représentation désenchevêtré contrôlable, et il utilise une approche similaire à celles utilisées pourcréer des deepfakes– démêler différentes parties d'un échantillon (séparant ainsi le mouvement du visage et l'identité du visage, dans le cas d'une vidéo deepfake).
Cela signifie que si une IA voit une voiture rouge et un vélo bleu, elle pourra alors 'imaginer' un vélo rouge pour elle-même - même si elle n'en a jamais vu auparavant. Les chercheurs ont rassemblé cela dans un cadre qu'ils appellent l'apprentissage supervisé en groupe.
Extrapolation de nouvelles données à partir des données d'entraînement. (Itti et al., 2021)
L'une des principales innovations de cette technique est le traitement des échantillons en groupes plutôt qu'individuellement, et la construction de liens sémantiques entre eux au fur et à mesure. L'IA est alors capable de reconnaître les similitudes et les différences dans les échantillons qu'elle voit, en utilisant ces connaissances pour produire quelque chose de complètement nouveau.
'Cette nouvelle approche de désenchevêtrement, pour la première fois, libère véritablement un nouveau sens de l'imagination dans les systèmes d'IA, les rapprochant de la compréhension humaine du monde', dit l'informaticien de l'USC Laurent Itti .
Ces idées ne sont pas completement nouveau , mais ici les chercheurs ont poussé les concepts plus loin, rendant l'approche plus flexible et compatible avec d'autres types de données. Ils ont également rendu le framework open source, afin que d'autres scientifiques puissent l'utiliser plus facilement.
À l'avenir, le système développé ici pourrait se prémunir contre les biais de l'IA en supprimant les attributs plus sensibles de l'équation - en aidant à créer des réseaux de neurones qui ne sont pas racistes ou sexistes, par exemple.
La même approche pourrait également être appliquée dans les domaines de la médecine et des voitures autonomes, selon les chercheurs, avec une IA capable 'd'imaginer' de nouveaux médicaments ou de visualiser de nouveaux scénarios routiers pour lesquels elle n'a pas été spécifiquement formée dans le passé.
'L'apprentissage en profondeur a déjà démontré des performances et des promesses inégalées dans de nombreux domaines, mais cela s'est trop souvent produit par mimétisme superficiel et sans une compréhension plus approfondie des attributs distincts qui rendent chaque objet unique', dit Itti .
La recherche a été présentée au 2021 Conférence internationale sur les représentations de l'apprentissage et peut être lu ici .