Le MIT (Massachusetts Institute of Technology) a développé STEGO, un algorithme permettant aux intelligences artificielles de mieux identifier les éléments d’une image, proche de la perception humaine.
Comment fonctionne l’identification d’un objet par les IA actuelles
Actuellement, la reconnaissance d’un objet par les IA nécessite qu’un humain dessine une case autour de cet objet dans une image.
Cette technique est connue du grand public grâce aux CAPTCHA, où l’utilisateur doit sélectionner des cases contenant un feu tricolore par exemple.
Le problème est que l’objet peut être associé à d’autres éléments de l’image, comme un chien assis dans l’herbe qui donnera lieu à une case contenant à la fois le chien et de l’herbe.
Comment STEGO améliore la perception des IA
STEGO utilise une technique de segmentation sémantique pour étiqueter chaque pixel de l’image avec une étiquette spécifique.
Ainsi, l’objet « chien » ne contiendra plus de traces d’herbe, comme si vous utilisiez le lasso magnétique sur Photoshop au lieu du lasso polygonal.
Cependant, cette technique nécessite de traiter un par un chacun des 65’536 pixels d’une image, ce qui est impossible sans l’aide d’une base de données contenant des objets similaires pour compléter l’apprentissage de l’algorithme.
STEGO est utile dans des situations complexes où même un expert peut avoir du mal à analyser une image
Dans le cas d’images complexes comme de l’imagerie médicale ou spatiale, il peut être difficile de trouver un élément précis sans les connaissances d’un expert.
Cependant, avec l’émergence de nouveaux domaines et les progrès technologiques, il arrive que même un expert éprouve des difficultés à analyser une image.
Dans ces cas, STEGO peut être entraîné sur une grande variété d’images, de l’intérieur d’une maison aux prises de vues à haute altitude, pour offrir des performances deux fois supérieures aux précédents systèmes de segmentation.
STEGO permet de développer de nouvelles technologies
En plus d’améliorer la perception des IA, STEGO permet également de développer de nouvelles technologies, comme des robots pouvant naviguer dans des environnements complexes ou des systèmes de reconnaissance de la parole.
Selon Mark Hamilton, doctorant au MIT et ingénieur logiciel chez Microsoft, « STEGO est un grand pas en avant pour la reconnaissance de l’objet, mais il y a encore beaucoup de travail à faire pour parvenir à un niveau de reconnaissance comparable à celui de l’être humain ».
STEGO est un algorithme permettant aux IA de mieux identifier les éléments d’une image, proche de la perception humaine. Il utilise une technique de segmentation sémantique pour étiqueter chaque pixel de l’image avec une étiquette spécifique, ce qui permet d’améliorer la reconnaissance d’un objet sans être associé à d’autres éléments de l’image. STEGO peut être utilisé dans des situations complexes où même un expert peut avoir du mal à analyser une image, et peut être développé pour de nouvelles technologies comme la reconnaissance de la parole ou la navigation de robots dans des environnements complexes. Cependant, il y a encore beaucoup de travail à faire pour atteindre un niveau de reconnaissance comparable à celui de l’être humain.