Dans une initiative visant à élargir l’accès aux données scientifiques de la NASA pour l’intelligence géospatiale et à accélérer les découvertes liées au climat, IBM et la plateforme d’intelligence artificielle open source Hugging Face ont annoncé aujourd’hui que le modèle géospatial watsonx.ai d’IBM – construit à partir des données satellites de la NASA – sera désormais disponible en open source sur Hugging Face. Il s’agira du plus grand modèle d’intelligence géospatiale disponible sur Hugging Face et du premier modèle d’intelligence artificielle open source créé en collaboration avec la NASA.
Un modèle open source pour comprendre et analyser les données environnementales
L’accès aux données les plus récentes reste un défi majeur en science du climat, où les conditions environnementales changent presque quotidiennement. Malgré l’augmentation des quantités de données – selon les estimations de la NASA, les scientifiques disposeront de 250 000 téraoctets de données provenant de nouvelles missions d’ici 2024 – les chercheurs et les scientifiques font encore face à des obstacles pour analyser ces vastes ensembles de données. Dans le cadre d’un accord avec la NASA, IBM s’est engagé plus tôt cette année à construire un modèle d’intelligence artificielle pour les données géospatiales. Et maintenant, en rendant un modèle de base géospatial disponible via Hugging Face – une référence en matière de modèles transformers open source – les efforts peuvent progresser pour démocratiser l’accès et l’application de l’intelligence artificielle afin de générer de nouvelles innovations en matière de climat et de sciences de la Terre.
L’IA au service du changement climatique vu par les experts d’IBM et de Hugging Face
« S’il y a bien un domaine où les technologies open source jouent un rôle essentiel pour accélérer les découvertes critiques, c’est le changement climatique », a déclaré Sriram Raghavan, vice-président de la recherche en IA chez IBM. « En combinant les efforts de création de modèles de base d’IBM visant à créer des systèmes d’IA flexibles et réutilisables avec le référentiel de données de la NASA sur les satellites terrestres, et en le rendant disponible sur la principale plateforme d’IA open source, Hugging Face, nous pouvons exploiter la puissance de la collaboration pour mettre en œuvre des solutions plus rapides et plus impactantes qui amélioreront notre planète. »
« Le domaine de l’IA reste un domaine scientifique, et la science ne peut progresser que grâce au partage d’informations et à la collaboration », a déclaré Jeff Boudier, responsable du produit et de la croissance chez Hugging Face. « C’est pourquoi l’IA open source et la publication ouverte de modèles et de jeux de données sont si fondamentales pour la progression continue de l’IA et pour s’assurer que cette technologie bénéficie au plus grand nombre de personnes possible. »
« Nous pensons que les modèles de base ont le potentiel de changer la manière dont les données d’observation sont analysées et de nous aider à mieux comprendre notre planète », a déclaré Kevin Murphy, responsable scientifique des données à la NASA. « Et en rendant ces modèles disponibles en open source et en les mettant à disposition du monde entier, nous espérons multiplier leur impact. »
Un modèle entraîné minutieusement
Le modèle, entraîné conjointement par IBM et la NASA sur des données satellitaires Harmonized Landsat Sentinel-2 (HLS) sur une période d’un an couvrant les États-Unis continentaux, puis affiné à l’aide de données étiquetées pour la cartographie des inondations et des cicatrices de brûlure, a déjà démontré une amélioration de 15 % par rapport aux techniques de pointe en utilisant la moitié moins de données étiquetées. Avec un affinage supplémentaire, le modèle de base pourra être réutilisé pour des tâches telles que le suivi de la déforestation, la prédiction des rendements des cultures ou la détection et la surveillance des gaz à effet de serre. Les chercheurs d’IBM et de la NASA travaillent également avec l’université de Clark pour adapter le modèle à des applications telles que la segmentation et la recherche de similarité dans les séries chronologiques.
Une collaboration innovante pour faire avancer la science ouverte
Cette nouvelle fait suite à l’annonce d’IBM plus tôt cette année de collaborer avec la NASA pour construire un modèle d’IA capable d’accélérer l’analyse des images satellites et de stimuler les découvertes scientifiques. Elle s’inscrit également dans le cadre de l’initiative scientifique open source décennale de la NASA visant à créer une communauté scientifique plus accessible, inclusive et collaborative. La NASA, avec la Maison Blanche et d’autres agences fédérales, a déclaré l’année 2023 comme l’année de la science ouverte pour célébrer les avantages et les succès créés grâce au partage ouvert des données, des informations et des connaissances.
Vers la commercialisation du modèle géospatial
Le modèle exploite la technologie des modèles de base d’IBM et s’inscrit dans le cadre des efforts plus importants d’IBM pour créer et entraîner des modèles d’IA pouvant être utilisés pour différentes tâches et appliquer des informations d’une situation à une autre. En juillet, IBM a annoncé la disponibilité de watsonx, une plateforme d’IA et de données permettant aux entreprises de mettre à l’échelle et d’accélérer l’impact de l’IA la plus avancée avec des données fiables. Une version commerciale du modèle géospatial, faisant partie de watsonx d’IBM, sera disponible dans le cadre du IBM Environmental Intelligence Suite (EIS) plus tard cette année.
Pour plus d’informations sur cette collaboration, consultez le blog de recherche d’IBM.
Les déclarations concernant l’orientation future et les intentions d’IBM sont susceptibles de changer ou d’être retirées sans préavis et représentent des objectifs uniquement.