Le Machine Learning pour prédire l'avenir de la planète

Suivre l’actualité des marchés
L'apprentissage automatique continue de progresser vers une relation toujours plus étroite entre données, monde physique et capacités prédictives.

Données, capacités d'analyse, intelligence artificielle: la technologie est un outil qui peut être utilisé dans divers secteurs et à différentes fins. L'un des plus urgents est la protection de l'environnement. Apprendre aux machines comment fonctionne le monde physique permet en effet de prévoir ce qui pourrait se passer dans les années à venir, et ainsi faire les meilleurs choix.

Le lien entre données et environnement

Le Machine Learning (en français apprentissage machine ou apprentissage automatique) est un segment de l'intelligence artificielle qui se nourrit de données, qui les élabore et qui, grâce à des algorithmes, lance ou propose des actions. L'apprentissage machine permet notamment d'identifier les e-mails frauduleux ou de recommander des films à regarder sur les plateformes de streaming. Le même principe, bien que complexifié, peut être appliqué à l'environnement et à la planète.

Lors de la Conférence internationale 2020 sur l'exploitation des données, une équipe de chercheurs de l'Université du Minnesota, de l'Université de Pittsburgh et de la US Geological Survey a présenté une étude sur la capacité de prédire le flux et les températures des réseaux fluviaux. Le modèle élaboré permet d'obtenir des prévisions, même quand on manque de données disponibles, comme c'est souvent le cas pour les rivières et les torrents. L'apprentissage machine a en effet besoin d'une grande quantité d'informations, sélectionnées de manière précise. L'enjeu est donc fondamental pour rendre l'apprentissage automatique efficace même quand le volume de données n'est pas très fourni, surtout dans un système complexe comme celui de la Terre.

Prévoir le flux et les températures des cours d'eau grâce à l'apprentissage machine

L'étude s'est concentrée sur la température des cours d'eau, car elle représente une variable centrale dans l'équilibre des habitats, dans les taux d'évaporation et dans la production d'énergie thermoélectrique. «Prévoir de manière précise la température de l'eau [...] permet de soutenir le processus de décision des gestionnaires de ressources», a expliqué Xiaowei Jia, professeur du Département informatique de l'Université de Pittsburgh. «Cela leur permet par exemple de déterminer le moment et la quantité d'eau à libérer des bassins hydriques dans les rivières en aval.»

Mais le Machine Learning est souvent critiqué pour sa capacité pas toujours efficace à identifier un lien entre les données d'entrée et de sortie dans le monde physique. Il s'agit d'un réel problème, surtout quand les données ne sont pas suffisantes. L'étude tente de surmonter cet obstacle avec un apprentissage automatique «guidé par la connaissance». Concrètement, des connaissances scientifiques spécifiques et approfondies servent de base pour le développement de l'algorithme, permettant ainsi d'obtenir des précisions efficaces même quand les données sont rares, voire carrément absentes.

L'apprentissage machine: l'application sur les «écosystèmes non surveillés»

L'étude américaine a été appliquée au bassin du fleuve Delaware, afin de mieux gérer l'accès en eau potable des 15 millions d'habitants alentours et de garantir une température favorable aux habitats des espèces fluviales. Mais la même approche s'avère efficace pour des systèmes à plus petite échelle. Une autre étude, financée par la National Science Foundation, a montré que des modèles d'apprentissage automatique «qui se fondent sur la connaissance» pouvaient être utiles pour formuler des prévisions notamment à l'intérieur d'écosystèmes (dans ce cas-ci, des lacs) non surveillés, c'est-à-dire sans aucun relevé ni donnée. Comment ? Des modèles élaborés à partir d'autres écosystèmes lacustres ont été appliqués. L'approche montre donc une grande capacité d'adaptation, permettant d'appliquer le potentiel de l'apprentissage machine à une part croissante du monde physique. Les fleuves et les lacs sont en réalité qu'un exemple d'utilisation judicieuse des données en faveur de la planète.