Photo: Unsplash

Machine learning au service du journalisme d’investigation

Des enquêtes d’un nouveau genre. Des enquêtes qui poussent le data journalisme à un autre niveau. Des enquêtes dans lesquelles l’intelligence artificielle s’avère être l’alliée des journalistes.

Glossaire:
Machine learning: la capacité d’un ordinateur à apprendre automatiquement grâce à des données préalablement entrées dans la machine (par un humain)
Open source: accessibles à tout un chacun via Internet

“Avec l’intelligence artificielle, vous avez un cerveau en plus dans la pièce.” Voilà ce qu’affirmait le panel de journalistes lors de la conférence Using AI to tackle “impossible” investigations au Festival International du Journalisme de Perugia. Oubliez les ordinateurs qui écrivent à votre place et les algorithmes qui récoltent des milliers de données pour vous proposer un contenu personnalisé sur les sites web. Ici, l’intelligence artificielle est votre amie.

Cette technologie peut en effet aider les (data) journalistes dans leurs enquêtes. Pourtant, tout comme dans le data journalisme, il s’agit de traiter des données. Quelle différence y a-t-il entre les deux?

La machine se déguise en lanceuse d’alerte

Grâce à l’intelligence artificielle, on peut traiter encore plus de données et mettre en évidence des informations ou des variables invisibles à l’œil nu. “Ça renverse la situation” explique Lucia Walinchus, journaliste et directrice de l’Eye on Ohio. 

Ce n’est plus le journaliste qui dit à l’ordinateur: “voici les facteurs que tu dois regarder”, c’est la machine qui dit au journaliste: “regarde cette variable, ça vaut peut-être la peine d’investiguer”. 

Lors de la conférence, Clayton Aldern, journaliste à Grist, a ajouté que le machine learning (ndlr: l’apprentissage automatique, la première étape de l’intelligence artificielle), contrairement au data journalisme, permet d’avoir une “conversation algorithmique.” C’est-à-dire que, concrètement, à l’inverse d’un simple tableau de données, l’ordinateur peut vous répondre. Presque comme si c’était une vraie personne. Un avantage indéniable.

Une technique qui porte ses fruits

À Perugia, le public a notamment découvert une enquête de l’Eye on Ohio. Celle-ci porte sur la manière dont les autorités gèrent les land banks à Cleveland aux États-Unis (ndlr: regroupement de parcelles de terrain en vue d’une vente ou d’un développement futur). 

En bref, l’État peut saisir les terrains et maisons des personnes qui ne paient pas leurs taxes. Ces terrains et maisons deviennent alors des land banks

Les journalistes Lucia Walinchus et Emily Crebs se sont demandé si l’on pouvait prédire, à partir de données sur le logement, quels terrains et maisons pourraient être saisis et sur quelle base. La réponse est oui et ce, même si la ville de Cleveland ne leur a pas transmis d’informations. Grâce au machine learning, les journalistes ont même identifié quels facteurs rendent les logements plus enclins à être restaurés. 

Une technologie pas si compliquée

Cette méthode de travail est-elle facilement applicable dans une rédaction? Quelles sont les ressources nécessaires pour y parvenir? Voici un petit guide pratique pour répondre à ces questions:

L’utilisation de l’intelligence artificielle a été présentée comme une petite révolution lors de la conférence. Cette technologie, tout comme les autres outils utilisés par les data journalistes, s’avère pratique. Toutefois, un risque persiste. Celui de la sécurité des données.

Les nombreux cas de hacking, notamment en Suisse, montrent qu’il faut redoubler de vigilance sur le web. Après l’instauration du machine learning dans les rédactions se pose donc la question: comment sécuriser son investigation?

Par Alessia Merulla

Crédit photo: Unsplash

Ce travail journalistique a été réalisé pour le cours “Production de formats journalistiques innovants”, dans le cadre du master en journalisme de l’Académie du journalisme et des médias (AJM) de l’Université de Neuchâtel.

Laisser un commentaire