EPJT

Les développeurs sont un atout majeur dans la collecte d’informations. Mais la pratique demande des moyens et reste rare en France.

Par Camille Charpentier

Dans les rédactions, les développeurs permettent un travail invisible, mais d’une importance capitale : récupérer des informations souvent inaccessibles et les ordonner. Cela va du « scraping » — une technique d’extraction automatique de données que les journalistes peuvent effectuer à l’aide de simples bases de code — à des opérations beaucoup plus complexes comme le hacking — qui est à la base du projet WikiLeaks.

L’extraction de documents et leur transformation en bases de données, c’est avec ces bases qu’ont débuté plusieurs investigations d’importances comme SwissLeaks où l’affaire des Panama papers.

 Intervient ensuite le travail de création d’une base de données. L’enjeu est de faire en sorte que les journalistes puissent chercher avec aisance parmi des masses de documents qui ne pourraient être traitées sans l’informatique. Au Décodeurs du Monde, le développeur Maxime Ferrer travaille ainsi depuis plusieurs mois sur une « interface qui rassemblera des milliers données » et qui servira à tirer des liens entre différentes affaires, « au lieu que chacun ait ses infos dans son petit carnet ».

 L’outil pourrait être utilisable dans un délai de six mois à deux ans. Impossible d’avancer plus vite, puisque Maxime Ferrer est le seul programmeur de l’équipe et qu’il développe l’outil lorsque l’actualité se fait calme.

 

« Il faut emprunter à l’univers de l’informatique la culture de l’open source et mettre en commun les bases de données »

Yann Guégan

Yann Guégan, journaliste et développeur indépendant, met également en avant le besoin de mettre en commun les données pour créer des outils innovants mais va plus loin. Pour lui, toutes les rédactions devraient se coordonner pour créer des bases de données à la manière de l’ICIJ, le Consortium international des journalistes d’investigation. Car, contrairement aux Etats-Unis où les autorités rendent publiques de nombreuses informations – on parle d’open data, de données ouvertes –, les institutions françaises s’y mettent avec timidité et envoient souvent des documents aux seules rédactions qui les demandent.

« Il faut emprunter à l’univers de l’informatique la culture de l’open source et mettre en commun les bases de données », estime Yann Guégan. S’il admet qu’un tel projet est aujourd’hui inconcevable car prime « la culture du scoop », il observe que ce travail pourrait être fait pour des sujets incontournables.

Lors de la publication de la listes des assistants parlementaires en février dernier par exemple, près de cinq journalistes ont ainsi été mobilisés aux Décodeurs, soit près de la moitié de la rédaction. Leur but : créer une base de données propre où figureraient le nom des députés, celui de leurs assistants et leur éventuel lien de famille.

Un travail identique a été mené dans la plupart des rédactions de France, avec la même façon de procéder. « Notre presse est pauvre, elle a peu moyens humains. Si on mettait en commun des simples bases comme celles-là, les journalistes pourraient se concentrer sur le fond et se distinguer dans l’angle et l’enrichissement de ces infos, assure Yann Guégan. Les développeurs sont passés par là et on les a pris pour des utopistes. Aujourd’hui, le logiciel libre est la norme. »