C’était l’un des grands thèmes débattus aux Assises du journalisme 2012. Malgré la monstrueuse quantité d’information venue d’internet grâce aux différents « leaks » divers et variés, l’immense majorité des journalistes font l’économie de solides connaissances en informatique. Difficile, pourtant, pour le journaliste de demain de faire sans. Explications.

100yearsofworldcuisine.jpg
100 years of World Cuisine : un exemple des possibilités offertes par le journalisme de données

Le web est devenu une réalité parallèle qui prend une grande place dans nos vies. Difficile d’y échapper et d’avoir toujours le contrôle – que ce soit pour les individus comme pour les entreprises, les Etats ou encore les collectivités territoriales. Dans cet univers, il y a aussi des cyber-guerres, de l’espionnage industriel, des «leaks» ou «libérations» d’information, et même les gouvernements s’y mettent en délivrant des teraoctets de données brutes en libre accès sur internet – par souci de transparence, bien que de ce côté là il y ait encore pas mal de retard.

Quand l’investigation change d’angle d’attaque

C’est une véritable mine d’or pour celui qui sait exploiter ces données brutes, souvent fouillis. Le journaliste qui souhaite s’y pencher peut trouver là de nombreuses idées d’articles, voire y trouver des informations particulièrement pointues.

L’investigation change d’angle d’attaque: il ne s’agit plus simplement de mettre à disposition du public des informations, il faut les lui présenter de telle manière à ce qu’il dispose des clés pour les comprendre (éléments de comparaisons, statistiques, représentations graphiques, géographiques…).

Quelques exemples d’infographies:

  • SlaveryFootPrint.org : quand les data-journalistes arrivent à impliquer entièrement le lecteur dans leur article ! Passionnant.
  • ediplomacy.afp.com : catalogue quelques 5000 comptes Twitter pour mesurer la cyber-influence des différentes diplomaties.
  • Ledauphine.com – carte noire de la TNT : un exemple tout simple de ce qu’on peut faire assez facilement juste en ayant quelques connaissances et beaucoup de motivation…
  • The Guardian Data Blog : plein d’exemples de ce qu’on peut faire et ce qu’on fera dans le futur.
  • jean-marc.manach.net : le blog d’un journaliste d’OWNI avec également des outils qu’on peut librement utiliser !
  • datajournalismelab.fr : un site géré par l’IJBA pour une meilleure réflexion sur le data-journalisme.
  • cablegatesearch.net : voici ce qu’un développeur passionné de journalisme a codé en à peine une semaine pour mieux représenter le volume des câbles diplomatiques de Wikileaks.

Pour un aperçu de ces nouveaux possibles, voici quelques sites gouvernementaux qui « libèrent » les données publiques :

Pour la France, suivez ce lien : http://www.data.gouv.fr

Pour comparaison, allez sur celui de la Grande-Bretagne par là : http://data.gov.uk

Ou encore sur celui des États-Unis par ici : http://www.data.gov/opendatasites

Bien entendu, le pré-requis est d’au moins maîtriser Excel en long, en large et en travers. Mais pour faire de jolies présentations, ce n’est pas toujours suffisant.

Les grandes rédactions parisiennes ont de plus en plus tendance à « outsource »r ces compétences, faisant appel à de très coûteux développeurs. Mais à l’image de ce qui se fait outre-manche au Guardian, la tendance inverse existe aussi : l’avenir, c’est d’intégrer des développeurs et des graphistes aux desks des rédactions.

Pourtant, encore faut-il que ces deux mondes se comprennent – plusieurs expériences ont en effet échoué à cause des différents entre des journalistes qui ne comprenaient pas nécessairement ce qu’il était possible de coder, et des développeurs qui prenaient leur propre raccourcis sur le cahier des charges sans toujours comprendre là où voulaient en venir les journalistes.

Le défi, c’est donc d’intégrer ces notions de programmation dans la formations des journalistes. Plusieurs écoles s’y mettent (la section journalisme de Sciences po Paris en tête). Mais on peut tout de même se poser une question : pourquoi en rester à des notions ? N’y aurait-il pas quelque chose de suffisamment spécifique au développement dans une optique data-journalistique pour que les journalistes ne puissent se passer de la tutelle de programmateurs ?

Nul doute que ces compétences connexes seront très valorisées par les rédactions à l’avenir… D’autant que les exemples connus de data-journalisme et d’infographie offrent au lecteur une nouvelle appréhension de l’information très attractive.

Quelques outils à potasser

Une liste non exhaustive : trouvez les outils avec lesquels vous vous sentez le plus à l’aise !

Le tableur : on ne le répètera jamais assez, mais savoir faire des tris, moyennes, additions, soustractions et multiplications sous Excel, Numbers, ou quelconque autre tableur opensource est un prérequis. Si l’expression «=MOYENNE(A1:A10)» ne vous dit rien, consultez cet excellent ouvrage : http://www.pourlesnuls.fr/catalogue/1622-informatique/1623-bureautique/excel-2010-pas-a-pas-pour-les-nuls-EAN9782754021289.html

Pour les utilisateurs familiers de Linux, l’(auto)apprentissage de quelques outils complémentaires – au début certes compliqués d’usage car non interactifs, mais qui partagent une syntaxe similaire – Grep, Sed, Awk, tr… permettront de manipuler des quantités gigantesques de données comme du chewing-gum, et au final d’en faire ce que vous voulez (y compris des tableurs, mais à ce stade vous n’en aurez même plus besoin tellement que ça vous paraîtra rudimentaire !). Un excellent ouvrage (malheureusement uniquement en anglais) fera l’affaire pour le débutant des trois premiers outils susmentionnés : http://shop.oreilly.com/product/9781565922259.do

Apprendre un langage est moins compliqué qu’il n’y paraît et ils partagent en général beaucoup de ressemblances en termes de syntaxe. Une importante bibliographie existe en fonction du niveau visé (du Javascript pour les nuls à du bien plus scientifique). Pas de préférence ici, mais des choix de raison :

Java et JavaScript : un peu laborieux mais si utilisés pour créer des représentations interactives que vous y passerez un jour ou un autre…

PHP : une sorte de Java «light» qui offre déjà de nombreuses possibilités. Souvent les personnes «traumatisées» par Java, apprennent le PHP, bien plus souple et moins sensible aux erreurs.

Bash et/ou Ruby / Perl… Disponible sur toutes les plateformes dérivées de Linux et en émulation sous Windows: très pratique lorsque l’information n’est pas ouvertement accessible. Cela permet de coder de A à Z de petites routines qui vous éviteront de récupérer de grandes quantités d’informations à la main (i.e. avec Curl, Grep et Sed). Exemple : allez voir sur le site de la Sécurité sociale et essayez de récupérer d’un coup toutes les données sur les généralistes, leur prix et leur adresse… impossible? pensez-vous

Bidouillez ! : de nombreux outils gratuits sont à votre disposition sur internet et permettent déjà de nombreuses choses sans forcément se plonger dans des milliers de pages de documentation. On peut citer ici Pearl Tree, Hitmap, GoogleMaps…