The following two tabs change content below.

Raphaël Da Silva

Webjournaliste au profil technique, je m'intéresse à tout ce qui peut se bidouiller en général et au datajournalisme en particulier

Derniers articles parRaphaël Da Silva (voir tous)

Des données...

Ceux qui se sont frottés plus d'une fois à la donnée le savent : on est loin d'avoir toujours sous la main un fichier propre. Par exemple, il peut arriver que les données mises à disposition soient incomplètes (valeurs manquantes), peu harmonisées (différence de nomenclature pour des villes), ou tout simplement mal formatées (des chaînes de caractères à la place de chiffres).

Ce guide fourni par Quartz aidera le reporter maniant des données à faire face à tous les cas de "bad data", des simples défauts aux problèmes beaucoup plus complexes (un échantillon n'est pas forcément aléatoire, la marge d'erreur est inconnue).

Lien:

Share This