Open Data
Les ressources
Les outils
Google Fusion Tables
google.com/fusiontablesGoogle Fusion Tables est un outils simple mais très efficace pour synthétiser un grand volume d'informations en un graphique ou une carte. Lors de ma démonstration, il m'a ainsi était possible de montrer qu'avec une liste d'entreprises et d'adresses (au format Excel), en l'occurrence les entreprises des apprentis de l'école ESIPE-MLV, on peut générer très rapidement une carte avec un point par entreprise, et ceci sans connaissance informatique avancées.

Gapminder
gapminder.orgGapminder permet de corréler des données provenant de divers sources mais qui touchent à la même thématique ; notamment, il est possible de visualiser un graphique évoluer dans le temps, ce qui sommes toutes permet de bien comprendre les liens entre les données.

Ci-dessus, par exemple, on essaye de voir le lien entre la proportion d'utilisateurs d'internet d'une population donnée, et les revenus générées par personne.
Comprehensive Knowledge Archive Network (CKAN)
ckan.orgCKAN est l'un des outils les plus connu du mouvement Open Data. CKAN est un registre de données participatif où les sites (aussi bien gouvernementaux que les autres) s'enregistre pour publier leurs données. Cet outils permet à certains d'être hébergé sur cette plateforme, ce qui évite des dépenses supplémentaires, mais il permet surtout à ceux qui sont déjà hébergé, de gagner en crédibilité et en notorité. Ceci s'explique par le fait que CKAN recense la majorité des grands sites d'open data, et figurer dans cette annuaire permet de se faire connaître, et d'encourager le public à utiliser les données que l'on met à disposition.
Pour plus d'informations : lire la FAQ du wiki de CKAN.
Autres outils
Il existe beaucoup trop d'outils concernant l'Open Data pour pouvoir tous les lister dans ce minisite. On peut distinguer les outils qui permettent de :
- convertir les données dans des formats libres comme RDF et XML qui sont en général préconisés,
- publier et partager les donneés libres en ligne (comme CKAN),
- nettoyer les données (comme avec Google Refine),
- analyser les volumes importants de données (comme avec Google FusionTable et GapMinder),
- effectuer des requêtes sur des données au format RDF (des graphes) en utilisant le langage SPARQL qui se généralise.
Les données
Pour trouver des données à exploiter, il existe de nombreux sites qui rassemblent des milliers voire centaines de milliers de sets de données :
- Thedatahub.org : le catalogue de données qui est stocké grâce à l'outils CKAN
- Freebase : une large base de données de tout type
- Open Street Map (Collaborative mapping) : un outils collaboratif de données ouvertes géolocalisées
- DBPedia : un effort pour transformer les données récoltées sur le site Wikipedia en un ensemble de données liées dans un graphe géant
- factual.com
- blueobelisk.org : concerne le domaine de la chimie.
- d8taplex.com : rassemble de nombreux sets de données ouvertes