web/hdalab/README.txt
author ymh <ymh.work@gmail.com>
Sun, 11 Mar 2012 22:53:13 +0100
changeset 142 8411d69b3ad9
parent 130 c8af52e4a047
child 227 b0cd3e6e31c7
permissions -rw-r--r--
Added tag V01.50 for changeset 444108d080bc

== Inclusion géographique ==

La migration 0007_geographic_inclusion crée les tables nécessaires

Pour récupérer les informations d'inclusion géographique de DBpedia (nécessite le package python SparqlWrapper)
    python manage.py query_geo_inclusion

== Traitement du fichier countries.geo.json ==

Le fichier a été téléchargé sur https://github.com/johan/world.geo.json/
Afin de faire correspondre les labels des pays aux tags sémantisés, on applique le script
    python manage.py geojson_transform <chemin/nom_du_fichier.geo.json>
pour rajouter ces informations dans le fichier

== Import des données Insee ==

La migration 0008_datasheet_insee crée les tables nécessaires

Il faut d'abord importer les fichiers donnant les coordonnées géographiques par code Insee dans la base.
Le fichier data/villes.csv a été téléchargé sur http://www.pillot.fr/cartographe/fic_villes.php
Il manque dans ce fichier quelques villes et les codes INSEE pour Paris, Marseille et Lyon n'incluent pas les arrondissements
Les communes manquantes se trouvent dans additional_cities.csv
Pour importer chacun de ces fichiers :
    python manage.py import_insee_csv <chemin/nom_du_fichier.csv>

Il faut ensuite importer les fichiers donnant la correspondance entre notices HDA (référencées par leur identifiant hda_id) et codes INSEE
Celles-ci sont fournies dans un fichier Excel donné par Bertrand, que j'ai converti en CSV et corrigé. Il s'agit de data/hda_insee.csv
Pour importer ce fichier:
    python manage.py import_insee_hda_csv <chemin/nom_du_fichier.csv>