# HG changeset patch # User veltr # Date 1330425809 -3600 # Node ID c8af52e4a047546295c06ca2f19549d88dc6a411 # Parent 9f5460c2c2c141a54ad4cfc2cc1e9985d0a45706 Information about migrations diff -r 9f5460c2c2c1 -r c8af52e4a047 web/hdalab/README.txt --- a/web/hdalab/README.txt Mon Feb 27 18:11:09 2012 +0100 +++ b/web/hdalab/README.txt Tue Feb 28 11:43:29 2012 +0100 @@ -0,0 +1,29 @@ +== Inclusion géographique == + +La migration 0007_geographic_inclusion crée les tables nécessaires + +Pour récupérer les informations d'inclusion géographique de DBpedia (nécessite le package python SparqlWrapper) + python manage.py query_geo_inclusion + +== Traitement du fichier countries.geo.json == + +Le fichier a été téléchargé sur https://github.com/johan/world.geo.json/ +Afin de faire correspondre les labels des pays aux tags sémantisés, on applique le script + python manage.py geojson_transform +pour rajouter ces informations dans le fichier + +== Import des données Insee == + +La migration 0008_datasheet_insee crée les tables nécessaires + +Il faut d'abord importer les fichiers donnant les coordonnées géographiques par code Insee dans la base. +Le fichier data/villes.csv a été téléchargé sur http://www.pillot.fr/cartographe/fic_villes.php +Il manque dans ce fichier quelques villes et les codes INSEE pour Paris, Marseille et Lyon n'incluent pas les arrondissements +Les communes manquantes se trouvent dans additional_cities.csv +Pour importer chacun de ces fichiers : + python manage.py import_insee_csv + +Il faut ensuite importer les fichiers donnant la correspondance entre notices HDA (référencées par leur identifiant hda_id) et codes INSEE +Celles-ci sont fournies dans un fichier Excel donné par Bertrand, que j'ai converti en CSV et corrigé. Il s'agit de data/hda_insee.csv +Pour importer ce fichier: + python manage.py import_insee_hda_csv \ No newline at end of file