Information about migrations
authorveltr
Tue, 28 Feb 2012 11:43:29 +0100
changeset 130 c8af52e4a047
parent 129 9f5460c2c2c1
child 131 9d5d9e6b7fbf
Information about migrations
web/hdalab/README.txt
--- a/web/hdalab/README.txt	Mon Feb 27 18:11:09 2012 +0100
+++ b/web/hdalab/README.txt	Tue Feb 28 11:43:29 2012 +0100
@@ -0,0 +1,29 @@
+== Inclusion géographique ==
+
+La migration 0007_geographic_inclusion crée les tables nécessaires
+
+Pour récupérer les informations d'inclusion géographique de DBpedia (nécessite le package python SparqlWrapper)
+    python manage.py query_geo_inclusion
+
+== Traitement du fichier countries.geo.json ==
+
+Le fichier a été téléchargé sur https://github.com/johan/world.geo.json/
+Afin de faire correspondre les labels des pays aux tags sémantisés, on applique le script
+    python manage.py geojson_transform <chemin/nom_du_fichier.geo.json>
+pour rajouter ces informations dans le fichier
+
+== Import des données Insee ==
+
+La migration 0008_datasheet_insee crée les tables nécessaires
+
+Il faut d'abord importer les fichiers donnant les coordonnées géographiques par code Insee dans la base.
+Le fichier data/villes.csv a été téléchargé sur http://www.pillot.fr/cartographe/fic_villes.php
+Il manque dans ce fichier quelques villes et les codes INSEE pour Paris, Marseille et Lyon n'incluent pas les arrondissements
+Les communes manquantes se trouvent dans additional_cities.csv
+Pour importer chacun de ces fichiers :
+    python manage.py import_insee_csv <chemin/nom_du_fichier.csv>
+
+Il faut ensuite importer les fichiers donnant la correspondance entre notices HDA (référencées par leur identifiant hda_id) et codes INSEE
+Celles-ci sont fournies dans un fichier Excel donné par Bertrand, que j'ai converti en CSV et corrigé. Il s'agit de data/hda_insee.csv
+Pour importer ce fichier:
+    python manage.py import_insee_hda_csv <chemin/nom_du_fichier.csv>
\ No newline at end of file