== Inclusion géographique ==
La migration 0007_geographic_inclusion crée les tables nécessaires
Pour récupérer les informations d'inclusion géographique de DBpedia (nécessite le package python SparqlWrapper)
python manage.py query_geo_inclusion
== Traitement du fichier countries.geo.json ==
Le fichier a été téléchargé sur https://github.com/johan/world.geo.json/
Afin de faire correspondre les labels des pays aux tags sémantisés, on applique le script
python manage.py geojson_transform <chemin/nom_du_fichier.geo.json>
pour rajouter ces informations dans le fichier
== Import des données Insee ==
La migration 0008_datasheet_insee crée les tables nécessaires
Il faut d'abord importer les fichiers donnant les coordonnées géographiques par code Insee dans la base.
Le fichier data/villes.csv a été téléchargé sur http://www.pillot.fr/cartographe/fic_villes.php
Il manque dans ce fichier quelques villes et les codes INSEE pour Paris, Marseille et Lyon n'incluent pas les arrondissements
Les communes manquantes se trouvent dans additional_cities.csv
Pour importer chacun de ces fichiers :
python manage.py import_insee_csv <chemin/nom_du_fichier.csv>
Il faut ensuite importer les fichiers donnant la correspondance entre notices HDA (référencées par leur identifiant hda_id) et codes INSEE
Celles-ci sont fournies dans un fichier Excel donné par Bertrand, que j'ai converti en CSV et corrigé. Il s'agit de data/hda_insee.csv
Pour importer ce fichier:
python manage.py import_insee_hda_csv <chemin/nom_du_fichier.csv>
== Mise en place de l'Environnement Virtuel ==
0) requis : python 2.6 (64 bits).
1) installer PostGreSql 9.X car ça tourne en 64 bits.
3) export PYTHONPATH=/path/to/workspace/hdabo/web (/Users/tc/dev/eclipse_workspace/hdabo/web)
4) ajouter le path jusqu'à pg_config dans les vars d'env : ajouter dans la ligne suivante dans ~/.bashrc :
export PATH=$PATH:/Library/PostgreSQL/9.X/bin
- faire en sorte que ~/.bashrc soit bien pris en compte quand on lance un terminal : ajouter dans la ligne suivante dans /etc/bashrc :
[ -r ~/.bashrc ] && . ~/.bashrc
- se mettre dans le bon répertoire et la création du virtualenv :
$ cd /path/to/workspace/hdabo/virtualenv/web (/Users/tc/dev/eclipse_workspace/hdabo/web)
$ python create_python_env.py
$ python project-boot.py --no-site-packages --type-install=local env/myhdaboenv
=== Migration hdabo -> hdalab ===
0) appliquer les migrations south
1) lancement de la commande query_wikipedia_category
2) lancement de la commande fill_tag_years
3) lancement de la commande query_wikipedia
4) lancement de la commande query_geo_inclusion
5) lancement de la commande geo_json_transform
6) lancement de la commande import_insee_csv
7) lancement de la commande import_hda_insee_csv
8) lancement de la commande query_category_inclusion
Toutes ces actions sont echaînées dans la commande import_hdabo_db
=== Migration hdalab 1 -> hdalab 2 ===
1) syncd
2) migrate (migrate passe les hdabo_tags à fr.dbdpedia)
3) query_dbpedia
4) fill_tag_years
5) query_geo_inclusion