src/hdalab/management/commands/query_wikipedia_category.py
branchdocumentation
changeset 693 09e00f38d177
parent 683 59d49ab04ded
--- a/src/hdalab/management/commands/query_wikipedia_category.py	Thu Apr 12 01:27:16 2018 +0200
+++ b/src/hdalab/management/commands/query_wikipedia_category.py	Wed Apr 11 12:19:47 2018 +0200
@@ -1,8 +1,32 @@
 # -*- coding: utf-8 -*-
 '''
-Created on Jun 7, 2011
+Requête Wikipedia qui renseigne les différentes catégories wikipedia pour les tag sémantisés.
+
+Les données suivantes sont moissonée pour chaque tag sémantisé (i.e. article Wikipedia)
+    - catégories visibles (`visible`)
+    - catégories cachées (`hidden`)
+    - paramêtres d'infobox (`infobox`)
+
+Les objets créé sont les suivants:
+
+    - catégories : :class:`hdalab.models.WpCategory` et :class:`hdalab.models.TagWpCategory`
+    - paramêtre d'infobox : :class:`hdalab.models.InfoboxParameter` et :class:`hdalab.models.TagInfobox`
+
+Cette commande utilise directement `l'api wikipedia <https://www.mediawiki.org/wiki/API:Main_page>`_ pour faire ses requêtes.
 
-@author: ymh
+**Usage**: ``django-admin query_wikipedia_category [options]``
+
+**Options spécifiques:**
+
+    - *\-\-all* :               force à traiter tous les tags
+    - *\-\-random* :            faire le traitement des tags dans un ordre aléatoire
+    - *\-\-force* :             ne pose aucune question
+    - *\-\-limit=LIMIT* :       Nombre de tags à traiter
+    - *\-\-start=START* :       Nombre de tags à ignorer
+    - *\-\-type=TYPES* :        Quel type de requête faire : `visible` : catégories visibles, `hidden` : catégories cachées, `infobox`: infoboxes, `all`: toutes (défaut). cette option peut être passée plusieurs fois.
+    - *\-\-use\-label* :        Utilise le label du tag au lieu du pageid pour faire la requête wikipedia
+    - *\-\-tag=TAG* :           Limite le traitement à ce tag
+
 '''
 
 from django.conf import settings