diff -r b7d19cd87fcf -r 09e00f38d177 src/hdalab/management/commands/query_wikipedia_category.py --- a/src/hdalab/management/commands/query_wikipedia_category.py Thu Apr 12 01:27:16 2018 +0200 +++ b/src/hdalab/management/commands/query_wikipedia_category.py Wed Apr 11 12:19:47 2018 +0200 @@ -1,8 +1,32 @@ # -*- coding: utf-8 -*- ''' -Created on Jun 7, 2011 +Requête Wikipedia qui renseigne les différentes catégories wikipedia pour les tag sémantisés. + +Les données suivantes sont moissonée pour chaque tag sémantisé (i.e. article Wikipedia) + - catégories visibles (`visible`) + - catégories cachées (`hidden`) + - paramêtres d'infobox (`infobox`) + +Les objets créé sont les suivants: + + - catégories : :class:`hdalab.models.WpCategory` et :class:`hdalab.models.TagWpCategory` + - paramêtre d'infobox : :class:`hdalab.models.InfoboxParameter` et :class:`hdalab.models.TagInfobox` + +Cette commande utilise directement `l'api wikipedia `_ pour faire ses requêtes. -@author: ymh +**Usage**: ``django-admin query_wikipedia_category [options]`` + +**Options spécifiques:** + + - *\-\-all* : force à traiter tous les tags + - *\-\-random* : faire le traitement des tags dans un ordre aléatoire + - *\-\-force* : ne pose aucune question + - *\-\-limit=LIMIT* : Nombre de tags à traiter + - *\-\-start=START* : Nombre de tags à ignorer + - *\-\-type=TYPES* : Quel type de requête faire : `visible` : catégories visibles, `hidden` : catégories cachées, `infobox`: infoboxes, `all`: toutes (défaut). cette option peut être passée plusieurs fois. + - *\-\-use\-label* : Utilise le label du tag au lieu du pageid pour faire la requête wikipedia + - *\-\-tag=TAG* : Limite le traitement à ce tag + ''' from django.conf import settings