hdabo: src/hdalab/views/ajax.py@09e00f38d177


# -*- coding: utf-8 -*-
'''
Created on Jan 31, 2012

@author: ymh
'''
from django.conf import settings
from django.core.cache import cache
from django.db.models import Q, Count, Min
from django.http import HttpResponse
from hdabo.models import Tag, Datasheet, TaggedSheet
from hdalab.models import HdaSession, Country, TagYears, DatasheetExtras
from hdalab.models.dataviz import DbpediaFieldsTranslation, DbpediaFields
from hdalab.models.categories import WpCategory
from hdalab.utils import fix_cache_key
import copy
import json
import hmac
import itertools
import uuid

import logging
logger = logging.getLogger(__name__)

def tagtranslation(request):
    """
    Vue donnant des traductions de label de tag pour une langue.
    la recherche se fait dans les objets :class:`hdalab.models.DbpediaFieldsTranslation`.

    Paramêtres GET:
        :var lang: La langue demandée
        :var labels: Un ou plusieurs labels de tag (séparateur : ",")

    Réponse (application/json):
        Un dictionnaire sous la forme ::

            {
                "<label1>": "<translation>",
                "<label2>": "<translation>"
            }

    """

    lang = request.GET.get('lang',request.LANGUAGE_CODE)
    labels = request.GET.get('labels',None)

    if not labels:
        return HttpResponse(content=json.dumps({}), content_type='application/json')

    labelslist = [lbl.strip() for lbl in labels.split(",")]
    masters = []

    for lbl in labelslist:
        labelqs = Tag.objects.select_related('dbpedia_fields').filter(~Q(dbpedia_uri = None), label__iexact = lbl)[0:1]
        if len(labelqs) > 0:
            tag = labelqs.get()
            if tag.dbpedia_fields:
                masters.append(tag.dbpedia_fields)

    translationqs = DbpediaFieldsTranslation.objects.select_related("master", "master__tag").filter(master__in = masters, language_code=lang)

    translations = dict([(t.master.label, t.label) for t in translationqs])

    return HttpResponse(content=json.dumps(translations), content_type='application/json')



def subcat(category, globtags, level, max_level):
    """
    Méthode récursive utilisée pour reconstruire un arbre de catégories.

    :param object category: La catégorie racine.
    :param dict globtags: dictionnaire flobal des tags.
    :param int level: Niveau de récursion.
    :param int max_level: Niveau maximum de récursion (level <= max_level)

    :returns: L'arbre des catégories.
    """
    # recursive function used by cattree
    catlabel = category.label
    tags = Tag.objects.filter(wp_categories__wp_category = category).distinct()
    taglabels = [k for k in dict([(t.label,t.label) for t in tags])]
    resobj = {
          'label': category.label,
          'themes': [],
          'contents': []
      }
    for label in taglabels:
        if label == catlabel:
            globtags[label] = {'level': level, 'access': resobj }
        else:
            tag_in_list = {'label' : label, 'contents': []}
            resobj['themes'].append(tag_in_list)
            globtags[label] = {'level': (level + 1), 'access': tag_in_list }

    if level < max_level:
        subcats = WpCategory.objects.filter(parent_categories__parent_category = category)
        resobj['themes'] += [subcat(subcats[i], globtags, level + 1, max_level ) for i in range(len(subcats))]
    return resobj

def cleantags(category):
    """
    Methode annexe qui nettoie recursivement un arbre de catégorie. elle effectue les actions suivantes:
      - retire les clefs correspondant à des listes vides ('contents' et 'themes')
      - trie les listes 'themes' par label
      - trie les listes 'contents' par score

    :param category: la catégorie racine où commencer le traitement.

    """
    if category.has_key('contents') and len(category['contents']) == 0:
        del category['contents']
    if category.has_key('contents'):
        category['contents'] = sorted(category['contents'], key=lambda content: -content['score'])
    if category.has_key('themes'):
        themes = []
        for theme in category['themes']:
            clean_theme = cleantags(theme)
            if clean_theme.has_key('themes') or clean_theme.has_key('contents'):
                themes.append(clean_theme)
        category['themes'] = sorted(themes, key=lambda cat: cat['label'])
        if len(category['themes']) == 0:
            del category['themes']
    return category

def cattree(request):
    """
    Contruit l'arbre de catégorie pour un label.
    Les contenus attachés aux noeud sont des listes de fiches hdalab triées par score.
    Le score pour une fiche est fonction de ses tags, de leur ordre, de leur présence dnas l'arbre des catégories et de leur hauteur dans l'arbre des catégories.

    Paramêtres GET :
        :var label: Le label

    Réponse (application/json):
        Un json représentant l'arbre des catégories avec pour chaque noeud une liste ordonnée de fiches liée à la catégorie.

        exemple ::

            {
                "label": "<label1>",
                "themes": [ { "label": "<label1.1>", "themes": [...], "contents": [...]}, ...],
                "contents": [
                    {
                        "organization": "Ciclic",
                        "description": "Ciclic propose...",
                        "score": 7,
                        "title": "Vocabulaire de l'analyse filmique...",
                        "url": "http://upopi.ciclic.fr/vocabulaire/definition/sceance-11",
                        "hda_id": "5879",
                        "organization_url": "http://www.ciclic.fr/",
                        "id": 14852
                    },
                    ...
                ]
            }
    """
    # Gets the category tree from a label
    ROOT_MAX_TAG_ORDER = 8
    MAX_TAG_ORDER = 8
    MAX_LEVEL = 3
    LEVEL_COEFF = 5
    label = request.GET.get('label', None)
    lowerlabel = label.lower()
    globtags = {}
    resobj = {}
    master_category = WpCategory.objects.filter(label__iexact=label)[0:1]
    if len(master_category):
        resobj = subcat(master_category[0], globtags, 1, MAX_LEVEL )

    #datasheets = Datasheet.objects.filter(validated = True, taggedsheet__tag__label__in = tag_list, taggedsheet__order__lte = MAX_TAG_ORDER).distinct()
    datasheets = Datasheet.objects.filter(validated = True, taggedsheet__tag__label__iexact = label, taggedsheet__order__lte = ROOT_MAX_TAG_ORDER).select_related('organisation').distinct()
    for datasheet in datasheets:
        # Calculating where we add the datasheet in the tree
        maintag = None
        maintagscore = -5
        dsscore = 0
        rootscore = 0
        for ts in TaggedSheet.objects.select_related('tag','datasheet').filter(datasheet__id=datasheet.id,order__lte=MAX_TAG_ORDER):
            label = ts.tag.label
            if globtags.has_key(label):
                score = LEVEL_COEFF * globtags[label]['level'] - ts.order
                if score > maintagscore:
                    maintagscore = score
                    maintag = label
                    dsscore = (MAX_TAG_ORDER - ts.order)
                if label.lower() == lowerlabel:
                    rootscore = (ROOT_MAX_TAG_ORDER - ts.order)
        if maintag is not None:
            globtags[maintag]['access']['contents'].append({
                'id': datasheet.id,
                'title': datasheet.title,
                'url': datasheet.url,
                'description': datasheet.description,
                'hda_id': datasheet.hda_id,
                'organization': datasheet.organisation.name,
                'organization_url': datasheet.organisation.website,
                'score': max(dsscore, rootscore)
            })
    if resobj:
        cleantags(resobj)
    elif len(master_category):
        resobj = {
            'label': master_category[0].label,
            'themes': [],
            'contents': []
        }
    else:
        resobj = {
            'label': label,
            'themes': [],
            'contents': []
        }


    return HttpResponse(content=json.dumps(resobj), content_type='application/json')


def sessioninfo(request):
    """
    Vue gérant les session Hda permettant de sauvegarder un état d'interface.
    Note : Cette vue n'est pas mappée dans le module `hdalab.url`.
    """

    data = json.loads(request.GET.get('data', "{}"))
    write = False

    if 'sessionid' in request.GET:
        request.session['sessionid'] = request.GET['sessionid']
    if 'sessionkey' in request.GET:
        request.session['sessionkey'] = request.GET['sessionkey']

    if 'sessionid' in request.session:
        sessionid = request.session['sessionid']

        if HdaSession.objects.filter(sessionid=sessionid).count() == 1:
            sessionkey = request.session.get('sessionkey',None)
            hm = hmac.new(settings.SECRET_KEY, sessionid)
            if hm.hexdigest() == sessionkey:
                write = True
        else:
            del request.session['sessionid']

    if 'sessionid' not in request.session:
        sessionid = unicode(uuid.uuid1())
        HdaSession.objects.create(sessionid=sessionid, data=json.dumps({}))
        write = True
        request.session['sessionid'] = sessionid
        request.session['sessionkey'] = hmac.new(settings.SECRET_KEY, sessionid).hexdigest()

    if write and data:
        HdaSession.objects.filter(sessionid=sessionid).update(data=json.dumps(data))
    else:
        data = HdaSession.objects.get(sessionid=sessionid).data
        data = json.loads(data) if data else {}

    resobj = {'data': data, "write_allowed" : write, "sessionid": sessionid }
    if write:
        resobj['sessionkey'] = request.session['sessionkey']

    return HttpResponse(content=json.dumps(resobj), content_type='application/json')


def tagsearch(request):
    """
    Vue permettant la recherche dans les tag.
    La recherche se fait dans les objets :class:`hdabo.models.Tag`, :class:`hdalab.models.DbpediaFields` et :class:`hdalab.models.DbpediaFieldsTranslation`.

    Paramêtres GET:
        :var (str) term: Le terme à rechercher.
        :var (str) lang: La langue dans laquelle il faut faire la recherche.
        :var (int) count: Le nombre maximum de résultat.
        :var (bool) count_notices: Ajoute ou pas le nombre de notices par tag.

    Réponse (application/json):
        Une liste comprenant les résultats de la recherche.

        exemple ::

            [
                {
                    "original_label": "Cathédrale Notre-Dame de Chartres",
                    "url": "http://fr.wikipedia.org/wiki/Cath%C3%A9drale_Notre-Dame_de_Chartres",
                    "abstract": "La cathédrale Notre-Dame de Chartres ...",
                    "value": "Cathédrale Notre-Dame de Chartres",
                    "thumbnail": "http://commons.wikimedia.org/wiki/Special:FilePath/Chartres_Cath+Gare.JPG?width=300",
                    "nb": 7
                },
                {
                    "original_label": "Cathédrale Notre-Dame de Paris",
                    "url": "http://fr.wikipedia.org/wiki/Cath%C3%A9drale_Notre-Dame_de_Paris",
                    "abstract": "La cathédrale Notre-Dame de Paris...",
                    "value": "Cathédrale Notre-Dame de Paris",
                    "thumbnail": "http://commons.wikimedia.org/wiki/Special:FilePath/Notre_Dame_de_Paris_DSC_0846w.jpg?width=300",
                    "nb": 6
                },
                ...
            ]
    """

    q = request.GET.get('term',None)
    maxcount = int(request.GET.get('count','40'))
    lang = request.GET.get('lang',request.LANGUAGE_CODE)
    count_notices_str = request.REQUEST.get("count_notices")
    count_notices_bool = True
    if count_notices_str:
        count_notices_bool = {'true': True, 'false': False, "0": False, "1": True}.get(count_notices_str.lower())

    stemming_langs = [ 'fr', 'en', 'de', 'it' ]
    # For Japanese, there are no word boundaries, we should not use the regexp in that case
    no_translate_langs = [ 'fr' ]

    if q:
        lq = q.lower()
        qs = Tag.objects.select_related('dbpedia_fields').filter(datasheet__validated=True)
        qrx = '(\\m|\\b)%s'%q
        if lang in no_translate_langs:
            if lang in stemming_langs:
                qs = qs.filter( label__iregex = qrx )
            else:
                qs = qs.filter( label__icontains = q )
        else:
            if lang in stemming_langs:
                qs = qs.filter(dbpedia_fields__translations__label__iregex=qrx, dbpedia_fields__translations__language_code=lang, dbpedia_fields__translations__is_label_translated = True)
            else:
                qs = qs.filter(dbpedia_fields__translations__label__icontains=q, dbpedia_fields__translations__language_code=lang, dbpedia_fields__translations__is_label_translated = True)
    else:
        qs = Tag.objects.filter(~Q(dbpedia_uri = None))

    if count_notices_bool:
        qs = qs.annotate(nb=Count('datasheet',distinct=True)).order_by('-nb')[:maxcount]
    else:
        qs = qs.distinct()[:maxcount]

    qslist = list(qs)

    if lang in no_translate_langs:
        translations = {}
    else:
        transqs = DbpediaFieldsTranslation.objects.filter(master__tag__in = qslist, language_code=lang, is_label_translated=True).select_related("master")
        translations = dict([(tr.master.tag_id, {'label':tr.label,'abstract':tr.abstract, 'is_label_translated': tr.is_label_translated}) for tr in transqs])

    res = []

    for t in qslist:
        if hasattr(t, 'dbpedia_fields'):
            dbfields = t.dbpedia_fields
            resobj = {'original_label':t.label, 'url':t.wikipedia_url}
            if count_notices_bool:
                resobj['nb'] = t.nb
            resobj['thumbnail'] = dbfields.thumbnail if dbfields is not None else None

            if t.id in translations:
                resobj['value'] = translations[t.id]['label']
                resobj['abstract'] = translations[t.id]['abstract']
            else:
                resobj['value'] = t.label
                resobj['abstract'] = dbfields.abstract if dbfields is not None else None
            if q is None or resobj['value'].lower().find(lq) != -1:
                res.append(resobj)

    return HttpResponse(content=json.dumps(res), content_type='application/json')



def catsearch(request):
    """
    Vue permettant la recherche de catégorie. On se restreint aux catégories qui sont aussi des tags.

    Paramêtres GET:
        :var (str) term: Le terme à rechercher.

    Réponse (application/json):
        Une liste comprenant le résultat de la recherche.

        exemple ::

            [
                { "value": "1982 au cinéma" },
                { "value": "Cinéma italien" },
                { "value": "2003 au cinéma" },
                ...
            ]

    """


    q = request.GET.get('term',None)

    # On ne récupère que les catégories qui sont également des tags
    qrx = '(\\m|\\b)%s'%q
    qs = Tag.objects.filter(label__iregex=qrx)

    labels = [tag.label for tag in qs]

    qs = WpCategory.objects.annotate(nb=Count('child_categories__child_category__tags')).filter(label__in = labels, nb__gt=0)

    res = [{'value':t.label} for t in qs]

    return HttpResponse(content=json.dumps(res), content_type='application/json')



def filter(request):
    """
    Vue permettant de filtrer par facette des fiches HDA.
    Cette méthode est en fait un simple wrapper pour la méthode `filter_generic`.

    Paramêtres GET:
        :var lang: la langue de recherche (défaut: fr-fr).
        :var period: Période dans laquelle doit se faire la recherche.
        :var label: un mot-clef.
        :var country: Une liste de pays limitant la recherche.
        :var contentlist: Liste de fiches limitant la recherche.
        :var mto: Ordre maximum des tags (défaut: 12).
        :var contentcount: nombre de fiches maximum (défaut : 8).
        :var tagcount: nombre maximum de tag (défaut: 30).

    Réponse (application/json):
        Un objet comprenant le résultat de la recherche.
    """


    lang = request.GET.get('lang',request.LANGUAGE_CODE)
    periode = request.GET.get('period',None)
    label = request.GET.get('label', None)
    country = request.GET.get('country', None)
    contentlist = request.GET.get('contentlist', None)
    max_tag_order = int(request.GET.get('mto', '12'))
    content_count = request.GET.get('contentcount', 8)
    tag_count = request.GET.get('tagcount', 30)

    outputstr = filter_generic(lang, periode, label, country, contentlist, max_tag_order, content_count, tag_count)

    return HttpResponse(content=outputstr, content_type='application/json')


def filter_generic(lang="fr-fr", periode=None, label=None, country=None, contentlist=None, max_tag_order=12, content_count=8, tag_count=30):
    """
    Méthode de recherche par facette sur les fiches HDA.

    :param str lang: La langue de recherche (défaut: "fr-fr").
    :param str period: Période d'année limitant la recherche. Le format est `<année-début>,<année-fin>` (défaut: None).
    :param str label: Limite la recherche à un label de tag (défaut: None).
    :param str country: Liste de pays où limiter la recherche. Le format est `<uri dbpedia pays 1>,<uri dbpedia pays 2>...` (défaut: None).
    :param str contentlist: Liste d'id de fiche HDA (:class:`hdabo.models.Datasheet`) limitant la recherche. Le format est `<id1>,<id2>...` (défaut: None)
    :param int max_tag_order: Limite le nombre maximum de tag par fiche (défaut: 12).
    :param int content_count: Limite le nombre de fiches résultat (défaut: 8).
    :param int tag_count: Limite le nombre de tag dans le résultat (défaut: 30).
    :rtype: string
    :returns: Un objet json sérialisé comprenant les résultats de la recherche pour les différentes facettes.


    Clefs de l'objet:
        - :count: Nombre total de fiches.
        - :disciplines: Liste de disciplines artistiques en relation avec les reesultats, triée par score.
        - :countries: Objet dont les clef sont des uri dbpedia de pays et les valeurs sont le nombre de fiches.
        - :tags: Liste de tag triés par score.
        - :sparkline: Liste d'année avec un score, triés par année. Le score est lié au nombre de fiche dont le contenu couvre l'année en question.
        - :contents: Liste de fiches HDA répondant à la recherche, classée par score. Chaque fiche comporte une liste de tag.
        - :tagtranslations: Objet donnant les traductions de label de tag rencontrés dans les résultats.

    exemple::

        {
            "count": 936,
            "disciplines": [
                {
                "translated_label": "Peinture",
                "score": 936,
                "label": "Peinture"
                },
                {
                "translated_label": "Sculpture",
                "score": 88,
                "label": "Sculpture"
                },
                ...
            ],
            "countries": {
                "http://fr.dbpedia.org/resource/Iran": 1,
                "http://fr.dbpedia.org/resource/Espagne": 16,
                ...
            },
            "tags": [
                {
                "url": "http://fr.dbpedia.org/resource/Portrait",
                "id": 63452,
                "translated_label": "Portrait",
                "score": 179,
                "wkpd_url": "http://fr.wikipedia.org/wiki/Portrait",
                "label": "Portrait",
                "thumbnail": "http://commons.wikimedia.org/wiki/Special:FilePath/Fayum02.jpg?width=300"
                },
                ...
            ],
            "sparkline": [
                {
                "score": 2,
                "year": -600
                },
                {
                "score": 4,
                "year": -500
                },
                ...
                {
                "score": 18,
                "year": 2001
                }
            ],
            "contents": [
                {
                "description": "Le palais Fesch, ...",
                "title": "Histoires bibliques",
                "url": "http://www.musee-fesch.com/index.php/musee_fesch/content/view/ef_catalogue_sommaire/1513/%28node_id_theme%29/33459",
                "tags": [
                    {
                    "url": "http://fr.dbpedia.org/resource/Peinture",
                    "id": 54648,
                    "translated_label": "Peinture",
                    "wkpd_url": "http://fr.wikipedia.org/wiki/Peinture",
                    "label": "Peinture",
                    "order": 1,
                    "match": true
                    },
                    ...
                ],
                "score": 23,
                "coords": {
                    "city_name": "Ajaccio",
                    "latitude": 41.916667,
                    "longitude": 8.733333
                },
                "hda_id": "4448",
                "id": 13855
                },
                {
                "description": "...",
                "title": "Le XIXe siècle",
                "url": "http://www.grandpalais.fr/fr/article/le-xixe-siecle",
                "tags": [ ... ],
                "score": 22,
                "hda_id": "5217",
                "id": 13582
                },
                ...
            ],
            "tagtranslations": {
                "Paul Cézanne": "Paul Cézanne",
                "Politique": "Politique",
                "Poésie": "Poésie",
                "Religion": "Religion",
                "Empereur": "Empereur",
                "Saint": "Saint",
                ...
            }
        }

    """

    no_translate_langs = [ 'fr' ]

    key_parts = ("filter",lang,periode,label,country,contentlist,max_tag_order,content_count,tag_count)
    key_parts = [unicode(p).encode("ascii", "ignore") for p in key_parts]

    cache_key = fix_cache_key("-".join(key_parts))

    outputstr = cache.get(cache_key)

    if outputstr is None:

        matchtagids = []

        tagqs = Tag.objects.exclude(category__label__in = ['Datation', 'Localisation', 'Discipline artistique']).filter(~Q(dbpedia_uri = None))
        countryqs = Country.objects
        discqs = Tag.objects.filter(~Q(dbpedia_uri = None), category__label = u'Discipline artistique').select_related('dbpedia_fields')
        yearqs = TagYears.objects

        contentqs = Datasheet.objects.filter(validated=True)
        labeltranslations = []

        if label or periode or country or contentlist :
            matchtagqslist = []

            if periode:
                years = periode.split(",")
                start_year = int(years[0])
                end_year = int(years[0:2][-1])
                delta = max(1, (end_year-start_year)/2)
                minstart = start_year - delta
                maxend = end_year + delta
                matchtagqs = Tag.objects.filter(~Q(dbpedia_uri = None),
                                                years__end_year__gte = start_year,
                                                years__start_year__lte = end_year,
                                                years__end_year__lte = maxend,
                                                years__start_year__gte = minstart,
                                                )
                matchtagqslist.append(matchtagqs)

            if label:
                for txtlbl in label.split(","):
                    matchtagqs = Tag.objects.select_related('dbpedia_fields').filter(~Q(dbpedia_uri = None), label__iexact = txtlbl.strip())
                    matchtagqslist.append(matchtagqs)

            if country:
                for country_uri in country.split(","):
                    matchtagqs = Tag.objects.filter(~Q(dbpedia_uri = None),locatedin__country__dbpedia_uri = country_uri)
                    matchtagids += [t.id for t in matchtagqs if t.id not in matchtagids]
                    matchtagqslist.append(matchtagqs)
            if contentlist:
                contentqs = contentqs.filter(id__in = contentlist.split(","))

            tagcond = None
            tagcondid = None
            for matchtagqs in matchtagqslist:
                newcond = Q(id__in = TaggedSheet.objects.filter(tag__in = copy.deepcopy(matchtagqs), order__lte = max_tag_order).values('datasheet_id'))
                newcondid = Q(id__in = matchtagqs)
                tagcond = newcond if tagcond is None else (tagcond & newcond)
                tagcondid = newcondid if tagcondid is None else (tagcondid | newcondid)

            contentqs = contentqs.filter(tagcond).distinct()
            matchtagidsqs = list(Tag.objects.select_related("dbpedia_fields").only("id").filter(tagcondid))
            matchtagids = [t.id for t in matchtagidsqs]

            if lang not in no_translate_langs:
                masters = [t.dbpedia_fields for t in matchtagidsqs if t.dbpedia_fields is not None]

                translationqs = DbpediaFieldsTranslation.objects.select_related("master", "master__tag").filter(master__in = masters, language_code=lang)
                labeltranslations = [{'label':t.master.label, 'translated_label':t.label} for t in translationqs]

            tagqs = tagqs.filter(datasheet__in = contentqs)
            countryqs = countryqs.filter(includes__tag__taggedsheet__datasheet__in = contentqs)
            discqs = discqs.filter(datasheet__in = contentqs)
            yearqs = yearqs.filter(tag__taggedsheet__datasheet__in = contentqs)

        if contentlist is None:
            contentqs.order_by('?')

        cont_count = contentqs.count()

        logger.debug("ajax filter SQL for contentqs %s", contentqs.query)

        contenus = dict([(content.id, {'score' : 0, 'tags' : [], 'hda_id': content.hda_id, 'id':content.id, 'title': content.title, 'description': content.description, 'url': content.url}) for content in contentqs[0:content_count]])
        contentids = contenus.keys()

        qs = DatasheetExtras.objects.select_related('insee').filter(datasheet__in = contentids)
        for dse in qs:
            contenus[dse.datasheet_id]['coords'] = {'city_name': dse.insee.city_name, 'latitude': dse.insee.latitude, 'longitude': dse.insee.longitude}

        qs = list(TaggedSheet.objects.select_related('tag', 'tag__dbpedia_fields').filter(datasheet__in = contentids, order__lte = max_tag_order).order_by('order'))

        translations = {}

        if lang not in no_translate_langs:
            ts_list = []
            for ts in qs:
                if hasattr(ts, 'tag') and hasattr(ts.tag, 'dbpedia_fields') :
                    ts_list.append(ts.tag.dbpedia_fields)
            transqs = DbpediaFieldsTranslation.objects.filter(master__in = ts_list, language_code = lang)
            translations = dict([(trans.master_id,trans.label) for trans in transqs])

        for ts in qs:
            if hasattr(ts, 'tag') and hasattr(ts.tag, 'dbpedia_fields') :
                match_tag = ts.tag.id in matchtagids
                contenus[ts.datasheet_id]['tags'].append({'id': ts.tag.id,
                                                          'label': ts.tag.label,
                                                          'order': ts.order,
                                                          'match': match_tag,
                                                          'translated_label': translations.get(ts.tag.dbpedia_fields.id, ts.tag.label) if ts.tag.dbpedia_fields is not None else ts.tag.label,
                                                          'url': ts.tag.dbpedia_uri,
                                                          'wkpd_url': ts.tag.wikipedia_url})

                if match_tag:
                    contenus[ts.datasheet_id]['score'] += 2*max_tag_order - ts.order

        if contentlist is None:
            contenus = sorted(contenus.values(),key=lambda e: -e['score'])
        else:
            contenus = contenus.values()

        #tagqs = tagqs.annotate(nb=Count('datasheet')).order_by('-nb')[:tag_count]
        tagqs = tagqs.annotate(nb=Count('datasheet')).order_by('-nb').only('id','label', 'dbpedia_uri', 'wikipedia_url')[:tag_count]
        #.select_related('dbpedia_fields')
        # hack to add only necessary fields in the group by
        # contournement bug https://code.djangoproject.com/ticket/17144
        #tagqs.query.clear_select_fields()
        #tagqs.query.add_fields(['id','label'], False)
        #tagqs.query.set_group_by()

        tagqslist = list(tagqs)

        dbpediafields = dict([(df.tag_id, df) for df in DbpediaFields.objects.filter(tag__in = tagqslist)])

        if lang not in no_translate_langs:
            transqs = DbpediaFieldsTranslation.objects.filter(master__in = dbpediafields.values(), language_code = lang)
            translations = dict([(trans.master_id,trans.label) for trans in transqs])

        tags = [{'id': tag.id,
                 'label': tag.label,
                 'score': tag.nb,
                 'thumbnail': dbpediafields[tag.id].thumbnail if tag.id in dbpediafields else None,
                 'translated_label': translations.get(dbpediafields[tag.id].id, tag.label) if tag.id in dbpediafields else tag.label,
                 'url': tag.dbpedia_uri,
                 'wkpd_url': tag.wikipedia_url} for tag in tagqslist]

        countryqs = countryqs.annotate(nb=Count('includes__tag__taggedsheet'))
        countries = dict([(country.dbpedia_uri, country.nb) for country in countryqs])

        discqslist = list(discqs.annotate(nb=Count('taggedsheet')).order_by('-nb')[:10])

        if lang not in no_translate_langs:
            list_dbpediafields = [tag.dbpedia_fields for tag in discqslist if tag.dbpedia_fields is not None]
            transqs = DbpediaFieldsTranslation.objects.filter(master__in = list_dbpediafields, language_code = lang)
            translations = dict([(trans.master_id,trans.label) for trans in transqs])

        disciplines = [{'label':tag.label,'score':tag.nb, 'translated_label': translations.get(tag.dbpedia_fields.id, tag.label) if tag.dbpedia_fields is not None else tag.label} for tag in discqslist]

        years = {}
        yearqs = yearqs.annotate(nb=Count('tag__taggedsheet'))
        for ty in yearqs:
            for year in range(ty.start_year, ty.end_year):
                years[year] = ty.nb + (years[year] if year in years else 0)

        yearchange = []
        for year in sorted(years.keys()):
            score = years[year]
            if year < 2011:
                if (year-1 not in years and score != 0) or (year-1 in years and years[year-1] != score):
                    yearchange.append({'year': year, 'score': score})
                if year+1 not in years and year != -1 and score != 0:
                    yearchange.append({'year': year+1, 'score': 0})

        tag_translations = {}
        for t in itertools.chain(labeltranslations,disciplines,tags):
            tag_translations[t['label']] = t['translated_label']
        for c in contenus:
            for t in c['tags']:
                tag_translations[t['label']] = t['translated_label']

        output = {'count': cont_count, 'contents': contenus, 'tags':tags, 'sparkline':yearchange, 'countries':countries, 'disciplines':disciplines, 'tagtranslations': tag_translations}
        outputstr = json.dumps(output)
        cache.set(cache_key, outputstr)

    return outputstr



def subtree(tree):
    """
    Methode récursive permettant de remplir un arbre ce catégories avec les fiches HDA correspondantes.

    :param tree: L'arbre de catégorie

    :returns:Un arbre de catégorie rempli de fiches HDA.

    format du paramêtre `tree` ::

        {
            "label": "secteur urbain",
            "contents": [
                { "label": "banlieue",
                    "contents": [
                        { "label": "faubourg" }
                    ] },
                { "label": "îlot" },
                ...
            ]
        }

    Exemple de retour ::


        {
            "label": "secteur urbain",
            "contents": [
                {
                    "score": 6,
                    "organization": "Institut national de l'audiovisuel ( INA )",
                    "description": "Pour faire face à la ...",
                    "title": "La construction des grands ensembles de banlieue : l'exemple de Sarcelles",
                    "url": "http://fresques.ina.fr/jalons/fiche-media/InaEdu01075/la-construction-des-grands-ensembles-de-banlieue--l-exemple-de-sarcelles",
                    "hda_id": "2090",
                    "organization_url": "http://www.ina.fr",
                    "id": 12360
                },
                {
                    "score": 6,
                    "organization": "Maison de banlieue et d'architecture",
                    "description": "La Maison de banlieue et d'architecture...",
                    "title": "Des ensembles assez grands. Mémoire et projets en Essonne",
                    "url": "http://maisondebanlieue.fr/wp-content/uploads/2011/05/Cahier11_grands_ensembles.pdf",
                    "hda_id": "5893",
                    "organization_url": "http://www.maisondebanlieue.fr/",
                    "id": 14821
                },
                ...
            ]
            "themes": [
                {
                    "label": "faubourg",
                    "content":  [...],
                    "themes": [...]
                },
                ...
            ]
        }

    """
    MAX_TAG_ORDER = 16
    label = tree['label']
    sub = tree.get('contents',[])

    datasheets = Datasheet.objects.filter(validated = True, taggedsheet__tag__label__iexact = label, taggedsheet__order__lte = MAX_TAG_ORDER).annotate(tagorder=Min('taggedsheet__order')).select_related('organisation').distinct()

    contents = [{ 'description': ds.description, 'title': ds.title, 'url': ds.url, 'score': int((MAX_TAG_ORDER - ds.tagorder)/2), 'id': ds.id, 'hda_id': ds.hda_id, 'organization': ds.organisation.name, 'organization_url': ds.organisation.website } for ds in datasheets]

    contents = sorted(contents, key=lambda e: -e['score'])

    res = { 'label': label }

    if len(contents):
        res['contents'] = contents

    if len(sub):
        subcats = [subtree(st) for st in sub]
        subcats = [sc for sc in subcats if len(sc.get('contents',[])) or len(sc.get('themes',[]))]
        res['themes'] = subcats

    return res

def filltree(request):
    """
    Vue permettant d'ajouter des fiches à un arbre de catégories.
    Cette méthode est en fait un simple wrapper pour la méthode :meth:`subtree`.

    Paramêtres GET:
        :var tree: Serialisation json d'un arbre de catégories à remplir. exemple:

        ::

            {
                "label": "secteur urbain",
                "contents": [
                    { "label": "banlieue",
                      "contents": [
                          { "label": "faubourg" }
                      ] },
                    { "label": "îlot" },
                    ...
                ]
            }

    Réponse (application/json):
        L'arbre de catégories remplis de fiches HDA (c.f. retour methode :meth:`subtree`)

    """

    tree = request.GET.get('tree','{}')

    treeobj = json.loads(tree)

    res = subtree(treeobj)

    return HttpResponse(content=json.dumps(res), content_type='application/json')
author	ymh <ymh.work@gmail.com>
	Wed, 11 Apr 2018 12:19:47 +0200
branch	documentation
changeset 693	09e00f38d177
parent 620	f45d7494332e
permissions	-rw-r--r--