[koha-Infos] Classement par titre v3.0
Ronald GANIER
ronald.ganier at progilone.fr
Mar 27 Juil 19:23:13 CEST 2010
Bonjour.
Les suites de caractères à échapper lors du tri doivent être définies dans
le paramétrage Zebra de manière exhaustive:
Dans zebradb/lang_defs/fr/sort-string-utf.chr :
map (^Le\s) @
map (^La\s) @
...
Cela signifie :
échapper la suite "Le " en début de texte.
échapper la suite "La " en début de texte.
...
On serait du coup tenté de croire qu’il est possible d'utiliser une
expression régulière pour retirer les caractères compris entre x88 et x89
(NSB,NSE) :
Dans zebradb/etc/word-phrase-utf.chr :
map (\x88.*\x89) @
Malheureusement, à ce jour nous ne sommes pas encore parvenu à tout faire
fonctionner.
Seul "\s" est une expression régulière, signifiant un caractère d'espace.
Attention également aux performances, l'indexation avec expression régulière
pouvant prendre énormément plus de temps.
Bonnes vacances à tous
Capturer
-----Message d'origine-----
De : infos-bounces at listes.koha-fr.org
[mailto:infos-bounces at listes.koha-fr.org] De la part de BERNON Jean
Envoyé : vendredi 23 juillet 2010 16:59
À : discussions générales sur Koha
Objet : Re: [koha-Infos] Classement par titre v3.0
A Lyon 3 nous avons noté le problème suivant dans le classement par titre.
Il y a deux séquences parce que certains de nos titres contiennent des
caractères NSB/NSE (délimiteurs des débuts de titre à ne pas classer que
l'on trouve dans les notices venant du SUDOC) et d'autres ne les contiennent
pas. Je pense qu'avec Zebra ce problème (comme celui-ci du "De l" sans
doute) est soluble en améliorant le paramétrage du fichier
zebradb/lang_defs/fr/sort-string-utf.chr, mais nous n'avons pas encore
trouvé la bonne formule.
Bonnes vacances
Jean Bernon
-----Message d'origine-----
De : infos-bounces at listes.koha-fr.org
[mailto:infos-bounces at listes.koha-fr.org] De la part de Martine Chazelas
Envoyé : vendredi 23 juillet 2010 10:41
À : discussions générales sur Koha
Objet : Re: [koha-Infos] Classement par titre v3.0
Bonjour,
J'ai essayé aussi avec le mot "architecture" (école d'architecture)
dans ma base. Cela marche bien aussi. Ce qui est troublant c'est que
lorsque le titre contient deux mots vides en entrée comme "De la ..."
ou "De l'..." le titre est classé à la lettre L et on a alors le
sentiment que l'ordre alphabétique n'est plus respecté. Simplement la
règle que semble utiliser Koha est de ne considérer comme mot vide que
le premier terme. Il ne tient pas compte du "De" et classe à L.
Cordialement
Martine
Sylvia Bozan a écrit :
> Pascale Nalon a écrit :
>> Bonjour,
>>
>> Je viens de faire dans l'interface professionnelle une recherche par
>> titre sur un mot (mines), ce qui me donne 2117 réponses (on est au
>> Mines) !
>> Jusque là tout est normal !
>> J'ai demandé le classement des réponses par titre (A-Z puis Z-A pour
>> voir) avec 20 réponses par page.
>> Si sur les 4à premières pages il n'y a pas de problèmes, à partir de
>> la quarante et unième ça semble n'importe quoi !
>> Avez-vous déjà remarqué ce genre de problème sur vos catalogues ?
>>
>> Cordialement
>>
>> --
>>
>> Pascale Nalon
>>
>> Bibliothèque de Mines ParisTech
>>
>> 35, rue St Honoré
>>
>> 77300 Fontainebleau
>>
>> Tel : 01 64 69 48 79
>>
>>
> Bonjour Pascale,
> J'ai fait une test sur l'interface pro du catalogue de la bibliothèque
> de sociologie avec la requête "sociologie", aucun problème rencontré
> (et en plus le temps de réponse est super rapide :-) ). J'ai la
> version 3.00.05.003 avec Zebra
> Bien à toi
> Sylvia
>
_______________________________________________
Infos mailing list
Infos at listes.koha-fr.org
https://listes.koha-fr.org/cgi-bin/mailman/listinfo/infos
_______________________________________________
Infos mailing list
Infos at listes.koha-fr.org
https://listes.koha-fr.org/cgi-bin/mailman/listinfo/infos
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: </pipermail/infos/attachments/20100727/dabd3553/attachment-0001.htm>
-------------- section suivante --------------
Une pièce jointe autre que texte a été nettoyée...
Nom: non disponible
Type: image/jpeg
Taille: 21738 octets
Desc: non disponible
URL: </pipermail/infos/attachments/20100727/dabd3553/attachment-0001.jpeg>
More information about the Infos
mailing list