[koha-Infos] Classement par titre v3.0

Ronald GANIER ronald.ganier at progilone.fr
Mar 27 Juil 19:23:13 CEST 2010


Bonjour.

 

Les suites de caractères à échapper lors du tri doivent être définies dans
le paramétrage Zebra de manière exhaustive:

Dans zebradb/lang_defs/fr/sort-string-utf.chr : 

        map (^Le\s)        @

        map (^La\s)        @

        ...

Cela signifie : 

        échapper la suite "Le " en début de texte.

        échapper la suite "La " en début de texte.

        ...

 

On serait du coup tenté de croire qu’il est possible d'utiliser une
expression régulière pour retirer les caractères compris entre x88 et x89
(NSB,NSE) :

Dans zebradb/etc/word-phrase-utf.chr : 

        map (\x88.*\x89)    @

 

Malheureusement, à ce jour nous ne sommes pas encore parvenu à tout faire
fonctionner.

Seul "\s" est une expression régulière, signifiant un caractère d'espace.

Attention également aux performances, l'indexation avec expression régulière
pouvant prendre énormément plus de temps.

 

Bonnes vacances à tous

 

Capturer

 

-----Message d'origine-----
De : infos-bounces at listes.koha-fr.org
[mailto:infos-bounces at listes.koha-fr.org] De la part de BERNON Jean
Envoyé : vendredi 23 juillet 2010 16:59
À : discussions générales sur Koha
Objet : Re: [koha-Infos] Classement par titre v3.0

 

A Lyon 3 nous avons noté le problème suivant dans le classement par titre.
Il y a deux séquences parce que certains de nos titres contiennent des
caractères NSB/NSE (délimiteurs des débuts de titre à ne pas classer que
l'on trouve dans les notices venant du SUDOC) et d'autres ne les contiennent
pas. Je pense qu'avec Zebra ce problème (comme celui-ci du "De l" sans
doute) est soluble en améliorant le paramétrage du fichier
zebradb/lang_defs/fr/sort-string-utf.chr, mais nous n'avons pas encore
trouvé la bonne formule.

Bonnes vacances

Jean Bernon

 

-----Message d'origine-----

De : infos-bounces at listes.koha-fr.org
[mailto:infos-bounces at listes.koha-fr.org] De la part de Martine Chazelas

Envoyé : vendredi 23 juillet 2010 10:41

À : discussions générales sur Koha

Objet : Re: [koha-Infos] Classement par titre v3.0

 

Bonjour,

 

J'ai essayé aussi avec le mot "architecture"  (école d'architecture) 

dans ma base. Cela marche bien aussi. Ce qui est troublant c'est que 

lorsque le titre contient deux mots vides en entrée comme  "De la ..." 

ou "De l'..." le titre est classé à la lettre L et on a alors le 

sentiment que l'ordre alphabétique n'est plus respecté. Simplement la 

règle que semble utiliser Koha est de ne considérer comme mot vide que 

le premier terme. Il ne tient pas compte du "De" et classe à L.

 

Cordialement

 

Martine

 

 

 

 

Sylvia Bozan a écrit :

> Pascale Nalon a écrit :

>> Bonjour,

>> 

>> Je viens de faire dans l'interface professionnelle une recherche par 

>> titre sur un mot (mines), ce qui me donne 2117 réponses (on est au 

>> Mines) !

>> Jusque là tout est normal !

>> J'ai demandé le classement des réponses par titre (A-Z puis Z-A pour 

>> voir) avec 20 réponses par page.

>> Si sur les 4à premières pages il n'y a pas de problèmes, à partir de 

>> la quarante et unième ça semble n'importe quoi !

>> Avez-vous déjà remarqué ce genre de problème sur vos catalogues ?

>> 

>> Cordialement

>> 

>> -- 

>> 

>> Pascale Nalon

>> 

>> Bibliothèque de Mines ParisTech

>> 

>> 35, rue St Honoré

>> 

>> 77300 Fontainebleau

>> 

>> Tel : 01 64 69 48 79

>> 

>> 

> Bonjour Pascale,

> J'ai fait une test sur l'interface pro du catalogue de la bibliothèque 

> de sociologie avec la requête "sociologie", aucun problème rencontré 

> (et en plus le temps de réponse est super rapide :-) ). J'ai la 

> version 3.00.05.003 avec Zebra

> Bien à toi

> Sylvia

> 

 

_______________________________________________

Infos mailing list

Infos at listes.koha-fr.org

https://listes.koha-fr.org/cgi-bin/mailman/listinfo/infos

_______________________________________________

Infos mailing list

Infos at listes.koha-fr.org

https://listes.koha-fr.org/cgi-bin/mailman/listinfo/infos

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: </pipermail/infos/attachments/20100727/dabd3553/attachment-0001.htm>
-------------- section suivante --------------
Une pièce jointe autre que texte a été nettoyée...
Nom: non disponible
Type: image/jpeg
Taille: 21738 octets
Desc: non disponible
URL: </pipermail/infos/attachments/20100727/dabd3553/attachment-0001.jpeg>


More information about the Infos mailing list