[koha-Infos] Dédoublonnage
LAURENT Henri-Damien
henridamien at koha-fr.org
Mar 29 Sep 15:33:54 CEST 2009
Camille Espiau-Bechetoille a écrit :
> Bonjour,
>
> Le SCD Lyon 2 a effectué quelques tests de dédoublonnage dans Koha, à partir d'imports iso2709 depuis notre base Loris ou depuis Electre.
>
> Toutefois, certaines informations nous semblent obscures :
>
> -Dans la définition des règles de concordance, les critères "offset" et "taille" semblent insensibles à la valeur que l'on a définie. Les résultats sont identiques, que l'on mette "0" ou une valeur plus élevée.
>
Normalement, si vous mettez une taille >0 les données considérées pour
la règle sont bien taillées selon la taille donnée.
Par contre, si taille==0 alors effectivement, c'est toute la donnée qui
est considérée et offset n'est pas utilisé. (On peut considèrer cela
comme un bug.)
> -Quel est le rapport entre le score attribué à des points de concordance et le seuil de concordance attribué à l'ensemble de la règle définie?
>
>
A chaque point de concordance, si la règle concorde, vous augmentez le
"score" de la notice du score du point de concordance.
Une fois que toutes les points de concordance de la règle ont été
considérés,
si le score de votre notice est Strictement supérieur au seuil de
concordance, alors votre notice est considérée comme ayant correspondance.
> -La notion de réservoir n'est pas très claire : parfois les notices sont préparées pour être traitées, parfois elles sont importées dans le réservoir avant traitement pour import dans la base. Quels sont réellement le rôle et les limites de ce réservoir?
>
mmmm... C'est peut-être le workflow qui a besoin d'être clarifié.
Effectivement, quand on passe par une recherche z3950, on fait "comme
si" on faisait un import en masse (du stage import), sauf que la partie
"vérification"/ recherche de doublon est faite non pas par la machine,
mais de façon "visuelle" par l'utilisateur.
Je ne sais pas si je suis très clair.
J'ai en fait du mal à voir ce qui est envisagé derrière la question.
--
Henri-Damien LAURENT
BibLibre
Plus d'informations sur la liste de diffusion Infos