[koha-Infos] Dédoublonnage

LAURENT Henri-Damien henridamien at koha-fr.org
Mar 29 Sep 15:33:54 CEST 2009


Camille Espiau-Bechetoille a écrit :
> Bonjour,
>
> Le SCD Lyon 2 a effectué quelques tests de dédoublonnage dans Koha, à partir d'imports iso2709 depuis notre base Loris ou depuis Electre.
>
> Toutefois, certaines informations nous semblent obscures : 
>
> -Dans la définition des règles de concordance, les critères "offset" et "taille" semblent insensibles à la valeur que l'on a définie. Les résultats sont identiques, que l'on mette "0" ou une valeur plus élevée.
>   
Normalement, si vous mettez une taille >0 les données considérées pour 
la règle sont bien taillées selon la taille donnée.
Par contre, si taille==0 alors effectivement,  c'est toute la donnée qui 
est considérée et offset n'est pas utilisé. (On peut considèrer cela 
comme un bug.)
> -Quel est le rapport entre le score attribué à des points de concordance et le seuil de concordance attribué à l'ensemble de la règle définie?
>
>   
A chaque point de concordance, si la règle concorde, vous augmentez le 
"score" de la notice du score du point de concordance.
Une fois que toutes les points de concordance de la règle ont été 
considérés,
si le score de votre notice est Strictement supérieur au seuil de 
concordance, alors votre notice est considérée comme ayant correspondance.

> -La notion de réservoir n'est pas très claire : parfois les notices sont préparées pour être traitées, parfois elles sont importées dans le réservoir avant traitement pour import dans la base. Quels sont réellement le rôle et les limites de ce réservoir? 
>   
mmmm... C'est peut-être le workflow qui a besoin d'être clarifié.
Effectivement, quand on passe par une recherche z3950, on fait "comme 
si" on faisait un import en masse (du stage import), sauf que la partie 
"vérification"/ recherche de doublon est faite non pas par la machine, 
mais de façon "visuelle" par l'utilisateur.
Je ne sais pas si je suis très clair.
J'ai en fait du mal à voir ce qui est envisagé derrière la question.

-- 
Henri-Damien LAURENT
BibLibre


Plus d'informations sur la liste de diffusion Infos