[koha-Infos] Import UNIMARC
paul POULAIN
paul.poulain at biblibre.com
Mar 14 Oct 17:41:41 CEST 2008
Julien Berard a écrit :
> paul POULAIN a écrit :
>
>> Julien Berard a écrit :
>>
>>
>>> Bon dans ce cas je n'y touche pas, j'ai vu que pour des raisons de
>>> "copyright" l'annexe J concernant l'encodage ISO-2709 n'est pas
>>> disponible sur le UNIMARC MANUAL, c'est dommage.
>>>
>>>
>>>
>> Vive google :
>> http://bibliotheque.bgp-fr.com/Unimarc_decriptage-ISO2709.pdf
>>
>>
>>
> Ce document est interessant, si je comprend bien "l'encodage" du fichier
> et donc de l' ISO 646 IRV, quand j'essaye de le convertir en UTF 8, j'ai
> une erreur par rapport a un caractere d'echappement, ce qui semble
> correspondre à ce vous m'avez dit précédement.
> L'emplacement de ce caractère correspond au premier accent présent dans
> mon fichier. Il est possible que mon fichier n'aie pas été exporté au
> bon format? En unimarc oui, mais pas en ISO-646?
>
au feeling, non, ce n'est pas la raison. Ou alors, qqc du genre : la
notice croit qu'elle est exportée en unicode (iso646), donc avec les
accents sur 2 octets. mais en fait non (ou le contraire)
du coup, dans l'en tête, on a "le champ fait X octets" alors qu'en fait,
il en fait X-n (ou X+n selon le sens de l'erreur)
exemple : "général" => 9 octets en isu646, 7 en latin1. L'en tête peut
écrire 9 alors que les données sont 7, ou le contraire.
bon, c'est une piste au feeling, mais ce ne serait pas la 1ere fois que
je croise ce genre de pb.
--
Paul POULAIN
http://www.biblibre.com
Expert en Logiciels Libres pour l'info-doc
NOUVEAU TELEPHONE : 04 91 81 35 08
Plus d'informations sur la liste de diffusion Infos