[koha-Infos] Import UNIMARC

paul POULAIN paul.poulain at biblibre.com
Mar 14 Oct 17:41:41 CEST 2008


Julien Berard a écrit :
> paul POULAIN a écrit :
>   
>> Julien Berard a écrit :
>>   
>>     
>>> Bon dans ce cas je n'y touche pas, j'ai vu que pour des raisons de 
>>> "copyright" l'annexe J concernant l'encodage ISO-2709 n'est pas 
>>> disponible sur le UNIMARC MANUAL, c'est dommage.
>>>   
>>>     
>>>       
>> Vive google :
>> http://bibliotheque.bgp-fr.com/Unimarc_decriptage-ISO2709.pdf
>>
>>   
>>     
> Ce document est interessant, si je comprend bien "l'encodage" du fichier 
> et donc de l' ISO 646 IRV, quand j'essaye de le convertir en UTF 8, j'ai 
> une erreur par rapport a un caractere d'echappement, ce qui semble 
> correspondre à ce vous m'avez dit précédement.
> L'emplacement de ce caractère correspond au premier accent présent dans 
> mon fichier. Il est possible que mon fichier n'aie pas été exporté au 
> bon format? En unimarc oui, mais pas en ISO-646?
>   
au feeling, non, ce n'est pas la raison. Ou alors, qqc du genre : la 
notice croit qu'elle est exportée en unicode (iso646), donc avec les 
accents sur 2 octets. mais en fait non (ou le contraire)
du coup, dans l'en tête, on a "le champ fait X octets" alors qu'en fait, 
il en fait X-n (ou X+n selon le sens de l'erreur)

exemple : "général" => 9 octets en isu646, 7 en latin1. L'en tête peut 
écrire 9 alors que les données sont 7, ou le contraire.

bon, c'est une piste au feeling, mais ce ne serait pas la 1ere fois que 
je croise ce genre de pb.

-- 
Paul POULAIN
http://www.biblibre.com
Expert en Logiciels Libres pour l'info-doc
NOUVEAU TELEPHONE : 04 91 81 35 08



Plus d'informations sur la liste de diffusion Infos