[koha-Infos] Import UNIMARC
Frederic Demians
frederic at tamil.fr
Mar 28 Oct 11:17:25 CET 2008
> Comment as tu fais pour trouver que c'etait du mac-roman et des fins
> de ligne en mac ?
Le flair du chasseur...
Fin de ligne: hexdump -C qui montre 0d
MacRoman : Si les fins de ligne sont CR alors c'est l'ancien format MAC,
d'où ancien encodage des caractères, donc MacRoman. CQFD.
> Alors j'ai fais un :
> iconv -f MAC -t UTF8 -o test file.txt
> sur vi :
> :%s/\r/\n/g
> Ca ma mis des ^@ a la palce des ^M.
> Ensutie j'ai fais un
> :%s/^@/\r/g
> Et la j'ai enfin un fichier lisible :-).
Pas mal ! Il y a avait aussi :
iconv -f mac -t utf8 marc.txt | tr "\r" "\n" >marc-propre.txt
>> http://marcpm.sourceforge.net
> Maintenant que j'ai mon fichier lisible, je n'ai pas d'autres
> solutions que d'ecrire un script perl avec ces librairies? Il existe
> certain soft pour passer du marc textualisé au marc iso27049?
Pas à ma connaissance. Vois peut-être avec MarcEdit que je ne connais
pas bien. Mais de toute façon, il faudra créer des exemplaires en 995
dans les notices bibliographiques. MARC/Perl est très bien pour ça.
--
Frédéric DEMIANS
http://www.tamil.fr/u/fdemians.html
Plus d'informations sur la liste de diffusion Infos