<div dir="ltr">Zeno,<div>in a script I use to build auth records with MARC::Record I set</div><div>explicitly utf8 for input and output. </div><div><br></div><div>Are you doing something similar?</div><div><br></div><div><div>
<font face="courier new, monospace">open my $out, ">", $outfile;</font></div><div><font face="courier new, monospace">binmode($out, ":utf8");</font></div><div><font face="courier new, monospace"><br>
</font></div><div><font face="courier new, monospace">open my $in, "<:utf8", $infile or die("Can't open auth file!");<br></font></div></div><div><font face="courier new, monospace">...</font></div>
<div><font face="courier new, monospace">$record->encoding( 'UTF-8' );<br></font></div><div><font face="courier new, monospace">...</font></div><div><font face="courier new, monospace">print $out $record->as_usmarc();</font><br>
</div><div><br></div><div><br></div><div>Bernardo</div><div><br></div></div><div class="gmail_extra"><br clear="all"><div>-- <div>Bernardo Gonzalez Kriegel</div><div><a href="mailto:bgkriegel@gmail.com" target="_blank">bgkriegel@gmail.com</a></div>
</div>
<br><br><div class="gmail_quote">On Mon, Sep 30, 2013 at 9:56 AM, Zeno Tajoli <span dir="ltr"><<a href="mailto:z.tajoli@cineca.it" target="_blank">z.tajoli@cineca.it</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi Paul and all,<br>
<br>
Il 30/09/2013 01:55, Paul ha scritto:<div class="im"><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
MARC (specifically LoC) tends to suggest that accented characters like é<br>
are in fact two chars ... and we've found this quite painful under some<br>
circumstances.<br>
<br>
You say you're importing from a text file (assuming UTF8). Can you try<br>
just putting a plain "e" (or the old fashioned IBM 130, or ANSI 0233) in<br>
this biblio to see if it works properly? Koha appears to never have<br>
problems with today's UTF char_set based on the older single chars.<br>
</blockquote>
<br></div>
I insert a plain 'e' inside the record and all is OK<br>
In fact I also modified lenght in leader from 00859 to 00861<br>
and now with 'é' all is OK<br>
<br>
My text file is UTF-8.<br>
It is during the creation of MARC blob that leader lenght is set<br>
in a wrong way.<br>
<br>
But I don't underdstood why.<br>
<br>
Cheers<div class="HOEnZb"><div class="h5"><br>
Zeno Tajoli<br>
-- <br>
Dr. Zeno Tajoli<br>
Dipartimento Gestione delle Informazioni e della Conoscenza<br>
<a href="mailto:z.tajoli@cineca.it" target="_blank">z.tajoli@cineca.it</a><br>
fax <a href="tel:%2B39%2002%202135520" value="+39022135520" target="_blank">+39 02 2135520</a><br>
CINECA - Sede operativa di Segrate<br>
______________________________<u></u>_________________<br>
Koha-devel mailing list<br>
<a href="mailto:Koha-devel@lists.koha-community.org" target="_blank">Koha-devel@lists.koha-<u></u>community.org</a><br>
<a href="http://lists.koha-community.org/cgi-bin/mailman/listinfo/koha-devel" target="_blank">http://lists.koha-community.<u></u>org/cgi-bin/mailman/listinfo/<u></u>koha-devel</a><br>
website : <a href="http://www.koha-community.org/" target="_blank">http://www.koha-community.org/</a><br>
git : <a href="http://git.koha-community.org/" target="_blank">http://git.koha-community.org/</a><br>
bugs : <a href="http://bugs.koha-community.org/" target="_blank">http://bugs.koha-community.<u></u>org/</a><br>
</div></div></blockquote></div><br></div>