<div dir="ltr">Waqar,<br><div class="gmail_extra"><br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">After enabling the ICU option manually, it's not working for my huge data until I deleted the most of the biblio records.<br>
<br>Then only difference was, I modified <span style="font-family:courier new,monospace"><icu_chain locale="en"></span> to blank <span style="font-family:courier new,monospace"><icu_chain locale=""></span> instead of <span style="font-family:courier new,monospace"><icu_chain locale="en_IN.UTF-8">. </span>As I am not sure what to do with locale for other languages<br>
</blockquote><div><br></div><div style>You cannot not have a locale, so far as I know. Leave it as locale="en" if you don't know what locale you want. </div><div style><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
So,<br><br>1 - I am getting these warining? Although I have already renamed my <br>    default.idx located at /home/koha/koha-dev/etc/zebradb/etc (i hope this is the right location)<br></blockquote><div><br></div><div style>
I'm not sure why you're talking about renaming default.idx, but you should not be. default.idx is required whether you are using ICU or not. You just have to adjust whether it is using an icuchain or charmap file.</div>
<div style><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">====================<br>REINDEXING zebra<br>

====================<br>12:22:45-10/01 zebraidx(2057) [warn] Unknown register type: 0<br>12:22:45-10/01 zebraidx(2057) [warn] Unknown register type: n<br>12:22:45-10/01 zebraidx(2057) [warn] Unknown register type: y<br>12:22:45-10/01 zebraidx(2057) [warn] Unknown register type: d<br>


<br>2 - Right after that I have this warning<br><br>    [warn] previous transaction didn't reach commit<br></blockquote><div><br></div><div style>That will be because either A) there was a very corrupted record or (more likely) B) the lack of a default.idx file is giving Zebra conniptions.</div>
<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">3 - I deleted the records upto just 9000. Now zebra started to index other languages. Why it is working only on this small set of data? Do i need to define any escape sequence somewhere for some special characters.<br>
</blockquote><div><br></div><div style>I had problems using ICU indexing for datasets larger than ~400k. I believe the problem was a corrupted record, but with 450k records I couldn't be bothered to track down which record it was.</div>
<div style><br></div><div style>Regards,<br>Jared</div></div><div><br></div>-- <br>Jared Camins-Esakov<div>Bibliographer, C & P Bibliography Services, LLC</div><div>(phone) +1 (917) 727-3445</div><div>(e-mail) <a href="mailto:jcamins@cpbibliography.com" target="_blank">jcamins@cpbibliography.com</a></div>
<div>(web) <a href="http://www.cpbibliography.com/" target="_blank">http://www.cpbibliography.com/</a></div>
</div></div>