[koha-Infos] Koha avec 220.000 notices

miled rousset miled.rousset at mom.fr
Jeu 7 Avr 12:22:09 CEST 2005



paul POULAIN a écrit :

> miled rousset a écrit :
>
>> Bonjour à tous,
>>
>> J'ai fini de charger 220.000 notices dans koha (il a mis 42 heures),  
>> il reste très stable et très rapide,
>> c'est très encourageant pour la suite.
>
>
>
> Voilà qui est fort intéressant...
> quelques questions :
> * la config du serveur (matérielle et logicielle)

C'est un serveur PowerEdge DELL 1750 avec la SUSE 9.1 (Linux)
Disque SCSI, 512 RAM, processeur Xeon 2,8 Go

> * la complexité des notices ?

chaque notice comporte 80 champs (pas forcement tous remplie à chaque fois)

> * la taille de la base résultante ?

1,6 Go

>
> A titre d'information, sur ma machine, avec disques SCSI, je charge 10 
> notices complètes à la seconde de manière assez constante (du moins 
> jusqu'à 45 000, le maximum que j'ai fait...). Ce qui fait 10*60*60 = 
> 36 000 notices/heure. Donc nettement moins de 42H pour 220 000. Votre 
> disque n'est surement qu'un IDE. Là, effectivement, ca rame, et en 
> plus ca diminue... Avantage supplémentaire du disque SCSI : la machine 
> reste parfaitement utilisable, même si ralentie. En IDE, c'est 
> totalement inutilisable.
>
Il faut dire qu'à partir de 150.000 notices, l'insertion d'une notice 
est très longue, c'est normal, à chaque insertion de notice
il pose des requêtes de cohérence au serveur, plus il y a de notices 
plus la réponse est longue .....ENFIN ce que je pense !!
Donc je crois que c'est raisonnable le temps, mais si on peut faire 
mieux pourquoi pas !!!

> Par contre, que ca reste très rapide à l'usage avec un disque IDE, ca 
> m'épate... Il faudrait voir avec des tests de charge et préciser votre 
> config mysql. A titre d'information, je sais qu'à Nelsonville, ils ont 
> des disques SCSI, mais surtout 2Go de RAM, dont 1Go en disque virtuel, 
> utilisé par mysql pour faire ses tris en RAM et pas sur le disque. 
> Sinon, ils ont des processeurs à 1GHz !
>
> PS : tentez le mod_perl, ca devrait accélérer encore.
> PS2 : des autorités dans le fichier ? si oui, il faut aussi les 
> reconstruire, il y a un modèle de script dans migration_tools.
> PS3 : dans la prochaine version majeure, il y aura des modifs 
> profondes dans la base qui permettront :
> 1- de diminuer fortement sa taille
> 2- d'accélérer fortement les recherches
> 3- de faire du "ranking" (= tri par pertinence)
>
> Et j'ai déjà quelques idées pour faire de l'indexation full-texte sur 
> les documents électroniques, (un début de GED quoi) ;-)

C'est une bonne idée !!

-- 
Miled ROUSSET
Responsable plate forme "Têtes de Réseau Documentaire"
Maison de l'Orient et de la Méditerranée
CNRS - Université Lumière Lyon 2
5-7, rue Raulin 69007 Lyon
Tél : 04  72  71  58  96
      __________
     /   --    (
    / ------  //
   /  ----   //
  /_________//
 (_________(/




Plus d'informations sur la liste de diffusion Infos