[koha-Infos] valeurs iso-639-2 [ was : listes deroulantes geléé ]

Thomas Harding thomas.harding at laposte.net
Lun 6 Oct 20:08:41 CEST 2003


On Mon, Oct 06, 2003 at 09:09:21AM +0200, paul POULAIN wrote:
> >     C Alternative SQL
> >       *inconnue*
> >
> Et elle le restera : ces tables sont trop sensibles pour qu'on "joue" 
> avec directement.

J'ai un peu mis le nez dans le source et la structure des tables : c'est
assez coton en effet (et malheureusement manque de doc) :)

> 
> >Pour ceux que ça intéresse, j'ai bricolé un fichier de valeurs ISO 639-2
> >« machine readable » à partir de la page de la librairie du congrès (à
> >la date du 30/09/2003).  L'idéal serait un constructeur de valeurs pour
> >l'associer au code du pays, afin de pouvoir remplir le repère 101 et
> >consors, mais je ne me sens pas maintenir le fichier (si quelqu'un a
> >essayé de faire de même, il sait ce que je veux dire par là), ni
> >fabriquer un constructeur de valeurs qui tienne la route.
> > 
> >
> Ca pourrait être intéressant. Peux tu donner quelques détails et 
> exemples de ce qui est déjà fait ?

- En m'inspirant de ce qui existe déjà pour les codes pays, j'ai extrait
  les "tableaux html" pour en faire une liste à séparateur "pipe" (html
  entre guillemets, parce que la page est impossible à parser, étant
  éditée au petit bonheur) -- "|" était le caractère le plus viable. Le
  plus simple pour le maintenir serait de faire un diff régulier sur le
  fichier html de la bibliothèque du congrès, et le mieux serait de
  pouvoir mettre en place le fichier texte chez eux (mon provider est
  filtré par leurs anti-spams...).

  Ca donne :
  (bib)|(trm)|(2c)|anglais|français NB: les valeurs de départ ne sont pas
                                        toujours présentes.
  
  aar||aa|Afar|afar
  abk||ab|Abkhazian|abkhaze
  [...]
  ady|||Adyghe; Adygei|adygh
  afa|||Afro-Asiatic (Other)|afro-asiatiques, autres langues
  bel||be|Belarusian|biélorusse
  [...]
  chu||cu|Church Slavic; Old Slavonic; Church Slavonic; Old Bulgarian;
  Old Church Slavonic|slavon d'église; vieux slave; slavon liturgique;
  vieux bulgare [1 ligne]
  wel|cym|cy|Welsh|gallois
  [etc]
  
- J'ai bricolé un peu en sed et awk pour en faire un fichier SQL (au choix,
  valeurs en français ou en anglais), afin de rentrer ça facilement dans les
  valeurs autorisées (testé OK, mais c'est du kisVs).

 -> INSERT INTO authorised_values(category,authorised_value,lib)
 VALUES('ISO6392Bfr','aar','afar');

(je peux te poster tout ça en bal, mais ce qui m'enquiquine est que
j'ignore le statut légal du fichier ISO 639-2 d'origine -- pas de
licence, mais ils disent en gros être seul site officiel. Et quand je
vois ce que ça donne avec la classification décimale _de_ Dewey...).

- J'ai commencé à mettre le nez dans la construction des valeurs
  "éditeur" (marche pas, au moins dans la 2.0.0.rc4, malgré
  l'essai de "1234 -- éditeur -- toto"), afin de pouvoir combiner si
  besoin est les valeurs langue-pays (ex; fre-FR), mais il va me falloir
  un peu de temps (j'en suis à l'analyse, et je m'y perds un peu) :)

Donc pas grand chose : 6 à 8 heures de boulot pas spécialement efficace,
vu que j'ai fini de rage à grands coups de tidy, vim, html2txt et sed
pour la liste :)

Le pire étant que j'ignore si les bibliothéquaires en on _vraiment_
besoin :/

-- 
Thomas Harding


Plus d'informations sur la liste de diffusion Infos