Import marc and choose manually label correspondence

Hi,

I'm looking for a library management logiciel and I think Zotero can be the one. But I have one condition, I need to import a .marc backup from PMB. I've test quickly and I have 2 problems : the encoding and the non-correspondence between PMB label and Zotero label.

For example after import, the Zotero title contains : 95 - F�evrier 2004 - Le march�e du travail en novembre 2003 (the number in my collection and the date of publication and the title)

Somebody know a solution and/or a plugin for this type of import ?

PS : I don't know PMB or Zotero freeware, I'm just the guy "who do the informatic things" in my association so I must do "the things"...

Thanks
PA

  • You can set the import character encoding in the Export tab of the Zotero preferences.

    I don't unfortunately understand the "the PMB label and Zotero label" part. Could you give an example? We also don't know what PMB stands for. And if you'd rather write in French, that's perfectly fine, even though we'll likely reply in English.
  • Bonjour,

    merci pour votre retour ! Pour l'encodage, je vais regarder de ce pas dans les paramètres.
    L'autre partie de ma question concerne les champs (ou nom de colonne en tableur). Dans l'exemple fourni, suite à l'import, j'ai dans mon champ 'titre' sous Zotero :
    95 - F�evrier 2004 - Le march�e du travail en novembre 2003
    Il s'agit en réalité d'une "concaténation" des champs issus de PMB : 'numéro dans ma collection/bibliothèque' - 'date de publication' - 'titre'

    J'espère avoir été plus clair... Je peux me réessayer à l'anglais, mais comme vous avez pu le lire, ce n'est pas mon point fort !
    Merci pour votre temps
    PA
  • The PMB exports Unimarc, not MARC 21, right?
  • Yes and another formats.
    I test to import in enl (endnote), ris, marc (and xml (not supported), txt (not supported), html (not supported)) but I've always the field name problem.

    And with adamsmith's answer, I look in preferences but there's not ISO-8859-1 so I've always problem with french accent. (perhap's in notepad or other with replace function it will be more easy/quick)
  • De toute façon, ISO-8859-1 ne vous aidera point. Votre fichier est très probablement encodé en MARC-8. Je ne peux pas le verifier ici mais:
    - c'est un codage répandu parmis les systèmes de gestion de bibliothèque et
    - c'est le seul codage utilisé en Europe à ce jour que je connais où les accents précèdent les lettres de base: La é en « F�evrier » ­serait réalisé avec un seul symbole à 8bit en ISO-8859-1; en Unicode ça serait ou un symbole composé comme en ISO-8859-1 ou décomposé en "e" + "´" .

    Le plus facile serait probablement de chercher un autre format d'export dans PMB car les formats MARC21 et UNIMARC ne partagent pas les étiquettes des champs, ou Vous cherchez un logiciel pour convertir les données UNIMARC en MARC21. Zotero, si je ne me trompe pas, ne comprend que MARC21.
  • J'ose pas trop vous contredire car je ne comprends pas vraiment ce que je fais mais sous PMB, j'ai essayé plusieurs formats d'exports dont le xml (dublin core, xml labellisé). En dublin core, la balise en haut est encoding="utf-8"?>. Pour le xml labellisé, il y a encoding="iso-8859-1"?>.

    Suite à votre remarque, j'ai téléchargé MarcEdit et j'ai essayé toutes sortes de conversion, rien de ne semble fonctionner pour mes accents... (de .marc , .xml , .ris vers . mrc , .mrk , .mrk8). Et l'outil UNIMARC vers marc21 plante sur mon fichier.
    J'ai vraiment l'impression de vous faire perdre votre temps (en plus du mien)...

    En dernier lieu, si vous souhaitez regarder, j'ai placé sur le ftp de notre partenaire différent export brut de PMB en différents formats. Peut-être remarquerez vous en un coup d’œil la source du blocage ...?
    https://doc.pilote41.fr/fournisseurs/cdpne/PMB_export/

    Et déjà un grand merci pour le temps que vous avez pris à me répondre
  • Pas de succès ici, non plus, avec le fichier MARC. Je ne comprends pas ce codage.

    Mais importer le fichier RIS fonctionne sans problèmes: Comme adamsmith a dit, il faut que vous choisissiez « Western » sous
    Édition > Préférences > Exportation > Codage de caractères 
    En ce qui concerne la concaténation des champs dans le champ « titre », c’est exactement comment les données sont exportées du système d’origine:

    En UNIMARC:
    00417nas2 22001211i 450 0010005000001000041000052000116000465300062001622100030002241010008002542150008002627100025002707791  a20080826u        u  u0frey0103   ba1 a95 - FÂevrier 2004 - Le marchÂe du travail en novembre 2003h95iLe marchÂe du travail en novembre 20039id:321  aBref Centre - Bulletin RÂegional Travail Emploi Formation  h2004-02-01dFÂevrier 20040 afre  a8 p02aDRTEFP40709id:1146
    En RIS:
    TY  - JOUR
    TI - 95 - Février 2004 - Le marché du travail en novembre 2003
    SP - 8 p
    PY - Février 2004
    AD - DRTEFP
    ER -
    Je ne sais pas beaucoup sur UNIMARC, mais il me semble non-standard comment le champ « titre » (champ 200) est composé ici. Aussi, en comparant les exports RIS et MARC, on voit que le champ 530 (le périodique) n’est pas inclu au fichier RIS. Peut-être on pourrait changer les préférences du logiciel d’origine pour l’inclure?


  • J'ai répondu hier soir mais il semble que mon message ne soit pas publié, j'ai dû faire une erreur à l'envoi. De mémoire, en plus de mes remerciements : je n'avais pas testé en "Western", merci gduffner, ça fonctionne en effet avec le RIS mais ça me perd beaucoup de champs.

    En parallèle, j'ai contacté Terry Reese, le créateur de MarcEdit qui m'a gentiment répondu que ma version de PMB (3.4.3) me fourni un UNIMARC codé en ISO 5426 (obsolète). En prime, il m'a fourni une version de mon fichier converti par ses soins en marc21 et codage en UTF8 --> une partie de mon problème est ainsi résolu, merci à lui !

    Mon second problème persiste en partie, je perds le champ 'Cote' qui permet à ma collègue de faire le lien pour chaque livre entre la bibliothèque physique et l'index numérique (PMB ou bientôt Zotero). J'ai fait plusieurs conversions du marc21 fourni par T. Reese sans succès (en json, rdf, dublin core, mrcx, xml) et testé leurs imports dans Zotero.
    Si vous avez encore un peu de temps à m'accorder, j'ai placé le fichier marc21_data.mrc (et les autres conversions) sur le serveur FTP si vous pouvez voir à quel endroit j'ai oublié une étape dans l'export/import...
    https://doc.pilote41.fr/fournisseurs/cdpne/PMB_export/
  • Bien fait. M. Reese est un vrai expert en cette matière.

    La logique pour les imports reste dans les « translators ». Le translator pour fichiers MARC est là: https://github.com/zotero/translators/blob/master/MARC.js

    Vous verrez que le champ « Cote » est importé depuis les champs MARC suivants (l. 485-488 et 650-658)
    "084"
    "082"
    "080"
    "070"
    "060"
    "050"
    "090"
    "099"
    "852"
    "686"
    "676"
    "675"
    "680"
    A mon avis il y a deux possibilités : l’une serait de créer une version du dit translator qui attribue votre champ privé de cote au champ Cote de Zotero, ou vous changez votre export que la cote se retrouve dans le champ (standard) 852.

    Et je viens de découvrir un autre problème dans votre export. Les noms des auteurs des livres (en champs 100 et 700) sont pas correctement inscrits. Ils devraient se trouver dans le sous-champ "$a" mais la lettre identifiant le sous-champ manque, donc la première lettre du nom doit être interprété comme identifiant du sous-champ (dans le cas ci-dessus: $T, $R, $B et $U). N’étant pas une « a », Zotero n’importera pas le nom. C’est probablement un problème de la conversion en MarcEdit:


    =ldr 00753nam a22001931i 4500
    =001 6882
    =008 070404u u b
    =020 $a2271057450
    =245 1 $aInvertébrés d'eau douce$bsystématique, biologie, écologie
    =260 $aParis$bCNRS Edition$c2003
    =300 $a587 p
    =100 1 $Tachet, Henry$4070
    =700 1 $Richoux, Philippe$4070
    =700 1 $Bournaud, Michel
    =700 1 $Usseglio-Polatera, Philippe
    =995 $aCDPNE$cCDPNE$f1287$k534 TAC$ruu$qu
    =995 $aCDPNE$cCDPNE$f1938$k534 TAC$ruu$qu
    =996 $f1287$k534 TAC$m00000000$n00000000$aCDPNE$b2$vCDPNE$xBureau Thierry$eLivre$1Consultation sur place
    =996 $f1938$k534 TAC$m00000000$n00000000$aCDPNE$b2$vCDPNE$xBibliothèque CDPNE$eLivre$1Consultation sur place
Sign In or Register to comment.