# Introduction

Suite à la publication de 340 notices d'entités LRM par le groupe Systèmes et Données https://zenodo.org/record/7358799 voici un ensemble de scripts pour visualiser un peu leur contenu

Les données diffusées en iso2709 ont été converties en MarcXML pour faciliter les traitements.

4 fichiers sont fournis :

In [1]:
manifs_filename = "UMB_Manifestations.xml"
oeuvres_expressions_filename = "UMA_Oeuvres_Expressions.xml"
autres_entites_filename = "UMA_Autres_Entites_Liees.xml"
items_filename = "UMH_Items.xml"

In [4]:
import SRUextraction as sru # import du fichier https://github.com/Lully/bnf-sru/blob/master/SRUextraction.py
from lxml import etree

ns = {"marc": "http://www.loc.gov/MARC21/slim"}

In [24]:
manifs_file = etree.parse(manifs_filename)
oeuvres_expressions_file = etree.parse(oeuvres_expressions_filename)
autres_entites_file = etree.parse(autres_entites_filename)
items_file = etree.parse(items_filename)

### Fonctions d'extraction

In [82]:
class Record:
    def __init__(self, xml_record, rectype):
        self.xml = xml_record
        self.type = rectype
        self.id = sru.record2fieldvalue(self.xml, "001")
        self.label = get_label(self.xml, self.type)
    
    def __repr__(self):
        return etree.tostring(self.xml).decode("utf-8")

class Manifestation(Record):
    def __init__(self, xml_record, rectype):
        pass
    
def get_label(xml_record, rectype):
    label = []
    if rectype in "mipc":
        label.append(sru.record2fieldvalue(xml_record, "200$a"))
    elif rectype in "eo":
        for field in xml_record.xpath("*[@tag]"):
            tag = field.get("tag")
            if tag.startswith("2"):
                if sru.field2subfield(field, "a"):
                    label.append(sru.field2subfield(field, "a"))
                else:
                    label.append("*"*20)
                    label.append("$a vide")
                    label.append(sru.field2value(field))
    return ", ".join(label)

# Relations entre entités

Liens : 531 $3

Point d'accès structuré: zone 511

Note (non exploitable informatiquement) 370

# Les manifestations

Besoins : 
* pour une manifestation, récupérer les métas principales :
  * titre, point d'accès, auteur
  * liens aux entités Expressions (et oeuvre ?)
* pour une manif, récupérer la liste des expressions et la liste des oeuvres (lien direct)
  * créer des attributs à la manifs, en fournissant l'expression source pour chaque oeuvre identifié


In [83]:
manifs = [Record(manif, "m") for manif in manifs_file.xpath(".//marc:record", namespaces=ns)]
oeuvres_expr = [Record(manif, "o") for manif in oeuvres_expressions_file.xpath(".//marc:record", namespaces=ns)]  

## Liste des ID et titres

In [84]:
for el in manifs:
    print(el.id, el.label)

UMLRM0003 Nosferatu
UMLRM0006 Dracula
UMLRM0009  Nosferatu, fantôme de la nuit
UMLRM0012 "Nosferatu le vampire"
UMLRM0015 Jean-Claude Gallotta, Nosferatu, ballet de l'Opéra
UMLRM0018 Dracula
UMLRM0021  Dracula
UMLRM0024 Dracula
UMLRM0027 Dracula
UMLRM0030 Dracula
UMLRM0033 Dracula
UMLRM0036 Dracula
UMLRM0039 Dracula
UMLRM0042  Dracula
UMLRM0045 Dracula
UMLRM0048 Dracula
UMLRM0051 Dracula
UMLRM0054 Dracula
UMLRM0057 Dracula
UMLRM0060  Dracula
UMLRM0063 Dracula
UMLRM0066 Drácula
UMLRM0069 Dracula‎
UMLRM0072 Bram Stoker
UMLRM0077 Dracula¤suivi de L'invité de Dracula
UMLRM0080 Bram Stoker's Dracula
UMLRM0083  "Dracula"
UMLRM0086 Dracula
UMLRM0089 Le vampire au fil des siècles
UMLRM0092 Nosferatu
UMLRM0095 Nosferatu
UMLRM0101 Nosferatu
UMLRM0104 Nosferatu
UMLRM0107 Dracula has risen from the grave‎
UMLRM0110 Dracula
UMLRM0113  Bram Stoker’s Dracula
UMLRM0116 Dracula l'immortel
UMLRM0119 Dracula l'immortel
UMLRM0122  Dracula, mort et heureux de l’être
UMLRM0128 Bram Stoker’s notes for “Drac

# Oeuvres expressions

Liste des titres

## Distinguer oeuvres et expressions

Label pos.9 permet de distinguer oeuvres et expressions : valeurs h / t (auteur-titre, ou titre seul) 

Zone 154 $a pos1 : a = oeuvre ; b = expression ; x = ne s'applique pas

Point d'accès
* 231 pour les oeuvres
* 232 pour les expressions

In [85]:
for el in oeuvres_expr:
    print(el.id, el.label)

UMLRM0001 $a vide, $7 ba0yba0y $8 freger $t Nosferatu, eine Symphonie des Grauens $c film
UMLRM0002 Nosferatu, eine Symphonie des Grauens
UMLRM0004 Stoker, Bram (1847-1912)
UMLRM0005 Stoker, Bram (1847-1912)
UMLRM0007  Nosferatu, Phantom der Nacht
UMLRM0008 Nosferatu, Phantom der Nacht
UMLRM0010 Palma, Paola (1971-….)¤Vezyroglou, Dimitri (1970-….)
UMLRM0011 Palma, Paola (1971-….)¤Vezyroglou, Dimitri (1970-….)
UMLRM0013 Jean-Claude Gallotta, Nosferatu, ballet de l'Opéra
UMLRM0014 Jean-Claude Gallotta, Nosferatu, ballet de l'Opéra
UMLRM0020 Stoker, Bram (1847-1912)
UMLRM0031 Stoker, Bram (1847-1912)
UMLRM0032 Stoker, Bram (1847-1912)
UMLRM0034 Humphries, Tudor (1953-….)
UMLRM0035 Humphries, Tudor (1953-….)
UMLRM0037 Stoker, Bram (1847-1912)
UMLRM0038 Stoker, Bram (1847-1912)
UMLRM0041 Stoker, Bram (1847-1912)
UMLRM0047 Stoker, Bram (1847-1912)
UMLRM0050 Stoker, Bram (1847-1912)
UMLRM0053 Stoker, Bram (1847-1912)
UMLRM0056 Stoker, Bram (1847-1912)
UMLRM0059 Stoker, Bram (1847-1912)
UMLRM0