# Trabajo con XML en Python

Para la realización de estos ejercicios, podeis consultar:
1. [Video: trabajo con librería pandas en Python](https://www.youtube.com/watch?v=avGrGydcAWI)
2. [Documento: Trabajar xon XML en Python](https://docs.google.com/document/d/1bDwPQ07CjNdeN-uxXvw8Lgm2dopt1ntkhlJnnHuCQhc/edit?usp=sharing)
3. [Tutorial: Uso de XML en python](https://www.oulub.com/es-ES/Python/library.xml.etree.elementtree)

### Ejercicio 1

Obtener el fichero XML "student.xml" y convertir en un Dataframe con las siguientes columnas "name","email","grade","age".<br>
Este proceso encapsulalo en una función de nombre "loadStudentsFromXML" al cual se le pase un parámetro el fichero a cargar (ruta y nombre del fichero), y retorne el Dataframe obtenido.
Para obtener ayuda mirar el siguiente [video](https://youtu.be/avGrGydcAWI)

In [None]:
import xml.etree.ElementTree as et
import pandas as pd

def loadStudentsFromXML(strFile):

    doc = et.parse(strFile)

    xroot = doc.getroot()

    df_cols = ["name","email","grade","age"]
    rows = []

    for node in xroot:
        name = node.attrib.get("name")
        mail = node.find("email").text
        grade = node.find("grade").text
        age = node.find("age").text

        rows.append({"email": mail,"name": name, "grade": grade, "age": age})


    df = pd.DataFrame(rows, columns=df_cols)
    return df

df = loadStudentsFromXML("./res/student.xml")
#print(df)

In [None]:
import xml.etree.ElementTree as et

doc = et.parse("")
xroot = doc.getroot()

libro = xroot.find("boot")
libro.attrib.pop()

et.ElementTree.write

### Ejercicio 2

Utilizando el método del ejercicio-1, con el dataframe obtenido establece la columna índice a la columna "name"

In [None]:
df = loadStudentsFromXML("./res/student.xml")
df = df.set_index("name")
print(df)

### Ejercicio 3

Carga el fichero CSV "student.csv" en un panda Dataframe, en el cual la columna indice sea el nombre del alumno

In [None]:
df = pd.read_csv("./res/students.csv",index_col="name")
print(df)

### Ejercicio 4

Carga el fichero CSV "student.csv", pero solo carga las columnas name, email y age.

In [None]:
df = pd.read_csv("./res/students.csv",index_col="name",usecols=['name','email','age'])
print(df)

### Ejercicio 5

Pasar el XML "students.xml" a un diccionario con la siguiente estructura.<br>
Una lista que contenga la siguiente información:
<br>
```python
[
  {
    "name": "John"
    "email": john@mail.com,
    "grade": "A",
    "age": 16
  {
    "name": "Alice"
    "email": "alice@mail.com",
    "grade": "B",
    "age": 17
},
   ... 
] 
```
Definir una función "studentsXml2Dic" con un parámetro que sea el nombre del fichero, y retorne el diccionario construido.<br>
Para la realización de este ejercicio consultar [Trabajo con XML en Python](https://docs.google.com/document/d/1bDwPQ07CjNdeN-uxXvw8Lgm2dopt1ntkhlJnnHuCQhc/edit?usp=sharing)

In [61]:
import xml.etree.ElementTree as et
import json

#Pasos para la realización
# 1. Cargar y parsear el fichero con ElementTree
# 2. Recorrer el XML e ir creando el diccionario por cada estudiante
# 3. Agregar a la lista cada estudiente (diccionario) generado


def studentsXml2Dic(strXmlFile):
     xtree = et.parse(strXmlFile)
     xroot = xtree.getroot()

     listaStudents = []

     for node in xroot:
          name = node.attrib.get("name")
          mail = node.find("email").text
          grade = node.find("grade").text
          age = node.find("age").text

          dictStd = {"name": name, "email": mail, "grade": grade, "age": age }
          listaStudents.append(dictStd)

     return listaStudents


In [None]:
# Probar la función
dictStudents = studentsXml2Dic("./res/student.xml")

#Para facilitar la visualización, utilizar este truco utilizando la libreria json.
print(json.dumps(dictStudents,sort_keys=True,indent=4))

### Ejercicio 6

Pasar el diccionario creado en el ejercicio anterior, a un fichero XML "estudiantes.xml".<br>
La estructura será igual al fichero XML "student.xml" (carpeta /res).
Para ello utilizar la libreria "xml.etree.ElementTree".
Fichero resultante debe ser este: 
<br>
```xml
<students>
    <student name="John">
        <email>john@mail.com</email>
        <grade>A</grade>
        <age>16</age>
    </student>
    <student name="Alice">
        <email>alice@mail.com</email>
        <grade>B</grade>
        <age>17</age>
    </student>
    <student name="Bob">
        <email>bob@mail.com</email>
        <grade>C</grade>
        <age>16</age>
    </student>
    <student name="Hannah">
        <email>hannah@mail.com</email>
        <grade>A</grade>
        <age>17</age>
    </student>
</students>
```
Para la realización de este ejercicio consultar [Trabajo con XML en Python](https://docs.google.com/document/d/1bDwPQ07CjNdeN-uxXvw8Lgm2dopt1ntkhlJnnHuCQhc/edit?usp=sharing)

In [68]:
import xml.etree.ElementTree as et
import json

#Pasos para la realización
# 1. Parametros necesarios dicionario-estudiantes y nombre-fichero-xml-guardar
# 2. Iterar por la lista de estudiantes
# 3. Crear el nodo-raiz del XML
# 4. Crear el nodo-estudiante
# 5. Crear los Tag (age, email, grade)
# 6. Agregar al nodo-estudiante los hijos (age,email,grade)
# 7. Guardar el nodo-raiz como un fichero XML

def studentsDic2Xml(dicStudents, strXmlFileToSave):

    # 3. Crear el nodo-raiz del XML
    root = et.Element("students")
    
    # 2. Iterar por la lista de estudiantes
    for studentItem in dictStudents:

        # 4. Crear el nodo-estudiante
        studentTag = et.Element("student", attrib={"name": studentItem['name']})
        
        # 5. Crear los Tag (age, email, grade)
        emailTag = et.Element("email")
        emailTag.text = studentItem["email"]
        studentTag.append(emailTag)

        gradeTag = et.Element("grade")
        gradeTag.text = studentItem["grade"]
        studentTag.append(gradeTag)
        
        ageTag = et.Element("age")
        ageTag.text = studentItem["age"]
        studentTag.append(ageTag)
        
        # 6. Agregar al nodo-estudiante los hijos (age,email,grade)
        root.append(studentTag)

    xmlTree = et.ElementTree(root)

    # 7. Guardar el nodo-raiz como un fichero XML
    xmlTree.write(strXmlFileToSave)

In [None]:
# Probar la función

#Llamar a la función anterior
dictStudents = studentsXml2Dic("./res/student.xml")

#Convertir el diccionario en XML ==> llamar a la función
studentsDic2Xml(dictStudents,'./res/estudiantes.xml')

### Ejercicio 7

Pasar el XML "ciclos-ies-gonzalo-nazareno.xml" a la siguiente estructura python.<br>
```python
{
    "nombre": "IES Gonzalo Nzareno",
    "web": "",
    "ciclos": [
        {
            "id": "ASIR",
            "nombre": "Administración de Sistemas informáticos en Red",
            "grado": "Superior",
            "decretoTitulo": "2009"
        },
         {
            "id": "DAW",
            "nombre": "Desarrollo de Aplicaciones Web",
            "grado": "Superior",
            "decretoTitulo": "2010"
        },
    ],
    "modulos": [
        {
            "id": 228,
            "modulo": "Aplicaciones Web",
            "curso": 2,
            "horasSemanales": 4,
            "ciclo": "SMR"
        },
         {
            "id": 373,
            "modulo": "Lenguajes de marcas y sistemas de gestión de información",
            "curso": 1,
            "horasSemanales": 4,
            "ciclo": ["ASIR", "DAW", "DAM" ]
        },
    ]
} 
```
Definir una función "ciclosXml2Dic" con un parámetro que sea el nombre del fichero, y retorne la estructura construida.

In [9]:
import xml.etree.ElementTree as et
import json

#Pasos para la realización
# 1. Cargar y parsear el fichero con ElementTree
# 2. Recorrer el XML e ir creando el diccionario por cada estudiante
# 3. Agregar a la lista cada estudiente (diccionario) generado

def ciclosXml2Dic(strXmlFile):

    doc = et.parse(strXmlFile)
    xroot = doc.getroot()

    dc = {}
    ciclos = []
    modulos = []

    # Cargar el nombre y la web
    dc = {
        "nombre": xroot.find("nombre").text,
        "web": xroot.find("web").text
    }

    # Obtenemos los ciclos
    ciclosNode = xroot.find("ciclos")

    for node in ciclosNode:

        cicloDict = {
            "id": node.attrib.get("id"),
            "nombre": node.find("nombre").text,
            "grado": node.find("grado").text,
            "decretoTitulo": node.find("decretoTitulo").attrib.get("año")
        }

        ciclos.append(cicloDict)

    # Obtenemos los módulos

    modulosNode = xroot.find("modulos")

    for moduleNode in modulosNode:

        moduloDict = {
            "id": moduleNode.attrib.get("id"),
            "nombre": moduleNode.find("nombre").text,
            "curso": moduleNode.find("curso").text,
            "horasSemanales": moduleNode.find("horasSemanales").text,
        }

        moduleCiclos = []
        for cicloNode in moduleNode.findall("ciclo"):
            moduleCiclos.append(cicloNode.text)

        moduloDict["ciclo"]= moduleCiclos

        modulos.append(moduloDict)


    ## Formamos el diccionario final

    dc["ciclos"] = ciclos
    dc["modulos"] = modulos


    return dc

In [None]:
# Probar la función

dc = ciclosXml2Dic("./res/ciclos-ies-gonzalo-nazareno.xml")
dc