<a href="https://colab.research.google.com/github/Danangellotti/Ciencia_de_Datos_UGR_24/blob/main/Copia_de_Semana_02_Tema_04_Archivo_xml.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Archivo xml

Es un lenguaje de marcado extensible y se utiliza para el almacenamiento, transmición y reconstrucción de datos. Es facil de leer y comprender.

Donde más se ve su utilización es en la comucicación con las API's.

## Estructura esperada

```xml
<?xml version="1.0" ?>
<datos>
	<pais nombre="Uruguay">
		<anio>2008</anio>
		<vecinos>
			<vecino nombre="Argentina" direccion="Oeste"/>
			<vecino nombre="Brazil" direccion="Norte"/>
		</vecinos>
	</pais>
	<pais nombre="Honduras">
		<anio>2011</anio>
		<vecinos>
			<vecino nombre="Guatemala" direccion="Norte"/>
			<vecino nombre="Nicaragua" direccion="Sur"/>
		</vecinos>
	</pais>
</datos>
```

# Importaciones

In [1]:
from typing import List
import xml.etree.ElementTree as ET
from xml.dom.minidom import parseString as minidom_parseString, parse as minidom_parse

In [2]:
#@title Definición de variables

archivo = "./29_archivo.xml" #@param {type:"string"}

## Dato

Vamos a definir una función que me devuelva el contenido que deseamos guardar en el archivo.


In [3]:
def _crear_datos_pais(nombre: str, anio: int, vecinos: List) -> ET.Element:
  """ Función que crea el elemento country

  Args:
      nombra (str): Nombre.
      anio (str): Año.
      vecinos (list): Lista de paises vecinos. La primera posición es
          el nombre del país y la segunda es la dirección según los
          puntos cardinales.

  Returns:
      ET.Element: Retorna un elemento del tipo Element.
  """
  pais = ET.Element("pais", {"nombre": nombre})
  anio_ = ET.SubElement(pais, "anio")
  anio_.text = str(anio)
  vecinos_et = ET.SubElement(pais, "vecinos")
  for vecino in vecinos:
      ET.SubElement(vecinos_et, "vecino", {
          "nombre": vecino[0],
          "direccion": vecino[1]
      })

  return pais

def obtener_datos() -> ET.Element:
  """ Función que retorna el contenido que será guardado en un archivo.

  Returns:
    ET.Element: Retorna un elemento del tipo Element.
  """
  dato = ET.Element("datos")
  dato.append(
        _crear_datos_pais(nombre="Uruguay",
                            anio=2008,
                            vecinos=[["Argentina", "Oeste"],
                                     ["Brazil", "Norte"]]))
  dato.append(
        _crear_datos_pais(nombre="Honduras",
                            anio=2011,
                            vecinos=[["Guatemala", "Norte"],
                                     ["Nicaragua", "Sur"]]))
  return dato

## Escritura

Vamos a escribir una función para guardar crear el archivo.

In [4]:
def escribir_archivo(archivo:str):
  """ Función que escribe un archivo.

  Args:
    archivo (str): Carpeta y nombre del arhivo que deseamos escribir.
  """
  with open(archivo, "wt") as w:
      # escribe el xml en formato de texto
      w.write(
          minidom_parseString(ET.tostring(obtener_datos())).toprettyxml())


## Lectura

Vamos a crear una función para leer el archivo.

In [5]:
def leer_archivo(archivo:str):
  """ Función que lee un archio.

  Args:
    archivo (str): Carpeta y nombre del arhivo que deseamos escribir.
  """
  # lee el archivo
  dato = minidom_parse(archivo)
  if dato:
      # en la variable data tengo un string con el contenido xml,
      # entonces lo formateo com la función [toprettyxml]. Esta función
      # agrega enter's por como esta escrito el archivo, entonces
      # lo separo por enter [split('\n')] y luego verifico si la línea
      # está vacia no la agrego al resultado [if line.strip()]. Por
      # último uno la lista resultante con un enter ['\n'.join()]
      dato = '\n'.join(
          [line for line in dato.toprettyxml().split('\n') if line.strip()])
  else:
      dato = "Archivo vacio"
  print(dato)


## Ejecución

In [6]:
# escritura
escribir_archivo(archivo=archivo)

In [7]:
# lectura
leer_archivo(archivo=archivo)

<?xml version="1.0" ?>
<datos>
	<pais nombre="Uruguay">
		<anio>2008</anio>
		<vecinos>
			<vecino nombre="Argentina" direccion="Oeste"/>
			<vecino nombre="Brazil" direccion="Norte"/>
		</vecinos>
	</pais>
	<pais nombre="Honduras">
		<anio>2011</anio>
		<vecinos>
			<vecino nombre="Guatemala" direccion="Norte"/>
			<vecino nombre="Nicaragua" direccion="Sur"/>
		</vecinos>
	</pais>
</datos>
