# Generación de ficheros de metadatos y lectura de formatos en python

#### Gonzalo Rodríguez Cañada 

#### ETL 2020-21

##### Ficheros YAML

YAML es un estándar de serialización de datos legibles para el ser humano que puede utilizarse en conjunto con todos los lenguajes de programación y se suele utilizar para escribir archivos de configuración.

*Características de los ficheros YAML*
   
   A diferencia de XML o JSON, **YAML** presenta los datos de una manera que hace fácil su lectura para un humano. La simple sintaxis no afecta a las capacidades del lenguaje. Cualquier dato o estructura añadida a un archivo XML o JSON también puede ser almacenada en YAML.

Además del código legible por humanos, YAML también tiene otras características:

    - Portabilidad de datos en varios idiomas
    - Un modelo de datos consistente
    - Procesamiento de una sola pasada
    - Facilidad de aplicación y uso
    

*Para leer primero importamos yaml para que jupyter entienda que lo que estamos haciendo es introducir ficheros .yaml*


In [1]:
import yaml

#Definimos la función

def read_yaml_file(filename):
    with open(filename, 'r') as stream:
        try:
            print(yaml.safe_load(stream))
        except yaml.YAMLError as exc:
            print(exc)

Genero un fichero

In [2]:
example =  [{'name': 'Juanito', 'occupation': 'Chef'},
         {'name': 'Lucía', 'occupation': 'Peluquera'}]

In [3]:


with open('example.yaml', 'w') as f:
    
    data = yaml.dump(example, f)




Leemos el fichero

In [4]:


read_yaml_file("example.yaml")



[{'name': 'Juanito', 'occupation': 'Chef'}, {'name': 'Lucía', 'occupation': 'Peluquera'}]


##### Ficheros  JSON

**JSON**(JavaScript Object Notation) es un formato ligero de intercambio de datos. Es fácil de leer y escribir para los humanos. Es fácil para las máquinas de analizar y generar. Está basado en un subconjunto del Lenguaje de Programación . JSON es un formato de texto que es completamente independiente del lenguaje, pero utiliza convenciones que son familiares para los programadores de la familia de lenguajes C, incluyendo C, C++, C#, Java, JavaScript, Perl, Python, y muchos otros. Estas propiedades hacen de JSON un lenguaje ideal para el intercambio de datos.

JSON está construido sobre dos estructuras:

    Una colección de pares nombre/valor. En varios idiomas, esto se realiza como un objeto, registro, estructura, diccionario, tabla hash, lista clave, o conjunto asociativo.
    Una lista ordenada de valores. En la mayoría de los idiomas, esto se realiza como una matriz, vector, lista o secuencia.

Se trata de estructuras de datos universales. Prácticamente todos los lenguajes de programación modernos las soportan de una forma u otra. Tiene sentido que un formato de datos que es intercambiable con los lenguajes de programación también se base en estas estructuras.


*Importamos JSON para que interprete que introducimos fichero .json*

In [5]:
import json

Para leer 

In [6]:
l = open('x.json', encoding="utf8")

data = json.load(l)

data

{'glossary': {'title': 'example glossary',
  'GlossDiv': {'title': 'S',
   'GlossList': {'GlossEntry': {'ID': 'SGML',
     'SortAs': 'SGML',
     'GlossTerm': 'Standard Generalized Markup Language',
     'Acronym': 'SGML',
     'Abbrev': 'ISO 8879:1986',
     'GlossDef': {'para': 'A meta-markup language, used to create markup languages such as DocBook.',
      'GlossSeeAlso': ['GML', 'XML']},
     'GlossSee': 'markup'}}}}}

Para crear

In [7]:
data_json = {}

data_json['Alumnos'] = []

data_json['Alumnos'].append({
    'Nombre': 'Fran',
    'Apellidos': 'Rguez',
    'Edad': 17})

data_json['Alumnos'].append({
    'Nombre': 'Tánia',
    'Apellidos': 'Vilella',
    'Edad': 13})

data_json['Alumnos'].append({
    'Nombre': 'Marcos',
    'Apellidos': 'Miranda',
    'Edad': 12})

with open('data.json', 'w', encoding = 'utf8') as file:
    json.dump(data_json, file, indent=4)

In [8]:
data_json

{'Alumnos': [{'Nombre': 'Fran', 'Apellidos': 'Rguez', 'Edad': 17},
  {'Nombre': 'Tánia', 'Apellidos': 'Vilella', 'Edad': 13},
  {'Nombre': 'Marcos', 'Apellidos': 'Miranda', 'Edad': 12}]}