<font size=6 color=red>30 días de Python: Día 20 - Manejo de archivos</font>

---

## Manejo de archivos

Hasta ahora hemos visto diferentes tipos de datos de Python. Por lo general, almacenamos nuestros datos en diferentes formatos de archivo. 
Además del manejo de archivos, también veremos diferentes formatos de archivo (.txt, .json, .xml, .csv, .tsv, .excel) en esta sección. 
Primero, familiaricémonos con el manejo de archivos con formato de archivo común (.txt).

El manejo de archivos es una parte importante de la programación que nos permite crear, leer, actualizar y eliminar archivos. En Python, para manejar datos, usamos la función integrada `open()`.

*Sintaxis:*

```python
open('filename', mode)  # mode(r, a, w, x, t, b) podría ser leer, escribir, actualizar
```

'`r`' - Lectura - Valor predeterminado. Abre un archivo para lectura, devuelve un error si el archivo no existe.

'`a`' - Agregar - Abre un archivo para agregar, crea el archivo si no existe.

'`w`' - Escribir - Abre un archivo para escribir, crea el archivo si no existe.

'`x`' - Create - Crea el archivo especificado, devuelve un error si el archivo existe.

'`t`' - Texto - Valor por defecto. Modo de texto.

'`b`' - Binario - Modo binario (por ejemplo, imágenes)


---

## Abrir archivos para leer

El modo predeterminado de apertura es lectura, por lo que no tenemos que especificar "`r`' o '`rt`'. Creé y guardé un archivo llamado read_file_example.txt en el directorio de archivos. Veamos cómo se hace:

```python
f = open('./files/reading_file_example.txt')
print(f)  # <_io.TextIOWrapper nombre='./files/reading_file_example.txt' mode='r' encoding='UTF-8'>
```

Como puede ver en el ejemplo anterior, imprimí el archivo abierto y brindó información al respecto. El archivo abierto tiene diferentes métodos de lectura: `read()`, `readline()`, `readlines()`. Un archivo abierto debe cerrarse con el método `close()`.

---

* `read()`: Lee todo el texto como una cadena. Si queremos limitar el número de caracteres que queremos leer, podemos limitarlo pasando el valor int al método `read(number)`.

```python
f = open('./files/reading_file_example.txt')
txt = f.read()
print(type(txt))
print(txt)
f.close()
```

*Salida:*

```text
<class 'str'>
Este es un ejemplo para mostrar cómo abrir un archivo y leer.
Esta es la segunda línea del texto.
```


En lugar de imprimir todo el texto, imprimamos los primeros 10 caracteres del archivo de texto.

```python
f = open('./files/reading_file_example.txt')
txt = f.read(10)
print(type(txt))
print(txt)
f.close()

```


*Salida:*

```text
<class 'str'>
Esto es un

```

---

* `readline()`: Lee solo la primera línea.

```python
f = open('./files/reading_file_example.txt')
line = f.readline()
print(type(line))
print(line)
f.close()

```


*Salida:*

```text
<class 'str'>
Este es un ejemplo para mostrar cómo abrir un archivo y leer.

```

---

* `readlines()`: Lee todo el texto línea por línea y devuelve una lista de líneas.

```python
f = open('./files/reading_file_example.txt')
lines = f.readlines()
print(type(lines))
print(lines)
f.close()

```

*Salida:*

```text
<class 'list'>
['Este es un ejemplo para mostrar cómo abrir un archivo y leer.\n', 'Esta es la segunda línea del texto.']

```


Otra forma de obtener todas las líneas como una lista es usando `splitlines()`:

```python
f = open('./files/reading_file_example.txt')
lines = f.read().splitlines()
print(type(lines))
print(lines)
f.close()

```


*Salida:*

```text
<class 'list'>
['Este es un ejemplo para mostrar cómo abrir un archivo y leer.', 'Esta es la segunda línea del texto.']

```

Después de abrir un archivo, debemos cerrarlo. Hay una alta tendencia a olvidarse de cerrarlos. Hay una nueva forma de abrir archivos usando `with` - cierra los archivos por sí mismo. Reescribamos el ejemplo anterior con el método `with`:

```python
with open('./files/reading_file_example.txt') as f:
    lines = f.read().splitlines()
    print(type(lines))
    print(lines)
 ```

*Salida:*

```text
<class 'list'>
['Este es un ejemplo para mostrar cómo abrir un archivo y leer.', 'Esta es la segunda línea del texto.']
```


---

## Abrir archivos para escribir y actualizar

Para escribir en un archivo existente, debemos agregar un modo como parámetro a la función `open()`:

```text
'a' - agregar - se agregará al final del archivo, si el archivo no lo hace, crea un nuevo archivo.
'w' - escribir - sobrescribirá cualquier contenido existente, si el archivo no existe, lo crea.
```

Agreguemos algo de texto al archivo que hemos estado leyendo:

```python
with open('./files/reading_file_example.txt','a') as f:
    f.write('Este texto tiene que ser anexado al final')
```

El siguiente método crea un nuevo archivo, si el archivo no existe:

```python
with open('./files/writing_file_example.txt','w') as f:
    f.write('Este texto se escribirá en un archivo recién creado.')
```


---

## Eliminación de archivos

Hemos visto en la sección anterior cómo crear y eliminar un directorio usando el módulo os . Nuevamente ahora, si queremos eliminar un archivo, usamos el módulo os.

```python
import os

os.remove('./files/example.txt')

```

Si el archivo no existe, el método de eliminación generará un error, por lo que es bueno usar una condición como esta:

```python
import os

if os.path.exists('./files/example.txt'):
    os.remove('./files/example.txt')
else:
    print('El archivo no existe')
    
```


---

## Tipos de archivos:

* Archivo con extensión `.txt`

El archivo con extensión txt es una forma de datos muy común y lo hemos cubierto en la sección anterior. Pasemos al archivo JSON.

* Archivo con extensión `.json`

JSON significa Notación de objetos de JavaScript. En realidad, es un objeto de JavaScript en forma de cadena o un diccionario de 
Python.

*Ejemplo:*


In [6]:
# diccionario
persona_diccionario= {
    'nombre': 'Enrique',
    'pais': 'España',
    'ciudad': 'Cordoba',
    'habilidades' :['JavaScript', 'React', 'Python']
}
# JSON: Una cadena forma un diccionario
persona_json = "{'nombre': 'Enrique', 'pais': 'España', 'ciudad': 'Cordoba', 'habilidades': ['JavaScript', 'React', 'Python']}"

# Usamos tres comillas y las hacemos de varias líneas para que sea más legible
persona_json = '''{
    "nombre": "Enrique",
    "pais": "España",
    "ciudad": "Cordoba",
    "habilidades": ["JavaScript", "React","Python"]
}'''

---

## Cambiando JSON a Diccionario

Para cambiar un JSON a un diccionario, primero importamos el módulo json y luego usamos el método de carga.


In [None]:
import json

# JSON
persona_json = '''{
    "nombre": "Enrique",
    "pais": "España",
    "ciudad": "Cordoba",
    "habilidades": ["JavaScript", "React", "Python"]
}'''

# Cambiemos JSON a diccionario
persona_diccionario = json.loads(persona_json)

print(type(persona_diccionario))
print(persona_diccionario)
print(persona_diccionario['nombre'])

*Salida:*

```text
class 'dict'>
{'nombre': 'Enrique', 'pais': 'España', 'ciudad': 'Cordoba', 'habilidades': ['JavaScript', 'React', 'Python']}
Enrique

```

---

## Cambio de diccionario a JSON

Para cambiar un diccionario a `JSON`, usamos el método `dumps` del módulo `json`.


In [None]:
import json

# Diccionario Python
persona = {
    'nombre': 'Enrique',
    'pais': 'España',
    'ciudad': 'Cordoba',
    'habilidades': ['JavaScript', 'React', 'Python']
}

# Vamos a convertirlo a json
persona_json = json.dumps(persona, indent=4)  # La sangría podría ser 2, 4, 8. Embellece el json

print(type(persona_json))
print(persona_json)

*Salida:*

```text
<class 'str'>
{
    "nombre": "Enrique",
    "pais": "Espa\u00f1a",
    "ciudad": "Cordoba",
    "habilidades": [
        "JavaScript",
        "React",
        "Python"
    ]
}

```

---

## Guardar como archivo JSON

También podemos guardar nuestros datos como un archivo `json`. Guardémoslo como un archivo json siguiendo los siguientes pasos. 
Para escribir un archivo json, usamos el método `json.dump()`, puede tomar diccionario, archivo de salida, sure_ascii y sangría.

In [None]:
import json

# Diccionario Python
persona = {
    'nombre': 'Enrique',
    'pais': 'España',
    'ciudad': 'Cordoba',
    'habilidades': ['JavaScript', 'React', 'Python']
}

with open('./files/json_example.json', 'w', encoding='utf-8') as f:
    json.dump(persona, f, ensure_ascii=False, indent=4)

En el código anterior, usamos codificación y sangría. La sangría hace que el archivo json sea fácil de leer.

---

## Archivo con extensión csv

CSV significa valores separados por comas. CSV es un formato de archivo simple que se utiliza para almacenar datos tabulares, 
como una hoja de cálculo o una base de datos. CSV es un formato de datos muy común en la ciencia de datos.

*Ejemplo:*

In [None]:
import csv

with open('./files/csv_example.csv') as f:
    csv_reader = csv.reader(f, delimiter=',') # Usamos, el método reader() para leer csv
    line_count = 0
    
    for row in csv_reader:
        if line_count == 0:
            print(f'El nombre de las columnas son: {', '.join(row)}')
            line_count += 1
        else:
            print(
                f'\t{row[0]} es un ingeniero. El vive en {row[1]}, {row[2]}.')
            line_count += 1

    print(f'Numero de lineas: {line_count}')

*Salida:*

```text
El nombre de las columnas son: nombre, pais, ciudad, habilidades
        Enrique es un ingeniero. El vive en Cordoba, España.
Numero de lineas:  2

```

---

## Archivo con extensión xlsx

Para leer archivos de Excel necesitamos instalar el paquete `xlrd`. Cubriremos esto después de que cubramos la instalación del paquete usando `pip`.

In [None]:
import xlrd

excel_book = xlrd.open_workbook('sample.xls')

print(excel_book.nsheets)
print(excel_book.sheet_names)

---

## Archivo con extensión xml

XML es otro formato de datos estructurados que se parece a `HTML`. En `XML`, las etiquetas no están predefinidas. La primera línea es una declaración XML. La etiqueta de persona es la raíz del XML. La persona tiene un atributo de género.

Ejemplo: XML

```xml
<?xml version='1.0'?>
<persona genero='masculino'>
  <nombre>Enrique</nombre>
  <pais>España</pais>
  <ciudad>Cordoba</ciudad>
  <habilidades>
    <habilidad>JavaScript</habilidad>
    <habilidad>React</habilidad>
    <habilidad>Python</habilidad>
  </habilidades>
</persona>
```

Para obtener más información sobre cómo leer un archivo XML, consulte la documentación:

https://docs.python.org/2/library/xml.etree.elementtree.html



In [None]:
import xml.etree.ElementTree as ET

tree = ET.parse('./files/xml_example.xml')
root = tree.getroot()

print('Etiqueta raiz: ', root.tag)
print('Atributo: ', root.attrib)

for child in root:
    print('campo: ', child.tag)

*Salida:*

```text
Etiqueta raiz: persona
Atributo: {'genero': 'masculino'}
campo: nombre
campo: pais
campo: ciudad
campo: habilidades
```