<font size=6>

<b>Curso de Programación en Python</b>
</font>

<font size=4>
    
Curso de formación interna, CIEMAT. <br/>
Madrid, marzo de 2023

Antonio Delgado Peris
</font>

https://github.com/andelpe/curso-intro-python/

<br/>

# Tema 5 - Entrada y Salida

## Objetivos

- Conocer mejor los strings, en particular la aplicación de formato
- Ser capaz de leer y escribir de ficheros
- Ser capaz de leer de la entrada estándar (`input`)
- Introducir formatos de serialización de datos: `pickle` y `json`

## Más sobre strings

### Definición de strings

- Una manera avanzada de definir strings largos es concatenarlas con espacios o saltos de líneas

In [4]:
s = 'two strings ' 'auto-concatenated'
print(s)
s2 = ('also '
      'with '
      'line breaks')
print(s2)

two strings auto-concatenated
also with line breaks


- Se pueden incluir caracteres _especiales_ con `\`

In [6]:
print("Ejemplo: \\t: un tabulador, \n: un salto de línea, o la propia \\")

Ejemplo: \t: un tabulador, 
: un salto de línea, o la propia \


- Pero con el modificador `r`, creamos _raw strings_, que no interpretan nada:

In [1]:
print(r"En este ejemplo no hay nada especial: \t \n \\")

En este ejemplo no hay nada especial: \t \n \\


### Conversión a strings

En Python, no hay conversión de tipos como tal. Lo que se hace es crear un nuevo objeto, a partir de uno dado.

Podemos generar un objeto string que represente a cualquier objeto Python `obj`, con: `str(obj)`.

- En realidad, estamos llamando al _constructor_ de la clase `str`, y generando un nuevo objeto string.

También existe la función `repr(obj)`, que también crea un string representando a `obj`, pero en un formato válido para usar en un programa Python (p.ej. con `eval`).

- En la práctica, `str()` y `repr()` devuelven el mismo resultado para la mayoría de tipos comunes.

Nota: La función `print` acepta argumentos de cualquier tipo, e internamente utiliza `str()` para convertirlos

- En caso de ambigüedad, siempre podemos usar `str()` explícitamente.

In [7]:
print('Muestro un entero:', 3)
print('O un string:', str(3))
print(type(3), type(str(3)))

Muestro un entero: 3
O un string: 3
<class 'int'> <class 'str'>


### Formateo de strings

- Existen varias maneras de formatear strings e incluir valores de variables:

  - Método más antiguo: operador `%`
  - Método antiguo: función `format` (python 2.7 y python 3)
  - Método más reciente: _fstrings_  (solo desde python 3.6)

En este notebook, usaremos _fstrings_ cuando necesitemos formatear.

- Pero los otros aparecen habitualmente, así que, al menos, conviene saber _leerlos_

In [10]:
var = 3
print("My var is %s, or %f" % (var, var))
print("My var is {0}, or {1:f}".format(var,4))
print(f"My var is {var}, or {var:f}")
print("My var is", var, ", or", var)

My var is 3, or 3.000000
My var is 3, or 4.000000
My var is 3, or 3.000000
My var is 3 , or 3


<br/>

Las _fstrings_ soportan operaciones arbitrarias y de formato (usando `:<modificador>`) en sus expresiones.

In [13]:
var = 125
print(f'Twice my var is: {2*var}')
print(f'Precision: {var:.2f}')

print(f'Padding: {var:8}')
var = 'abc'
print(f'Padding: {var:8}')

print(f'Padding with char: {var:_>8}')
print(f'Inverse adding: {var:_<8}')

Twice my var is: 250
Precision: 125.00
Padding:      125
Padding: abc     
Padding with char: _____abc
Inverse adding: abc_____


<br/>

<div style="background-color:powderblue;">

**EJERCICIO e5_1:** Usando las variables `v1`, `v2`, `v3` dadas...

- Mostrar la línea `Puedes ir en la locomotora del tren, o en avión`.
- Mostrarlas en tres líneas, alineadas a la derecha

In [21]:
v1 = 'locomotora'
v2 = 'avión'
v3 = 'tren'
print(f"Puedes ir en la {v1} del {v3}, o en {v2}.")
print (f'{v1:>20}')
print (f'{v2:>20}')
print (f'{v3:>20}')

Puedes ir en la locomotora del tren, o en avión.
          locomotora
               avión
                tren


## Ficheros

### Apertura

La función `open` devuelve un objeto de tipo `file`, que permite leer y escribir un fichero.

    mi_fichero = open(<ruta-fichero>, [<modo>])

`ruta-fichero` es un string con el nombre/ruta del fichero, y `modo` puede ser uno de los siguientes:

> `'r'`: lectura (el defecto, si no se especifica), `'w'`: modo escritura, `'a'`: modo _append_

Por defecto, los ficheros se consideran de texto, lo que implica que se usa una codificación concreta (por defecto, el configurado en la máquina) para los caracteres.

- Si el fichero es binario, debe indicarse añadiendo `'b'` al modo especificado para evitar modificaciones indeseadas.

In [22]:
f = open('myfile.txt', 'w')

### Lectura y escritura

El objeto fichero se puede usar para escribir con el método `write(<string>)`. 

Para cerrar un fichero (sea de lectura o escritura) se usa el método `close()`.

In [23]:
f.write('Just some text\n')
f.write('Some more\n')
f.close()

In [24]:
f.write('aaaa')

ValueError: I/O operation on closed file.

Para leer de un fichero existen varios métodos:

- `read(<num>)`: lee `num` caracteres (o bytes), o bien el fichero entero
- `readline()` :  lee una sola línea
- `readlines()`: lee todas las líneas y devuelve una lista

In [26]:
f = open('myfile.txt')
text = f.readlines()
f.close()

print(text)


['Just some text\n', 'Some more\n']


### Prácticas recomendadas

1. La sentencia `with` (_context manager_) permite asociar acciones predeterminadas a un objeto.
   - En el caso de un fichero, `with` asegura que se cierre aunque haya algún error en las operaciones realizadas con él.
2. Una manera eficiente de leer un fichero línea a línea es recorrerlo en bucle (es iterable)

In [27]:
with open('myfile.txt') as f:
    for line in f:
        print(line.strip())
    print('\n¿El fichero está cerrado? 1:', f.closed)
        
print('\n¿El fichero está cerrado? 2:', f.closed)

Just some text
Some more

¿El fichero está cerrado? 1: False

¿El fichero está cerrado? 2: True


<br/>

<div style="background-color:powderblue;">

**EJERCICIO e5_2:** Leer un ficheros de texto.

Leer fichero `datos/e5_2.txt`, y mostrar las líneas.

In [30]:
with open('datos/e5_2.txt') as f:
    for line in f:
        print(line.strip())
   
        


dato1  12  2   5
dato2   5  3  -3
dato3  21  5   2
dato4  -4  2   1


## Serialización

Los métodos de lectura y escritura de ficheros vistos solo escriben o leen _strings_. Para manejar otro tipos de datos, se requieren conversiones. P.ej.:

In [31]:
num = 256

with open('myfile.txt', 'w') as f:
    f.write(str(num))

with open('myfile.txt') as f:
    num_read = int(f.read())

print('Read:', num_read, type(num_read))

Read: 256 <class 'int'>


Este método se torna rápidamente muy farragoso para datos más complejos. Sin embargo, existen protocolos que definen como convertir objetos en strings (_serializar_) de manera estándar y cómoda.

### JSON

JSON (JavaScript Object Notation) es un estándar muy popular, usado para la representación de números, strings, listas y diccionarios en formato texto. 

No es específico de Python, por lo que permite almacenar información, y también compartirla entre diferentes lenguajes.

En Python se puede usar con el módulo `json`.

In [32]:
import json

d = {'a': 10, 'b': [0, 1, 2]}

d_json = json.dumps(d)
print('Json repr:', type(d_json), d_json)

Json repr: <class 'str'> {"a": 10, "b": [0, 1, 2]}


In [33]:
with open('myfile.txt', 'w') as f:
    json.dump(d, f)

In [34]:
with open('myfile.txt') as f:
    obj_read = json.load(f)

print('Read:', type(obj_read), obj_read)

Read: <class 'dict'> {'a': 10, 'b': [0, 1, 2]}


### Pickle

El módulo `pickle` permite (de)serializar cualquier objeto Python (no solo los tipos básicos, como JSON), en un formato binario (serie de bytes, en lugar de caracteres).

Las desventajas de Pickle (que me llevan a recomendar `json`) son dos: 
- Es específico de Python, por lo que no se puede leer con otros lenguajes
- No es seguro, puesto que un fichero Pickle podría, potencialmente, codificar código malicioso

La ventaja de Pickle es que permite almacenar incluso clases de usuario, y es eficiente, lo cual puede ser útil en algunos casos.
  
Las funciones ofrecidas por `pickle` son las mismas que las de `json`.

In [35]:
import pickle

d = {'a': 10, 'b': [0, 1, 2]}

d_pickle = pickle.dumps(d)
print('Pickle repr:', type(d_pickle), d_pickle)

Pickle repr: <class 'bytes'> b'\x80\x03}q\x00(X\x01\x00\x00\x00aq\x01K\nX\x01\x00\x00\x00bq\x02]q\x03(K\x00K\x01K\x02eu.'


In [36]:
with open('myfile.txt', 'wb') as f:
    pickle.dump(d, f)

In [37]:
!cat myfile.txt

�}q (X   aqK
X   bq]q(K KKeu.

In [38]:
with open('myfile.txt', 'rb') as f:
    obj_read = pickle.load(f)

print('Read:', type(obj_read), obj_read)

Read: <class 'dict'> {'a': 10, 'b': [0, 1, 2]}


### Funciones `eval` y `exec`

Las funciones `eval` y `exec` pueden usarse para ejecutar código python expresado en forma literal (string). Esto puede considerarse otra manera de deserializar objetos y código previamente almacenados como strings.

- `eval` acepta expresiones únicas y devuelven su evaluación
- `exec` ejecuta una serie de instrucciones, pero siempre devuelve `None`

**NOTA:** es un riesgo utilizar `eval/exec` con expresiones/instrucciones que no creemos nosotros mismos (p.ej. por entrada de usuario), pues puede contenter código malicioso.

In [47]:
# Supongamos que recibes esta expresión encriptada
expresion_encriptada = 'x**2 + 5*x + 6'
clave = {'x': 2}  # Aquí se proporciona la clave para desencriptar 'x'

# Desencriptar y evaluar la expresión
resultado = eval(expresion_encriptada, clave)
print(resultado)  # Imprimirá 20 (2**2 + 5*2 + 6 = 20)

# Script de encriptación en forma de cadena
script_encriptacion = '''
texto = "hola mundo"
clave = 3
texto_encriptado = ""

for caracter in texto:
    if caracter.isalpha():
        codigo = ord(caracter)
        codigo += clave

        if caracter.isupper():
            if codigo > ord('Z'):
                codigo -= 26
            elif codigo < ord('A'):
                codigo += 26
        elif caracter.islower():
            if codigo > ord('z'):
                codigo -= 26
            elif codigo < ord('a'):
                codigo += 26

        texto_encriptado += chr(codigo)
    else:
        texto_encriptado += caracter

print("Texto original:", texto)
print("Texto encriptado:", texto_encriptado)
'''

# Ejecutar el script de encriptación
exec(script_encriptacion)





20
Texto original: hola mundo
Texto encriptado: krod pxqgr


## Lectura de la entrada estándar

### Función `input`

Para capturar información en un programa interactivo, se puede usar la función `input(<prompt>)`, que devuelve un string.

In [48]:
nombre = input("Dime tu nombre:")
print(f"Hola {nombre}")

Hola Hola


- Si utilizamos `input` para recibir valores no textuales, tendremos que convertirlos a su tipo correspondiente (o usar `eval`, para expresiones más complejas)

In [None]:
edad = int(input("Dime tu edad:"))
print(f"Te quedan {60-edad} años para cumplir 60")

### `sys.stdin` 

Una alternativa a `input` es usar directamente el objeto `stdin` del módulo `sys`, que soporta operaciones como las de un fichero.

- Este se usa más habitualmente cuando se ejecuta un script tras un _pipe_ o con un fichero redirigido.

Un ejemplo sería el siguiente (nota: no parece funcionar _dentro de Jupyter_, donde _stdin_ debe de estar cambiado):

```python
import sys
texto = sys.stdin.readline()
print('Texto introducido:', texto)
```

Sin embargo, podemos probarlo ejecutando el comando fuera de Jupyter con `!`. El código del fichero `ejemplos/stdin.py` es exactamente el mostrado arriba.

In [50]:
!echo "Hola don Pepito" | python3 ejemplos/stdin.py

Texto introducido: Hola don Pepito



## Epílogo

Borramos el fichero creado en los ejemplos (solo por limpieza...)

In [51]:
from pathlib import Path
try:    Path('myfile.txt').unlink()
except: pass

<br/>

<div style="background-color:powderblue;">

**EJERCICIO e5_3:** Leer un ficheros con datos ordenados por filas

Leer fichero `datos/e5_2.txt`, y almacenar en un diccionario `datos`:
- Clave: primer campo
- Valor: lista con el resto de campos

P. ej.:  `{'dato': [12, 5, ...],  ...}`

Mostrar el diccionario producido.
    
A continuación, mostrar la suma de los valores para cada clave (línea).

In [57]:
datos = {}
with open('datos/e5_2.txt', 'r') as file:
    for line in file:
        fields = line.strip().split()
        key = fields[0]
        values = [int(x) for x in fields[1:]]
        datos[key] = values

# Mostrar el diccionario producido
print("Diccionario:")
print(datos)

# Calcular la suma de los valores para cada clave y mostrarla
print("\nSuma de los valores para cada clave:")
for key, value in datos.items():
    suma = sum(value)
    print("Hola esto es {}: {}".format(key,value))

Diccionario:
{'dato1': [12, 2, 5], 'dato2': [5, 3, -3], 'dato3': [21, 5, 2], 'dato4': [-4, 2, 1]}

Suma de los valores para cada clave:
Hola esto es dato1: 19
Hola esto es dato2: 5
Hola esto es dato3: 28
Hola esto es dato4: -1


<br/>

<div style="background-color:powderblue;">

**EJERCICIO e5_4:** Mejora: Líneas en blanco y comentarios

Repetir el ejercicio anterior, pero en esta ocasión leyendo el fichero `datos/e5_4.txt`, ignorando las líneas en blanco y todas aquellas que comiencen por el carácter `#`.
    
Ayuda: los métodos `strip` y `startswith` del tipo _str_ pueden resultar útiles.


In [56]:
# Leer el archivo y almacenar en un diccionario
datos = {}
with open('datos/e5_4.txt', 'r') as file:
    for line in file:
        line = line.strip()
        if line and not line.startswith("#"):
            fields = line.split()
            key = fields[0]
            values = [int(x) for x in fields[1:]]
            datos[key] = values

# Mostrar el diccionario producido
print("Diccionario:")
print(datos)

# Calcular la suma de los valores para cada clave y mostrarla
print("\nSuma de los valores para cada clave:")
for key, value in datos.items():
    suma = sum(value)
    print(f"{key}: {suma}")


Diccionario:
{'dato1': [12, 2, 5], 'dato2': [5, 3, -3], 'dato3': [21, 5, 2], 'dato4': [-4, 2, 1]}

Suma de los valores para cada clave:
dato1: 19
dato2: 5
dato3: 28
dato4: -1


<br/>

<div style="background-color:powderblue;">

**EJERCICIO e5_5:** Ampliación: datos ordenados por columnas

Repetir de nuevo el ejercicio, pero leyendo el fichero `datos/e5_5.txt`, que ordena los datos por columnas.