# Entrada / salida básica con Python

<img src="https://www.python.org/static/img/python-logo.png" alt="yogen" style="width: 200px; float: right;"/>
<br>
<br>
<br>
<a href = "http://yogen.io"><img src="http://yogen.io/assets/logo.svg" alt="yogen" style="width: 200px; float: right;"/></a>

# Objetivos

-   Aprender a mostrar mensajes al usuario

-   Aprender a pedir información al usuario

-   Leer y escribir ficheros de datos

-   Una mini-intro a ficheros de datos y *data science*

-   Repaso de estrategias para escribir programas

# Mostrar mensajes en la pantalla 

## Comunicación con el usuario

-   Mostrar mensajes de texto al usuario

-   Pedir números y texto al usuario

## Mostrar mensajes al usuario

-   `print` 

El comando print permite mostrar mensajes de texto, con valores de variables, y aplicando un formato a la salida

-   Por ejemplo, número de decimales a mostrar

## Ejemplos

In [2]:
print(1)
print(10.)
print([1,2],'asdf')

1
10.0
[1, 2] asdf


¿Por qué usar el comando print para mostrar el contenido de variables, si ya se muestran en el *notebook*?

Porque el que se muestren en el *notebook* es específico de IPython. Si queremos que se muestren corra donde corra nuestro programa deberemos usar `print`

## Mostrar mensajes con formato

Construir cadenas un poco complejas a base de concatenación se vuelve fatigoso muy rápido. Para esto está el formateo de strings.

Podemos insertar múltiples valores desde variables o desde literales.

Con print podemos combinar números y texto en el mismo mensaje, pero requiere *indicadores de formato*.

Este [minilenguaje de formateo](http://www.cprogramming.com/tutorial/printf-format-strings.html) es común a muchos lenguajes de programación.


In [3]:
n_virus = 0

message = 'He detectado ' + str(n_virus) + ' virus'

print(message)

He detectado 0 virus


In [10]:
n_virus = 0
folders = ['saddas' , 'asfsadf']
user = 'Roque'

message = 'He detectado %d virus en las carpetas %s del usuario %s' % (n_virus, folders, user)

print(message)

He detectado 0 virus en las carpetas ['saddas', 'asfsadf'] del usuario Roque


## Indicadores de formato

| Formato |      Descripción       |
| --------|------------------------|
| %d      | Números sin decimales  |
| %f      | Números con decimales  |
| %s      | Texto                  |

## Ejemplos

Diferencias entre %d y %f

In [16]:
var1 = 5

print('Como float: %f como entero: %d' % (var1, var1))

Como float: 5.000000 como entero: 5


## Uso con texto

Podemos introducir varias variables en la string, dándolas como una tupla.

#### Ejercicio

Dada unas variables
```python
name = "Daniel"
students = 21
```
Saca por pantalla un saludo al estimado profesor de parte de sus 14 estudiantes, usando formateo de strings.

In [14]:
name = 'Daniel'
students = 21
print('Buenas tardes estimado %s de parte de tus %d estudiantes' % (name, students))

Buenas tardes estimado Daniel de parte de tus 21 estudiantes


### Ejemplo

Vamos a hacer un [_mad libs_](https://en.wikipedia.org/wiki/Mad_Libs)

## Números decimales

### Decimales en cadenas de texto 

`%n.m f`

-   n es el número mínimo de columnas utilizadas en la
    escritura

-   m es el número de decimales

### Ejemplos

In [23]:
'hello, %10.5f' % 1.3

'hello,    1.30000'

In [24]:
'hello, %10.5f' % 120.3

'hello,  120.30000'

In [32]:
import math
print(math.pi)
print('Número pi: %.3f' % math.pi)

3.141592653589793
Número pi: 3.142


#### Ejercicio

Construye una expresión print que, dadas las variables

```python
progress = 45.3
total = 120
```

Exprese el progreso de una descarga por pantalla.

Queremos que, si mostramos el mensaje múltiples veces, los números queden alineados aunque tengan un número disinto de cifras.

In [92]:
progress = 55
total = 120

print('Progreso: %10.2f de %d' % (progress, total))

Progreso:      55.00 de 120


Nos estamos repitiendo mucho. Mucho mejor abstraer los componentes comunes a variables para reutilizarlos

## Números enteros

Enteros en cadaneas de texto %n.m d

-   n es el número mínimo de columnas utilizadas en la
    escritura

-   m es el número de dígitos

#### Ejemplos

In [99]:
dia = 12
mes = 10
print('%2.2d/%2.2d/2017' % (dia, mes))

12/10/2017


# Pedir datos al usuario 

Muchos programas pueden necesitar preguntar datos al usuario. Para ello usamos el comando:

-   `input`

#### Ejemplo: Pedir un número

In [101]:
nombre = input('Dime tu nombre: ')
print(nombre)

Dime tu nombre: Carlos
Carlos


## `input` siempre devuelve una string

Si necesitamos otro tipo de dato, tendremos que modificarlo nosotros. 

La interacción con el usuario es un punto en el que típicamente se producen errores.

In [102]:
type(nombre)

str

In [104]:
entrada = input('Dame un número: ')

Dame un número: 4


In [109]:
numero = int(entrada) + 4
numero

8

In [2]:
#Pedir un número y que devuelva ese número multiplicado por 4

entrada_1 = input("Dame un número: ")
print("El número %s multiplicado por 4 es %.2f" % (entrada_1, float(numero_1) * 4))

Dame un número: 4
El número 4 multiplicado por 4 es 16.00


No podemos dar por sentado que el usuario hará lo que le pedimos:

# Pedir datos al usuario 

Muchos programas pueden necesitar preguntar datos al usuario. Para ello usamos el comando:

-   `input`

#### Ejemplo: Pedir texto

# Ficheros de datos 

## Leer datos de un fichero

Normalmente, en *data science* leeremos los datos desde ficheros, no se los pediremos al usuario.

-   En realidad, usaremos bibliotecas específicas para leer y escribir
    datos, como por ejemplo **`pandas`**

## Abrir y cerrar ficheros
Es necesario abrir un fichero usando un **modo de apertura** para poder trabajar con un fichero.

Necesitamos tener el archivo `fichero.csv` en el directorio donde estamos: el _current working directory_. 

Para saber cuál es podemos usar la función `os.getcwd()`

In [4]:
fichero = open("C:\\Users\\carlo\\Desktop\\Máster\\Curso Programación Python\\fichero.csv")

In [6]:
#Para saber el directorio de trabajo
import os
os.getcwd()

'C:\\Users\\carlo\\Desktop\\Máster\\Curso Programación Python'

In [12]:
fichero = open("fichero.csv")

In [13]:
type(fichero)

_io.TextIOWrapper

In [14]:
fichero.closed

False

## Leer ficheros

Tenemos varias instrucciones que podemos usar para leer ficheros:

-   `read` para leer el contenido entero del fichero

-   `readline` para leer el fichero línea a línea

-   `readlines` para leer todas las líneas en una lista

    -   Esta función es iterable, es decir, no necesitamos cargar el
        fichero en memoria entero si usamos readlines

-   Veamos un ejemplo con un fichero de datos

In [24]:
fichero.readline()

'id,type,article,price\n'

`readline()` nos devuelve una única línea, con su salto de línea al final.

In [25]:
fichero.readline()

'001,garden,SawMaster,200.0\n'

Si lo volvemos a llamar, nos devuelve la siguiente línea.

In [26]:
fichero.readline()

'002,kitchen,CutPlus,99.95\n'

Con `seek()` podemos recolocar el "cursor", la posición actual, dentro del archivo.

In [28]:
fichero.seek(0)
fichero.readline()

'id,type,article,price\n'

`readlines` nos devuelve todas las líneas en forma de listas. 

Si el archivo es lo suficientemente grande, podemos llenar la memoria.

In [22]:
fichero.seek(0)
fichero.readlines()

['id,type,article,price\n',
 '001,garden,SawMaster,200.0\n',
 '002,kitchen,CutPlus,99.95\n',
 '003,personal_hygiene,IntiMus,19.99\n']

Por defecto, los archivos se abren en modo de lectura, 'r'

Siempre hay que cerrar los archivos cuando hemos terminado de usarlos.

In [29]:
#Para cerrar el fichero
fichero.close()
fichero.closed

True

## Escribir ficheros

Usaremos la instrucción *write*

-   Acepta solo cadenas de texto

-   No escribe saltos de línea por defecto, por lo que tenemos que
    añadir saltos de línea al final de cada línea de texto
    
-   Tenemos que abrir el archivo en modo 'w', de escritura

In [48]:
#Hay que poner "w" para indicarle que es un fichero que voy a escribir
nuevo_fichero = open("mi_nuevo_archivo.txt", "w")

In [49]:
nuevo_fichero.write("Hola mundo")

10

In [50]:
nuevo_fichero.close()

## Cerrar ficheros

Corrupción de datos

-   Siempre que escribamos en un fichero, no podemos estar 
    seguros de que los datos se han guardado en el
    disco hasta que no hemos cerrado el fichero.

-   Cuando leemos, esto no es imprescindible, pero sí  **altamente
    recomendable**
    
-   Podemos forzar al sistema operativo a guardarlos con `flush()`, 
    pero aún así deberemos cerrar el archivo al terminar con él.

## Cláusula with

Se asegura de que el fichero quede cerrado cuando se sale del contexto de `with`

In [51]:
with open("fichero.csv") as input_fichero:
    print(input_fichero.read())

id,type,article,price
001,garden,SawMaster,200.0
002,kitchen,CutPlus,99.95
003,personal_hygiene,IntiMus,19.99



In [53]:
fichero.closed

True

In [60]:
with open("mi_nuevo_archivo2.txt", "w") as nuevo_fichero:
    nuevo_fichero.write("Hola Mundo")
nuevo_fichero.closed   


True

## Leer un CSV con Pandas

En la práctica de *Data Science*, no usaríamos una API de tan
bajo nivel. Existen muchas bibliotecas de análisis de datos que nos
permiten cargar los datos en un *dataframe*

In [62]:
import pandas as pd

In [63]:
df = pd.read_csv("fichero.csv")

In [64]:
df.head()

Unnamed: 0,id,type,article,price
0,1,garden,SawMaster,200.0
1,2,kitchen,CutPlus,99.95
2,3,personal_hygiene,IntiMus,19.99


`pandas` nos hace extremadamente fácil leer datos en distintos formatos, incluso de fuentes remotas:

También escribir en distintos formatos: csv, excel...

\* Para poder leer y escribir archivos excel necesitaremos instalar los módulos xlrd y xlwt, respectivamente.

# Ejemplo de programa con entrada / salida 

Vamos a calcular el área de un círculo

## Pasos para hacer un programa

1.  Definir bien el problema

    -   En nuestro caso, calcular el área de un círculo



2.  Identificar las entradas de datos al programa

    -   El radio del círculo


3.  Identificar las salidas de datos del programa

    -   El valor del área


4.  Decidir el algoritmo que calculará las salidas de datos a partir de
    las entradas

## Algoritmo

Área de un círculo

Si sabemos el radio, podemos calcular el área
$$A= \pi r^2$$

<center>![image](figs/area.png)</center>

#### Ejercicio:

Escribe el programa para calcular el área del círculo, según el patrón que venimos estableciendo:

- Entrada de datos

- Algoritmo

- Salida de datos

In [70]:
import math

# Input
r = float(input("Dime el radio del círculo: "))

# Algorithm
A = math.pi * r **2

# Output
print("El área del círculo con radio %.2f es: %.2f" % (r, A))

Dime el radio del círculo: 5
El área del círculo con radio 5.00 es: 78.54


Muchas variables están definidas en módulos. Por ejemplo, `pi` está definida en el módulo `math`. Podemos traerla a nuestro entorno con `import`:

# Para llevar

### resumen del tema

-   Para mostrar el valor de una variable, o un mensaje sencillo, usamos
    la función `print`

-   Si queremos mostrar mensajes complejos podemos componer mensajes con
    formato

-   Podemos mostrar:

    -   %d: Números enteros

    -   %f: Números decimales

    -   %s: Texto

## Para llevar: resumen del tema

-   Podemos pedir datos al usuario con input

    -   Con input, la entrada **no** se evalúa: siempre será una `str`

-   Podemos abrir ficheros con open tanto para lectura como
    escritura

-   Con readline, lo podemos leer de manera iterativa sin
    cargar el fichero en memoria

-   Siempre tenemos que cerrar el fichero después de leerlo. Lo mejor es
    usar with para no olvidarnos de cerrarlo.

## Para llevar: resumen del tema

-   Nuestros programas deben tener siempre la estructura:

    -   Entrada de datos

    -   Algoritmo

    -   Salida de datos

-   El primer paso para programar es siempre definir bien el problema

    -   Dejar claro qué hay que hacer

    -   Cómo hay que hacerlo será lo que escribamos en el programa

# Para saber más

http://www.cprogramming.com/tutorial/printf-format-strings.html

http://www.practicepython.org/

http://codingbat.com/python

# Ejercicios para fijar

#### Ejercicio

Escribe un programa que acepte el apellido y nombre de un usuario y los muestre por pantalla en orden inverso, con un espacio entre ellos

In [154]:
# Input
nombre_apellido = input("Dime tu nombre y apellido: ")

# Algorithm
pos = nombre_apellido.find(" ")
nombre = nombre_apellido[: pos]
apellido = nombre_apellido[pos + 1 :]

# Output
print("%s %s" % (apellido, nombre))

Dime tu nombre y apellido: Carlos Ferrer-Bonsoms
Ferrer-Bonsoms Carlos


In [159]:
nombre_apellido = input("Dime tu nombre y apellido: ")

lista_nombre_apellido = nombre_apellido.split(" ")
nombre = lista_nombre_apellido[0]
apellido = lista_nombre_apellido[1]

print("%s %s" % (apellido, nombre))

Dime tu nombre y apellido: Carlos Ferrer
Ferrer Carlos


#### Ejercicio

Escribe un programa Python que acepte una secuencia de 4 números separados por comas y los imprima cada uno en una línea. 

_Pista_: en los [métodos de `str`](https://docs.python.org/3/library/stdtypes.html#string-methods) seguro que encuentras algo que te sea útil.

_Entrada de muestra_: `"1,53,3,12"`

_Salida de muestra_: 
```python
1
53
3
12
```

In [44]:
# Input
text = input("Por favor, introduzca 4 numeros separados por comas")

# Algorithm
my_list = text.split(",")

# Output
print(my_list[0])
print(my_list[1])
print(my_list[2])
print(my_list[3])

Por favor, introduzca 4 numeros separados por comas4,3,2,7
4
3
2
7


In [45]:
# Input
text = input("Por favor, introduzca 4 numeros separados por comas")

# Algorithm
my_list = text.split(",")
message = "%d\n%d\n%d\n%d\n" % (int(my_list[0]), int(my_list[1]), int(my_list[2]), int(my_list[3]))


# Output
print(message)

Por favor, introduzca 4 numeros separados por comas6,4,3,2
6
4
3
2



In [46]:
[int(a) for a in my_list]

[6, 4, 3, 2]

#### Ejercicio

Escribe un programa que acepte del usuario una ruta absoluta (en formato Unix) de archivo y muestre por pantalla el nombre de archivo y la extensión, en líneas consecutivas.

_Entrada de muestra_: `/home/user/course/best-class-ever.ipynb`

_Salida de muestra_: 
```
best-class-ever
.ipynb
```



In [153]:
mi_ruta = "/home/user/course/best-class-ever.ipynb"

pos_ult_punto = mi_ruta.rfind(".")
pos_ult_barra = mi_ruta.rfind("/")
nombre_archivo = mi_ruta[pos_ult_barra + 1 : pos_ult_punto]
nombre_extension = mi_ruta[pos_ult_punto : ]

print("%s\n%s" % (nombre_archivo, nombre_extension))

best-class-ever
.ipynb


#### Ejercicio

Extiende el programa del ejercicio anterior (es decir, cópialo en una celda nueva y modifícalo) para que ahora muestre el resultado en una frase de lenguaje natural.

_Entrada de muestra_: `/home/user/course/best-class-ever.ipynb`

_Salida de muestra_: 
```
El archivo "best-class-ever" está en el directorio "/home/user/course/" y tiene extensión ".ipynb"

```



In [160]:
mi_ruta = "/home/user/course/best-class-ever.ipynb"

index_extension = mi_ruta.rfind(".")
index_direccion = mi_ruta.rfind("/") + 1
nombre_directorio = mi_ruta[:index_direccion]
nombre_archivo = mi_ruta[index_direccion:index_extension]
nombre_extension = mi_ruta[index_extension:]

print('El archivo "%s" está en el directorio "%s" y tiene extensión "%s"' % (nombre_archivo, nombre_directorio, nombre_extension))

El archivo "best-class-ever" está en el directorio "/home/user/course/" y tiene extensión ".ipynb"


In [187]:
ruta = "/home/user/course/best-class-ever.ipynb"

lista = ruta.split(".")
extension = "." + lista[-1]
archivo = lista[0].split("/")[-1]
directorio = lista[0].split(archivo)[0]

print('El archivo "%s" está en el directorio "%s" y tiene extensión "%s"' % (archivo, directorio, extension))

El archivo "best-class-ever" está en el directorio "/home/user/course/" y tiene extensión ".ipynb"


In [188]:
ruta = "/home/user/course/best-class-ever.ipynb"

ultimo = ruta.split("/")[-1]
extension = "." + ultimo.split(".")[-1]
archivo = ultimo.split(".")[0]
directorio = ruta.split(archivo)[0]

print('El archivo "%s" está en el directorio "%s" y tiene extensión "%s"' % (archivo, directorio, extension))


El archivo "best-class-ever" está en el directorio "/home/user/course/" y tiene extensión ".ipynb"


#### Ejercicio

Escribe un programa que acepte dos números por separado, y compruebe si están "cerca" para un nivel de precisión arbitrario, indicado por un tercer número.

_Entrada de muestra_:
```python
0.0003
0.000302
0.000005
```

_Salida de muestra_: 
```python
True
```

#### Ejercicio

Escribe un programa para convertir una presión en kilopascales en psi, mmHg y atm. Muestra el resultado con un formato adecuado.


_Entrada de muestra_:
```python
1000
```

_Salida de muestra_: 
```python
1000 kPa equivalen a 145.04 psi, 7500.6 o 9.869 atm
```

In [133]:
# Input
presion_kPa = 1000

# Algorithm
presion_psi = presion_kPa * 0.145038
presion_atm = presion_kPa * 9.86923e-03
presion_mmHg = presion_kPa * 7.5006

# Output
print("%d kPa equivalen a %.2f psi, %.2f mmHg o %.2f atm" % (presion_kPa, presion_psi, presion_mmHg, presion_atm))

1000 kPa equivalen a 145.04 psi, 7500.60 mmHg o 9.87 atm


#### Ejercicio

Escribe un programa que reciba un número de segundos y lo convierta en años, meses, días, horas, minutos y segundos (considera que todos los meses tienen 30 días),

_Entrada de muestra_:
```python
50000000
```

_Salida de muestra_: 
```python
50000000 segundos son 1 año(s), 7 mes(es), 3 día(s), 16 hora(s), 53 minuto(s) y 20 segundo(s).
```

In [130]:
# Input
num_secs = int(input("Introduzca un número de segundos: "))

# Algorithm
secs_year = 365 * 24 * 60 * 60
secs_month = 30 * 24 * 60 * 60
secs_day = 24 * 60 * 60
secs_hour = 60 * 60
secs_min = 60

years = int(num_secs / secs_year)
resto = num_secs % secs_year

months = int(resto / secs_month)
resto = resto % secs_month

days = int(resto / secs_day)
resto = resto % secs_day

hours = int(resto / secs_hour)
resto = resto % secs_hour

minutes = int(resto / secs_min)
seconds = resto % secs_min

# Output
print("%d segundos equivalen a: %d año(s), %d mes(es), %d día(s), %d hora(s), %d minuto(s) y %d segundos" % (num_secs, years, months, days, hours, minutes, seconds))


Introduzca un número de segundos: 250000
250000 segundos equivalen a: 0 año(s), 0 mes(es), 2 día(s), 21 hora(s), 26 minuto(s) y 40 segundos


In [47]:
# Input
input_secs = int(input("num segundos"))

# Algorithm
secs_in_year = 365 * 24 * 60 * 60
secs_in_month = 30 * 24 * 60 * 60
secs_in_day = 24 * 60 * 60
secs_in_hour = 60 * 60
secs_in_minute = 60

# Compare readability:
# m, rest = divmod(rest_secs, 2592000)
years, rest_secs = divmod(input_secs, secs_in_year)
months, rest_secs = divmod(rest_secs, secs_in_month)
days, rest_secs = divmod(rest_secs, secs_in_day)
hours, rest_secs = divmod(rest_secs, secs_in_hour)
minutes, rest_secs = divmod(rest_secs, secs_in_minute)

message = "%d segundos son %d año(s), %d mes(es), %d día(s), %d hora(s), %d minuto(s) y %d segundo(s)." % (input_secs, years, months, days, hours, minutes, rest_secs)

# Output
print(message)


num segundos150000000
150000000 segundos son 4 año(s), 9 mes(es), 6 día(s), 2 hora(s), 40 minuto(s) y 0 segundo(s).
