# Una breve introducción a Python 
### por Rafa Caballero (Facultad de Informática - UCM)

Python es un lenguaje de programación de propósito general. Creado por Guido Van Rossum allá por 1989, se ha convertido en uno de los lenguajes más comunes en ciencia de datos.

En estos cuadernos vamos a ver una pequeña introducción a algunos elementos básicos del lenguaje. Los cuadernos están pensados para personas con mínimos conocimientos de programación y solo abarcan lo necesario para iniciarse en la ciencia de datos.


Estos notebooks están basados en varios libros y recursos entre los que hay que destacar:

* [https://www.python.org/](https://www.python.org/)   La referencia básica de Python. Aquí pueden encontrarse tutoriales y también una ayuda muy detallada.

* [Rajath Kumar en GitHub](https://github.com/rajathkumarmp/Python-Lectures "Rajath Kumar en GitHub"). Notebooks para Python 2 en lugar de 3, pero que han servido de punto de partida para estas notas.
* Python for Kids: un libro para niños tan bien escrito y explicado que vale para todos.
* [The Python tutorial](https://docs.python.org/3/tutorial/index.html "The Python tutorial"). Una referencia obligada. Aunque no es mi preferido (me parece prolijo y poco didáctico) es una referencia muy completa.
* Learning with Python How to Think Like a Computer Scientist. Buen libro para iniciarse en Python con una perspectiva adecuada para la ciencia de datos.
* Introducción a la programación en Python 3 : libro detallado, para quien quiera conocer el lenguaje a fondo.
    Python para todos: hace hincapié en la parte de objetos de Python, que apenas veremos en el curso, por lo que puede utilizarse como complemento.




## Versiones y entornos

Por desgracia, allá por 2008, Python se *escindió*, al publicarse la versión 3 que no era compatible *hacia atrás*, es decir los programas escritos en Python 2.X no necesariamente corren en Python 3.x (ni viceversa, pero esto es más habitual). 

En todo caso la idea es que finalmente solo una de las versiones, la 3.X, siga manteniéndose y nos vamos a ceñir a esta.

En cuanto a entornos, hay muchos disponibles y nos valdrá cualquiera, como Anaconda, que incluya los Jupyter notebooks.

**¡Empezamos!**


Si quieres, puedes saltar a la sección que prefieras siguiendo este índice:

### Índice

[Variables](#Variables)

[Operadores](#Operadores)<br>
  &emsp;[Operadores aritméticos](#Operadores-aritméticos)<br>
  &emsp;[Operadores relacionales](#Operadores-relacionales)<br>
  &emsp;[Operadores de bit](#Operadores-de-bit)<br>
  &emsp;[Operadores para secuencias](#Operadores-para-secuencias)<br>
  &emsp;[Slices](#Slices)<br>

[Funciones predefinidas](#Funciones-predefinidas)<br>
  &emsp;[Conversión entre bases](#Conversión-entre-bases)<br>
  &emsp;[Funciones para secuencias](#Funciones-para-secuencias)<br>

[Importación de bibliotecas](#Importación-de-bibliotecas)

[Tipos en Python](#Tipos-en-Python)

[Entrada de usuario](#Entrada-de-usuario)

## Variables 


En los lenguajes de programación a los datos, sean números, frases u otro tipo de valores, solemos ponerles nombres. Es lo que denominamos *variable*.

Una variable puede pensarse como un trocito de memoria de ordenador que tiene un nombre asociado, y un valor, el valor contenido en ese trocito de memoria.

In [35]:
x = 2
y = 1.2
xy = 'if you torture the data long enough, it will confess to anything'

Estas instrucciones Python crean 3 variables
* Una variable con nombre  x,  con valor 2
* Una variable con nombre y, con valor 1.2
* Una variable con nombre xy, con valor *'if you torture the data long enough, it will confess to anything'*. 

Es importante señalar con las secuencias de caracteres siempre van entre comillas (se puede elegir la comilla simple ' o la doble ", pero recordad cerrar la secuenca con el mismo símbolo)

In [36]:
print(x+y,xy,x*y)

3.2 if you torture the data long enough, it will confess to anything 2.4


se le puede dar valor a varias variables simultáneamente:

In [3]:
x = y = 1

In [4]:
print(x,y)

1 1


Otra forma de hacer lo mismo

In [12]:
x,y = 1,1

Esta notación es en realidad una forma abreviada de escribir una *tupla*, una de las estructuras de las que dispone Python para agregar elementos.

La forma no abreviada:

In [9]:
(x,y) = (1,1)

Nótese que las tuplas permiten tener elementos ordenados agregados. Otras formas son los strings y las listas. Los tres tipos, strings, listas y tuplas constituyen las *secuencias de Python*

###### Ej. *¿Cómo declarar en una sola línea dos variables x,y y hacer que la primera tome el valor 1 y la segunda el valor 2?*

In [8]:
# escribir aquí la solución


###### Ej. * ¿Qué hará el siguiente código? * (para probarlo quitar el símbolo de comentario #)

In [24]:
#x = y = 5
#x = x+1
#y = y+x-2
#print(x,y)

## Operadores

### Operadores aritméticos

| Símbolo | Función |
|----|---|
| +  | suma |
| -  | resta |
| /  | división |
| %  | módulo |
| *  | multiplicación |
| //  | división entera |
| **  | Potencia |

In [25]:
1+20000000000

20000000001

In [26]:
200000000-1

199999999

In [8]:
1*2

2

###### Ej. *¿Por qué sucede esto?*

In [9]:
1/2

0

In [10]:
1/2.0

0.5

In [11]:
15%10

5

En el caso de trabajar con números reales también se puede obtener el resultado de truncar el resultado de la división

In [29]:
1.9//1.0

1.0

### Operadores relacionales

Son operadores que pueden devolver los valores True (cierto) o False (falso). 

En programación llamamos a estos valores (True,False) *valores booleanos* o *valores lógicos*

| Operador | Significado |
|----|---|
| == | True, si los dos operandos son iguales, False e.o.c. |
| !=  | True, si los dos operandos son diferente, False e.o.c. |
| < | menor |
| > | mayor  |
| <=  | menor o igual  |
| >=  | mayor o igual |

In [30]:
z = 1
print(z)

1


In [31]:
z == 1

True

In [32]:
z > 1

False

### Operadores de bit

| Símbolo | Significado |
|----|---|
| &  | Conjunción lógica |
| l  | disyunción lógica |
| ^  | XOR |
| ~  | negación |
| >>  | desplazamiento a la derecha |
| <<  | desplazamiento a la izquierda |

In [33]:
a = 2 #10
b = 3 #11

In [35]:
print(a | b)
print(bin(a&b))

3
0b10


In [18]:
5 >> 1

2

0000 0101 -> 5 

El desplazamiento hacia la derecha introduce ceros por la izquierda

0000 0010 -> 2

In [19]:
5 << 1

10

### Operadores para secuencias

En este apartado vemos los operadadores aplicados a las tuplas. Los mismos son aplciables a listas y a strings.

El operador + *concatena* dos secuencias

In [10]:
(1,2,3) + (4,5)

(1, 2, 3, 4, 5)

El operador * repite una secuencia una cantidad de veces

In [11]:
(1,2,3)*4

(1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3)

El operador *[i]* permite acceder al i-ésimo elemento. Hay que tener en cuenta que el primer elemento es el que ocupa la posición 0, el segundo la posición 1

In [13]:
(1,2,3)[0]

1

In [21]:
(1,2,3)[3]

IndexError: tuple index out of range

Una variante es *[-i]*  que permite el acceso desde el final

In [17]:
x = (1,2,3)
x[-0]

1

In [18]:
x[-1]

3

Los operadores infijos *in* y  *not in* sirven para determinar si un elemento está o no en una secuencia

In [34]:
x = (1,2,3)
print(2 in x)
print(5 not in x)
print(5  in x)

True
True
False


### Slices ###
Un tipo especial de operadores son los de "rodaja" o *slice*, que extraen una subsecuencia de la secuencia


    a[start:stop]  # elementos desde start hasta stop -1
    a[start:]      # desde start hasta el final
    a[:stop]       # desde el principio hasta stop-1
    a[:]           # copia la secuencia
    a[start:stop:step] # desde start sin llegar ni pasar de stop, saltando step


In [29]:
x = (0,1,2,3,4,5,6,7,8,9,10)
print(x[3:6])
print(x[3:7:2])

(3, 4, 5)
(3, 5)


In [19]:
x[1:2]

(2,)

La notación (2,) se hace para indicar que es una tupla, no del número (2). Esto es útil para crear tuplas de un solo elemento:

In [20]:
y = (3,)
y[0]

3

**Ej.** ¿Qué resultado producirá el siguiente código? ¿por qué?

In [22]:
y = (3)
y[0]

TypeError: 'int' object is not subscriptable

**Ej.** ¿Qué resultado producirá el siguiente código? ¿por qué?

In [25]:
a = (1,2,3,4,5,6,7,8,9,10)
a[2:][4]

7

## Funciones predefinidas

Las funciones agrupan fragmentos de código con un propósito concreto bajo cierto nombre. Para añadir flexibilidad, pueden recibir valores de entrada y devolver valores de salida. Algunas funciones ya están predefinidas en el sistema, pero el usuario también puede definir sus propias funciones, como veremos en otro cuaderno.

Python incluye numerosas funciones predefinidas. Veamos algunas de ellas.

| Función | Significado |
|----|---|
| 0xV  | Convierte el número hexadecimal V en entero |
| hex(x)  | convierte x a su representación hexadecimal, como cadena |
| 0oV  | Convierte el número octal V en entero |
| oct(x)  | convierte x a su representación octal, como cadena |
| 0b  | Convierte el número binario V en entero |
| bin(x)  | convierte x a su representación binaria, como cadena |
| int(x,b)  | Representa el número x en base b|
| int(x)  | Convierte el número real x en su parte entera |
| int(x)  | Convierte el string x en un entero |
| >>  | desplazamiento a la derecha |
| <<  | desplazamiento a la izquierda |

### Conversión entre bases

Python considera que un número está escrito en hexadecimal anteponiendo el prefijo **0x**. También se puede convertir un entero en hexadecimal utilizando la función **hex( )**. Ojo porque esta función devuelve el valor  hexadecimal, pero como una cadena de caracteres.

In [41]:
hex(1714) 

'0x6b2'

In [38]:
0x6B2

1714

Para representar un valor en octal antepondremos el prefijo **0o**  al valor octal. 

Viceversa, la función **oct( )** permite convertir un valor decimal en octal, pero representado como caracteres.


In [54]:
oct(8)

'0o10'

In [55]:
0o10

8

En el caso de números binarios podemos utilizar el prefijo 0b y la función bin()

In [42]:
0b01111

15

In [50]:
bin(15)

'0b1111'

La función **int(x,b)** convierte a entero el número x, que es un string en base b

In [77]:
print(int('1010',8))
print(int('baba',16))
print(int('0xbaba',16))
print(int('1010',2))
print(int('bigdata',30))


520
47802
47802
10
8469720880


###### Ej. En matemáticas, decimos que f y g son funciones inversas si para todo valor x, se cumple que 

f(g(x)) == x 

y para todo valor y

g(f(y)) == y

¿Cual es la inversa de la función hex(x)? (para pensar, la respuesta no es trivial)

In [70]:
x = 0xacaba
y = '0xcaba'
# Solución, cambiar f,g por las funciones adecuadas para que se cumpla

# f(g(x)) == x
# g(f(y)) == y



True

### Funciones para secuencias
En el caso de las secuencias, tenemos algunas funciones predefinidas interesantes. La más conocida es **len(x)** que devuelve el número de elementos de la secuencia *x*

In [30]:
x = (0,1,2,3,4,5,6,7)
len(x[1:3])

2

También se pueden utilizar otras funciones como

- mySeq.*index*(x): devuelve la posición (empezando desde 0) de la primera ocurrencia del valor x en la secuencia mySeq, o un error si no x no aparece.  Si se quiere evitar el error mejor emplear el operador *in* dentro de una instrucción *if*. 

- min(mySeq), max(mySeq): devuelve el menor y el mayor elemento de mySeq, respectivamente.
    
- mySeq.count(x): devuelve el número de apariciones del valor x en mySeq.

In [2]:
x = ("Si", "me", "quieres", "quiéreme", "entera", "no", "por", "zonas", "de", "luz", "o", "sombra")
x.index("no")

5

**Ej.** ¿Qué devolverá la siguiente expresión?

In [8]:
# quitar el comentario de la línea inferior para probar
#max(x[1:])

## Importación de bibliotecas


Una de las razones del éxito de Python es la gran cantidad de *bibliotecas* que contienen funciones útiles. Estas bibliotecas ( o módulos, como se denominan en Python) se pueden instalar desde una consola (una consola de Anaconda si estamos en este sistema)

 
    pip install modulo


o, si no tenemos permiso para instalar para todos los usuarios

    pip install --user  modulo
    
En algunos sistemas puede que en lugar de *pip* tengamos que utilizar *pip3*.

El siguiente ejemplo importa (hace visible al programa) los módulos random y math

In [10]:
import random
import math


for i in range(5):
    print(random.randint(1, 25))

print(math.pi)

21
1
8
17
23
3.141592653589793


Lo de escribir 

        random.randint 

todo el tiempo puede resultar molesto. Si queremos usar solo randint podemos poner:

In [12]:
from random import randint
from math import pi


for i in range(5):
    print(randint(1, 25))

print(pi)

17
9
20
18
11
3.141592653589793


Una última posibilidad es renombrar para utilizar nombres más cortos. El siguiente ejemplo (que no hace falta entender completamente) utiliza esta posibilidad para dibujar gráficos de barras

In [17]:
%matplotlib notebook
import numpy as np
import matplotlib.pyplot as plt

N = 5
hombre_means = (20, 35, 30, 35, 27)
hombre_std = (2, 3, 4, 1, 2)
mujer_means = (25, 32, 34, 20, 25)
mujer_std = (3, 5, 2, 3, 3)

ind = np.arange(N)  # posición de cada grupo
print('ind',ind)
width = 0.35       # anchura de las barras

fig, ax = plt.subplots()
rects1 = ax.bar(ind, hombre_means, width, color='r', yerr=hombre_std)

rects2 = ax.bar(ind + width, mujer_means, width, color='y', yerr=mujer_std)

# etiquetas, título, marcas en los ejes
ax.set_ylabel('Puntuaciones')
ax.set_title('Puntuaciones por grupo y género')
ax.set_xticks(ind + width / 2)
ax.set_xticklabels(('G1', 'G2', 'G3', 'G4', 'G5'))

ax.legend((rects1[0], rects2[0]), ('Hombres', 'Mujeres'))
plt.show()

ind [0 1 2 3 4]


<IPython.core.display.Javascript object>

## Tipos en Python

En Python, **todo valor tiene un tipo**, es decir pertenece a un conjunto predefinido de valores.
Decimos que se trata de un lenguaje con tipos, o un lenguaje tipado.

Sin embargo, a diferencia de otros lenguajes como C, C++, C# o Java, en Python no se declaran los tipos explícitamente, los deduce el sistema.

Esto es una comodidad, pero no debe hacernos olvidar que los tipos existen. En concreto, en Python, tenemos:

* Tipos numéricos: int, float, complex 
* Tipo cierto/falso: bool
* Tipo carácter: chr
* Tipo secuencia de caracteres: str
* Tipos secuencia: list, tuple, range
* Tipos secuencia de bnarios: bytes, bytearray, memoryview
* Conjuntos: set, frozenset
* Maps: dict
* Programación orientada a objetos: Clases, objetos
* Programación funcional: funciones lambda



### Conversión entre tipos

La función predefinida **int( )** se puede convertir para convertir un número real en su parte entera, o para convertir un número entre comillas en su versión como entero (es decir, si no se pone segundo parámetro se asume implícitamente base 10). 

Para este último uso, conversión de *string* a *int*, disponemos también de una función inversa,  **str( )** que convierte un entero en string.



In [72]:
print(int(7.7))
print(int('7'))

7
7


**Observaciones: ** 

* A este tipo de funciones que pasan de un tipo a otro se conoce como *funciones de conversión de tipo*
*  Aunque generalmente no nos preocupamos de pensar en los tipos, el sistema comprueba que no mezclemos tipos diferentes en una misma expresión, y si lo hacemos obtendremos un error (a no ser que sea posible una *conversión automática de tipos*)

In [76]:
x = '12'
# 3+x  # error!!!!
3 + int(x)

15

De manera similar, **float(x)**  convierte una cadena x en su representación como número real.



In [79]:
pi = '3.1415'
2*(float(pi))

6.283

**chr( )** se utiliza para convertir un entero a su equivalente alfabético, mientras que **ord( )** es su función inversa.

In [26]:
chr(98)

'b'

In [27]:
ord('b')

98

### Funciones predefinidas aritméticas

**round( )** permite redondear un real a su valor entero más próximo. si se añade un segundo parámetro sirve para redondear al número de decimales indicado. 

In [83]:
print(round(85.6231)) 
print(round(4.55892, 2))
print(int(85.6231))

86
4.56
85


**complex( )** se emplea para definir números complejos, mientras que **abs( )**  deuele el valor absoluto de un número entero/real o el módulo de un número complejo.

In [84]:
c =complex('5+2j')
print(abs(c))
print(abs(-4.5))

5.385164807134504
4.5


**divmod(x,y)** devuelve tanto el cociente como el resto de una división. Para eso se utiliza una **tupla** con la forma (cociente, resto). 

In [30]:
divmod(9,2)

(4, 1)

In [86]:
cociente,resto = divmod(9,2)
print(cociente, resto, cociente*2+resto)

4 1 9


**isinstance(x,y )** es una función booleana es decir que devuelve True o False, según si x es de tipo y. Se pueden comprobar varias clases a la vez haciendo que el segundo argumento sea una tupla

In [88]:
print(isinstance(1, int))
print(isinstance(1.0,int))
print(isinstance(1.0,(int,float)))

True
False
True


**pow(x,y,z)** se emplea para calcular $x^y$. Si se especifica el tercer argumento, z, el resultado es el módulo: ($x^y$ % z).

In [99]:
print(pow(3,3))
print(pow(3,3,5))

27
2


La función **range( )** genera una secuencia de enteros dentro del rango indicado. Admite tres formatos, y es una función importante, que utilizaremos muy a menudo:
* Si solo recibe un argumento entero x devuelve los valores desde 0 hasta x-1.
* Si recibe dos argumentos x,y devuelve la secuencia de elementos que va desde x hasta y-1.
* Si recibe tres argumentos, x,y,z, devuelve los elementos desde x hasta y-1, pero saltando de z en z. 

El resultado es una lista, tipo que veremos en detalle más adelante.

In [100]:
print(range(3))
print(range(2,9))
print(range(2,27,8))

range(0, 3)
range(2, 9)
range(2, 27, 8)


## Entrada del usuario

**input( )**  es una función que lee lo que teclee el usuario hasta que pulsa enter.

In [103]:
abc = input("Dime lo que quieras \t")
print(abc,'? mmmmm...estoy de acuerdo')

Dime lo que quieras 	guapo
guapo ? mmmmm...estoy de acuerdo


In [104]:
type(abc)

str

Si lo que se quiere es leer un entero, debemos convertirlo con **int()**

###### Ej. Corrige el siguiente programa para que calcule de verdad la suma de dos números

In [108]:
a =  input("Dame un número ")
b =  input("Y ahora otro ")
suma = a+b
print('La suma es', suma)

Dame un número 5
Y ahora otro 4
La suma es 54


In [111]:
type(a)

str

Para acabar mencionemos un valor especial, **None**,
es un valor especial que puede ser comparado con cualquier otro, 
sin dar error de tipo

In [112]:
print(None==1.5)
print(None==True)
print(None==False)


False
False
False


Puede pensarse entones que None pertenece a todos los tipos, pero no:

In [113]:
print(isinstance(None,bool))
print(isinstance(None,list))
print(isinstance(None,float))
print(isinstance(None,complex))
print(type(None))

False
False
False
False
<class 'NoneType'>


Como vemos, *None* tiene su propio tipo, que resulta ser compatible con los demás. Este valor tan especial resulta muy útil porque normalmente se representa que ha habido un error en un cómputo.