# Introducción a Python: 4.- Funciones, módulos y clases

Con todo lo visto en los anteriores notebooks deberíamos ser capaces de crear cualquier programa. En este apartado vamos a ver cómo se puede (y debe) estrucurar el código de los programas Python de forma que se asegure su reusabilidad y se minimice los posibles puntos de error de los mismos.

### Funciones

<ul>
<li>Puede entenderse como un nombre asignado a un bloque de código que permite su posterior invocación.</li>
<li>Dispone de un conjunto de parámetros de entrada (opcionales) sobre los que trabajará el bloque de código interno.</li>
<li>Ofrecen un resultado de salida (opcional) que podrá ser utilizado por el código que invocó a la función.</li>
<li>Permiten encapsular código de forma que pueda ser reutilizado en varios puntos de un programa.</li>
<li>Evitan la necesidad de copiar y pegar código.</li>
<li>Facilita el mantenimiento y reduce los posibles puntos de error.</li>
<li>Permiten "generalizar" código al trabajar sobre unos parámetros de entrada que pueden ser "variables".</li>
</ul>

In [None]:
list_1 = ["uno", "dos", "tres", "cuatro", "cinco", "treinta"]
list_C = []
for element in list_1:
    if element[0] == "c":
        list_C.append(element.upper())
print (list_C)        

¿Qué pasa si quisiésemos usar una lista distina? ¿Qué pasa si queremos seleccionar sólo los elementos que empiezan por "t"? ¿Qué pasa si queremos devolver los elementos en minúscula? Tendríamos que replicar varias veces el mismo código. Aquí es donde las funciones muestran su potencial.

In [1]:
def mi_funcion(lista, inicial, a_mayuscula):
    list_out = []
    for element in lista:
        if element[0] == inicial:
            if a_mayuscula:
                list_out.append(element.upper())
            else:
                list_out.append(element.lower())
    return list_out

list_1 = ["uno", "dos", "tres", "cuatro", "cinco", "treinta"]
print (mi_funcion(list_1, "c", True))
print (mi_funcion(list_1, "u", False))
print (mi_funcion(list_1, "t", True))

['CUATRO', 'CINCO']
['uno']
['TRES', 'TREINTA']


#### Argumentos opcionales

Podemos asignar **valores por defecto a los parámetros** de la función.

In [None]:
def mi_funcion(lista, inicial, a_mayuscula=True):
    list_out = []
    for element in lista:
        if element[0] == inicial:
            if a_mayuscula:
                list_out.append(element.upper())
            else:
                list_out.append(element.lower())
    return list_out

list_1 = ["uno", "dos", "tres", "cuatro", "cinco", "treinta"]
print (mi_funcion(list_1, "c"))
print (mi_funcion(list_1, "u", False))
print (mi_funcion(list_1, "t", True))

#### Especificar el nombre de los argumentos en la llamada

Se puede **especificar el nombre de los argumentos de entrada en la llamada, eliminando la necesidad de mantener su orden** (funcionamiento por defecto si no se especifica nombre).

In [None]:
list_1 = ["uno", "dos", "tres", "cuatro", "cinco", "treinta"]
print (mi_funcion(inicial="c", lista=list_1))

#### Retorno de múltiples elementos

Aunque, en general, el retorno de las funciones será único (un único valor que se podrá asignar a una variable en el código que invoca), sería posible **devolver una secuencia** y recoger los resultados en diferentes variables (por las propiedades vistas en la presentación de secuencias).

In [None]:
def mi_funcion(lista, inicial, a_mayuscula=True):
    list_out = []
    for element in lista:
        if element[0] == inicial:
            if a_mayuscula:
                list_out.append(element.upper())
            else:
                list_out.append(element.lower())
    return (len(list_out), list_out)

list_1 = ["uno", "dos", "tres", "cuatro", "cinco", "treinta"]
num_elementos, elementos = mi_funcion(list_1, "c")

for i in range(0, num_elementos):
    print (elementos[i])

### Módulos / Paquetes


- Por defecto, en un **script de Python tienes acceso a todas las variables y funciones definidas en el propio fichero.

- Es posible acceder a elementos definidos en otros ficheros mediante la **importación de módulos.**

- Un **fichero .py es un módulo** en Python cuyo **nombre es el mismo que el del fichero (sin extensión).

- La forma de incorporar elementos definidos en un módulo es mediante el uso de la sentencia **import**.

- También podemos crear **nuestros propios scripts** .py con nuestro código e **importarlos en otros proyectos.

#### Importar el módulo completo

Se importa todo el contenido del módulo y es necesario utilizar el alias de módulo delante de las funciones: **modulo.función()**

In [2]:
import numpy
array = numpy.array([[1, 2], [3, 4]])
mean = numpy.mean(array)
print (array)
print (mean)

[[1 2]
 [3 4]]
2.5


#### Importar todo el contenido del módulo

**Se importa todo el contenido** del módulo y se incorporan sus funciones al entorno de trabajo actual, por lo que **no es necesario especificar un alias**. CUIDADO: esto sobreescribiría cualquier función de mismo nombre del entorno de trabajo: **función()**

In [None]:
from numpy import *
array = array([[1, 2], [3, 4]])
media = mean(array)
print (array)
print (media)

#### Importar un elemento específico el módulo

Se importa únicamente el elemento seleccionado, aunque también hay peligro de sobreescritura.

In [None]:
from numpy import array
array = array([[1, 2], [3, 4]])
media2 = mean(array)
print (array)
print(media2)

#### Importar con alias

Se puede especifcar un alias a los elementos importados de forma que asegures que no hay sobreescritura.

In [None]:
from numpy import array as array_de_numpy
array = array_de_numpy([[1, 2], [3, 4]])
print (array)

### Instalación de módulos

Al contrario que en R, en Python no se dispone de una función para instalar módulos directamente desde el intérprete y se debe hacer desde la consola. La herramienta básica para la gestión de paquetes es *pip*.

#### Herramienta: pip install package

pip instala paquetes disponibles en el repositorio PyPI (índice de paquetes de Python). Los comandos más comunes son:<br/>
<ul>
<li>list: Listado de paquetes actualmente instalados en el entorno.</li>
<li>search &lt;search_string&gt;: Búsqueda de paquetes en el repositorio.</li>
<li>install &lt;package&gt;: Instalación de paquetes no disponibles.</li>
<li>update &lt;package&gt;: Actualización del paquete a la última versión disponible.</li>
</ul>

### Importación de funciones personales

- **Crear un fichero .py** con nuestro código.

- Usar **import** para importarlo a un notebook

- Si tanto el fichero .py como el notebook en el que estamos trabajando están **en el mismo directorio:

    - from mymodulo import * 
    - **Usa tus funciones**

- Si el fichero .py está en **otro directorio:

    - **import sys**

    - **sys.path.append**("C:\\Users\\juanh\\Dropbox\\EMPRESA\\SW repository\\B Santander training")

    - from mymodulo import * 
    
    - Ya se pueden usar tus funciones.

### Clases

 - Son **objetos que pueden tener atributos (dan un valor) y métodos(ejecutan una acción)**.
 
 - Por ejemplo los **modelos de Machine Learning son objetos:
     

In [44]:
from sklearn.linear_model import LogisticRegression as log #Importamos una clase logistic regression
import pandas as pd
import random as rand

mymodel=log() #Creamos una instancia del objeto modelo random forest

#Ahora creamos un dataframe pandas con dos columnas de números aleatorios entre 0 y 1.
a=[]
b=[]
for cont in range(0,1000):
    a.append(rand.random())
    b.append(rand.random())

df=pd.DataFrame(a,columns=['a'])
df['b']=b

#Definimos las variables de entrada que va a tener el modelo
feats=['a','b']
x=df[feats] #x es el input al modelo (tiene dos variables: a y b)


y=np.trunc(2*df['a']+df['b'])#generamos una salida. Es una función sencilla y=2*a+b pero que es truncada para tener salidas discretas.

df['y']=y #Incluimos la salida de la función dentro del dataframe

print(df.head(20)) #PRintamos parte del dataframe con el que vamos a entrenar el modelo.Tiene entrada (dos primeras columnas) y salida (la tercera)

mymodel.fit(x,y) #Entrenamos el modelo enseñándole la entrada (a,b) y la salida y

'''
El modelo debe encontrar la correlación entre (a,b) e y.
Ahora el objeto mymodel está entrenado.
fit ES UN MÉTODO.

'''

# Ahora modificamos la entrada (a,b) de forma aleatoria.También ponemos a cero la salida
a=[]
b=[]
for cont in range(0,1000):
    a.append(rand.random())
    b.append(rand.random())

df['a']=a
df['b']=b
df['y']=0
print()
print(df.head(20))# Printamos parte del dataframe actualizado
x=df[feats] #Capturamos el input nuevo para que el modelo haga la predicción.

predictions=mymodel.predict(x) #Almacenamos en la variable predictions la predicción para el nuevo input

# .PREDICT ES OTRO MÉTODO.

df['y']=predictions #Introducimos en el dataframe la predicción y mostramos en nuevo input con su predicción
print()
print(df.head(20))

# AHORA PRINTAMOS UNO DE LOS ATIBUTOS DEL MODELO
print()
print('Ahora printamos los coeficientes del modelo entrenado')
print(mymodel.coef_)


           a         b    y
0   0.605106  0.738671  1.0
1   0.532124  0.135221  1.0
2   0.601984  0.616437  1.0
3   0.100220  0.023849  0.0
4   0.457333  0.772489  1.0
5   0.274439  0.594477  1.0
6   0.829863  0.482541  2.0
7   0.476718  0.678338  1.0
8   0.403172  0.938901  1.0
9   0.693237  0.960264  2.0
10  0.498291  0.176279  1.0
11  0.744774  0.500422  1.0
12  0.187504  0.547259  0.0
13  0.310707  0.194516  0.0
14  0.365628  0.225283  0.0
15  0.372459  0.416079  1.0
16  0.345445  0.568102  1.0
17  0.239441  0.245814  0.0
18  0.873548  0.221385  1.0
19  0.401739  0.275322  1.0

           a         b  y
0   0.442165  0.378990  0
1   0.354626  0.574253  0
2   0.979495  0.977941  0
3   0.650762  0.879000  0
4   0.238220  0.985359  0
5   0.127255  0.341038  0
6   0.361155  0.668097  0
7   0.338499  0.871412  0
8   0.525856  0.327444  0
9   0.849723  0.735314  0
10  0.123138  0.122776  0
11  0.556853  0.068277  0
12  0.602356  0.410962  0
13  0.309528  0.339171  0
14  0.702456  0.08125



#### Creando una clase

In [25]:
class MyClass(object):
    def __init__(self,nombre,apellidos): #El parámetro self es obligatorio. Además se necesita al menos otro parámetro más (nombre en este caso).
        '''
        Definimos los atributos
        '''
        self.name=nombre #Definimos el atributo 'name'
        self.family=apellidos #Definimos el atributo 'family'
    def say_name_completo(self):
        print('my name is',self.name+' '+self.family)
        
    def say_name(self):
        print('my name is',self.name)
        
    def say_family(self):
        print('my family is',self.family)

In [21]:
yo=MyClass('fede','lopez')

In [22]:
yo.say_name_completo() #El método llama a la función say_name_completo

my name is fede lopez


In [23]:
yo.name #Atributo

'fede'

In [24]:
yo.say_family()

my family is lopez
