# Sesión 4 - Fundamentos de Python

Martes 25/10/2022

### Enlaces de consulta

1. [Tutorial de Python](https://docs.python.org/es/3/tutorial/)
2. [Tutorial de Python](https://aprendeconalf.es/docencia/python/manual/introduccion-python/)
3. [1ra opción de Numpy](https://python-course.eu/numerical-programming/introduction-to-numpy.php)
4. [2da opción de Numpy](https://numpy.org/doc/stable/user/index.html)
5. [Pandas](https://pandas.pydata.org/docs/user_guide/index.html)

### Contenido

* [Funciones](#funciones)
* [Librería Numpy](#numpy)
* [Librería Pandas](#pandas)

### Objetivo de la sesión
- Conocer el significado de una función y el uso de librerias

<a id="funciones"></a>
## Funciones

### Funciones integradas

Python tiene una serie de funciones y tipos incluidos en él que están siempre disponibles.
![image info](./Figure/f1.png)

[Para más detalle aquí](https://docs.python.org/es/3.8/library/functions.html)

In [None]:
nombre = 'Maria'
if nombre == 'Maria':
    print('Bienvenida Maria')
else:
    print('Bienvenida a todos')

**Librerias de Python**

![Librerias](./Figure/lib.png)

Imagen tomada de: https://www.actumlogos.com/python-para-ia.html

Librería [**math**](https://docs.python.org/es/3/library/math.html)

In [None]:
import math as mt

print(math.fsum([4,5]))
print(math.sqrt(9))

In [None]:
math.factorial(5)

In [None]:
math.pi

In [None]:
math.sqrt(85)

In [None]:
math.floor(4.22)

In [None]:
math.ceil(4.22)

**Inportante!** se puede preguntar a Python por ayuda con la función **help(nombre de la librería)**

### Definir una funciones 
El concepto de función es básico en prácticamente cualquier lenguaje de programación. Se trata de una estructura que nos permite agrupar código. Persigue dos objetivos claros: 
1. **No repetir** trozos de código durante nuestro programa. 
2. **Reutilizar** el código para distintas situaciones.
![image info](./Figure/funcion.png)

In [None]:
def hola():
    print('Hola mundo')

In [None]:
hola()

In [None]:
def string(a):
    print(a)

In [None]:
string('Es un estring')

In [None]:
y = 54
string(y)

In [None]:
def suma(num1, num2):
    print(num1 + num2)

In [None]:
suma(5,10)

In [None]:
suma('Ho','la')

In [None]:
def suma1(a,b):
    return(a + b)

In [None]:
suma1(7, 10)

In [None]:
def s_p_e(v1, v2):
    s = v1 + v2
    p = v1 * v2
    e = v1 ** v2
    return(s, p, e)

In [None]:
s_p_e(4,5)

In [None]:
suma2, producto, exponente = s_p_e(2, 5)

In [None]:
suma2

Generar archivo

![Función](./Figure/fun.png)

In [None]:
import pandas as pd

In [None]:
def generar_archivo_txt(lista, nombre):
    nombreArchivo = nombre + '.csv'
    archivo = pd.DataFrame(lista)
    archivo.to_csv('./Archives/'+ nombreArchivo, encoding = 'utf-8')
    return nombreArchivo

In [None]:
print(generar_archivo_txt([[1, 2, 3],[2, 4, 8],[7, 8, 9]],'Nueva_lista'))

In [None]:
l = './Archives/Nueva_lista.csv'

In [None]:
df = pd.read_csv(l, skipfooter=0, index_col=[0])

In [None]:
df

In [None]:
def generar_archivo_txt1(lista, nombre, columnas = ['Valor1', 'Valor2', 'Valor3']):
    nombreArchivo = nombre + '.csv'
    archivo = pd.DataFrame(lista, columns = columnas)
    archivo.to_csv('./Archives/' + nombreArchivo, encoding = 'utf-8')
    total_filas = len (archivo)
    return nombreArchivo, total_filas

In [None]:
lista2 = [[1, 2, 3],[2, 4, 8],[7, 8, 9]]
nombreArchivo, total_filas = generar_archivo_txt1(lista2,'Nueva_l2', ['1ro','2do','3ro'])
print(nombreArchivo, total_filas)

In [None]:
df2 = pd.read_csv('./Archives/Nueva_l2.csv', skipfooter=0, index_col=[0])

In [None]:
df2

**Funciones recursivas**

In [None]:
def jugar(intento = 1): 
    respuesta = input('¿De qué color es una naranja? ') 
    if respuesta != "naranja": 
        if intento < 3: 
            print('Fallaste! Inténtalo de nuevo')
            intento += 1 
            jugar(intento) # Llamada recursiva 
        else: 
            print('Perdiste!')
    else:
        print('Ganaste!') 

In [None]:
jugar()

In [None]:
def cuenta_atras(num):
    num -= 1
    if num > 0:
        print(num)
        cuenta_atras(num)
    else:
        print("Boooooooom!")
    print("Fin de la función", num)

In [None]:
cuenta_atras(5)

In [None]:
def factorial(numero):
    if numero == 0:
        return 1
    total = numero * factorial(numero-1)
    return total

In [None]:
factorial(3)

<a id="numpy"></a>
## Numpy

`Numpy` es una libreria que permite el manejo eficiente de **tensores**, es decir, arreglos multidimensionales.

Para instalar escriva el siguiente comando: **!pip install numpy**

In [None]:
import numpy as np

#### Creación de matrices Numpy

Hay varias formas de inicializar nuevas matrices Numpy, por ejemplo, desde

* conversión de listas o tuplas de Python
* usar funciones dedicadas a generar matrices numpy, como `arange`, `linspace`, etc.
* lectura de datos de archivos

##### De las listas

Por ejemplo, para crear nuevas matrices de vectores y matrices a partir de las listas de Python, podemos usar la función `numpy.array`

In [None]:
lista = [1, 2, 3, 4, 5]
v_a = np.array(lista)
v_a

In [None]:
v_b = np.array([1, 2, 3, 4, 5])
v_b

In [None]:
print(v_a.dtype)

In [None]:
M = np.array([[1, 2], [3, 4]])
M

In [None]:
type(v_a), type(M)

La diferencia entre las matrices `v_a` y `M` son solo sus formas. Podemos obtener información sobre la forma de una matriz usando la propiedad `ndarray.shape`.

In [None]:
v_a.shape

In [None]:
M.shape

El número de elementos en la matriz está disponible a través de la propiedad `ndarray.size`:

In [None]:
M.size

In [None]:
a = np.array([[0.0,0.0,0.0],[10.0,10.0,10.0],[20.0,20.0,20.0],[30.0,30.0,30.0]])
b = np.array([0.0,1.0,2.0])

In [None]:
a + b

In [None]:
lista= [1,2,3,4,5]
a_complejo = np.array(lista, dtype = complex)
print(a_complejo)

In [None]:
c = np.array([[0,1,2],[3,4,5]])
print(c)

In [None]:
c.ndim

In [None]:
c.shape

In [None]:
a = np.array([[0,1,2,3,4,5],[10,11,12,13,14,15],[20,21,22,23,24,25],[30,31,32,33,34,35],[40,41,42,43,44,45],[50,51,52,53,54,55]])

In [None]:
a

In [None]:
a[1]

In [None]:
a[1,:]

In [None]:
a[4:,4:]

In [None]:
a[:,2]

In [None]:
a[0,3:5]

In [None]:
a[2::2,::2]

<a id="pandas"></a>
## Pandas

#### ¿Qué es Pandas?

Pandas es una biblioteca de software escrita para el lenguaje de programación Python para la manipulación y el análisis de datos. En particular, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series de tiempo.

#### Características de la biblioteca

* Objeto DataFrame para manipulación de datos con indexación integrada
* Herramientas para leer y escribir datos entre estructuras de datos en memoria y diferentes formatos de archivo
* Alineación de datos y manejo integrado de datos faltantes
* Remodelación y pivoteo de conjuntos de datos
* Rebanado basado en etiquetas, indexación elegante y creación de subconjuntos de grandes conjuntos de datos
* Inserción y eliminación de columnas de estructura de datos
* Motor de agrupación que permite operaciones de división, aplicación y combinación en conjuntos de datos
* Fusión y unión de conjuntos de datos
* Indexación de ejes jerárquicos para trabajar con datos de alta dimensión en una estructura de datos de menor dimensión
* Funcionalidad de serie temporal: generación de rango de fechas y conversión de frecuencia, estadísticas de ventana móvil, regresiones lineales de ventana móvil, cambio de fecha y retraso

La biblioteca está altamente optimizada para el rendimiento, con rutas de código críticas escritas en Cython o C.

In [None]:
edad = pd.Series([10,20,14,11])
edad

In [None]:
bacteria = pd.Series([10,20,14,11], index = ['a','b','c','d'])
bacteria

In [None]:
bacteria.values, bacteria.index

In [None]:
bacteria_dict = {'a':10, 'b':20,'c':14,'d':11}

In [None]:
pd.Series(bacteria_dict)

In [None]:
bacteria.describe()

In [None]:
data = np.array([['','Col1','Col2'],['Fila1',11,22],['Fila2',33,44]])
data

In [None]:
df = pd.DataFrame(data = data[1:,1:], index = data[1:,0],columns = data[0,1:])
df

In [None]:
df.shape

In [None]:
df.describe()

In [None]:
df.mean()

### Datos del Titanic

In [None]:
titanic = pd.read_csv('./Archives/titanic.csv')

In [None]:
len(titanic)

In [None]:
titanic.head()

In [None]:
titanic.describe()

In [None]:
titanic.dtypes

In [None]:
titanic['Sex'].value_counts()

In [None]:
titanic.isnull().sum()

In [None]:
df1 = pd.read_csv('./Archives/titanic.csv', usecols = ['PassengerId', 'Survived','Pclass','Sex'])
df1.head()

In [None]:
df1 = df1.sort_values('Pclass', ascending = False)
df1

In [None]:
df1.hist('Survived', by = 'Pclass', grid = 'False', layout = [1,3], figsize = [10,3])
df1.hist('Survived', by = 'Sex', grid = 'False', layout = [1,3], figsize = [10,3])