# Módulos en Python

Un **módulo** o **librería** en Python es simplemente  un archivo con extensión `.py` que contiene definiciones y declaraciones de Python: funciones, clases, variables, etc. Su propósito es organizar el código de manera lógica y reutilizable.

<center><i>Cuando importas un módulo, estás diciendo: “quiero usar lo que está definido allí”</i></center>

Los módulos suelen contener *funciones* reutilizables, pero también en el se pueden definir *variables* con datos simples o compuestos (*listas*, *diccionarios*, etc), incluso hasta *clases* o cualquier otro código válido en Python.

Enseguida definimos un módulo `mimodulo.py` con dos funciones `suma()` y `resta()`.

In [None]:
#mimodulo.py

constante = 2.71

def suma(a, b):
    return a + b

def resta(a, b):
    return a - b

Una vez definido, dicho módulo puede ser usado o importado en otro fichero, como mostramos a continuación. Usando import podemos importar todo el contenido.

In [None]:
import mimodulo

In [None]:
#print(mimodulo.suma(4, 3))   
#print(mimodulo.resta(10, 9)) 
#print(mimodulo.multiplicacion(2,-1))

print(mimodulo.constante)

## Rutas y Uso de `sys.path`

Normalmente los módulos que importamos están en la misma carpeta, pero es posible acceder también a módulos ubicados en una subcarpeta. 

Podemos importar el módulo `miotromodulo.py` de la siguiente manera:

In [None]:
from Mis_modulos.miotromodulo import *

saludo()

Es importante notar que Python busca los módulos en las rutas indicadas por el `sys.path`. Es decir, cuando se importa un módulo, lo intenta buscar en dichas carpetas. Puedes ver tu `sys.path` de la siguiente manera:

In [None]:
import sys
print(sys.path)

Como puedes observar la carpeta de tu proyecto está incluida, pero ¿y si queremos importar un módulo que se encuentre en una ubicación distinta? Pues bien, podemos añadir al `sys.path` la ruta en la que queremos que Python busque.

In [None]:
import sys
sys.path.append(r'/ruta/de/tu/modulo')

Una vez realizado esto, los módulos contenidos en dicha carpeta podrán ser importados sin problema como hemos visto anteriormente.

## Importando módulos

Python permite importar un módulo completo o sólo algunas partes de él. Cuando se importa un módulo completo, el intérprete de Python ejecuta todo el código que contiene el módulo, mientras que si solo se importan algunas partes del módulo, solo se ejecutarán esas partes.

### Importación completa de módulos (`import`)

* `import mi_modulo`: Ejecuta el código que contiene `mi_modulo` y crea una referencia a él, de manera que pueden invocarse un objeto o función `f` definida en él mediante la sintaxis `mi_modulo.f`.

### El uso de `as`


* `import mi_modulo as modulo` : Ejecuta el código que contiene `mi_modulo` y crea una referencia a él con el nombre `m`, de manera que pueden invocarse un objeto o función `f` definida en él mediante la sintaxis `modulo.f`. Esta forma es similar a la anterior, pero se suele usar cuando el nombre del módulo es muy largo para utilizar un alias más corto. 

De esta manera, es posible cambiar el nombre del módulo usando `as`. Imaginemos que tenemos un módulo cuyo nombre es: `nombre_modulo_muylargo.py`

In [None]:
import Mis_modulos.nombre_modulo_muylargo  as m

print(m.CONSTANTE)

### Importación parcial de módulos (`from import`)

* `from mi_modulo import f, g, ... `: Ejecuta el código que contiene `mi_modulo` y crea referencias a los objetos `f, g, ...`, de manera que pueden ser invocados por su nombre. De esta manera para invocar cualquiera de estos objetos no hace falta precederlos por el nombre del módulo, basta con escribir su nombre.

* `from mi_modulo import *`: Ejecuta el código que contiene `mi_modulo`  y crea referencias a todos los objetos públicos (aquellos que no empiezan por el carácter _) definidos en el módulo, de manera que pueden ser invocados por su nombre.

También podemos importar únicamente los componentes que nos interesen de nuestro modulo como se muestra a continuación:

In [None]:
from mimodulo import suma, resta, CONSTANTE

print(suma(4, 3))   
print(resta(10, 9))  
print(CONSTANTE)

Por último, podemos importar todo el módulo haciendo uso de `*`, sin necesidad de usar `mimodulo.*.`

In [None]:
from mimodulo import *



print(suma(2,0))
print(multiplicacion(2,-7))




**Observación:** Cuando se importen módulos de esta manera hay que tener cuidado de que no haya coincidencias en los nombres de funciones, variables u otros objetos.

## Módulos estándar más importantes

Python viene con una biblioteca de módulos predefinidos que no necesitan instalarse. Algunos de los más utilizados son:

* `sys`: Funciones y parámetros específicos del sistema operativo.
  
* `os`: Interfaz con el sistema operativo.

* `os.path`: Funciones de acceso a las rutas del sistema.
io: Funciones para manejo de flujos de datos y ficheros.

* `string`: Funciones con cadenas de caracteres.
 
* `datetime`: Funciones para fechas y tiempos.
 
* `math`: Funciones y constantes matemáticas.

* `statistics`: Funciones estadísticas.
 
* `random`: Generación de números pseudo-aleatorios.


### Otras librerías imprescindibles

Estas librerías no vienen en la distribución estándar de Python y necesitan instalarse. 

* `matplotlib`: Análisis y representación gráfica de datos.
 
* `NumPy`: Funciones matemáticas avanzadas y arrays.

* `Pandas`: Funciones para el manejo y análisis de estructuras de datos.

* `SciPy`: Más funciones matemáticas para aplicaciones científicas.

* `Request`: Acceso a internet por http.

Para verificar si una librería ya está instalada en Python podemos seguir los siguientes pasos:

* Abre la terminal dentro de VS Code
  * Ve al menú `Terminal > Nueva terminal` o presiona Ctrl + ` (tecla de tilde invertida).
* En la terminal escribe:
  * `pip list`

O bien sólo ejecuta el siguiente código:

In [None]:
pip list

Si quieres saber si una librería específica está instalada, escribe en la terminal:

* `pip show nombre_del_paquete`

In [None]:
pip show numpy


## Librería `Matplotlib`



**Matplotlib** es una librería de Python especializada en la creación de gráficos en 2D (y con extensiones, también 3D) para crear gráficos estáticos, animados e interactivos en Python. Su módulo principal es `pyplot`, que ofrece una interfaz similar a MATLAB. Se trata de un paquete grande y relativamente complejo que entre otros contiene `pylab`.

`Pyplot` ofrece una interfaz fácil para crear gráficos fácilmente, automatizando la creación de figuras y ejes automáticamente cuando hace un gráfico. Por otra parte, `pylab` combina la funcionalida de `pyplot` para hacer gráficos con funcionalidad de numpy para hacer cálculos con arrays usando un único espacio de nombres muy parecido a Matlab.

In [None]:
pip show matplotlib

In [None]:
pip install matplotlib

In [None]:
import matplotlib.pyplot as plt

ahorros = [50, 100, 30, 65, 120,0]

plt.plot(ahorros)

plt.show()

In [None]:
a = [5, 1, 7, 2]
b = [11, 22, 33, 44]
plt.plot(a, b,color='red', linewidth=0.5, label='linea')
plt.legend()
plt.title('Mi gráfica')
plt.ylabel('Eje Y')
plt.xlabel('Eje X')
plt.grid()
plt.show()



## Diagrama de línea

<table>
  <thead>
    <tr>
      <th>Argumento</th>
      <th>Descripción</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>x</td>
      <td>Los datos de las coordenadas x de los puntos que se van a trazar. Puede ser una secuencia de valores numéricos.</td>
    </tr>
    <tr>
      <td>y</td>
      <td>Los datos de las coordenadas y de los puntos que se van a trazar. Puede ser una secuencia de valores numéricos.</td>
    </tr>
    <tr>
      <td>color</td>
      <td>El color de la línea. Puede ser un color específico (como "red" o "#FF0000") o un código de color hexadecimal.</td>
    </tr>
    <tr>
      <td>linestyle</td>
      <td>El estilo de línea. Puede ser "-" (línea sólida), "--" (línea punteada), "-." (línea guion-punto), ":" (línea punteada fina) u otros estilos disponibles.</td>
    </tr>
    <tr>
      <td>linewidth</td>
      <td>El ancho de línea. Puede ser un número para especificar el grosor en puntos, o también puede ser una cadena como "thin", "medium" o "thick".</td>
    </tr>
    <tr>
      <td>marker</td>
      <td>El marcador colocado en cada punto de datos. Puede ser un símbolo como "o" (círculo), "s" (cuadrado), "D" (diamante), "+" (más) u otros marcadores disponibles.</td>
    </tr>
    <tr>
      <td>markersize</td>
      <td>El tamaño de los marcadores. Puede ser un número para especificar el tamaño en puntos.</td>
    </tr>
    <tr>
      <td>label</td>
      <td>La etiqueta asignada a la línea trazada. Las etiquetas se utilizan para crear una leyenda que describe cada línea.</td>
    </tr>
    <tr>
      <td>alpha</td>
      <td>La transparencia de la línea. Puede ser un valor numérico entre 0 y 1, donde 0 significa completamente transparente y 1 significa completamente opaco.</td>
    </tr>
  </tbody>
</table>


In [None]:
import matplotlib.pyplot as plt

#Definir los datos
x1 = [3, 4, 5, 6]
y1 = [5, 6, 3, 4]
x2 = [2, 5, 8]
y2 = [3, 4, 3]

#Configurar las características del gráfico
plt.plot(x1, y1, label = 'Línea 1', linewidth = 1, color = 'blue')
plt.plot(x2, y2, label = 'Línea 2', linewidth = 1, color = 'green')

#Definir título y nombres de ejes
plt.title('Diagrama de Líneas')
plt.ylabel('Eje Y')
plt.xlabel('Eje X')

#Mostrar leyenda, cuadrícula y figura
plt.legend()
plt.grid()
plt.show()

In [None]:
from matplotlib import pyplot

# Función cuadrática.
def f1(x):
    return 2*(x**2) + 5*x - 2

# Función lineal.
def f2(x):
    return 4*x + 1

# Valores del eje X que toma el gráfico.
x = range(-10, 10)

# Graficar ambas funciones.
pyplot.plot(x, [f1(i) for i in x])
pyplot.plot(x, [f2(i) for i in x])

# Establecer el color de los ejes.
pyplot.axhline(0, color="black")
pyplot.axvline(0, color="black")

# Limitar los valores de los ejes.
pyplot.xlim(-10, 10)
pyplot.ylim(-10, 10)

# Guardar gráfico como imágen PNG.
pyplot.savefig("mi_grafica.jpg")
pyplot.show()

### Ejercicio

Una persona invierte una cantidad inicial de **$5,000** en una cuenta que paga un **interés compuesto** del **6% anual**. La inversión se mantiene durante **15 años** y el interés se capitaliza **una vez al año**.

Utiliza la fórmula del **interés compuesto** para calcular el **capital final** al cabo de cada año. La fórmula es:

   $$A = P \left(1 + \frac{r}{n}\right)^{nt}$$

   Donde:
   - $ A $ es el monto final de la inversión después de $ t $ años.
   - $ P $ es el capital inicial (\$5,000).
   - $ r $ es la tasa de interés anual (6% o 0.06).
   - $ n $ es el número de veces que se capitaliza el interés al año (en este caso 1).
   - $ t $ es el tiempo en años (de 1 a 15).

## Gráfica de barras

<table>
  <thead>
    <tr>
      <th>Argumento</th>
      <th>Descripción</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>x</td>
      <td>Los valores de la posición x de las barras. Puede ser una secuencia de valores numéricos o una secuencia de etiquetas para etiquetar cada barra en el eje x.</td>
    </tr>
    <tr>
      <td>height</td>
      <td>La altura de las barras. Puede ser una secuencia de valores numéricos que representen la altura de cada barra o un solo número para establecer una altura fija para todas las barras.</td>
    </tr>
    <tr>
      <td>width</td>
      <td>El ancho de las barras. Es opcional y su valor predeterminado es 0.8. Puede ser un número entre 0 y 1 para especificar un ancho relativo a la separación entre barras.</td>
    </tr>
    <tr>
      <td>align</td>
      <td>La alineación de las barras con respecto a las posiciones x. Puede ser "center" (centro) o "edge" (borde). El valor predeterminado es "center".</td>
    </tr>
    <tr>
      <td>color</td>
      <td>El color de las barras. Puede ser un solo color para todas las barras o una secuencia de colores del mismo tamaño que los valores x o las alturas de las barras para especificar colores diferentes para cada barra.</td>
    </tr>
    <tr>
      <td>edgecolor</td>
      <td>El color del borde de las barras. Es opcional y su valor predeterminado es None. Puede ser un color específico o None para no dibujar bordes.</td>
    </tr>
    <tr>
      <td>linewidth</td>
      <td>El ancho del borde de las barras. Es opcional. Puede ser un número que representa el grosor del borde en puntos. Si no se especifica, se usa el valor por defecto del sistema.</td>
    </tr>
    <tr>
      <td>tick_label</td>
      <td>Las etiquetas de los ticks en el eje x. Es opcional y se utiliza para etiquetar cada barra en el eje x. Debe ser una secuencia de etiquetas del mismo tamaño que los valores x.</td>
    </tr>
    <tr>
      <td>label</td>
      <td>Etiqueta para incluir en la leyenda del gráfico. Es útil cuando se quieren mostrar varias series de barras con `plt.legend()`.</td>
    </tr>
    <tr>
      <td>alpha</td>
      <td>El nivel de transparencia de las barras. Es un valor entre 0 (completamente transparente) y 1 (completamente opaco). El valor por defecto es 1.</td>
    </tr>
  </tbody>
</table>


In [None]:
#Definir los datos
x1 = ['A','B','C', 'D', 'E']
y1 = [10, 55, 80, 32, 40]
x2 = ['a', 'b', 'c', 'd', 'e']
y2 = [42, 26, 10, 29, 66]

#Configurar las características del gráfico
plt.bar(x1, y1, label = 'Datos 1', width = 0.75, color = 'lightblue')
#plt.bar(x2, y2, label = 'Datos 2', width = 0.75, color = 'orange')

#Definir título y nombres de ejes
plt.title('Gráfico de barras')
plt.ylabel('Valores')
plt.xlabel('Categorias')

#Mostrar leyenda y figura
plt.legend()
plt.show()

In [None]:
#Definir los datos
x1 = [0.25, 1.25, 2.25, 3.25, 4.25]
y1 = [10, 55, 80, 32, 40]
x2 = [0.75, 1.75, 2.75, 3.75, 4.75]
y2 = [42, 26, 10, 29, 66]

#Configurar las características del gráfico
plt.bar(x1, y1, label = 'Conjunto de datos 1', width = 0.5, color = 'lightblue')
plt.bar(x2, y2, label = 'Conjunto de datos 2', width = 0.5, color = 'orange')

#Definir título y nombres de ejes
plt.title('Gráfico de barras')
plt.ylabel('Categorias')
plt.xlabel('Valores')

#Mostrar leyenda y figura
plt.legend()
plt.show()

In [None]:
import matplotlib.pyplot as plt

# Datos de ejemplo
categorias = ['A', 'B', 'C', 'D']
valores = [10, 20, 15, 25]

# Cambiar el color y el ancho de las barras
colores = ['red', 'green', 'blue', 'orange'] #Lista de colores, para asignar un color diferente a cada barra.
anchos = [0.5, 0.75, 0.25, 1] #Se establece el ancho de cada barra

# Crear el gráfico de barras con ajustes
plt.bar(categorias, valores, color=colores, width=anchos, edgecolor='blue', linewithd =)

# Personalizar el gráfico
plt.xlabel('Categorías')
plt.ylabel('Valores')
plt.title('Gráfica de barras')

# Mostrar el gráfico
plt.show()


## Histogramas

Un histograma es una representación gráfica de la distribución de frecuencias de un conjunto de datos. Divide el rango de los datos en intervalos (`bins`) y cuenta cuántos valores caen en cada intervalo.

A diferencia del gráfico de barras, el histograma se utiliza para variables numéricas continuas, y los intervalos (bins) son contiguos.

<table>
  <thead>
    <tr>
      <th>Argumento</th>
      <th>Descripción</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>x</td>
      <td>El conjunto de datos numéricos a representar. Puede ser una lista, un arreglo NumPy o una serie de pandas. También se acepta una lista de listas para graficar múltiples histogramas superpuestos.</td>
    </tr>
    <tr>
      <td>bins</td>
      <td>Controla la cantidad y posición de los intervalos del histograma. Puede ser un número entero (cantidad de bins), una lista de bordes de los bins, o una regla automática como 'auto', 'sturges', 'fd', etc.</td>
    </tr>
    <tr>
      <td>range</td>
      <td>Una tupla (min, max) que define el rango de los valores a incluir. Los valores fuera de este rango se ignoran. Si no se especifica, se usa el mínimo y máximo del conjunto de datos.</td>
    </tr>
    <tr>
      <td>density</td>
      <td>Si se establece en True, se normaliza el histograma para que el área total sea igual a 1, mostrando una estimación de la densidad de probabilidad. Si es False (por defecto), se muestra el conteo de observaciones por bin.</td>
    </tr>
    <tr>
      <td>cumulative</td>
      <td>Si se establece en True, el histograma se acumula desde la izquierda (o desde la derecha si cumulative='-'). Útil para visualizar funciones de distribución acumulada.</td>
    </tr>
    <tr>
      <td>color</td>
      <td>El color de las barras del histograma. Puede ser una cadena de color estándar de Matplotlib (como 'blue', 'red'), un código hexadecimal (como '#FF5733') o una lista si se grafican múltiples conjuntos.</td>
    </tr>
    <tr>
      <td>alpha</td>
      <td>El nivel de opacidad de las barras. Es un valor entre 0 (completamente transparente) y 1 (completamente opaco). Útil para superponer histogramas.</td>
    </tr>
    <tr>
      <td>label</td>
      <td>Etiqueta que describe el conjunto de datos, usada para mostrar una leyenda con plt.legend(). Es especialmente útil cuando se grafican varios histogramas en la misma figura.</td>
    </tr>
    <tr>
      <td>edgecolor</td>
      <td>Color del borde de las barras del histograma. Mejora la visibilidad de los contornos, especialmente cuando las barras tienen colores similares.</td>
    </tr>
    <tr>
      <td>histtype</td>
      <td>Tipo de histograma. Puede ser 'bar' (predeterminado), 'step', 'stepfilled' o 'barstacked'. Cambia la forma visual del histograma.</td>
    </tr>
  </tbody>
</table>


In [None]:
#Definir los datos
a = [22,55,62,45,21,22,34,42,42,4,2,102,95,85,55,110,120,70,65,55,111,115,80,75,65,54,44,43,42,48]
bins = [0,18,20,30,40,50,60,70,80,90,100]

#Configurar las características del gráfico
plt.hist(a, bins, histtype = 'bar', rwidth = 0.8, color = 'blue')

#Definir título y nombres de ejes
plt.title('Histograma')
plt.ylabel('Eje Y')
plt.xlabel('Eje X')

#Mostrar figura
plt.show()

## Grafica de dispersión

<table>
  <thead>
    <tr>
      <th>Argumento</th>
      <th>Descripción</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>x</td>
      <td>Los datos de las coordenadas x de los puntos que se van a trazar. Puede ser una secuencia de valores numéricos.</td>
    </tr>
    <tr>
      <td>y</td>
      <td>Los datos de las coordenadas y de los puntos que se van a trazar. Puede ser una secuencia de valores numéricos.</td>
    </tr>
    <tr>
      <td>s</td>
      <td>El tamaño de los puntos en el gráfico de dispersión. Puede ser un número único para establecer un tamaño fijo para todos los puntos, o una secuencia del mismo tamaño que `x` e `y` para especificar un tamaño diferente para cada punto.</td>
    </tr>
    <tr>
      <td>c</td>
      <td>El color de los puntos en el gráfico de dispersión. Puede ser un color específico (como "red" o "#FF0000"), una secuencia de colores del mismo tamaño que `x` e `y` para especificar un color diferente para cada punto, o una secuencia de valores numéricos para crear una gráfica de color en función de los valores.</td>
    </tr>
    <tr>
      <td>marker</td>
      <td>El tipo de marcador utilizado para representar los puntos en el gráfico de dispersión. Algunos ejemplos de marcadores son "o" (círculo), "s" (cuadrado), "D" (diamante), "+" (más), entre otros.</td>
    </tr>
    <tr>
      <td>alpha</td>
      <td>La transparencia de los puntos en el gráfico de dispersión. Puede ser un valor numérico entre 0 y 1, donde 0 significa completamente transparente y 1 significa completamente opaco.</td>
    </tr>
    <tr>
      <td>label</td>
      <td>La etiqueta asignada a los puntos en el gráfico de dispersión. Las etiquetas se utilizan para crear una leyenda que describe cada conjunto de puntos.</td>
    </tr>
  </tbody>
</table>


In [None]:
#Definir los datos
x1 = [0.25, 1.25, 2.25, 3.25, 4.25]
y1 = [10, 55, 80, 32, 40]
x2 = [0.75, 1.75, 2.75, 3.75, 4.75]
y2 = [42, 26, 10, 29, 66]


#Configurar las características del gráfico
plt.scatter(x1, y1, label = 'Datos 1',color = 'red')
plt.scatter(x2, y2,label = 'Datos 2', color = 'purple')


#Definir título y nombres de ejes
plt.title('Gráfico de dispersión')
plt.ylabel('Eje Y')
plt.xlabel('Eje X')


#Mostrar leyenda y figura
plt.legend()
plt.show()

## Gráfico circular

<table>
  <thead>
    <tr>
      <th>Argumento</th>
      <th>Descripción</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>x</td>
      <td>Secuencia de valores numéricos que representan los tamaños relativos de las porciones del gráfico circular. Los valores no tienen que estar normalizados, ya que se ajustan automáticamente al total.</td>
    </tr>
    <tr>
      <td>labels</td>
      <td>Secuencia de cadenas que etiquetan cada segmento del gráfico. Debe tener la misma longitud que <code>x</code>.</td>
    </tr>
    <tr>
      <td>colors</td>
      <td>Lista de colores para cada segmento. Puede contener nombres de colores, códigos hexadecimales (como <code>'#FF5733'</code>) o referencias a colormaps de Matplotlib.</td>
    </tr>
    <tr>
      <td>explode</td>
      <td>Lista de valores numéricos (uno por segmento) que determinan cuánto se separa cada porción del centro del gráfico. El valor por defecto es 0 para todos; valores mayores a 0 separan visualmente el segmento.</td>
    </tr>
    <tr>
      <td>autopct</td>
      <td>Cadena de formato o función que determina cómo se muestran los porcentajes en los segmentos. Por ejemplo, <code>"%1.1f%%"</code> mostrará un decimal. También puede ser una función personalizada.</td>
    </tr>
    <tr>
      <td>startangle</td>
      <td>Ángulo de inicio (en grados) desde el eje horizontal. Controla la rotación inicial del gráfico. El valor por defecto es 0.</td>
    </tr>
    <tr>
      <td>shadow</td>
      <td>Valor booleano que indica si se debe dibujar una sombra debajo del gráfico. Mejora el contraste visual. El valor por defecto es <code>False</code>.</td>
    </tr>
    <tr>
      <td>pctdistance</td>
      <td>Distancia radial desde el centro en la que se colocan los porcentajes. Valor entre 0 y 1; por defecto es <code>0.6</code>. Un valor más cercano a 0 los acerca al centro.</td>
    </tr>
  </tbody>
</table>


In [None]:
import matplotlib.pyplot as plt

# Datos: horas por actividad a lo largo de 5 días
dormir = [7, 8, 6, 11, 7]
comer = [2, 3, 4, 3, 2]
trabajar = [7, 8, 7, 2, 2]
recreacion = [8, 5, 7, 8, 13]

# Sumar las horas por actividad
divisiones = [sum(dormir), sum(comer), sum(trabajar), sum(recreacion)]
actividades = ['Dormir', 'Comer', 'Trabajar', 'Recreación']
colores = ['red', 'purple', 'blue', 'orange']
explode = (0.1, 0, 0, 0.25)  # Resaltar dormir y recreación

# Configurar tamaño del gráfico
plt.figure(figsize=(8, 6))

# Crear gráfico circular
plt.pie(divisiones,labels=actividades,colors=colores,startangle=90,shadow=True,explode=explode,autopct='%1.1f%%')

# Título del gráfico
plt.title('Distribución del tiempo semanal por actividad')

# Mostrar figura
plt.axis('equal')  # Mantiene proporciones circulares
plt.show()


<a href="https://matplotlib.org/stable/index.html" > Matplotlib</a>

# Librería `Numpy`

La **visualización gráfica** se basa en la idea de manipular información almacenada en unas estructuras conocidas como *vectores* y *matrices*. En Python la única forma de simular estas estructuras es usando listas, pero resulta que  son estas son muy limitadas respecto a las funciones matemáticas que permiten. `Numpy` viene a solucionar esa carencia Proporciona un poderoso objeto de matriz multidimensional llamado `ndarray`, junto con funciones para operar en estas matrices.

**NumPy** es una de las bibliotecas fundamentales en Python para **computación científica** y **análisis numérico**. 

Enseguida se enlistan algunas  características importantes de `NumPy`:

* **Arrays multidimensionales:** El objeto `ndarray` permite almacenar y manipular datos de manera eficiente. Estas arreglos pueden tener cualquier número de dimensiones y contener elementos del mismo tipo. Los `arrays` en `NumPy` son más eficientes en términos de memoria y tiempo de ejecución en comparación con las listas de Python.

* **Rápida ejecución de operaciones matemáticas:**  `NumPy` permite realizar operaciones matemáticas con matrices de manera eficiente. Esto es especialmente beneficioso cuando se trabaja con conjuntos de datos grandes o algoritmos numéricamente intensivos.

* **Funciones de álgebra lineal:**  `NumPy` proporciona una amplia gama de funciones para realizar operaciones de ***Álgebra lineal***, como *multiplicación de matrices*, *descomposición de valores singulares*, *descomposición LU*, *inversión de matrices* y mucho más.

* **Generación de números aleatorios:** `NumPy` incluye un módulo llamado `random` que permite generar números aleatorios de diversas **distribuciones estadísticas**. Esto es útil para simular datos o realizar experimentos numéricos.

* **Integración con otras bibliotecas:** `NumPy` se utiliza ampliamente como base para otras bibliotecas científicas en Python, como `SciPy` (biblioteca de cálculo científico), `pandas` (biblioteca de manipulación de datos) y `scikit-learn` (biblioteca de aprendizaje automático).

## Importando `Numpy`

In [None]:
import numpy as np

## Crear un arreglo a partir  de una lista 

In [None]:
arreglo = np.array([1, 2, 3, 4, 5])
print(arreglo)

**Observación:** Al imprimir un array a diferencia de las listas sus elementos no están separados por comas.

In [None]:
print(type(arreglo))

## Creando un array

In [None]:
import numpy as np

arreglo = np.array([1, 2, 3, 4, 5]) 
print(arreglo)


In [None]:

arreglo2d = np.array([list(range(1,4)), list(range(4,7)), list(range(7,10))])
print(arreglo2d)

## Atributos de un ndarray

Existen varios atributos y funciones que describen las características de un array.

* `a.ndim`: Devuelve el número de dimensiones del array a.

* `a.shape`: Devuelve una tupla con las dimensiones del array a.

* `a.size`: Devuelve el número de elementos del array a.

* `a.dtype`: Devuelve el tipo de datos de los elementos del array a.

Podemos consultar la **dimensión** y **forma** de un array con sus propiedades `ndim` y `shape`

In [None]:
print(arreglo.shape)   # Muestra las dimensiones del ndarray
print(arreglo.ndim)    # Muestra el número de dimensiones del ndarray
print(arreglo.size)    # Muestra el número total de elementos en el ndarray

Ahora bien, **podemos definir un array a partir de una lista anidada formada por dos sublistas**:

In [None]:
array = np.array([[1, 2, 3, 4, 5],[6, 7, 8, 9, 10]])
print(array)
print(array.ndim)
print(array.shape)
print(array.size)

El array se muestra como una tabla de 2 filas con 5 columnas, números que precisamente concuerdan con la forma (2, 5).

Estas estructuras formadas por filas y columnas parecidas a una tabla tienen dos dimensiones, anchura y altura (por eso nos dice que tiene 2 dimensiones). También se conocen como **vectores multidimensionales** o **matrices**.

## Tipos de array

También podemos consultar el tipo de los arrays.

In [None]:
array = np.array([1, 2, 3, 4, 5])
print(array.dtype)

In [None]:
array = np.array([1, 2, 3, 4, 5, 6.1234])
print(array.dtype)

In [None]:
array = np.array(["Hola_5", "que", "tal"])
print(array.dtype)

In [None]:
array = np.array(["Hola", 1234, 3.1415])
print(array.dtype)
#print(array)

## Acceso a los elementos de un array

Para acceder a los elementos contenidos en un array se usan índices al igual que para acceder a los elementos de una lista, pero indicando los índices de cada dimensión separados por comas.

Al igual que para listas, los índices de cada dimensión comienzan en 0.

In [None]:
arreglo = np.array([1, 2, 3, 4, 5])
print(arreglo[0]) 

In [None]:
arreglo2d = np.array([list(range(1,4)), list(range(4,7)), list(range(7,10))])
print(arreglo2d)

print(arreglo2d[0])
print(arreglo2d[-1,-1])

In [None]:
print(arreglo2d[0][2])

In [None]:
arreglo2d[0] = 11
print(arreglo2d)

### Slicing. 



También es posible obtener subarrays con el operador dos puntos `:` Se basa en dos índices, uno de inicio y otro de fin separados por dos puntos para cada dimensión. Si dejamos los índices vacíos se toman por defecto el principio y el final.

In [None]:
arreglo = np.array([1, 2, 3, 4, 5]) 
print(arreglo[1:4])   
print(arreglo[:])
print(arreglo[0:-1])

In [None]:
arreglo[1:-1]=0
print(arreglo[:])

In [None]:
arreglo2d = np.array([list(range(1,4)), list(range(4,7)), list(range(7,10))])
print(arreglo2d)


In [None]:
print(arreglo2d[:][:])
print(arreglo2d[:2][:])
print(arreglo2d[:][:1])

In [None]:
arreglo2d[:2][:2] = 0
print(arreglo2d[:][:])

## Copia de un arreglo

En Python, cuando copias una estructura como una lista o un array, debes distinguir entre:

* `Copia por referencia`: Ambas variables apuntan al mismo objeto.

* `Copia  superficial`: Se copia el contenedor, pero los elementos siguen compartidos (relevante con estructuras anidadas). Es decir, por ejemplo si se copia superficielmente un  arrays de dos dimensiones, todos los cambios realizados en un subarray se verán reflejados en el original.

### Copia por referencia

In [None]:
import numpy as np

arr1 = np.array([1, 2, 3])


arr2 = arr1
arr2[0] = 100

print(arr1)  


[100   2   3]


### Copia con `np.copy()`

In [None]:

arr1 = np.array([1, 2, 3])
arr2 = np.copy(arr1)

arr2[0] = 100
print(arr1) 
print(arr2) 

## Filtrado de elementos de un array

Una característica muy útil de los arrays es que es muy fácil obtener otro array con los elementos que cumplen una condición

`a[condicion]`: Devuelve una lista con los elementos del array `a` que cumplen la condición `condicion`.

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6]])

[2 4 6]
[4 6]


In [None]:
print(a[a % 2 == 0])


In [None]:
print(a[(a % 2 == 0) &  (a > 2)])

In [4]:
b = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

In [6]:
resultado = b[b > 4]
print(resultado)

[5 6 7 8 9]


## Operaciones matemáticas entre arreglos

Existen dos formas de realizar operaciones matemáticas con arrays: a nivel de elemento y a nivel de array.

Las operaciones a nivel de elemento operan los elementos que ocupan la misma posición en dos arrays. Se necesitan, por tanto, dos arrays con las mismas dimensiones y el resultado es una array de la misma dimensión.

Los operadores matemáticos `+, -, *, /, %, **` se utilizan para la realizar suma, resta, producto, cociente, resto y potencia a nivel de elemento respectivamente.

### Suma

In [None]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

#print(np.add(a, b))        
print(a+b)


In [None]:
arr_5 = np.array([[1,2],[3,4]])
arr_6 = np.array([[5,6],[7,8]])

suma = arr_5 + arr_6
print(suma)

### Resta

In [7]:
print(np.subtract(a, b))   
resta = a-b
print(resta)




ValueError: operands could not be broadcast together with shapes (2,3) (3,3) 

### Multiplicación

In [None]:
print(np.multiply(a, b))   
print(a*b)

# Multiplicación por escalar
print(5*a)


### División

In [None]:
#print(np.divide(a, b))     
print(a/b)

#Divisiones interesantes
print(1/a)


### Potencia

In [None]:
print(a**2)

In [8]:
#Potencias interesantes

print(a**-1.)

[[1.         0.5        0.33333333]
 [0.25       0.2        0.16666667]]


## Álgebra Matricial (submódulo `linalg`)

`Numpy` incorpora funciones para realizar las principales operaciones algebraicas con vectores y matrices. La mayoría de los métodos algebráicos se agrupan en el submódulo `linalg`.

### Producto escalar de dos vectores

Para realizar el producto escalar de dos vectores se utiliza el operador `@` o el siguiente método: `u.dot(v)`: Devuelve el producto escalar de los vectores u y v.

In [None]:
a = np.array([1, 2, 3])
b = np.array([1, 0, 1])
print(a @ b)

### Módulo de un vector

Para calcular el módulo de un vector se utiliza el siguiente método:

`norm(v)`: Devuelve el módulo del vector `v`.

In [None]:
import numpy as np
a = np.array([3, 4])
print(np.linalg.norm(a))

### Producto de dos matrices

Para realizar el producto matricial se utiliza el mismo operador `@` y método que para el producto escalar de vectores:

`a.dot(b)`: Devuelve el producto matricial de las matrices `a` y `b` siempre y cuando sus dimensiones sean compatibles.

In [None]:
import numpy as np
a = np.array([[1, 2, 3], [4, 5, 6]])
b = np.array([[1, 1], [2, 2], [3, 3]])
print(a @ b)
print(a.dot(b))

### Matriz Transpuesta

Para trasponer una matriz se utiliza el método

`a.T` : Devuelve la matriz traspuesta de la matriz `a`.

In [None]:
import numpy as np
a = np.array([[1, 2, 3], [4, 5, 6]])
print(a.T)

### Traza de una matriz

La traza de una matriz cuadrada se calcula con el siguiente método:

`a.trace()`: Devuelve la traza (suma de la diagonal principal) de la matriz cuadrada `a`.

In [9]:
import numpy as np
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(a.trace())

15


### Determinante de una matriz

El determinante de una matriz cuadrada se calcula con la siguiente función:

`det(a)`: Devuelve el determinante de la matriz cuadrada `a`.

In [None]:
import numpy as np
a = np.array([[1, 2], [3, 4]])
print(np.linalg.det(a))

### La inversa de una matriz 

La inversa de una matriz se calcula con la siguiente función:

`inv(a)`: Devuelve la matriz inversa de la matriz cuadrada `a`.

### Matriz inversa

La inversa de una matriz se calcula con la siguiente función:

`inv(a)` : Devuelve la matriz inversa de la matriz cuadrada `a`.

In [None]:
import numpy as np
a = np.array([[1, 2], [3, 4]])
print(np.linalg.inv(a))

### Autovalores de una matriz

Los autovalores de una matriz cuadrada se calculan con la siguiente función:

`eigvals(a)`: Devuelve los autovalores de la matriz cuadrada `a`.

In [None]:
import numpy as np
a = np.array([[1, 1, 0], [1, 2, 1], [0, 1, 1]])
print(np.linalg.eigvals(a))

### Autovectores de una matriz

Los autovectores de una matriz cuadrada se calculan con la siguiente función:

`eig(a)`: Devuelve los autovalores y los autovectores asociados de la matriz cuadrada `a`.

## Funciones estadísticas

In [None]:
arreglo = np.array([1, 2, 3, 4, 5])

print(np.mean(arreglo))       # Calcula la media del ndarray
print(np.median(arreglo))     # Calcula la mediana del ndarray
print(np.std(arreglo))        # Calcula la desviación estándar del ndarray
print(np.min(arreglo))        # Encuentra el valor mínimo del ndarray
print(np.max(arreglo))        # Encuentra el valor máximo del ndarray

### Solución de un sistema de ecuaciones

Para resolver un sistema de ecuaciones lineales se utiliza la función siguiente:

`solve(A, B)`: Devuelve la solución del sistema de ecuaciones lineales con los coeficientes de la matriz `A` y los términos independientes de la matriz `B`.

## Arrays pregenerados

rear arrays a partir de listas puede ser muy tedioso, por eso numpy integra varias funciones muy útiles para generar arrays de uso común en el álgebra de matrices

In [10]:
import numpy as np
# Sistema de dos ecuaciones y dos incógnitas
# x + 2y = 1
# 3x + 5y = 2 
A = np.array([[1, 2], [3, 5]])
B = np.array([1, 2])
print(np.linalg.solve(A, B))

[-1.  1.]


### Array de ceros

Un array de ceros es cuando todos sus elementos son ceros. Podemos generarlos con el método zeros de Numpy:

In [None]:
import numpy as np
print(np.zeros(3))


Evidentemente podemos generar arrays multidimensionales, pero para ello tenemos que pasarle al método una lista o tupla con la longitud de sus dimensiones:

In [None]:
np.zeros([3,3])

In [None]:
m = np.zeros([2,2])
m[0][0] = np.zeros(2)

### Array de unos

Lo mismo podemos hacer pero utilizando el método ones:

In [None]:
print(np.ones([3,3]))

### Array  identidad

Los arrays de identidad son matrices cuadradas (con el mismo número de filas que de columnas) donde todos los valores son ceros a excepción de la diagonal donde son unos. Podemos generarlos con el método eye:

In [None]:
np.eye(2)

### Array de rangos

 también es posible generar arrays a partir de un rango de valores. Para hacerlo utilizaríamos el método arange:

In [None]:
# Rango de 0 a 3
np.arange(4)



In [None]:
# Rango 0 a 4 decimal
np.arange(4.)


In [None]:

# Rango de -3 a 4
np.arange(-3, 3)


In [None]:

# Rango de 0 a 20 cada 5 números
np.arange(0, 20, 5)

## Consideraciones importantes

Los `arrays` tienen una característica muy especial y es que **se encuentran referenciados en la memoria**.
Esto significa que a la hora de trabajar con subarrays todos los cambios que hagamos se verán reflejados en el array original. 

In [15]:
arreglo = np.arange(0, 50, 0.1)

print(arreglo)


sub_arreglo = arreglo[0:4]

print(sub_arreglo)

[ 0.   0.1  0.2  0.3  0.4  0.5  0.6  0.7  0.8  0.9  1.   1.1  1.2  1.3
  1.4  1.5  1.6  1.7  1.8  1.9  2.   2.1  2.2  2.3  2.4  2.5  2.6  2.7
  2.8  2.9  3.   3.1  3.2  3.3  3.4  3.5  3.6  3.7  3.8  3.9  4.   4.1
  4.2  4.3  4.4  4.5  4.6  4.7  4.8  4.9  5.   5.1  5.2  5.3  5.4  5.5
  5.6  5.7  5.8  5.9  6.   6.1  6.2  6.3  6.4  6.5  6.6  6.7  6.8  6.9
  7.   7.1  7.2  7.3  7.4  7.5  7.6  7.7  7.8  7.9  8.   8.1  8.2  8.3
  8.4  8.5  8.6  8.7  8.8  8.9  9.   9.1  9.2  9.3  9.4  9.5  9.6  9.7
  9.8  9.9 10.  10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 10.9 11.  11.1
 11.2 11.3 11.4 11.5 11.6 11.7 11.8 11.9 12.  12.1 12.2 12.3 12.4 12.5
 12.6 12.7 12.8 12.9 13.  13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8 13.9
 14.  14.1 14.2 14.3 14.4 14.5 14.6 14.7 14.8 14.9 15.  15.1 15.2 15.3
 15.4 15.5 15.6 15.7 15.8 15.9 16.  16.1 16.2 16.3 16.4 16.5 16.6 16.7
 16.8 16.9 17.  17.1 17.2 17.3 17.4 17.5 17.6 17.7 17.8 17.9 18.  18.1
 18.2 18.3 18.4 18.5 18.6 18.7 18.8 18.9 19.  19.1 19.2 19.3 19.4 19.5
 19.6 

Modifiquemos el subarray:

In [None]:
sub_arreglo[:] = 0
sub_arreglo
arreglo

Esto ocurre porque numpy hace una gestión óptima de la memoria y no va a malgastarla creando copias por valor. Para **crear una copia** real de un array y no modificar el original, tendremos que utilizar el método `copy`:

In [None]:
arreglo = np.arange(0, 51, 5)
sub_arreglo = arreglo.copy()
sub_arreglo

In [None]:
sub_arreglo[:] = 0
sub_arreglo
arreglo

## Fancy index

 Esta propiedad de los arrays nos permite trabajar muy cómodamente con las filas de estos arrays

Vamos a crear una matriz 5x10 llena de ceros:

In [11]:
matrixceros = np.zeros((5,10))


Con `fancy index`, podemos pasarle una lista al array haciendo referencia a las filas donde queremos acceder.

Por ejemplo podemos modificar al vuelo la primera, tercera y última fila:

In [None]:
matrixceros[[0,2,-1]] = 1
matrixceros

**Observacion:**  La idea es  que realmente las filas simulan sublistas. De hecho podríamos recorrer este 2-array  con un `for` y cada vez que entramos al bucle estamos en una fila:

In [None]:
for row in matrixceros:
    print(row)

De manera que si quisiéramos darle el mismo valor a cada fila no costaría mucho, sólo deberíamos acceder a través de nuestro índice mágico, que podemos sacarlo por ejemplo con un enumerador:

In [None]:
for i,row in enumerate(matrixceros):
    matrixceros[i]=11

matrixceros

## Arrays de 3 y más dimensiones

De la misma forma que un array de 2 dimensiones, el truco para crear uno de 3 consiste en anidar listas a 3 niveles de profundidad.

In [None]:
import numpy as np

# Primer nivel, 2 elementos en ancho
arreglo_1d = np.array(
    [1, 2]
)
arreglo_1d

In [None]:

# Segundo nivel, 2 elementos en ancho por 2 de alto,
# 4 elementos en total
arreglo_2d = np.array([
    [1, 2],
    [3, 4]
])
arreglo_2d

In [None]:

# Tercer nivel, 2 elementos en ancho por 2 de alto
# por 2 de profundidad, 8 elementos en total
arreglo_3d = np.array([
    [
        [1, 2],
        [3, 4]
    ],
    [
        [5, 6],
        [7, 8]
    ]
])
arreglo_3d

In [12]:
import pandas as pd

matriz = np.array([[1, 2, 3], [4, 5, 6]])
df = pd.DataFrame(matriz)
print(df)


   0  1  2
0  1  2  3
1  4  5  6
