# 📚 Librerias NumPy y Pandas

## 🔹 1. NymPy 💻🧮
NumPy es una librería de Python especializada en el cálculo numérico y el análisis de datos, especialmente para un gran volumen de datos.

Incorpora una nueva clase de objetos llamados `arrays` que permite representar colecciones de datos de un mismo tipo en varias dimensiones, y funciones muy eficientes para su manipulación.

La ventaja de Numpy frente a las listas predefinidas en Python es que el procesamiento de los arrays se realiza mucho más rápido (hasta 50 veces más) que las listas, lo cual la hace ideal para el procesamiento de vectores y matrices de grandes dimensiones.

In [3]:
##Ejemplo del uso de la biblioteca NumPy
import numpy as np #Importacion con alias

calif = np.array ([55, 60, 58, 62, 64, 59, 61, 63, 65, 67,
69, 70, 68, 72, 74, 73, 75, 76, 78, 80,
79, 81, 83, 85, 82, 86, 87, 88, 90, 89,
91, 93, 92, 94, 95, 96, 97, 98, 99, 100,
78, 76, 74, 72, 70, 68, 66, 64, 62, 60])

#Procedemos a aplicar las siguientes funciones al array
print(f"La media de las calificaciones de los 50 alumnos es: {np.mean(calif)}") #Calcular la media
print(f"La mediada de las calificaciones fue: {np.median(calif)}") #Calcular la mediana
print(f"La desviacion estandar de las calficaciones fue: {np.std(calif)}") #Calcular la desviación estándar
print(f"La calificacion mas alta fue: {np.max(calif)}") #Encontrar el valor máximo
print(f"La calificacion mas baja fue: {np.min(calif)}") #Encontrar el valor mínimo

La media de las calificaciones de los 50 alumnos es: 76.88
La mediada de las calificaciones fue: 75.5
La desviacion estandar de las calficaciones fue: 12.681703355622226
La calificacion mas alta fue: 100
La calificacion mas baja fue: 55


## 🔹 2. Pandas 🐼📊
Pandas proporciona una serie de estructuras de datos y funciones para trabajar con datos estructurados. Las dos principales estructuras de datos en Pandas son `Series` y `DataFrames`. 

Una `Serie` es un array unidimensional que puede almacenar cualquier tipo de datos.

Un `DataFrame` es una tabla bidimensional que puede almacenar múltiples `Series`. 

Pandas proporciona una serie de funciones para seleccionar, filtrar y manipular datos en estas estructuras. Algunas de las principales ventajas de usar Pandas incluyen:

- Carga eficiente de datos y manipulación de grandes conjuntos de datos.
- Sintaxis intuitiva y flexible para la manipulación y el análisis de datos
- Soporte completo para datos que faltan y limpieza de datos
- Potentes funciones de agregación y agrupación de datos

In [7]:
#Ejemplo del uso de la biblioteca Pandas
#Declaracion de uso de bibliotecas
import numpy as np
import pandas as pd

calif = np.array ([55, 60, 58, 62, 64, 59, 61, 63, 65, 67,
69, 70, 68, 72, 74, 73, 75, 76, 78, 80,
79, 81, 83, 85, 82, 86, 87, 88, 90, 89,
91, 93, 92, 94, 95, 96, 97, 98, 99, 100,
78, 76, 74, 72, 70, 68, 66, 64, 62, 60]) #Comjunto de datos a usar

Li = [] #Limite inferior
LS = [] #Limite superior
LiD = np.min(calif)
LSD = np.max(calif)
Frec = []

a = 0 #Contador de posicion de los elementos de los arrays de limite superior e inferior

#Haremos una tabla con datos para usar en estadistica, solo como demostracion
long = len(calif) #Conocimiento del tamano de la muestra
print(f"El tamano de la muestra es de: {long}")

ESt = 1 + 3.322* np.log10(long) #Aplicacion de la Ec. de Sturges para en no. de intervalos de clase
ESt = round(ESt) #Redondeo del numero intervalos
print(f"El numero intervalos de clase a usar son {ESt}")

Amp = (LSD - LiD)/ ESt #Amplitud o largo del intervalo de clase
print(f"La amplitud de cada intervalo de clase es de: {Amp:.1f}") #Redondeo de la amplitus a un decimal

while a < ESt: #Ciclo se repite hasta el numero de intervalos
    Li.append(round(LiD, 1))
    LSD = LiD + Amp
    LS.append(round(LSD,1))
    LiD = LSD
    a += 1
print(Li)
print(LS)
a = 0

for a in range(len(Li)): #
    en_rango = (calif >= Li[a] ) & (calif <= LS[a])
    cant_en_rango = np.sum(en_rango)
    Frec.append(cant_en_rango)

df = pd.DataFrame({
    "Limite inferior": Li,
    "Limite superior": LS,
    "Frecuencia": Frec
})
df.index = df.index + 1
print(df.to_string(index=True))

El tamano de la muestra es de: 50
El numero intervalos de clase a usar son 7
La amplitud de cada intervalo de clase es de: 6.4
[np.int64(55), np.float64(61.4), np.float64(67.9), np.float64(74.3), np.float64(80.7), np.float64(87.1), np.float64(93.6)]
[np.float64(61.4), np.float64(67.9), np.float64(74.3), np.float64(80.7), np.float64(87.1), np.float64(93.6), np.float64(100.0)]
   Limite inferior  Limite superior  Frecuencia
1             55.0             61.4           6
2             61.4             67.9           8
3             67.9             74.3          10
4             74.3             80.7           7
5             80.7             87.1           6
6             87.1             93.6           6
7             93.6            100.0           7


In [8]:
#Ejercicio adicional usando Random
#Prueba del uso de la funcion random
import numpy as np
import pandas as pd
numrand = []

for i in range (20):
    num = np.random.rand()
    ent = np.random.randint(1, 10)
    verand = num*(10**ent)
    verand_f = f"{verand:.3f}"
    numrand.append(verand_f)
print(numrand)

#convertirlo en un dataframe
df = pd.DataFrame(numrand, columns=["Número aleatorio (ajustado)"])

# Mostrar tabla sin columna de índice si prefieres
df.index = df.index + 1
print(df.to_string(index=True))