# üìä Notebook 2: NumPy y Pandas en profundidad

Este notebook te introduce a las bibliotecas m√°s utilizadas en ciencia de datos: **NumPy** y **Pandas**.


### üéØ Objetivos de Aprendizaje
- Comprender la estructura y ventajas de los arrays de NumPy
- Manipular datos en estructuras `Series` y `DataFrames` de Pandas
- Aplicar operaciones estad√≠sticas, de filtrado y transformaci√≥n de datos
- Cargar y explorar archivos CSV reales


### üì¶ Producto Final
- Un conjunto de t√©cnicas para explorar, transformar y resumir datasets cient√≠ficos con Pandas y NumPy


## 1Ô∏è‚É£ Introducci√≥n a NumPy

In [None]:
import numpy as np

# Creamos un array de 10 n√∫meros enteros
array = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

# Mostramos el array
print("Array original:", array)

# Operaciones vectorizadas: sumamos 5 a cada elemento
print("Array + 5:", array + 5)

# Media y desviaci√≥n est√°ndar
print("Media:", np.mean(array))
print("Desviaci√≥n est√°ndar:", np.std(array))


## 2Ô∏è‚É£ Introducci√≥n a Pandas

In [None]:
import pandas as pd

# Creamos una Serie de temperaturas
serie = pd.Series([22.5, 23.1, 21.9, 24.3])

# Mostramos la serie
print("Serie de temperaturas:")
print(serie)

# Creamos un DataFrame con datos simulados
datos = {
    "Estaci√≥n": ["A", "B", "C", "D"],
    "Temperatura": [22.5, 23.1, 21.9, 24.3],
    "Humedad": [85, 78, 90, 70]
}
df = pd.DataFrame(datos)

# Mostramos el DataFrame
print("DataFrame de datos clim√°ticos:")
print(df)


## 3Ô∏è‚É£ Selecci√≥n y filtrado de datos

In [None]:
# Accedemos a una columna
print("Temperaturas:", df["Temperatura"])

# Filtramos por condici√≥n: temperatura mayor a 23
print("Filtrado - Temperatura > 23:")
print(df[df["Temperatura"] > 23])

# Accedemos a una fila por √≠ndice
print("Primera fila:")
print(df.iloc[0])


## 4Ô∏è‚É£ Estad√≠sticas y resumen de datos

In [None]:
# Estad√≠sticas descriptivas
print("Resumen estad√≠stico:")
print(df.describe())

# Media por columna
print("Media de cada columna num√©rica:")
print(df.mean(numeric_only=True))


## 5Ô∏è‚É£ Carga y exploraci√≥n de un archivo CSV
Puedes descargar un dataset real desde [OpenAQ CSV Export](https://openaq.org/#/datasets)

In [None]:
# Cargar un archivo CSV (usa tu propio archivo o descarga uno real)
# df_calidad_aire = pd.read_csv("datos_calidad_aire.csv")

# Vista previa de los primeros registros
# df_calidad_aire.head()


## üéØ Mini proyecto: An√°lisis de estaciones meteorol√≥gicas simuladas

In [None]:
# Simulamos un dataset con 100 observaciones
np.random.seed(0)
df_meteo = pd.DataFrame({
    "Estaci√≥n": np.random.choice(["A", "B", "C", "D"], size=100),
    "Temperatura": np.random.normal(loc=23, scale=2, size=100),
    "Humedad": np.random.uniform(low=60, high=100, size=100)
})

# Calculamos promedios por estaci√≥n
promedios = df_meteo.groupby("Estaci√≥n").mean(numeric_only=True)
print("Promedios por estaci√≥n:")
print(promedios)

# Contamos cu√°ntas observaciones hay por estaci√≥n
conteo = df_meteo["Estaci√≥n"].value_counts()
print("Conteo por estaci√≥n:")
print(conteo)


---
‚úÖ **Notebook completo.** Ya puedes trabajar con NumPy y Pandas para cargar, transformar y explorar datos cient√≠ficos. En el siguiente notebook exploraremos c√≥mo limpiar y preparar datos para an√°lisis m√°s avanzados.