# Semana 1 – Día 2: Introducción a NumPy y Pandas

**Objetivo del día**  
1. Conocer la librería **NumPy** para manejo de arreglos numéricos.  
2. Introducir **Pandas** para análisis y manipulación de datos tabulares.  
3. Practicar con un dataset real (.csv) y realizar operaciones básicas.

> Asegúrate de tener instaladas las librerías:  
> ```bash
> pip install numpy pandas
> ```


In [1]:
import numpy as np
import pandas as pd
print('NumPy version:', np.__version__)
print('Pandas version:', pd.__version__)

NumPy version: 2.3.0
Pandas version: 2.3.0


## 1. NumPy – arreglos y operaciones básicas

In [None]:
# Crear arreglos
arreglo = np.array([1, 2, 3, 4, 5])       # 1D
matriz  = np.arange(1, 10).reshape(3, 3)  # 2D

print('Arreglo:', arreglo)
print('Matriz:\n', matriz)


In [None]:
# Operaciones element‑wise
print('arreglo + 10 →', arreglo + 10)
print('matriz * 2  →\n', matriz * 2)


In [None]:
# Indexado y slicing
print('arreglo[0]   →', arreglo[0])
print('matriz[1, :] →', matriz[1, :])  # segunda fila


### ✏️ Desafío 1  
1. Crea una función `estadisticas_np(arr)` que reciba un arreglo y devuelva su media, mediana y desviación estándar.  
2. Prueba la función con al menos dos arreglos diferentes.


## 2. Pandas – Series y DataFrames

In [None]:
# Creamos una Serie y un DataFrame simples
serie = pd.Series([10, 15, 17, 21], name='edades')
df = pd.DataFrame({'nombre': ['Ana', 'Luis', 'Sofía', 'Pedro'],
                   'edad':   [23, 21, 19, 24],
                   'ciudad': ['MTY', 'CDMX', 'GDL', 'MTY']})

display(serie)
display(df)


In [None]:
# Operaciones comunes
print('Promedio de edad:', df['edad'].mean())
print('\nConteo por ciudad:')
print(df['ciudad'].value_counts())


### 2.1 Cargar un dataset desde CSV

Descarga (o coloca) un archivo llamado **`ventas.csv`** en la misma carpeta.  
Elige un dataset pequeño con columnas como `producto, precio, cantidad, categoria`.


In [None]:
# Cargar el archivo CSV (descomenta y actualiza la ruta si es necesario)
# ventas = pd.read_csv('ventas.csv')
# display(ventas.head())


### ✏️ Desafío 2  
Con el DataFrame `ventas`:
1. Calcula el ingreso total (`precio * cantidad`) por fila y agrégalo como una nueva columna.  
2. Filtra las filas donde la `cantidad` sea mayor o igual a 10.  
3. Agrupa por `categoria` y muestra la suma de ingresos por cada categoría.


## 🚀 Desafío Opcional  
Usa Matplotlib (o el método `.plot()` de Pandas) para graficar la cantidad total vendida por categoría.  
> No te preocupes por estilos o colores específicos por ahora.


---
**¡Buen trabajo!** Cuando termines, guarda el notebook y súbelo a tu repositorio en:
```
fundamentals/week01/day02_numpy_pandas.ipynb
```