# 🧪 Laboratorio 1 – Manipulación de Datos con Pandas

Este laboratorio está diseñado para analistas de negocio que desean aprender a manipular datos usando Python en Google Colab.

### 🔹 Paso 1: Importar librerías y cargar los datos

In [None]:
import pandas as pd

# Cargar el archivo Excel, saltando las primeras 8 filas de encabezado
df = pd.read_excel('REPORTE VOLUMEN DE CREDITO 2024_12.xlsx', skiprows=8)
df.head()

### 🔹 Paso 2: Renombrar columnas

In [None]:
df = df.rename(columns={
    'NÚMERO DE OPERACIONES': 'Num_Operaciones',
    'MONTO OTORGADO': 'Monto_Otorgado'
})

### 🔹 Paso 3: Eliminar columnas innecesarias

In [None]:
# Eliminar columna SUBSISTEMA si existe
df = df.drop(columns=['SUBSISTEMA'], errors='ignore')

### 🔹 Paso 4: Conversión de tipos de datos

In [None]:
df['FECHA'] = pd.to_datetime(df['FECHA'], errors='coerce')
df['Monto_Otorgado'] = pd.to_numeric(df['Monto_Otorgado'], errors='coerce')
df['Num_Operaciones'] = pd.to_numeric(df['Num_Operaciones'], errors='coerce')
df.dtypes

### 🔹 Paso 5: Exploración de datos

In [None]:
# Estadísticas generales
print(df.describe())

# Créditos por tipo
print(df['TIPO DE CREDITO'].value_counts())

# Monto otorgado por provincia
print(df.groupby('PROVINCIA')['Monto_Otorgado'].sum().sort_values(ascending=False))

### 🔹 Paso 6 (opcional): Guardar archivo limpio

In [None]:
df.to_csv('datos_limpios.csv', index=False)

### 📌 Desafío para el estudiante

1. ¿Cuál es la provincia con mayor monto otorgado?
2. ¿Qué tipo de crédito tiene mayor número de operaciones?
3. Crea una nueva columna con el monto promedio por operación y analiza los resultados.

In [None]:
# Responde aquí:
print(df.groupby('PROVINCIA')['Monto_Otorgado'].sum().idxmax())
print(df.groupby('TIPO DE CREDITO')['Num_Operaciones'].sum().idxmax())

df['Monto_Promedio'] = df['Monto_Otorgado'] / df['Num_Operaciones']
df[['TIPO DE CREDITO', 'Monto_Promedio']].groupby('TIPO DE CREDITO').mean()