# TP1 – Taller de Programación (UBA 2025)

**Grupo 4:** Ángel Zapata, David Robalino y Federico Kisza  
**Profesora:** María Noelia Romero  
**Materia:** Taller de Programación  
**Carrera:** Maestría en Economía Aplicada (UBA)  
**Fecha:** 4 de octubre de 2025

---

## 🎯 Objetivo

El presente trabajo tiene como objetivo aplicar los métodos de análisis de datos y programación en Python vistos en clase, utilizando librerías como `pandas`, `numpy`, `matplotlib` y `seaborn`, para realizar un análisis exploratorio sobre la base asignada.


In [1]:
# ========================================================
# SECCIÓN 1 - Importar librerías y configurar entorno
# ========================================================

import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Estilos y opciones generales
plt.style.use('seaborn-v0_8-darkgrid')
pd.set_option('display.max_columns', None)

# Definir rutas base del trabajo
BASE = os.path.abspath(".")  # Carpeta actual
DATOS = os.path.join(BASE, "datos")
FIGS  = os.path.join(BASE, "figuras")

# Crear carpetas si no existen
os.makedirs(DATOS, exist_ok=True)
os.makedirs(FIGS, exist_ok=True)

# Mostrar rutas configuradas
print("Rutas configuradas correctamente:")
print("📂 BASE  ->", BASE)
print("📂 DATOS ->", DATOS)
print("📂 FIGS  ->", FIGS)

Rutas configuradas correctamente:
📂 BASE  -> C:\Users\econz\OneDrive\Documentos\Lecturas libros\Cursos UBA\Programación\Grupo4_UBA_2025\TP1
📂 DATOS -> C:\Users\econz\OneDrive\Documentos\Lecturas libros\Cursos UBA\Programación\Grupo4_UBA_2025\TP1\datos
📂 FIGS  -> C:\Users\econz\OneDrive\Documentos\Lecturas libros\Cursos UBA\Programación\Grupo4_UBA_2025\TP1\figuras


In [None]:
# ========================================================
# SECCIÓN 2 - Carga de datos EPH (2005 y 2025)
# ========================================================

# En esta sección vamos a:
# 1️⃣ Verificar si los archivos de la EPH están en la carpeta /datos
# 2️⃣ Cargar los archivos en formato .dta (Stata) y .xls/.xlsx (Excel)
# 3️⃣ Mostrar la cantidad de observaciones y columnas de cada base

import os
import glob
import pandas as pd

# Definir ruta base
DATOS = r"C:\Users\econz\OneDrive\Documentos\Lecturas libros\Cursos UBA\Programación\Grupo4_UBA_2025\TP1\datos"

# Definimos las rutas de los archivos
archivo_2005 = os.path.join(DATOS, "Individual_t105.dta")

# Buscar automáticamente el archivo de 2025 (sea .xls o .xlsx)
archivos_2025 = glob.glob(os.path.join(DATOS, "usu_individual_T125.*"))
if archivos_2025:
    archivo_2025 = archivos_2025[0]
    print("✅ Archivo 2025 encontrado:", archivo_2025)
else:
    print("⚠️ No se encuentra el archivo 2025.")
    archivo_2025 = None

# Verificar si los archivos existen
if not os.path.exists(archivo_2005):
    print("⚠️ No se encuentra el archivo 2005 en:", archivo_2005)
else:
    print("✅ Archivo 2005 encontrado.")

# Cargar los datos (si existen)
try:
    eph2005 = pd.read_stata(archivo_2005)
    if archivo_2025:
        eph2025 = pd.read_excel(archivo_2025)
    print("\n✅ Bases cargadas correctamente.")
except Exception as e:
    print("\n❌ Error al cargar las bases:", e)

# Mostrar información básica de cada base
try:
    print("\n--- Información de la base 2005 ---")
    print(eph2005.shape)
    print(eph2005.head(3))

    print("\n--- Información de la base 2025 ---")
    print(eph2025.shape)
    print(eph2025.head(3))
except:
    print("⚠️ No se puede mostrar información, verifica las rutas o nombres de archivo.")

✅ Archivo 2025 encontrado: C:\Users\econz\OneDrive\Documentos\Lecturas libros\Cursos UBA\Programación\Grupo4_UBA_2025\TP1\datos\usu_individual_T125.xlsx
✅ Archivo 2005 encontrado.
