In [5]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
from scipy import stats

# Configuración de estilo
plt.style.use('seaborn-v0_8')
sns.set_theme(style="whitegrid")
plt.rcParams['font.size'] = 12

# Cargar los datos
years = range(2014, 2024)
dfs = []

for year in years:
    try:
        df = pd.read_csv(f'div_{year}.csv')
        df['AÑO'] = year
        dfs.append(df)
    except FileNotFoundError:
        print(f"Archivo div_{year}.csv no encontrado")

if not dfs:
    raise ValueError("No se encontraron archivos de datos. Verifica que:")
    print("- Los archivos estén en el mismo directorio que este script")
    print("- Los archivos se llamen div_AAAA.csv (ej. div_2014.csv)")
    print("- Tengas permisos para leer los archivos")

df = pd.concat(dfs, ignore_index=True)

# 1. Tendencias temporales de divorcios
plt.figure(figsize=(14, 7))
divorcios_por_anio = df['AÑO'].value_counts().sort_index()
sns.lineplot(x=divorcios_por_anio.index, y=divorcios_por_anio.values, marker='o', linewidth=2.5)
plt.title('Evolución de Divorcios por Año (2014-2023)', pad=20)
plt.xlabel('Año')
plt.ylabel('Número de Divorcios')
plt.grid(True, linestyle='--', alpha=0.7)
plt.axvline(2019.5, color='red', linestyle='--', label='Inicio Pandemia')
plt.legend()
plt.tight_layout()
plt.savefig('1_tendencia_anual.png', dpi=300)
plt.close()

# 2. Distribución de divorcios por mes
plt.figure(figsize=(14, 7))
meses = ['Ene', 'Feb', 'Mar', 'Abr', 'May', 'Jun', 'Jul', 'Ago', 'Sep', 'Oct', 'Nov', 'Dic']
divorcios_por_mes = df['MESREG'].value_counts().sort_index()
sns.barplot(x=divorcios_por_mes.index, y=divorcios_por_mes.values, palette="Blues_d")
plt.title('Distribución de Divorcios por Mes', pad=15)
plt.xlabel('Mes')
plt.ylabel('Número de Divorcios')
plt.xticks(range(12), meses)
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig('2_divorcios_por_mes.png', dpi=300)
plt.close()

# 3. Edades al momento del divorcio
plt.figure(figsize=(14, 7))
df['DIF_EDAD'] = df['EDADHOM'] - df['EDADMUJ']
sns.boxplot(data=df[['EDADHOM', 'EDADMUJ']], palette="Set2")
plt.title('Distribución de Edades al Momento del Divorcio', pad=15)
plt.xticks([0, 1], ['Edad Hombre', 'Edad Mujer'])
plt.ylabel('Edad')
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig('3_edades_divorcio.png', dpi=300)
plt.close()

# 4. Diferencia de edad entre cónyuges
plt.figure(figsize=(14, 7))
sns.histplot(df['DIF_EDAD'], bins=30, kde=True, color='skyblue')
plt.title('Diferencia de Edad entre Cónyuges (Hombre - Mujer)', pad=15)
plt.xlabel('Diferencia de Edad (años)')
plt.ylabel('Frecuencia')
plt.axvline(df['DIF_EDAD'].mean(), color='red', linestyle='--', 
            label=f'Media: {df["DIF_EDAD"].mean():.1f} años')
plt.legend()
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig('4_diferencia_edades.png', dpi=300)
plt.close()

# 5. Departamentos con más divorcios
plt.figure(figsize=(14, 8))
top_deptos = df['DEPREG'].value_counts().nlargest(10)
sns.barplot(y=top_deptos.index, x=top_deptos.values, palette="viridis", orient='h')
plt.title('Top 10 Departamentos con Más Divorcios (Lugar de Registro)', pad=15)
plt.xlabel('Número de Divorcios')
plt.ylabel('Departamento')
plt.grid(axis='x', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig('5_top_departamentos.png', dpi=300)
plt.close()

# 6. Nivel de escolaridad comparado
plt.figure(figsize=(14, 7))
escolaridad = pd.DataFrame({
    'Hombre': df['ESCHOM'].value_counts(normalize=True),
    'Mujer': df['ESCMUJ'].value_counts(normalize=True)
}).sort_values('Mujer', ascending=False).head(5)
escolaridad.plot(kind='bar', color=['steelblue', 'salmon'])
plt.title('Nivel de Escolaridad (Top 5)', pad=15)
plt.xlabel('Nivel Educativo')
plt.ylabel('Proporción')
plt.legend(title='Sexo')
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig('6_escolaridad_comparada.png', dpi=300)
plt.close()

# 7. Ocupaciones más comunes
plt.figure(figsize=(14, 7))
ocupaciones = pd.DataFrame({
    'Hombre': df['CIUOHOM'].value_counts().nlargest(5),
    'Mujer': df['CIUOMUJ'].value_counts().nlargest(5)
})
ocupaciones.plot(kind='barh', color=['steelblue', 'salmon'])
plt.title('Ocupaciones Más Comunes entre Divorciados', pad=15)
plt.xlabel('Número de Divorcios')
plt.ylabel('Ocupación')
plt.legend(title='Sexo')
plt.grid(axis='x', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig('7_ocupaciones_comunes.png', dpi=300)
plt.close()

print("Análisis completado. Se han guardado 7 gráficos individuales:")
print("1. 1_tendencia_anual.png - Evolución anual de divorcios")
print("2. 2_divorcios_por_mes.png - Distribución por meses")
print("3. 3_edades_divorcio.png - Edades al momento del divorcio")
print("4. 4_diferencia_edades.png - Diferencia de edad entre cónyuges")
print("5. 5_top_departamentos.png - Departamentos con más divorcios")
print("6. 6_escolaridad_comparada.png - Nivel de escolaridad comparado")
print("7. 7_ocupaciones_comunes.png - Ocupaciones más comunes")


Passing `palette` without assigning `hue` is deprecated and will be removed in v0.14.0. Assign the `x` variable to `hue` and set `legend=False` for the same effect.

  sns.barplot(x=divorcios_por_mes.index, y=divorcios_por_mes.values, palette="Blues_d")

Passing `palette` without assigning `hue` is deprecated and will be removed in v0.14.0. Assign the `y` variable to `hue` and set `legend=False` for the same effect.

  sns.barplot(y=top_deptos.index, x=top_deptos.values, palette="viridis", orient='h')


TypeError: '<' not supported between instances of 'str' and 'int'

<Figure size 1400x700 with 0 Axes>

<Figure size 1400x700 with 0 Axes>