## Instrucciones
Este notebook usa el archivo `inscripciones-autos-total.csv` (402 MB), disponible en:


- [GitHub Release](https://github.com/Manu-Martinez/Analisis-Matriculacion-Vehiculos-Argentina/releases/download/v1.0/inscripciones-autos-total.csv)

El archivo se carga directamente desde el enlace. Para uso local, descarga el archivo y ajusta `file_path` en la versión local del código.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# URL del archivo en GitHub Releases (reemplaza con el enlace real de tu release)
url = 'https://github.com/Manu-Martinez/Analisis-Matriculacion-Vehiculos-Argentina/releases/download/v1.0/inscripciones-autos-total.csv'

# Paso 1: Verificar columnas
print("Cargando primeras 1000 filas para verificar columnas...")
try:
    df_preview = pd.read_csv(url, nrows=1000, low_memory=False)
except UnicodeDecodeError:
    print("Error de codificación. Intentando con 'latin1'...")
    df_preview = pd.read_csv(url, nrows=1000, encoding='latin1', low_memory=False)
except Exception as e:
    print(f"Error al cargar el archivo: {e}")
    print("Asegúrate de que el enlace de GitHub Releases sea correcto.")
    print("Puedes descargar el archivo desde: https://github.com/tu-usuario/tu-repositorio/releases")
    exit()

# Mostrar columnas
columns = df_preview.columns.tolist()
print("\nColumnas disponibles (originales):", columns)
print("Columnas disponibles (en minúsculas):", [col.lower() for col in columns])

# Verificar 'fecha_inscripcion_inicial'
target_column = 'fecha_inscripcion_inicial'
if target_column in columns or target_column.lower() in [col.lower() for col in columns]:
    print(f"\nColumna '{target_column}' encontrada.")
    print(f"Muestra de '{target_column}':")
    print(df_preview[target_column].head())
else:
    print(f"\nColumna '{target_column}' NO encontrada.")
    similar_columns = [col for col in columns if any(x in col.lower() for x in ['fecha', 'inscripcion', 'registro', 'date'])]
    print("Columnas similares con 'fecha', 'inscripcion', 'registro' o 'date':", 
          similar_columns if similar_columns else "Ninguna encontrada")
    print("Verifica que el archivo subido a GitHub Releases sea el correcto.")
    exit()

# Paso 2: Cargar el archivo en fragmentos
chunk_size = 100000
print(f"\nCargando archivo en fragmentos de {chunk_size} filas...")
try:
    chunks = pd.read_csv(
        url,
        chunksize=chunk_size,
        low_memory=False,
        encoding='latin1' if 'latin1' in locals() else None
    )
except Exception as e:
    print(f"Error al cargar el archivo: {e}")
    exit()

df_list = []
for chunk in chunks:
    chunk['fecha_inscripcion_inicial'] = pd.to_datetime(
        chunk['fecha_inscripcion_inicial'], format='%Y-%m-%d', errors='coerce'
    )
    chunk['Año'] = chunk['fecha_inscripcion_inicial'].dt.year
    df_list.append(chunk)

# Combinar fragmentos
df = pd.concat(df_list, ignore_index=True)
print("\nArchivo cargado exitosamente.")

# Paso 3: Verificar años disponibles
print("Años disponibles:", df['Año'].unique())

KeyboardInterrupt: 