# Analisis exploratorio
## Base de datos de matricula en educación superior desde el año 2005 al 2024.

In [None]:
import pandas as pd

# Configuración para mostrar todas las columnas
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

# URL cruda del archivo CSV en GitHub
url = 'https://github.com/jcastilloc168/PythonUDD_ProyectoFinal/raw/main/data/BaseDefinitivaINDICES-2005-2024.csv'

# Leer el archivo CSV desde GitHub
df = pd.read_csv(url, delimiter=';')

# Verificar el resultado
print(df.head())

In [None]:
# Obtener información del dataset
print(df.info())

### Descripción de las Columnas (1-30)

| Nombre del Campo | Descripción del Campo |
|------------------|-----------------------|
| **Año (int64)** | Año de proceso |
| **Cód. Institución (int64)** | Código CNED de la institución |
| **Nombre Institución (object)** | Nombre de la institución de educación superior |
| **Tipo Institución (object)** | Clasificación de la institución según su tipo |
| **Clasificación1 (object)** | Primera clasificación de la institución |
| **Clasificación2 (object)** | Segunda clasificación de la institución |
| **Clasificación3 (object)** | Tercera clasificación de la institución |
| **Clasificación4 (object)** | Cuarta clasificación de la institución |
| **Clasificación5 (object)** | Quinta clasificación de la institución |
| **Clasificación6 (object)** | Sexta clasificación de la institución |
| **Nombre de la Sede (object)** | Ciudad donde se dicta el programa |
| **Comuna donde se imparte la carrera o programa (object)** | Nombre de la comuna donde la institución declara que dicta el programa |
| **Nombre Region (object)** | Nombre de la región donde se dicta el programa |
| **Orden Geográfico de la Región (Norte a Sur) (int64)** | Código que permite ordenar geográficamente las regiones de norte a sur |
| **Cód. Carrera (int64)** | Código de la carrera |
| **Carrera Genérica (object)** | Nombre genérico de la carrera |
| **Nombre Programa (object)** | Nombre del programa específico |
| **Mención o Especialidad (object)** | Mención o especialidad del programa |
| **Horario (object)** | Horario del programa. (Diurno, Vespertino u otro) |
| **Tipo Programa (object)** | Tipo de programa (e.g., Programa Regular o Especial) |
| **Area Conocimiento (object)** | Área de conocimiento del programa |
| **idgenerocarrera (int64)** | Código interno CNED de carrera genérica |
| **Tipo Carrera (object)** | Corresponde a una clasificación de la carrera o programa según su plan de estudios |
| **IngresoDirecto (object)** | Indica si el ingreso es directo (Sí o No) |
| **Año Inicio Actividades (int64)** | Año de inicio de las actividades del programa |
| **Nombre del Campus (object)** | Nombre del campus donde se imparte el programa |
| **Duración (en semestres) (int64)** | Duración del programa en semestres |
| **Cód. Campus (int64)** | Código del campus |
| **Cód. Sede (int64)** | Código de la sede |
| **Título (object)** | Título otorgado por el programa |

### Descripción de las Columnas (31-61)

| Nombre del Campo | Descripción del Campo |
|------------------|-----------------------|
| **Grado Académico (object)** | Grado académico otorgado por el programa |
| **Máximo Puntaje (promedio matemáticas y lenguaje) (float64)** | Máximo puntaje promedio en matemáticas y lenguaje |
| **Promedio Puntaje (promedio matemáticas y lenguaje) (float64)** | Puntaje promedio en matemáticas y lenguaje |
| **Mínimo Puntaje (promedio matemáticas y lenguaje) (float64)** | Mínimo puntaje promedio en matemáticas y lenguaje |
| **Puntaje de corte (primer seleccionado) (float64)** | Puntaje de corte del primer seleccionado |
| **Puntaje de corte (promedio de la carrera) (float64)** | Puntaje de corte promedio de la carrera |
| **Puntaje de corte (último seleccionado) (float64)** | Puntaje de corte del último seleccionado |
| **Máximo Puntaje NEM (float64)** | Máximo puntaje NEM |
| **Promedio Puntaje NEM (float64)** | Puntaje promedio NEM |
| **Mínimo Puntaje NEM (float64)** | Mínimo puntaje NEM |
| **Máximo Puntaje Ranking (float64)** | Máximo puntaje de ranking |
| **Promedio Puntaje Ranking (float64)** | Puntaje promedio de ranking |
| **Mínimo Puntaje Ranking (float64)** | Mínimo puntaje de ranking |
| **Nº Alumnos Ingreso Via PSU o PDT (int64)** | Número de alumnos ingresados vía PSU o PDT |
| **Nº Alumnos Ingreso Otra Via (int64)** | Número de alumnos ingresados por otras vías |
| **Valor de matrícula (float64)** | Valor de la matrícula en pesos o UF |
| **Valor de arancel (float64)** | Valor del arancel en pesos o UF |
| **Valor del Título (float64)** | Valor del título en pesos o UF |
| **Tipo Moneda (object)** | Tipo de moneda (Pesos o UF) |
| **Vacantes (int64)** | Número de vacantes disponibles |
| **Matrícula primer año hombres (int64)** | Número de matriculados hombres en el primer año |
| **Matrícula primer año mujeres (int64)** | Número de matriculadas mujeres en el primer año |
| **Matrícula primer año extranjeros (int64)** | Número de matriculados extranjeros en el primer año |
| **auxiliar (int64)** | Columna auxiliar (descripción no especificada) |
| **Matrícula Primer Año (int64)** | Número total de matriculados en el primer año |
| **Matrícula total hombres (int64)** | Número total de hombres matriculados |
| **Matrícula total mujeres (int64)** | Número total de mujeres matriculadas |
| **Matrícula total extranjeros (int64)** | Número total de extranjeros matriculados |
| **Matrícula Total (int64)** | Número total de matriculados |
| **Códgo SIES (object)** | Código SIES (Sistema de Información de la Educación Superior) |
| **Pregrado/Posgrado (object)** | Indica si el programa es de pregrado o posgrado |