

```
# ANÁLISIS DE PREVALENCIA DE ENFERMEDADES MENTALES EN ESTUDIANTES POR EDAD

Autor: Dario Bermeo
Fecha: Diciembre de 2025
Herramientas: Python, pandas, matplotlib, seaborn

```


```
# Análisis de Prevalencia de enfermedades mentales por edad

## Objetivo
Analizar la prevalencia de diferentes condiciones de salud mental ( ansiedad, depresión, transtornos alimenticios, TOC, TEPT) en distintos grupos etarios,identificando patrones y tendencias que puedan informar políticas de salud pública y programas de intervención.

## Dataset
*  Fuente : Mental Healt Datset - Kaggle.
*  Variables analizadas : Edad, Ansiedad, Depresión, Transtornos   Alimenticios, TOC, TEPT.
*  Tipo de Análisis : Exploratorio y correlacional.

## Preguntas de Investigación
1. ¿Cuáles son las condiciones de salud mental más prevalentes?
2. ¿Cómo varía la prevalencia según el grupo de edad?
3. ¿Existen correlaciones entre diferentes condiciones mentales?
4. ¿Qué grupos etarios presentan mayor riesgo?

## Tecnologías
- Python 3.14
- pandas (manipulación de datos)
- matplotlib (visualizaciones)
- seaborn (gráficos estadísticos)
- Google Colab
- Git - Git-Hub





```







In [1]:
# SECCIÓN 2 IMPORTACIÓN Y CONFIGURACIÓN DE VISUALIZACIÓN
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualizaciones
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('husl')
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 10


In [2]:
# SECCIÓN 3 CARGAR DATASET
print("=" * 60)
print("Cargando dataset...")
print("=" * 60)

student_data = pd.read_csv("/content/Student Depression Dataset.csv")
print(f"\n Dataset cargado exitosamente ")
print(f" Dimensiones del dataset: {student_data.shape[0]} filas, {student_data.shape[1]} columnas")
print("=" * 60)



Cargando dataset...

 Dataset cargado exitosamente 
 Dimensiones del dataset: 27901 filas, 18 columnas


In [4]:
# SECCIÓN 4 EXPLORACIÓN INICIAL DE DATOS
print("\n" + "=" * 60 )
print("EXPLORACIÓN INICIAL")
print("=" * 60 )

# Primeras filas
print("\n Primeras 5 filas del dataset:")
print(student_data.head())

#Información general
print("\n Información general del dataset:")
print(student_data.info())

#Estadísticas descriptivas
print("\n Estadísticas descriptivas del dataset:")
print(student_data.describe())

#Tipo de datos por columna
print("\n Tipo de datos por columna:")
print(student_data.dtypes)




EXPLORACIÓN INICIAL

 Primeras 5 filas del dataset:
   id  Gender   Age           City Profession  Academic Pressure  \
0   2    Male  33.0  Visakhapatnam    Student                5.0   
1   8  Female  24.0      Bangalore    Student                2.0   
2  26    Male  31.0       Srinagar    Student                3.0   
3  30  Female  28.0       Varanasi    Student                3.0   
4  32  Female  25.0         Jaipur    Student                4.0   

   Work Pressure  CGPA  Study Satisfaction  Job Satisfaction  \
0            0.0  8.97                 2.0               0.0   
1            0.0  5.90                 5.0               0.0   
2            0.0  7.03                 5.0               0.0   
3            0.0  5.59                 2.0               0.0   
4            0.0  8.13                 3.0               0.0   

      Sleep Duration Dietary Habits   Degree  \
0          5-6 hours        Healthy  B.Pharm   
1          5-6 hours       Moderate      BSc   
2  Less t

In [8]:
# SECCIÓN 4 : ANÁLISIS DE CALIDAD DE DATOS
print("\n" + "=" * 60 )
print("CALIDAD DE DATOS")
print("=" * 60)

#Valores nulos
print("\n  Análisis de Valores nulos :")
nulos = student_data.isnull().sum()
print(nulos)

total_nulos = student_data.isnull().sum().sum()
total_valores = student_data.shape[0] * student_data.shape[1]
porcentaje_completo = ((total_valores - total_nulos) / total_valores) * 100

print("f\n Resumen calidad de los datos :")
print(f"Total de valores nulos: {total_nulos}")
print(f"Porcentaje de datos completos: {porcentaje_completo:.3f}%")

if total_nulos > 0:
  print(f"\n se identificaron valores nulos - Se requiere limpieza ")
else:
  print(f"\n Dataset Completo ")

#Valores duplicados
duplicados = student_data.duplicated().sum()
print(f"\n Número de filas duplicadas: {duplicados}")



CALIDAD DE DATOS

  Análisis de Valores nulos :
id                                       0
Gender                                   0
Age                                      0
City                                     0
Profession                               0
Academic Pressure                        0
Work Pressure                            0
CGPA                                     0
Study Satisfaction                       0
Job Satisfaction                         0
Sleep Duration                           0
Dietary Habits                           0
Degree                                   0
Have you ever had suicidal thoughts ?    0
Work/Study Hours                         0
Financial Stress                         3
Family History of Mental Illness         0
Depression                               0
dtype: int64
f
 Resumen calidad de los datos :
Total de valores nulos: 3
Porcentaje de datos completos: 99.999%

 se identificaron valores nulos - Se requiere limpieza 

 Número