##  Análisis Exploratorio del Dataset: Salud Mental y Redes Sociales

Este análisis usa el dataset **Mental_Health_and_Social_Media_Balance** de Kaggle.  
Aquí se estudian hábitos de pantalla, estrés, felicidad, sueño y uso de redes sociales.

Se realizan:
- Limpieza de datos  
- Estadísticas generales  
- Filtros  
- Columnas nuevas  
- Análisis por categorías  
- 5 insights importantes  


In [1]:
import pandas as pd

df = pd.read_csv("Mental_Health_and_Social_Media_Balance_Dataset.csv")
df.head()


Unnamed: 0,User_ID,Age,Gender,Daily_Screen_Time(hrs),Sleep_Quality(1-10),Stress_Level(1-10),Days_Without_Social_Media,Exercise_Frequency(week),Social_Media_Platform,Happiness_Index(1-10)
0,U001,44,Male,3.1,7.0,6.0,2.0,5.0,Facebook,10.0
1,U002,30,Other,5.1,7.0,8.0,5.0,3.0,LinkedIn,10.0
2,U003,23,Other,7.4,6.0,7.0,1.0,3.0,YouTube,6.0
3,U004,36,Female,5.7,7.0,8.0,1.0,1.0,TikTok,8.0
4,U005,34,Female,7.0,4.0,7.0,5.0,1.0,X (Twitter),8.0


### Información general del dataset:


In [2]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 500 entries, 0 to 499
Data columns (total 10 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   User_ID                    500 non-null    object 
 1   Age                        500 non-null    int64  
 2   Gender                     500 non-null    object 
 3   Daily_Screen_Time(hrs)     500 non-null    float64
 4   Sleep_Quality(1-10)        500 non-null    float64
 5   Stress_Level(1-10)         500 non-null    float64
 6   Days_Without_Social_Media  500 non-null    float64
 7   Exercise_Frequency(week)   500 non-null    float64
 8   Social_Media_Platform      500 non-null    object 
 9   Happiness_Index(1-10)      500 non-null    float64
dtypes: float64(6), int64(1), object(3)
memory usage: 39.2+ KB


### Estadísticas principales:


In [3]:
df.describe()

Unnamed: 0,Age,Daily_Screen_Time(hrs),Sleep_Quality(1-10),Stress_Level(1-10),Days_Without_Social_Media,Exercise_Frequency(week),Happiness_Index(1-10)
count,500.0,500.0,500.0,500.0,500.0,500.0,500.0
mean,32.988,5.53,6.304,6.618,3.134,2.448,8.376
std,9.960637,1.734877,1.529792,1.542996,1.858751,1.428067,1.524228
min,16.0,1.0,2.0,2.0,0.0,0.0,4.0
25%,24.0,4.3,5.0,6.0,2.0,1.0,7.0
50%,34.0,5.6,6.0,7.0,3.0,2.0,9.0
75%,41.0,6.7,7.0,8.0,5.0,3.0,10.0
max,49.0,10.8,10.0,10.0,9.0,7.0,10.0


In [4]:
df.shape

(500, 10)

In [5]:
df.isnull().sum()

Unnamed: 0,0
User_ID,0
Age,0
Gender,0
Daily_Screen_Time(hrs),0
Sleep_Quality(1-10),0
Stress_Level(1-10),0
Days_Without_Social_Media,0
Exercise_Frequency(week),0
Social_Media_Platform,0
Happiness_Index(1-10),0


No se encontraron valores nulos en el dataset.

## Columnas nuevas

### Columna 1: Clasificación de estrés

In [16]:
def clasificar_estres(x):
    if x <= 3:
        return "bajo"
    elif x <= 6:
        return "moderado"
    else:
        return "alto"

df["Nivel_Estres"] = df["Stress_Level(1-10)"].apply(clasificar_estres)
df.head()

Unnamed: 0,User_ID,Age,Gender,Daily_Screen_Time(hrs),Sleep_Quality(1-10),Stress_Level(1-10),Days_Without_Social_Media,Exercise_Frequency(week),Social_Media_Platform,Happiness_Index(1-10),Screen_Time_Category,Emotional_Score,Nivel_Estres
0,U001,44,Male,3.1,7.0,6.0,2.0,5.0,Facebook,10.0,Medio,4.0,moderado
1,U002,30,Other,5.1,7.0,8.0,5.0,3.0,LinkedIn,10.0,Medio,2.0,alto
2,U003,23,Other,7.4,6.0,7.0,1.0,3.0,YouTube,6.0,Alto,-1.0,alto
3,U004,36,Female,5.7,7.0,8.0,1.0,1.0,TikTok,8.0,Medio,0.0,alto
4,U005,34,Female,7.0,4.0,7.0,5.0,1.0,X (Twitter),8.0,Alto,1.0,alto


### Columna 2: Clasificación de sueño

In [17]:
def clasificar_sueno(x):
    if x <= 4:
        return "malo"
    elif x <= 7:
        return "regular"
    else:
        return "bueno"

df["Calidad_Sueno"] = df["Sleep_Quality(1-10)"].apply(clasificar_sueno)
df.head()


Unnamed: 0,User_ID,Age,Gender,Daily_Screen_Time(hrs),Sleep_Quality(1-10),Stress_Level(1-10),Days_Without_Social_Media,Exercise_Frequency(week),Social_Media_Platform,Happiness_Index(1-10),Screen_Time_Category,Emotional_Score,Nivel_Estres,Calidad_Sueno
0,U001,44,Male,3.1,7.0,6.0,2.0,5.0,Facebook,10.0,Medio,4.0,moderado,regular
1,U002,30,Other,5.1,7.0,8.0,5.0,3.0,LinkedIn,10.0,Medio,2.0,alto,regular
2,U003,23,Other,7.4,6.0,7.0,1.0,3.0,YouTube,6.0,Alto,-1.0,alto,regular
3,U004,36,Female,5.7,7.0,8.0,1.0,1.0,TikTok,8.0,Medio,0.0,alto,regular
4,U005,34,Female,7.0,4.0,7.0,5.0,1.0,X (Twitter),8.0,Alto,1.0,alto,malo


### Aplicación 3 filtros

In [12]:
# 1. Personas con más de 6 horas de pantalla
filtro1 = df[df["Daily_Screen_Time(hrs)"] > 6]

# 2. Personas que duermen muy bien (8+ calidad)
filtro2 = df[df["Sleep_Quality(1-10)"] >= 8]

# 3. Usuarios que NO usaron redes por más de 5 días
filtro3 = df[df["Days_Without_Social_Media"] > 5]

filtro1.head(), filtro2.head(), filtro3.head()


(  User_ID  Age  Gender  Daily_Screen_Time(hrs)  Sleep_Quality(1-10)  \
 2    U003   23   Other                     7.4                  6.0   
 4    U005   34  Female                     7.0                  4.0   
 5    U006   38    Male                     6.6                  5.0   
 6    U007   26  Female                     7.8                  4.0   
 7    U008   26  Female                     7.4                  5.0   
 
    Stress_Level(1-10)  Days_Without_Social_Media  Exercise_Frequency(week)  \
 2                 7.0                        1.0                       3.0   
 4                 7.0                        5.0                       1.0   
 5                 7.0                        4.0                       3.0   
 6                 8.0                        2.0                       0.0   
 7                 6.0                        1.0                       4.0   
 
   Social_Media_Platform  Happiness_Index(1-10) Screen_Time_Category  \
 2               Y

### GroupBy por plataformas

In [15]:
promedios_por_red = df.groupby("Social_Media_Platform")[
    ["Daily_Screen_Time(hrs)", "Stress_Level(1-10)", "Happiness_Index(1-10)"]
].mean()

promedios_por_red


Unnamed: 0_level_0,Daily_Screen_Time(hrs),Stress_Level(1-10),Happiness_Index(1-10)
Social_Media_Platform,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Facebook,5.658025,6.666667,8.345679
Instagram,6.07973,6.959459,7.986486
LinkedIn,5.291954,6.45977,8.517241
TikTok,5.457895,6.589474,8.378947
X (Twitter),5.306818,6.454545,8.647727
YouTube,5.478667,6.64,8.306667


## Insights del Análisis

Las personas que usan más horas de pantalla suelen tener más estrés.

Elemento de la lista.

Cuando el estrés sube, el Emotional_Score baja, lo que muestra menos bienestar.

La categoría de Screen Time Alto aparece más en personas con peor calidad de sueño.

Algunas redes sociales tienen usuarios con más horas de pantalla y más estrés promedio.

Las personas con mejor sueño suelen tener puntajes emocionales más altos.


## Conclusión

En este análisis se pudo observar que las horas de pantalla, el estrés, el sueño y la felicidad están muy relacionados. Las personas que pasan más tiempo usando redes sociales tienden a tener más estrés y un puntaje emocional más bajo. También se vio que quienes duermen mejor y se alejan un poco de las redes suelen sentirse más felices. En general, el dataset muestra que mantener un mejor equilibrio entre el uso del celular, el descanso y las actividades diarias puede ayudar a mejorar el bienestar emocional.
