# Introducción
---
En la actualidad, las redes sociales son parte fundamental de la vida cotidiana, especialmente entre los jóvenes. Su uso ha crecido exponencialmente, y con ello surgen cuestionamientos sobre sus posibles efectos en la salud y los hábitos diarios de los usuarios, en particular los estudiantes universitarios.

Este análisis tiene como objetivo explorar, la relación entre el uso de redes sociales y las horas de sueño en estudiantes de nivel **Undergraduate** (Universitarios). A través del estudio de un conjunto de datos recolectados mediante encuestas, se busca identificar patrones de uso, niveles de adicción y su posible impacto en el descanso.

In [None]:
pip install plotly



In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
import pandas as pd
import plotly.express as px
import plotly.subplots as sp
import plotly.graph_objects as go

In [None]:
df_general = pd.read_csv('/content/drive/MyDrive/Addiction in students/Students Social Media Addiction.csv')
df_general.head()

Unnamed: 0,Student_ID,Age,Gender,Academic_Level,Country,Avg_Daily_Usage_Hours,Most_Used_Platform,Affects_Academic_Performance,Sleep_Hours_Per_Night,Mental_Health_Score,Relationship_Status,Conflicts_Over_Social_Media,Addicted_Score
0,1,19,Female,Undergraduate,Bangladesh,5.2,Instagram,Yes,6.5,6,In Relationship,3,8
1,2,22,Male,Graduate,India,2.1,Twitter,No,7.5,8,Single,0,3
2,3,20,Female,Undergraduate,USA,6.0,TikTok,Yes,5.0,5,Complicated,4,9
3,4,18,Male,High School,UK,3.0,YouTube,No,7.0,7,Single,1,4
4,5,21,Male,Graduate,Canada,4.5,Facebook,Yes,6.0,6,In Relationship,2,7


##Variables clave del análisis

|Columna|Descripción|
|------------------------|------------------------------------------------------------------------------|
| **Most_Used_Platform** | Plataforma de redes sociales más utilizada por el estudiante|
| **Avg_Daily_Usage_Hours** | Promedio de horas diarias dedicadas a redes sociales|
| **Sleep_Hours** | Promedio de horas de sueño por díad|
| **Addiction_Level** | Nivel de adicción a redes sociales (escala de 1 a 10)|
| **Affects_Academic_Performance** | Indica si el uso de redes sociales afecta el rendimiento académico (Sí/No) |


In [None]:
df_general.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 705 entries, 0 to 704
Data columns (total 13 columns):
 #   Column                        Non-Null Count  Dtype  
---  ------                        --------------  -----  
 0   Student_ID                    705 non-null    int64  
 1   Age                           705 non-null    int64  
 2   Gender                        705 non-null    object 
 3   Academic_Level                705 non-null    object 
 4   Country                       705 non-null    object 
 5   Avg_Daily_Usage_Hours         705 non-null    float64
 6   Most_Used_Platform            705 non-null    object 
 7   Affects_Academic_Performance  705 non-null    object 
 8   Sleep_Hours_Per_Night         705 non-null    float64
 9   Mental_Health_Score           705 non-null    int64  
 10  Relationship_Status           705 non-null    object 
 11  Conflicts_Over_Social_Media   705 non-null    int64  
 12  Addicted_Score                705 non-null    int64  
dtypes: fl

---
# Visualización y análisis de datos


In [None]:
df_undergraduate = df_general[df_general['Academic_Level'] == 'Undergraduate']

Se filtraron los datos para quedarse **solo** con los estudiantes de nivel **undergraduate**

In [None]:
conteo_genero = df_undergraduate['Gender'].value_counts()

fig = px.pie(conteo_genero,
             names=conteo_genero.index,
             values=conteo_genero.values,
             hole=.3,
             title='Distribución de Hombres y Mujeres en la encuesta',
             color_discrete_sequence=px.colors.qualitative.Dark2)
fig.show()

In [None]:
fig = px.histogram(
    df_undergraduate,
    x='Sleep_Hours_Per_Night',
    nbins=10,
    title='Distribución de horas de sueño'
)
fig.update_layout(
    xaxis_title='Horas de sueño',
    yaxis_title='Número de estudiantes'
)
fig.show()

A partir de las primeras dos visualizaciones, se pueden descatar algunos aspectos importantes del perfil de los encuestados:

*   La mayoría de las respuestas provienen de mujeres, lo que puede influir en los resultados, especialmente si existen diferencias de género en los hábitos de uso de redes sociales o patrones de sueño.
*   Aunque el promedio general parece centrarse entre 6 y 8 horas, se observa una variabilidad importante. Esto indica que no todos los estudiantes mantienen un mismo patrón de descanso, lo cual puede estar influenciado por factores como la carga académica o el uso de redes sociales.



In [None]:
combined_df = pd.merge(
    df_undergraduate['Most_Used_Platform'].value_counts().rename('Cantidad de usuarios'),
    df_undergraduate.groupby('Most_Used_Platform')['Avg_Daily_Usage_Hours'].mean().rename('Promedio de uso diario'),
    left_index = True,
    right_index = True
)

combined_df = combined_df.sort_values(by='Cantidad de usuarios', ascending=False)

colors = px.colors.qualitative.Dark2
colors_repeated = colors * (len(combined_df) // len(colors) + 1)
colors_repeated = colors_repeated[:len(combined_df)]

fig = go.Figure()

fig.add_trace(go.Bar(
    x=combined_df.index,
    y=combined_df['Cantidad de usuarios'],
    name='Cantidad de usuarios',
    marker_color=colors_repeated,
    text=combined_df['Cantidad de usuarios'],
    textposition='outside'
))

fig.add_trace(go.Bar(
    x=combined_df.index,
    y=combined_df['Promedio de uso diario'],
    name='Uso promedio diario (horas)',
    marker_color='red',
    text=combined_df['Promedio de uso diario'].round(2),
    textposition='outside'
))

fig.update_layout(
    title='Uso de plataformas: Cantidad de usuarios y uso promedio diario',
    xaxis_title='Plataformas',
    yaxis_title='Valor',
    barmode='group',
    xaxis_tickangle=-45
)

fig.show()




*   Se observa que ciertas aplicaciones destacan como las más utilizadas, siendo estas: **Instagram, Tiktok y Facebook**
*   Y por otro lado, al separar la visualización del número de usuarios y el promedio de horas de uso por plataforma, se aprecia que no siempre las plataformas más usadas son las que absorben mas tiempo diario.


In [None]:
fig = px.scatter(
      df_undergraduate,
      x = 'Avg_Daily_Usage_Hours',
      y = 'Sleep_Hours_Per_Night',
      color= 'Gender',
      trendline = 'ols',
      title='Relacion entre uso de redes sociales y horas de sueño'
)

fig.update_layout(
    xaxis_title='Uso diario (horas)',
    yaxis_title='Horas de sueño (horas)'
)

fig.show()

Esta gráfica de dispersión explora si existe una relación entre el número de horas diarias que los estudiantes universitarios dedican a redes sociales y la cantidad de horas que duermen.

A simple vista, puede observarse una tendencia en la que, **conforme aumenta el uso diario de redes sociales, las horas de sueño tienden a disminuir en algunos casos.** Aunque no se establece una relación causal directa, este patrón sugiere que un uso excesivo podría estar asociado con una reducción del descanso, lo cual es relevante al tratar temas de bienestar y salud entre estudiantes.

In [None]:
df_undergraduate['Nivel_Adiccion'] = pd.cut(
    df_undergraduate['Addicted_Score'],
    bins = [0,3,7,10],
    labels = ['Bajo', 'Medio', 'Alto'],
    ordered = True
)

fig = px.box(
    df_undergraduate,
    x = 'Nivel_Adiccion',
    y = 'Sleep_Hours_Per_Night',
    title = 'Horas de sueño por nivel de adiccion a redes sociales (1-3 Bajo, 4-7 Medio, 8-10 Alto)'
)

fig.update_layout(
    xaxis_title ='Nivel de adiccion',
    yaxis_title ='Horas de sueño'
)

fig.show()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



Mediante una gráfica de cajas se comparan las horas de sueño de los estudiantes divididos en tres niveles de adicción a redes sociales: bajo (1–3), medio (4–7) y alto (8–10), de acuerdo con una escala previamente definida.

Se observa que los estudiantes con mayor nivel de adicción tienden a dormir menos en comparación con aquellos con niveles bajos o medios. **Esta tendencia refuerza la hipótesis de que una mayor dependencia o uso intensivo de redes sociales podría tener un impacto negativo en la calidad y cantidad del sueño.**Además, se aprecia una mayor variabilidad en las horas de sueño de quienes presentan adicción media o alta.

# Conclusión
---

El análisis realizado permite identificar patrones relevantes en el uso de redes sociales entre estudiantes universitarios. La mayoría de los encuestados son mujeres, y aunque el promedio de horas de sueño se mantiene dentro de un rango saludable para muchos, se observan señales de posible impacto negativo cuando se incrementa el uso de redes sociales.

Las plataformas más utilizadas muestran una clara preferencia por ciertas aplicaciones, y aunque la mayoría de los estudiantes no superan las 5 horas de uso diario, los niveles más altos de adicción sí presentan una tendencia a dormir menos. La relación entre el tiempo dedicado a redes sociales y las horas de sueño, así como la variabilidad del descanso según el nivel de adicción, refuerzan la importancia de fomentar hábitos digitales saludables

