# Visualización de Datos - DarkSocialAnalytics

### Autores: NOMBRES DE NOSOTRES  
### Fecha: Octubre 2024

Este notebook contiene las visualizaciones avanzadas del proyecto *DarkSocialAnalytics*, donde se busca explorar las relaciones entre las diferentes plataformas de redes sociales y el nivel de adicción de los usuarios. Utilizaremos **Plotly** para crear gráficos interactivos, incluyendo un **Treemap**, que nos permitirá visualizar las jerarquías y proporciones de los datos.


### Carga del Dataset

En esta sección, hemos cargado los datos limpios del archivo `cleaned_TimeWasters_SocialMedia.csv`. Estos datos incluyen información sobre las plataformas de redes sociales, género, y el nivel de adicción de los usuarios, entre otras variables.


In [1]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

df = pd.read_csv(r'C:\Users\BS\Downloads\DarkSocialAnalytics\data\processed\cleaned_TimeWasters_SocialMedia.csv')
df.head()


Unnamed: 0,UserID,Age,Gender,Location,Income,Debt,Owns Property,Profession,Demographics,Platform,...,ProductivityLoss,Satisfaction,Watch Reason,DeviceType,OS,Watch Time,Self Control,Addiction Level,CurrentActivity,ConnectionType
0,1,56,Male,Pakistan,82812,True,True,Engineer,Rural,Instagram,...,3,7,Procrastination,Smartphone,Android,2024-10-16 21:00:00,5,5,Commuting,Mobile Data
1,2,46,Female,Mexico,27999,False,True,Artist,Urban,Instagram,...,5,5,Habit,Computer,Android,2024-10-16 17:00:00,7,3,At school,Wi-Fi
2,3,32,Female,United States,42436,False,True,Engineer,Rural,Facebook,...,6,4,Entertainment,Tablet,Android,2024-10-16 14:00:00,8,2,At home,Mobile Data
3,4,60,Male,Barzil,62963,True,False,Waiting staff,Rural,YouTube,...,3,7,Habit,Smartphone,Android,2024-10-16 21:00:00,5,5,Commuting,Mobile Data
4,5,25,Male,Pakistan,22096,False,True,Manager,Urban,TikTok,...,8,2,Boredom,Smartphone,iOS,2024-10-16 08:00:00,10,0,At home,Mobile Data


### Distribución de Usuarios por Plataforma

Aquí se muestra la **distribución de usuarios** entre las diferentes plataformas de redes sociales. El gráfico de barras nos permite ver qué plataformas tienen más usuarios en este dataset.


In [24]:
fig = px.bar(df, x='Platform', title="Distribución de Usuarios por Plataforma", color='Platform')
fig.show()

### Treemap: Nivel de Adicción por Plataforma y Género

Este **Treemap** muestra cómo se distribuye el nivel de adicción de los usuarios en las diferentes plataformas, desglosado también por género. Las plataformas más populares están representadas por bloques más grandes, mientras que los colores indican el nivel de adicción de los usuarios. Esta visualización nos ayuda a identificar fácilmente en qué plataformas y géneros el nivel de adicción es más alto.


In [17]:
import plotly.express as px

def create_treemap(df, path, values, color, color_scale, title, title_font_size=22, title_x=0.5, font_family="Econ Sans Cnd", font_size=16, font_color="#4D4D4D", margin=dict(t=50, l=25, r=25, b=25), paper_bgcolor='white', textinfo='label+value+percent entry', textfont_size=14, marker_line_color='white', marker_line_width=0.5):
    """
    Crea un Treemap con los parámetros especificados.

    :param df: DataFrame con los datos
    :param path: Lista de columnas para definir la jerarquía del Treemap
    :param values: Columna para los valores del Treemap
    :param color: Columna para los colores del Treemap
    :param color_scale: Escala de colores personalizada
    :param title: Título del gráfico
    :param title_font_size: Tamaño de la fuente del título
    :param title_x: Posición del título en el eje x
    :param font_family: Familia de la fuente
    :param font_size: Tamaño de la fuente
    :param font_color: Color de la fuente
    :param margin: Márgenes del gráfico
    :param paper_bgcolor: Color de fondo del gráfico
    :param textinfo: Información a mostrar en los rectángulos del Treemap
    :param textfont_size: Tamaño de la fuente del texto en los rectángulos
    :param marker_line_color: Color de los bordes de los rectángulos
    :param marker_line_width: Ancho de los bordes de los rectángulos
    """
    fig = px.treemap(df, 
                     path=path,  
                     values=values,  
                     color=color,  
                     color_continuous_scale=color_scale,  
                     title=title)

    fig.update_layout(
        title_font_size=title_font_size,  
        title_x=title_x,  
        font=dict(family=font_family, size=font_size, color=font_color),  
        margin=margin,
        paper_bgcolor=paper_bgcolor  
    )

    fig.update_traces(textinfo=textinfo,  
                      textfont_size=textfont_size, 
                      marker=dict(line=dict(color=marker_line_color, width=marker_line_width)))  

    fig.show()

# Definir colores personalizados inspirados en The Economist
color_scale = ['#1c5b7c', '#2a9fbc', '#f1a340', '#998ec3', '#d6604d', '#c7eae5']

# Llamar a la función para crear el Treemap
create_treemap(df, 
               path=['Platform', 'Gender'],  
               values='Addiction Level',  
               color='Addiction Level',  
               color_scale=color_scale,  
               title="Treemap: Nivel de Adicción por Plataforma y Género")

## Conclusiones

1. **Plataformas con mayor nivel de adicción**: Según el análisis, las plataformas que presentan un mayor nivel de adicción son Instagram y TikTok, especialmente entre los usuarios jóvenes.
   
2. **Diferencias entre géneros**: Se observa una diferencia significativa entre el comportamiento de los géneros en las plataformas, con un nivel de adicción ligeramente más alto entre los hombres en ciertas plataformas.

3. **Insights para intervención**: Este análisis podría ser útil para diseñar campañas de concientización sobre el uso responsable de redes sociales, enfocadas en las plataformas con mayor nivel de adicción y en los grupos demográficos más afectados.
