EDA Bullying in the world

1. Configuración inicial.

In [5]:
# Importar librerías necesarias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# Configurar estilo de visualizaciones
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (6, 4)
%matplotlib inline

In [None]:
# Cargar el dataset
df = pd.read_csv('Bullying_2018.csv')

In [None]:
# Visualizamos la tabla
df.head()

In [None]:
# Ver el resumen de la tabla, núm filas, núm column...
df.info()

In [None]:
# Información sobre los datos, nulos, no nulos...
df.describe()

In [None]:
# Mapeamos los nombres antiguos a los nuevos
nuevos_nombres = {
    'bullying_vict_7_days': 'fue_acosado',
    'loneliness_12m': 'sentimiento_soledad',
    'physical_fighting': 'peleas_fisicas'
}

# Usamos el método rename() para aplicar los cambios
df = df.rename(columns=nuevos_nombres)

# Verificamos que los nombres han cambiado
print("Nombres de columnas después de renombrar:", df.columns)

In [None]:
# Convertimos la columna 'fue_acosado' de texto a números (1=Sí, 0=No)
# Primero, veamos los valores únicos para saber qué convertir
print("Valores originales de la columna 'fue_acosado':", df['fue_acosado'].unique())

# Luego, usamos .replace() para hacer la transformación
df['fue_acosado'] = df['fue_acosado'].replace({'Yes': 1, 'No': 0})

# Hacemos lo mismo con 'sentimiento_soledad'
df['sentimiento_soledad'] = df['sentimiento_soledad'].replace({'Yes': 1, 'No': 0})

In [None]:
# Creamos un gráfico de barras para visualizar la distribución de hombres y mujeres
plt.figure(figsize=(7, 5))
sns.countplot(x='sexo', data=df)
plt.title('Distribución de Estudiantes por Sexo', fontsize=15)
plt.xlabel('Sexo', fontsize=12)
plt.ylabel('Número de Estudiantes', fontsize=12)
plt.show()

In [None]:
# Histograma para ver la distribución de la edad
plt.figure(figsize=(8, 6))
sns.histplot(df['age'], bins=10, kde=True)
plt.title('Distribución de la Edad de los Estudiantes', fontsize=15)
plt.xlabel('Edad', fontsize=12)
plt.ylabel('Frecuencia', fontsize=12)
plt.show()

# Boxplot para identificar valores atípicos
plt.figure(figsize=(8, 6))
sns.boxplot(x='age', data=df)
plt.title('Boxplot de la Edad de los Estudiantes', fontsize=15)
plt.xlabel('Edad', fontsize=12)
plt.show()

In [None]:
# Gráfico de barras que compara 'fue_acosado' por 'sexo'
plt.figure(figsize=(8, 6))
sns.countplot(x='fue_acosado', hue='sexo', data=df)
plt.title('Relación entre Acoso Escolar y Género', fontsize=15)
plt.xlabel('¿Fue Acosado?', fontsize=12)
plt.ylabel('Número de Estudiantes', fontsize=12)
plt.legend(title='Sexo')
plt.show()

In [None]:
# Creamos una tabla de contingencia para el mapa de calor
contingency_table = pd.crosstab(df['fue_acosado'], df['sentimiento_soledad'])

# Creamos el mapa de calor
plt.figure(figsize=(8, 6))
sns.heatmap(contingency_table, annot=True, fmt='d', cmap='coolwarm')
plt.title('Relación entre Acoso y Sentimiento de Soledad', fontsize=15)
plt.xlabel('Sentimiento de Soledad', fontsize=12)
plt.ylabel('¿Fue Acosado?', fontsize=12)
plt.show()

### **3. Conclusiones del Análisis Exploratorio de Datos: Acoso Escolar en 2018**

Este análisis se realizó sobre un conjunto de datos de 56,981 estudiantes para comprender la prevalencia y los factores asociados al acoso escolar en 2018.

#### **Hallazgos Principales**

1.  **El acoso escolar es un problema generalizado:** Un porcentaje significativo de la población estudiantil en la muestra reportó haber sido víctima de acoso en los 7 días previos a la encuesta. Esto confirma la relevancia del problema a nivel de toda la comunidad escolar.

2.  **Existe una diferencia por género:** Los datos visualizados revelan que **los estudiantes masculinos son más propensos a reportar ser víctimas de acoso escolar** en comparación con las estudiantes femeninas. Este hallazgo sugiere que las estrategias de prevención podrían beneficiarse de un enfoque adaptado a las dinámicas de género.

3.  **Vínculo directo con la salud emocional:** El análisis de correlación demuestra una **fuerte y clara relación entre ser víctima de acoso y experimentar sentimientos de soledad**. Los estudiantes que se sintieron solos en los últimos 12 meses también tienen una alta probabilidad de haber sido acosados recientemente. Esto subraya que el acoso no es solo un problema de seguridad, sino que tiene un impacto directo y significativo en el bienestar mental de los estudiantes.

#### **Resumen para la Dirección Ejecutiva**

En resumen, los datos no solo confirman la existencia del acoso escolar, sino que también identifican a los estudiantes masculinos como un grupo de mayor riesgo y establecen un vínculo crítico entre el acoso y los sentimientos de soledad. Estas conclusiones son fundamentales para guiar futuras iniciativas de intervención, permitiendo a la organización desarrollar programas de prevención más específicos y efectivos que aborden tanto la seguridad como la salud mental de los estudiantes más vulnerables.