# Anàlisi de Dades: Drets de les Persones Migrades LGTBIQ+

Aquest notebook conté una anàlisi de dades sobre els drets de les persones migrades LGTBIQ+.

## Objectius

1. Analitzar les dades sobre els drets i la situació de les persones migrades LGTBIQ+
2. Identificar patrons i tendències
3. Visualitzar les troballes principals
4. Proporcionar insights basats en evidències

## 1. Importació de Biblioteques

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import warnings

# Configuració
warnings.filterwarnings('ignore')
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('husl')
%matplotlib inline

# Configurar visualitzacions
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 10

print('Biblioteques importades correctament')

## 2. Càrrega de Dades

Crearem un conjunt de dades sintètiques per a l'anàlisi. En un context real, aquestes dades podrien provenir d'enquestes, estudis o bases de dades oficials.

In [None]:
# Generar dades sintètiques per a l'anàlisi
np.random.seed(42)

n_registres = 500

# Crear dataset sintètic
data = {
    'id': range(1, n_registres + 1),
    'edat': np.random.randint(18, 65, n_registres),
    'pais_origen': np.random.choice(['Veneçuela', 'Colòmbia', 'Hondures', 'El Salvador', 'Nicaragua', 
                                      'Marroc', 'Síria', 'Ucraïna', 'Rússia', 'Brasil'], n_registres),
    'identitat_genere': np.random.choice(['Home trans', 'Dona trans', 'Home cis gay', 'Dona cis lesbiana', 
                                           'No binària', 'Queer', 'Bisexual'], n_registres),
    'anys_residencia': np.random.randint(0, 20, n_registres),
    'situacio_legal': np.random.choice(['Resident legal', 'En procés', 'Sense papers', 'Refugiat'], 
                                        n_registres, p=[0.3, 0.25, 0.2, 0.25]),
    'discriminacio_laboral': np.random.choice(['Sí', 'No', 'Prefereixes no dir'], 
                                               n_registres, p=[0.45, 0.40, 0.15]),
    'acces_sanitat': np.random.choice(['Fàcil', 'Difícil', 'Molt difícil', 'Impossible'], 
                                       n_registres, p=[0.25, 0.35, 0.25, 0.15]),
    'suport_social': np.random.randint(1, 11, n_registres),  # Escala 1-10
    'violencia_experimentada': np.random.choice(['Sí', 'No', 'Prefereixes no dir'], 
                                                 n_registres, p=[0.40, 0.45, 0.15]),
    'habitatge_estable': np.random.choice(['Sí', 'No'], n_registres, p=[0.60, 0.40]),
    'nivell_educatiu': np.random.choice(['Primària', 'Secundària', 'Universitari', 'Postgrau'], 
                                         n_registres, p=[0.15, 0.35, 0.35, 0.15])
}

df = pd.DataFrame(data)

print(f'Dades carregades: {len(df)} registres')
print(f'Columnes: {list(df.columns)}')
df.head(10)

## 3. Exploració Inicial de les Dades

In [None]:
# Informació general del dataset
print('=== INFORMACIÓ GENERAL ===')
print(df.info())
print('\n=== ESTADÍSTIQUES DESCRIPTIVES ===')
print(df.describe())
print('\n=== VALORS NULS ===')
print(df.isnull().sum())

## 4. Anàlisi Demogràfica

In [None]:
# Distribució per país d'origen
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# Gràfic 1: País d'origen
pais_counts = df['pais_origen'].value_counts()
axes[0, 0].barh(pais_counts.index, pais_counts.values, color='skyblue')
axes[0, 0].set_xlabel('Nombre de persones')
axes[0, 0].set_title('Distribució per País d\'Origen')
axes[0, 0].grid(axis='x', alpha=0.3)

# Gràfic 2: Identitat de gènere
identitat_counts = df['identitat_genere'].value_counts()
axes[0, 1].bar(range(len(identitat_counts)), identitat_counts.values, color='coral')
axes[0, 1].set_xticks(range(len(identitat_counts)))
axes[0, 1].set_xticklabels(identitat_counts.index, rotation=45, ha='right')
axes[0, 1].set_ylabel('Nombre de persones')
axes[0, 1].set_title('Distribució per Identitat de Gènere')
axes[0, 1].grid(axis='y', alpha=0.3)

# Gràfic 3: Distribució d'edat
axes[1, 0].hist(df['edat'], bins=20, color='lightgreen', edgecolor='black')
axes[1, 0].set_xlabel('Edat')
axes[1, 0].set_ylabel('Freqüència')
axes[1, 0].set_title('Distribució d\'Edat')
axes[1, 0].grid(axis='y', alpha=0.3)

# Gràfic 4: Anys de residència
axes[1, 1].hist(df['anys_residencia'], bins=20, color='plum', edgecolor='black')
axes[1, 1].set_xlabel('Anys de residència')
axes[1, 1].set_ylabel('Freqüència')
axes[1, 1].set_title('Distribució d\'Anys de Residència')
axes[1, 1].grid(axis='y', alpha=0.3)

plt.tight_layout()
plt.savefig('data/demografics.png', dpi=300, bbox_inches='tight')
plt.show()

print('Gràfics demogràfics generats correctament')

## 5. Anàlisi de Drets i Accés a Serveis

In [None]:
# Anàlisi de situació legal i accés a serveis
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# Gràfic 1: Situació legal
situacio_counts = df['situacio_legal'].value_counts()
colors_situacio = ['#2ecc71', '#f39c12', '#e74c3c', '#3498db']
axes[0, 0].pie(situacio_counts.values, labels=situacio_counts.index, autopct='%1.1f%%', 
               colors=colors_situacio, startangle=90)
axes[0, 0].set_title('Situació Legal')

# Gràfic 2: Accés a sanitat
sanitat_counts = df['acces_sanitat'].value_counts()
axes[0, 1].barh(sanitat_counts.index, sanitat_counts.values, color='lightcoral')
axes[0, 1].set_xlabel('Nombre de persones')
axes[0, 1].set_title('Accés a Sanitat')
axes[0, 1].grid(axis='x', alpha=0.3)

# Gràfic 3: Discriminació laboral
discrim_counts = df['discriminacio_laboral'].value_counts()
axes[1, 0].bar(discrim_counts.index, discrim_counts.values, color=['#e74c3c', '#2ecc71', '#95a5a6'])
axes[1, 0].set_ylabel('Nombre de persones')
axes[1, 0].set_title('Discriminació Laboral')
axes[1, 0].grid(axis='y', alpha=0.3)

# Gràfic 4: Habitatge estable
habitatge_counts = df['habitatge_estable'].value_counts()
axes[1, 1].pie(habitatge_counts.values, labels=habitatge_counts.index, autopct='%1.1f%%',
               colors=['#2ecc71', '#e74c3c'], startangle=90)
axes[1, 1].set_title('Habitatge Estable')

plt.tight_layout()
plt.savefig('data/drets_acces.png', dpi=300, bbox_inches='tight')
plt.show()

print('Gràfics de drets i accés generats correctament')

## 6. Anàlisi de Violència i Suport Social

In [None]:
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# Gràfic 1: Violència experimentada
violencia_counts = df['violencia_experimentada'].value_counts()
axes[0].pie(violencia_counts.values, labels=violencia_counts.index, autopct='%1.1f%%',
            colors=['#e74c3c', '#2ecc71', '#95a5a6'], startangle=90)
axes[0].set_title('Violència Experimentada')

# Gràfic 2: Distribució del suport social
axes[1].hist(df['suport_social'], bins=10, color='steelblue', edgecolor='black')
axes[1].set_xlabel('Nivell de suport social (1-10)')
axes[1].set_ylabel('Freqüència')
axes[1].set_title('Distribució del Suport Social')
axes[1].axvline(df['suport_social'].mean(), color='red', linestyle='--', label=f'Mitjana: {df["suport_social"].mean():.2f}')
axes[1].legend()
axes[1].grid(axis='y', alpha=0.3)

plt.tight_layout()
plt.savefig('data/violencia_suport.png', dpi=300, bbox_inches='tight')
plt.show()

print('Gràfics de violència i suport social generats correctament')

## 7. Anàlisi de Correlacions

In [None]:
# Crear variables numèriques per a l'anàlisi de correlació
df_numeric = df.copy()

# Convertir variables categòriques a numèriques
df_numeric['discriminacio_laboral_num'] = df_numeric['discriminacio_laboral'].map({'Sí': 1, 'No': 0, 'Prefereixes no dir': 0.5})
df_numeric['violencia_num'] = df_numeric['violencia_experimentada'].map({'Sí': 1, 'No': 0, 'Prefereixes no dir': 0.5})
df_numeric['habitatge_num'] = df_numeric['habitatge_estable'].map({'Sí': 1, 'No': 0})
df_numeric['acces_sanitat_num'] = df_numeric['acces_sanitat'].map({'Fàcil': 3, 'Difícil': 2, 'Molt difícil': 1, 'Impossible': 0})

# Seleccionar columnes per a correlació
cols_correlacio = ['edat', 'anys_residencia', 'suport_social', 'discriminacio_laboral_num', 
                   'violencia_num', 'habitatge_num', 'acces_sanitat_num']

correlation_matrix = df_numeric[cols_correlacio].corr()

# Visualitzar matriu de correlació
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', center=0, 
            square=True, linewidths=1, cbar_kws={"shrink": 0.8})
plt.title('Matriu de Correlació entre Variables', fontsize=14, fontweight='bold')
plt.tight_layout()
plt.savefig('data/correlacions.png', dpi=300, bbox_inches='tight')
plt.show()

print('Matriu de correlació generada correctament')

## 8. Anàlisi Creuada: Situació Legal i Altres Variables

In [None]:
# Analitzar com la situació legal afecta altres aspectes
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# Gràfic 1: Situació legal vs Discriminació laboral
pd.crosstab(df['situacio_legal'], df['discriminacio_laboral'], normalize='index').plot(
    kind='bar', ax=axes[0, 0], color=['#e74c3c', '#2ecc71', '#95a5a6'])
axes[0, 0].set_title('Situació Legal vs Discriminació Laboral')
axes[0, 0].set_xlabel('Situació Legal')
axes[0, 0].set_ylabel('Proporció')
axes[0, 0].legend(title='Discriminació Laboral')
axes[0, 0].tick_params(axis='x', rotation=45)

# Gràfic 2: Situació legal vs Accés a sanitat
pd.crosstab(df['situacio_legal'], df['acces_sanitat'], normalize='index').plot(
    kind='bar', ax=axes[0, 1], stacked=True)
axes[0, 1].set_title('Situació Legal vs Accés a Sanitat')
axes[0, 1].set_xlabel('Situació Legal')
axes[0, 1].set_ylabel('Proporció')
axes[0, 1].legend(title='Accés a Sanitat', bbox_to_anchor=(1.05, 1))
axes[0, 1].tick_params(axis='x', rotation=45)

# Gràfic 3: Situació legal vs Suport social (boxplot)
df.boxplot(column='suport_social', by='situacio_legal', ax=axes[1, 0])
axes[1, 0].set_title('Situació Legal vs Suport Social')
axes[1, 0].set_xlabel('Situació Legal')
axes[1, 0].set_ylabel('Nivell de Suport Social (1-10)')
axes[1, 0].tick_params(axis='x', rotation=45)
plt.suptitle('')  # Eliminar títol per defecte de boxplot

# Gràfic 4: Situació legal vs Habitatge estable
pd.crosstab(df['situacio_legal'], df['habitatge_estable'], normalize='index').plot(
    kind='bar', ax=axes[1, 1], color=['#2ecc71', '#e74c3c'])
axes[1, 1].set_title('Situació Legal vs Habitatge Estable')
axes[1, 1].set_xlabel('Situació Legal')
axes[1, 1].set_ylabel('Proporció')
axes[1, 1].legend(title='Habitatge Estable')
axes[1, 1].tick_params(axis='x', rotation=45)

plt.tight_layout()
plt.savefig('data/situacio_legal_analisi.png', dpi=300, bbox_inches='tight')
plt.show()

print('Anàlisi creuada generada correctament')

## 9. Resum Estadístic i Conclusions

In [None]:
print('=' * 80)
print('RESUM ESTADÍSTIC: DRETS DE LES PERSONES MIGRADES LGTBIQ+')
print('=' * 80)
print()

print('1. DADES DEMOGRÀFIQUES')
print(f'   - Total de participants: {len(df)}')
print(f'   - Edat mitjana: {df["edat"].mean():.1f} anys')
print(f'   - Anys mitjans de residència: {df["anys_residencia"].mean():.1f} anys')
print()

print('2. SITUACIÓ LEGAL')
for situacio, count in df['situacio_legal'].value_counts().items():
    pct = (count / len(df)) * 100
    print(f'   - {situacio}: {count} ({pct:.1f}%)')
print()

print('3. DISCRIMINACIÓ I VIOLÈNCIA')
discrim_si = (df['discriminacio_laboral'] == 'Sí').sum()
violencia_si = (df['violencia_experimentada'] == 'Sí').sum()
print(f'   - Persones amb discriminació laboral: {discrim_si} ({(discrim_si/len(df)*100):.1f}%)')
print(f'   - Persones amb violència experimentada: {violencia_si} ({(violencia_si/len(df)*100):.1f}%)')
print()

print('4. ACCÉS A SERVEIS')
sanitat_facil = (df['acces_sanitat'] == 'Fàcil').sum()
habitatge_si = (df['habitatge_estable'] == 'Sí').sum()
print(f'   - Accés fàcil a sanitat: {sanitat_facil} ({(sanitat_facil/len(df)*100):.1f}%)')
print(f'   - Habitatge estable: {habitatge_si} ({(habitatge_si/len(df)*100):.1f}%)')
print()

print('5. SUPORT SOCIAL')
print(f'   - Mitjana de suport social: {df["suport_social"].mean():.2f}/10')
print(f'   - Desviació estàndard: {df["suport_social"].std():.2f}')
print()

print('6. PRINCIPALS TROBALLES')
print('   - Les persones migrades LGTBIQ+ enfronten múltiples barreres')
print('   - La situació legal té un impacte significatiu en l\'accés a drets')
print('   - Hi ha una necessitat clara de suport integral i polítiques inclusives')
print('   - La discriminació laboral i la violència són problemàtiques prevalents')
print('=' * 80)

## 10. Exportar Resultats

In [None]:
# Guardar el dataset processat
df.to_csv('data/dades_processades.csv', index=False, encoding='utf-8')
print('Dataset processat guardat a: data/dades_processades.csv')

# Crear un resum estadístic
resum = {
    'Total registres': len(df),
    'Edat mitjana': df['edat'].mean(),
    'Anys residència mitjana': df['anys_residencia'].mean(),
    'Suport social mitjà': df['suport_social'].mean(),
    'Percentatge discriminació laboral': (df['discriminacio_laboral'] == 'Sí').sum() / len(df) * 100,
    'Percentatge violència': (df['violencia_experimentada'] == 'Sí').sum() / len(df) * 100,
    'Percentatge habitatge estable': (df['habitatge_estable'] == 'Sí').sum() / len(df) * 100
}

resum_df = pd.DataFrame([resum])
resum_df.to_csv('data/resum_estadistic.csv', index=False, encoding='utf-8')
print('Resum estadístic guardat a: data/resum_estadistic.csv')

print('\nAnàlisi completada!')