Samsung Innovation Campus (SIC 2024)
Nombre del Proyecto: Migración de la población a la capital debido a la Desigualdad Económica en Panamá
Grupo: Data Wizards Gang
Conformado por: 
1. Justin Williams
2. Carlos Rodríguez Chong
3. José Luis Camarena
4. Oscar Pérez
5. Alejandro Cardona

Problema a resolver:
Panamá tiene una alta migración a la capital debido a la desigualdad económica que se presenta a lo largo de las pronvincias debido a diferentes factores como el PIB por provincia, desempleo, el nivel de educación y la actividad económica en las provincias. En este miniproyecto nos enfocaremos al estudio de estas variables para ver realmente el impacto que tienen y como se puede idear una solución a este problema. Los datos fueron obtenidos del Instituto Nacional de Estadística y Censo de los años 2015 al 2022 para hacer el estudio.


In [None]:
#Promedio del valor económico por Provincia
import pandas as pd
import plotly.express as px

# Cargar el archivo Excel en un DataFrame de pandas
df = pd.read_excel('Datos/valor_economico_por_provincia_2015_2022.xlsx')

# Obtener las columnas numéricas para calcular el promedio
columnas_numericas = df.select_dtypes(include=['float64', 'int64']).columns

# Calcular el promedio por provincia
df_mean = df[columnas_numericas].mean(axis=1)
df_mean = pd.DataFrame(df_mean, columns=['Promedio'])

# Agregar la columna de provincias
df_mean['Provincia'] = df['region']

# Graficar los datos utilizando plotly.express
fig = px.bar(df_mean, x='Provincia', y='Promedio', title='Promedio del valor económico por provincia')
fig.update_layout(xaxis_title='Provincia', yaxis_title='Promedio Valor Económico')
fig.show()

In [None]:
import pandas as pd
import plotly.express as px

# Cargar los datos desde el archivo Excel
archivo_excel = 'Datos\estudiantes.xlsx'
datos_por_provincia = pd.read_excel(archivo_excel, sheet_name=None)

# Inicializar un diccionario para almacenar los totales de estudiantes reprobados por provincia
totales_por_provincia = {}

# Iterar sobre cada hoja del Excel (cada año)
for año, datos in datos_por_provincia.items():
    # Calcular el total de estudiantes reprobados por provincia para este año
    for index, fila in datos.iterrows():
        provincia = fila['region']
        reprobados = fila['total_reprobados']
        if provincia in totales_por_provincia:
            totales_por_provincia[provincia] += reprobados
        else:
            totales_por_provincia[provincia] = reprobados

# Convertir el diccionario a un DataFrame
totales_df = pd.DataFrame(list(totales_por_provincia.items()), columns=['Provincia', 'Total Reprobados'])

# Graficar el total de estudiantes reprobados por provincia
fig = px.bar(totales_df, x='Provincia', y='Total Reprobados', title='Total de Estudiantes Reprobados por Provincia')
fig.show()

In [None]:
import pandas as pd
import plotly.express as px

# Leer el archivo Excel
archivo_excel = 'Datos/trabajadores_por_educacion_por_provincia_2015_2022.xlsx'
datos = pd.read_excel(archivo_excel, sheet_name=None)

# Inicializar diccionario para almacenar el total de trabajadores y trabajadores universitarios por año
total_trabajadores_por_año = {}
trabajadores_universitarios_por_año = {}

# Recorrer cada hoja del archivo Excel
for año, df in datos.items():
    # Sumar el total de trabajadores y trabajadores universitarios para cada año
    total_trabajadores_por_año[año] = df['total_trabajadores'].sum()
    trabajadores_universitarios_por_año[año] = df['trabajadores_universitarios'].sum()

# Convertir diccionarios a DataFrames
df_total_trabajadores = pd.DataFrame(total_trabajadores_por_año.items(), columns=['Año', 'Total_Trabajadores'])
df_trabajadores_universitarios = pd.DataFrame(trabajadores_universitarios_por_año.items(), columns=['Año', 'Trabajadores_Universitarios'])

# Unir los DataFrames
df_porcentaje = pd.merge(df_total_trabajadores, df_trabajadores_universitarios, on='Año')

# Calcular el porcentaje de trabajadores universitarios respecto al total de trabajadores
df_porcentaje['Porcentaje_Trabajadores_Universitarios'] = (df_porcentaje['Trabajadores_Universitarios'] / df_porcentaje['Total_Trabajadores']) * 100

# Graficar con plotly.express
fig = px.line(df_porcentaje, x='Año', y='Porcentaje_Trabajadores_Universitarios', title='Porcentaje de Trabajadores Universitarios vs Total de Trabajadores por Año')
fig.update_xaxes(title='Año')
fig.update_yaxes(title='Porcentaje de Trabajadores Universitarios')
fig.show()

Solución:
En base los datos analizados por llegar a la conclusión que no solo la preparación de los profesionales influye sino también las actividades económicas que poseen las provincias. Debido a esto una solución óptima sería trasladar empresas o abrir nuevas en lugares donde la población es alta y se puede explotar el capital humano de forma positiva para igualar el salario a nivel nacional brindando las mismas oportunidades a nivel nacional.

Propuesta de Valor:
Sería de gran utilidad poder analizar otros aspectos que no pudimos debido a la data conseguida en el INEC con respecto étnias y sexo que también nos ayudarían a identificar de mejor manera la desigualdad que puede existir entre los salarios. Continuar con el estudio serviría para seguir mitigando la desigualdad económica y evitar la migración a la capital y provincias con mayor desarrollo económico en el país.