In [None]:
import streamlit as st
import pandas as pd
from PIL import Image
import plotly.express as px

# Leer el archivo CSV
df = pd.read_csv('C:/Users/ccast/Downloads/employee_data.csv')

#Filtrmos solamente por las columnas necesarios
df_filtrada = df[['name_employee', 'birth_date', 'age', 'gender', 'marital_status',
                       'hiring_date', 'position', 'salary', 'performance_score',
                       'last_performance_date', 'average_work_hours',
                       'satisfaction_level', 'absences']]

# Título de la aplicación
st.title("Análisis del desempeño de los colaboradores de Socialize your Knowledge")

#Breve descripción de la aplicación web
st.markdown("Esta aplicación ayuda identificar tus fortalezas y áreas de oportunidad y así lograr mejorar tu rendimiento con el fin de obtener una mayor calidad en los servicios que brindamos.")


# Despliegue del logotipo de la empresa
# Cargar la imagen
imagen = Image.open('C:/Users/ccast/Downloads/MINC.jpg')
# Mostrar la imagen en Streamlit
st.image(imagen, caption='Logotipo de Socialize your Knowledge')

# Control de selección del género del empleado
genero = st.selectbox("Selecciona el género del empleado", df["gender"].unique())
st.write(f"Selected Option: {genero!r}")

# Control de selección del rango del puntaje de desempeño
performance_score_slider = st.slider(
    "Seleccione el Perfromance Score",
    min_value=float(df['performance_score'].min()),
    max_value=float(df['performance_score'].max()),
    step=1.0
)

subset_performance = df[(df['performance_score'] <= performance_score_slider)]
st.write(f"Cantidad de empleados con este Permormance Score {performance_score_slider}: {subset_performance .shape[0]}")


# Control de selección del estado civil del empleado
estado_civil = st.radio("Selecciona el estado civil del empleado", df["marital_status"].unique())
st.write(f"Selected Option: {estado_civil}")

# Gráfico de distribución de puntajes de desempeño

# Agrupar por score y contar los empleados
df_conteo = df.groupby('performance_score')['name_employee'].count().reset_index()
df_conteo.columns = ['performance_score', 'cantidad_empleados']
# Crear el gráfico de distribución
st.subheader("Distribución de los puntajes de desempeño")
fig = px.pie(df_conteo, values='cantidad_empleados', names='performance_score')
fig.show()
st.plotly_chart(fig, use_container_width=True)

# Gráfico del promedio de horas trabajadas por género

# Agrupar por score y contar los empleados
df_promedio = df.groupby("gender")["average_work_hours"].mean().reset_index()
df_promedio.columns = ['gender', 'average_work_hours']
# Crear el gráfico de barras
st.subheader("Promedio de horas trabajadas por género")
fig = px.bar(df_promedio, x='gender', y='average_work_hours')
fig.show()
st.plotly_chart(fig, use_container_width=True)


# Gráfico de edad de los empleados versus salario

# Crear el gráfico de dispersión
st.subheader("Edad de los empleados con respecto al salario de los mismos")
fig = px.scatter(df, x=df["age"], y="salary",color='salary')
fig.show()
st.plotly_chart(fig, use_container_width=True)


# Gráfico de relación entre el promedio de horas trabajadas y el puntaje de desempeño

st.subheader("Relación del promedio de horas trabajadas versus el puntaje de desempeño")
# Agrupar por score y promediar las horas trabajadas
df_score = df.groupby("performance_score")["average_work_hours"].mean().reset_index()
df_score.columns = ['performance_score', 'average_work_hours']
# Crear el gráfico de dispersión
fig = px.scatter(df_score, x="performance_score", y="average_work_hours")
fig.show()
st.plotly_chart(fig, use_container_width=True)

# Conclusión sobre el análisis mostrado en la aplicación web
st.subheader("Conclusión sobre el análisis")
st.markdown("El 78% de los empleados cuenta con un buen performance de califiación 3, sin embargo, un 10% de los empleados se califican con 1 y 2; estos empleados poseen grandes oportunidades de mejora")
st.markdown("Por otro lado, no se ve diferencia significativa entre las horas trabajadas segpun el género del empleado")
st.markdown("Asimismo, no se ve diferencia significativa o patrones que indiquen relación entre la edad y el salario del empleado")
st.markdown("Por último, si podemos identificar que las personas con un mayor score del performance tienen en promedio mayor cantidad de horas trabajadas")