In [5]:
%pip install streamlit



In [None]:
# aplicativo_streamlit.py
import streamlit as st
import pandas as pd
import joblib
import plotly.graph_objects as go
import os

# ----------------------------------------------------
# 1. Configura√ß√µes e Carregamento de Dados/Modelo
# ----------------------------------------------------
st.set_page_config(page_title="People Analytics", layout="wide", initial_sidebar_state="expanded")

# Carregar modelo (Ajuste para rodar no Streamlit Cloud)
@st.cache_resource
def load_model():
    try:
        # Pega o caminho do diret√≥rio do arquivo atual
        base_dir = os.path.dirname(os.path.abspath(__file__))
        # Constr√≥i o caminho completo para o arquivo do modelo
        model_path = os.path.join(base_dir, "modelo_rf.pkl")
        
        return joblib.load(model_path)
    except FileNotFoundError:
        st.error("Erro: O arquivo 'modelo_rf.pkl' n√£o foi encontrado. Certifique-se de que o modelo est√° no mesmo diret√≥rio do aplicativo.")
        st.stop()


# Carregar base de dados (para as listas de op√ß√µes)
@st.cache_data
def load_data():
    try:
        # Pega o caminho do diret√≥rio do arquivo atual
        base_dir = os.path.dirname(os.path.abspath(__file__))
        # Constr√≥i o caminho completo para o arquivo da base
        csv_path = os.path.join(base_dir, "rh_data.csv")
        return pd.read_csv(csv_path)
        
    except FileNotFoundError:
        st.error("Erro: O arquivo 'rh_data.csv' n√£o foi encontrado. Certifique-se de que a base de dados est√° no mesmo diret√≥rio.")
        st.stop()

rf_model = load_model()
df = load_data()

# ----------------------------------------------------
# 2. Layout da Barra Lateral (Sidebar)
# ----------------------------------------------------
with st.sidebar:
    st.title("üí° Sobre este App")
    st.markdown("""
    Este aplicativo utiliza **Machine Learning** para prever a probabilidade de um colaborador solicitar desligamento. O modelo **Random Forest** foi treinado com dados hist√≥ricos para gerar previs√µes precisas e confi√°veis.
    
    Ele fornece **insights pr√°ticos e a√ß√µes de reten√ß√£o personalizadas**, auxiliando l√≠deres e equipes de RH na tomada de decis√£o estrat√©gica e no fortalecimento do engajamento.
    """)
    st.markdown("---")
    st.header("üìö Entenda a Tecnologia")
    st.markdown("""
    - **Machine Learning**: Permite que computadores identifiquem padr√µes a partir de dados, sem programa√ß√£o expl√≠cita.
    - **Random Forest**: Algoritmo que combina m√∫ltiplas √°rvores de decis√£o para criar um modelo mais robusto e preciso.
    

    **Por que a reten√ß√£o √© importante?**

    Reter talentos √© crucial para o crescimento e a sustentabilidade. A alta rotatividade gera custos significativos, impacta a moral da equipe e causa perda de conhecimento. Investir em reten√ß√£o √© entender e valorizar o capital humano da empresa.
    """)
    st.markdown("---")
    st.info("Desenvolvido por Vanessa Santana do Amaral\n\n"

            "Github: https://github.com/vanessasantanadoamaral\n\n"

            "Linkedin: https://www.linkedin.com/in/vanessasantanadoamaral/)")

# ----------------------------------------------------
# 3. Se√ß√£o Principal: Inputs do Usu√°rio
# ----------------------------------------------------
st.title("People Analytics - Previs√£o de Churn")
st.subheader("üë§ An√°lise de Risco Individual")
st.markdown("Preencha os dados do colaborador para prever a probabilidade de desligamento.")

with st.form("input_funcionario"):
    st.markdown("---")
    
    # Organiza√ß√£o dos inputs em colunas
    col1, col2, col3 = st.columns(3)
    
    with col1:
        st.header("Informa√ß√µes Pessoais")
        Age = st.number_input("Idade", min_value=18, max_value=70, value=30)
        
        # Ajuste: Tradu√ß√£o e ordena√ß√£o dos tipos de viagem
        travel_map = {"Travel_Frequently": "Viaja Frequentemente", "Travel_Rarely": "Viaja Raramente", "Non-Travel": "N√£o Viaja"}
        BusinessTravel = st.selectbox(
            "Viagens a trabalho", 
            options=sorted(list(travel_map.keys())),
            format_func=lambda x: travel_map[x]
        )
        
        DistanceFromHome = st.number_input("Dist√¢ncia de casa (km)", min_value=0, max_value=100)
        
        
        Education = st.selectbox(
            "N√≠vel de Educa√ß√£o", 
            df["Education"].unique(),
            help="1: Abaixo da faculdade, 2: Universidade, 3: Bacharelado, 4: Mestrado, 5: Doutorado"
        )
    
    with col2:
        st.header("Informa√ß√µes Profissionais")
        
        # Ajuste: Tradu√ß√£o e ordena√ß√£o dos departamentos
        department_map = {"Human Resources": "Recursos Humanos", "Research & Development": "Pesquisa & Desenvolvimento", "Sales": "Vendas"}
        Department = st.selectbox(
            "Departamento", 
            options=sorted(list(department_map.keys())),
            format_func=lambda x: department_map[x]
        )
        
        # N√≠vel do cargo e expander para a descri√ß√£o
        JobLevel = st.selectbox("N√≠vel do cargo", df["JobLevel"].unique(),
        help="1: Junior, 2: Pleno, 3: S√™nior, 4: Coordenador, 5: Gerente / Diretor")
        
        # Ajuste: Tradu√ß√£o e ordena√ß√£o dos cargos
        jobrole_map = {
            "Healthcare Representative": "Representante de Sa√∫de",
            "Human Resources": "Recursos Humanos",
            "Laboratory Technician": "T√©cnico de Laborat√≥rio",
            "Manager": "Gerente",
            "Manufacturing Director": "Diretor de Manufatura",
            "Research Director": "Diretor de Pesquisa",
            "Research Scientist": "Cientista de Pesquisa",
            "Sales Executive": "Executivo de Vendas",
            "Sales Representative": "Representante de Vendas"
        }
        JobRole = st.selectbox(
            "Cargo",
            options=sorted(list(jobrole_map.keys())),
            format_func=lambda x: jobrole_map[x]
        )
        
        MonthlyIncome = st.number_input("Sal√°rio Mensal", min_value=1000, value=5000)
        PercentSalaryHike = st.number_input("Percentual de aumento salarial (%)", min_value=0)
    
    with col3:
        st.header("Hist√≥rico na Empresa")
        YearsAtCompany = st.number_input("Tempo na empresa (anos)", min_value=0)
        YearsSinceLastPromotion = st.number_input("Anos desde a √∫ltima promo√ß√£o", min_value=0)
        YearsWithCurrManager = st.number_input("Anos com o gestor atual", min_value=0)
        TotalWorkingYears = st.number_input("Total de anos de experi√™ncia", min_value=0)
        NumCompaniesWorked = st.number_input("N√∫mero de empresas anteriores", min_value=0)
        TrainingTimesLastYear = st.number_input("Treinamentos no √∫ltimo ano", min_value=0)
        
        # Ajuste: Descri√ß√£o do n√≠vel de a√ß√µes
        StockOptionLevel = st.number_input(
            "N√≠vel de op√ß√µes de a√ß√µes", 
            min_value=0, 
            help="Quanto maior o n√∫mero, mais op√ß√µes de a√ß√µes o funcion√°rio possui."
        )
        
    st.markdown("---")
    submitted = st.form_submit_button("üìà Prever Desligamento", use_container_width=True)

# ----------------------------------------------------
# 4. L√≥gica de Previs√£o e Exibi√ß√£o de Resultados
# ----------------------------------------------------
if submitted:
    with st.spinner("Analisando os dados..."):
        # Mapeamento para garantir que os inputs correspondem aos dados de treinamento do modelo
        input_dict = {
            "Age": [Age], "BusinessTravel": [BusinessTravel], "Department": [Department],
            "DistanceFromHome": [DistanceFromHome], "Education": [Education], "JobLevel": [JobLevel],
            "JobRole": [JobRole], "MonthlyIncome": [MonthlyIncome], "NumCompaniesWorked": [NumCompaniesWorked],
            "PercentSalaryHike": [PercentSalaryHike], "StockOptionLevel": [StockOptionLevel],
            "TotalWorkingYears": [TotalWorkingYears], "TrainingTimesLastYear": [TrainingTimesLastYear],
            "YearsAtCompany": [YearsAtCompany], "YearsSinceLastPromotion": [YearsSinceLastPromotion],
            "YearsWithCurrManager": [YearsWithCurrManager]
        }
        input_df = pd.DataFrame(input_dict)

        # One-hot encoding e alinhamento de colunas
        cat_cols = ["BusinessTravel", "Department", "JobRole"]
        input_df_encoded = pd.get_dummies(input_df, columns=cat_cols)

        model_features = rf_model.feature_names_in_ if hasattr(rf_model, 'feature_names_in_') else None
        if model_features is None:
            st.error("Erro no modelo: 'feature_names_in_' n√£o encontrado.")
            st.stop()
            
        missing_cols = set(model_features) - set(input_df_encoded.columns)
        for c in missing_cols:
            input_df_encoded[c] = 0
        input_df_encoded = input_df_encoded[model_features]

        # Previs√£o
        prob = rf_model.predict_proba(input_df_encoded)[0][1]
        prob_percent = round(prob * 100, 2)

    st.markdown("---")
    st.subheader("üìä Resultado da An√°lise de Churn")
    
    # Defini√ß√£o dos n√≠veis de risco
    RISCO_BAIXO_MAX = 30
    RISCO_MEDIO_MAX = 60

    if prob_percent <= RISCO_BAIXO_MAX:
        status_text = "‚úÖ **BAIXO RISCO** de desligamento."
        status_color = "#4CAF50" # Verde
        recom_title = "A√ß√µes para manter o engajamento e a satisfa√ß√£o"
        recom_list = """
        - **Monitoramento cont√≠nuo:** Realize check-ins peri√≥dicos para garantir que o colaborador continue satisfeito e engajado.
        - **Oportunidades de crescimento:** Continue oferecendo desafios e oportunidades de aprendizado para manter o alto desempenho.
        - **Reconhecimento:** Reconhe√ßa e celebre as conquistas para refor√ßar o sentimento de valoriza√ß√£o.
        - **Qualidade de vida:** Estimule o equil√≠brio entre vida pessoal e profissional.
        """
    elif prob_percent <= RISCO_MEDIO_MAX:
        status_text = "‚ö†Ô∏è **M√âDIO RISCO** de desligamento. Aten√ß√£o!"
        status_color = "#FFC107" # Laranja
        recom_title = "A√ß√µes sugeridas para mitigar o risco"
        recom_list = """
        - **Di√°logo aberto:** Agende uma conversa com o colaborador para entender suas expectativas e poss√≠veis insatisfa√ß√µes.
        - **Plano de desenvolvimento:** Crie um plano de carreira individualizado (PDI), mostrando um caminho claro de crescimento na empresa.
        - **An√°lise de remunera√ß√£o:** Revise a competitividade do sal√°rio e dos benef√≠cios.
        - **Mentoria:** Conecte o colaborador com um mentor para oferecer orienta√ß√£o e apoio.
        - **Feedback construtivo:** Promova feedbacks mais frequentes e orientados para o desenvolvimento.
        """
    else:
        status_text = "üö® **ALTO RISCO** de desligamento. Aja rapidamente!"
        status_color = "#E53935" # Vermelho
        recom_title = "A√ß√µes de reten√ß√£o cr√≠ticas"
        recom_list = """
        - **Desenvolvimento e Carreira:** Crie um plano de desenvolvimento individual com metas claras e urgentes. Ofere√ßa mentoria ou coaching.
        - **Reconhecimento e Valoriza√ß√£o:** Destaque suas conquistas e revise urgentemente o plano de remunera√ß√£o e benef√≠cios.
        - **Engajamento e Clima:** Realize um check-in profundo para ouvir as necessidades e, se poss√≠vel, flexibilize a jornada de trabalho.
        - **Lideran√ßa e Gest√£o:** Capacite o gestor para pr√°ticas de lideran√ßa mais emp√°ticas e garanta que a carga de trabalho seja justa.
        """

    # Exibi√ß√£o do gr√°fico e m√©tricas
    col_chart, col_status = st.columns([0.6, 0.4])

    with col_chart:
        fig = go.Figure(data=[go.Pie(
            labels=["Probabilidade de Churn", "Probabilidade de Perman√™ncia"],
            values=[prob_percent, 100 - prob_percent],
            hole=0.7,
            marker=dict(colors=[status_color, "#d9d9d9"]),
            textinfo="label+percent"
        )])
        fig.update_layout(
            title_text="Probabilidade de Desligamento",
            title_x=0.5,
            showlegend=False,
            height=300,
            margin=dict(t=50, b=0, l=0, r=0),
            font=dict(size=14)
        )
        st.plotly_chart(fig, use_container_width=True)

    with col_status:
        st.subheader("Resultado da An√°lise")
        st.markdown(f"#### {status_text}")
        st.markdown(f"**Probabilidade de Churn:** `{prob_percent}%`")
        st.markdown("---")
        st.info("O modelo fornece uma estimativa. Use-a como um ponto de partida para um di√°logo construtivo.")

    # Se√ß√£o de recomenda√ß√µes din√¢micas
    with st.container(border=True):
        st.subheader(f"üöÄ {recom_title}")
        st.markdown(recom_list)

2025-08-26 17:15:59.933 
  command:

    streamlit run /usr/local/lib/python3.12/dist-packages/colab_kernel_launcher.py [ARGUMENTS]
2025-08-26 17:15:59.955 Session state does not function when running a script without `streamlit run`


DeltaGenerator(_form_data=FormData(form_id='input_funcionario'))