In [None]:
import streamlit as st
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import altair as alt
from pathlib import Path

# Configuraci칩n de la p치gina
st.set_page_config(
    page_title="Mantenimiento Predictivo WAI4I 2020",
    layout="wide"
)

# Cargar datos
@st.cache_data
def load_data():
    # Construye la ruta al CSV desde el notebook
    notebook_path = Path().resolve()
    csv_path = notebook_path.parents[1] / "data" / "ai4i2020.csv"
    df = pd.read_csv(csv_path)
    return df

df = load_data()

# Columnas continuas y de fallos
numeric_cols = ["Air temperature [K]", "Process temperature [K]", "Rotational speed [rpm]", 
                "Torque [Nm]", "Tool wear [min]"]
fallos_cols = ["TWF","HDF","PWF","OSF","RNF"]

# Calcular conteo total de fallos
fallos_count = df[fallos_cols].sum()

# Sidebar para navegaci칩n
st.sidebar.title("Navegaci칩n")
opcion = st.sidebar.radio("Selecciona una secci칩n:", ["Exploraci칩n de datos", "Predicciones"])

# Informaci칩n de fallos
fault_info = pd.DataFrame({
    'Fault': ['Desgaste de herramienta ', 'Disipaci칩n de calor', 'Potencia fuera de rango', 
              'Sobreesfuerzo mec치nico', 'Falla Aleatoria'],
    'Abbrev.': ['TWF', 'HDF', 'PWF', 'OSF', 'RNF']
})
st.sidebar.subheader("Significado de Fallos")
st.sidebar.table(fault_info)

# Contenido principal
st.title("An치lisis y Predicci칩n de Fallos")
st.markdown("Este panel permite explorar los datos del dataset WAI4I 2020 y analizar la distribuci칩n de fallos en m치quinas industriales.")

# Exploraci칩n de datos
if opcion == "Exploraci칩n de datos":

    # Crear columnas para gr치ficos lado a lado
    col1, col2 = st.columns(2)

    # Pie chart de fallos con porcentajes
    with col1:
        st.subheader("Distribuci칩n de los tipos de fallos")
        counts = df[fallos_cols].sum()
        fallos_df = pd.DataFrame({
            "Tipo de fallo": counts.index,
            "Cantidad": counts.values,
            "Porcentaje": (counts.values / counts.sum() * 100).round(1)
        })
        fallos_df["label"] = fallos_df["Porcentaje"].astype(str) + "%"
        base = alt.Chart(fallos_df).encode(
            theta=alt.Theta(field="Cantidad", type="quantitative"),
            color=alt.Color(field="Tipo de fallo", type="nominal")
        )
        pie = base.mark_arc(innerRadius=0)
        text = base.mark_text(radius=100, size=14).encode(text="label")
        chart = (pie + text).properties(width=300, height=300)
        st.altair_chart(chart)

    # Gr치fico interactivo: fallos por tipo de m치quina
    with col2:
        st.subheader("Cantidad de fallos por tipo de m치quina y tipo de fallo")
        df["MachineType"] = df["Product ID"].str[0]
        fail_long = (
            df.groupby(["MachineType"])[fallos_cols]
            .sum()
            .reset_index()
            .melt(id_vars="MachineType", var_name="Tipo de fallo", value_name="Cantidad")
        )
        stacked_bar = (
            alt.Chart(fail_long)
            .mark_bar()
            .encode(
                x=alt.X("Tipo de fallo:N", title="Tipo de fallo"),
                y=alt.Y("sum(Cantidad):Q", title="Cantidad total"),
                color=alt.Color("MachineType:N", title="Tipo de m치quina"),
                tooltip=["Tipo de fallo:N", "MachineType:N", "Cantidad:Q"]
            )
            .properties(width=500, height=350)
        )
        st.altair_chart(stacked_bar, use_container_width=True)

    # Crear otra fila de gr치ficos
    col3, col4 = st.columns(2)

    # Gr치fico de l칤neas: fallos seg칰n variable
    with col3:
        st.subheader("Cantidad de fallos seg칰n variable seleccionada")
        selected_var = st.selectbox("Selecciona la variable X:", numeric_cols)
        selected_fail = st.selectbox("Selecciona el tipo de fallo:", fallos_cols)
        num_bins = st.slider("N칰mero de bins:", min_value=5, max_value=50, value=10)
        df_plot = df[[selected_var, selected_fail]].copy()
        df_plot["bin"] = pd.cut(df_plot[selected_var], bins=num_bins)
        fail_counts = df_plot.groupby("bin")[selected_fail].sum().reset_index()
        fail_counts["bin_str"] = fail_counts["bin"].astype(str)
        line_fail = alt.Chart(fail_counts).mark_line(point=True, color="salmon").encode(
            x=alt.X("bin_str:N", title=selected_var),
            y=alt.Y(f"{selected_fail}:Q", title=f"Cantidad de {selected_fail}"),
            tooltip=["bin_str", selected_fail]
        ).properties(width=500, height=300)
        st.altair_chart(line_fail)

    # Matriz de co-ocurrencia de fallos
    with col4:
        st.subheader("Matriz de co-ocurrencia de fallos")
        co_occur = df[fallos_cols].T.dot(df[fallos_cols])
        fig, ax = plt.subplots(figsize=(6,5))
        sns.heatmap(co_occur, annot=True, fmt="d", cmap="Blues", ax=ax)
        st.pyplot(fig)

#Predicciones
elif opcion == "Predicciones":
    st.header("游늳 Predicciones")
    st.write("Aqu칤 se implementar치 el modelo y su interfaz para hacer predicciones con nuevos datos.")


2025-12-04 17:58:35.934 No runtime found, using MemoryCacheStorageManager
2025-12-04 17:58:35.935 No runtime found, using MemoryCacheStorageManager
2025-12-04 17:58:35.993 Session state does not function when running a script without `streamlit run`
2025-12-04 17:58:36.125 Please replace `use_container_width` with `width`.

`use_container_width` will be removed after 2025-12-31.

For `use_container_width=True`, use `width='stretch'`. For `use_container_width=False`, use `width='content'` or specify an integer width.
  fail_counts = df_plot.groupby("bin")[selected_fail].sum().reset_index()
