In [28]:
import pandas as pd
import plotly.express as px
import scipy.stats as stats

df = pd.read_csv("eye_cancer_filtrado.csv")


In [29]:
# Gráfica de barras apiladas: proporción de marcadores genéticos por tipo de cáncer
fig_prop = px.bar(
    df_prop_melt,
    x="Tipo de Cáncer",
    y="Proporción",
    color="Marcadores genéticos",
    barmode="stack",
    text_auto=True,
    title="Proporción de marcadores genéticos por tipo de cáncer"
)
fig_prop.show()

# Gráfica de barras agrupadas: conteo de marcadores genéticos por tipo de cáncer
df_genetico_counts = df.groupby(["Tipo de Cáncer", "Marcadores genéticos"]).size().reset_index(name="count")
fig_geneticos = px.bar(
    df_genetico_counts,
    x="Tipo de Cáncer",
    y="count",
    color="Marcadores genéticos",
    barmode="group",
    text_auto=True,
    title="Distribución de tipos de cáncer según marcadores genéticos"
)
fig_geneticos.show()

# Análisis estadístico: prueba de chi-cuadrado de independencia
tabla_cancer_genetico = pd.crosstab(df["Tipo de Cáncer"], df["Marcadores genéticos"])
chi2_gen, p_gen, dof_gen, expected_gen = stats.chi2_contingency(tabla_cancer_genetico)

# Conclusión
if p_gen < 0.05:
    conclusion_gen = "Se encontró una asociación estadísticamente significativa entre los marcadores genéticos y el tipo de cáncer diagnosticado (p < 0.05)."
else:
    conclusion_gen = "No se encontró una asociación estadísticamente significativa entre los marcadores genéticos y el tipo de cáncer diagnosticado (p ≥ 0.05)."

print(f"Chi2: {chi2_gen:.4f}, p-valor: {p_gen:.4f}, grados de libertad: {dof_gen}")
print("Conclusión:", conclusion_gen)

Chi2: 0.5144, p-valor: 0.7732, grados de libertad: 2
Conclusión: No se encontró una asociación estadísticamente significativa entre los marcadores genéticos y el tipo de cáncer diagnosticado (p ≥ 0.05).


In [30]:
import streamlit as st

st.title("Análisis de Marcadores Genéticos y Tipos de Cáncer")

st.subheader("Proporción de marcadores genéticos por tipo de cáncer")
st.plotly_chart(fig_prop, use_container_width=True)

st.subheader("Distribución de tipos de cáncer según marcadores genéticos")
st.plotly_chart(fig_geneticos, use_container_width=True)

st.subheader("Prueba de Chi-cuadrado de independencia")
st.write(f"Chi2: {chi2_gen:.4f}, p-valor: {p_gen:.4f}, grados de libertad: {dof_gen}")
st.info(conclusion_gen)



DeltaGenerator()

In [31]:
import plotly.express as px
import scipy.stats as stats

# Asegurarse de que la columna de fecha es datetime
df['Fecha de diagnóstico'] = pd.to_datetime(df['Fecha de diagnóstico'])

# Cantidad de pacientes diagnosticados por año
df['Año de diagnóstico'] = df['Fecha de diagnóstico'].dt.year
diagnosticos_por_año = df['Año de diagnóstico'].value_counts().sort_index()
df_diagnosticos = diagnosticos_por_año.reset_index()
df_diagnosticos.columns = ['Año de diagnóstico', 'Cantidad']

# Gráfica de barras con plotly
fig_diag = px.bar(
    df_diagnosticos,
    x='Año de diagnóstico',
    y='Cantidad',
    text_auto=True,
    title='Cantidad de pacientes diagnosticados por año'
)
fig_diag.show()

# Análisis estadístico: ¿la cantidad de diagnósticos varía significativamente entre años?
# Prueba de chi-cuadrado sobre la frecuencia observada vs. uniforme
observed = df_diagnosticos['Cantidad'].values
expected = [observed.sum() / len(observed)] * len(observed)
chi2_diag, p_diag = stats.chisquare(f_obs=observed, f_exp=expected)

# Conclusión
if p_diag < 0.05:
    conclusion_diag = "Existe una diferencia estadísticamente significativa en la cantidad de pacientes diagnosticados entre los años (p < 0.05)."
else:
    conclusion_diag = "No se observa una diferencia estadísticamente significativa en la cantidad de pacientes diagnosticados entre los años (p ≥ 0.05)."

print(f"Chi2: {chi2_diag:.4f}, p-valor: {p_diag:.4f}")
print("Conclusión:", conclusion_diag)

Chi2: 2.0176, p-valor: 0.8467
Conclusión: No se observa una diferencia estadísticamente significativa en la cantidad de pacientes diagnosticados entre los años (p ≥ 0.05).


In [None]:
import streamlit as st

st.subheader("Cantidad de pacientes diagnosticados por año")
st.plotly_chart(fig_diag, use_container_width=True)

st.subheader("Prueba de Chi-cuadrado de diagnósticos por año")
st.write(f"Chi2: {chi2_diag:.4f}, p-valor: {p_diag:.4f}")
st.info(conclusion_diag)