# JUPYTER NOTEBOOK - ACTIVIDAD II: INFERENCIA ESTAD√çSTICA
# An√°lisis de 4 Sistemas Empresariales

# =============================================================================
# CELDA 1: IMPORTACI√ìN DE LIBRER√çAS
# =============================================================================

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

print("‚úÖ Librer√≠as importadas correctamente")
print("üìä Listo para an√°lisis de inferencia estad√≠stica")

# =============================================================================
# SISTEMA 1: CONTROL DE CADENA LOG√çSTICA DE DISTRIBUCI√ìN
# Distribuci√≥n: POISSON
# =============================================================================

"""
## üè¢ SISTEMA 1: CADENA LOG√çSTICA - LogiM√©xico S.A.

**CONTEXTO EMPRESARIAL:**
LogiM√©xico S.A., distribuidora farmac√©utica l√≠der en CDMX, implement√≥ un nuevo 
sistema automatizado de gesti√≥n de pedidos. Hist√≥ricamente manejaban 12 pedidos/hora.
Necesitan verificar si el nuevo sistema ha afectado esta tasa.

**PAR√ÅMETROS DEL AN√ÅLISIS:**
- Tasa hist√≥rica: 12 pedidos/hora
- Muestra: 60 horas de operaci√≥n
- Nivel de confianza: 95%
- Nueva tasa esperada: 14 pedidos/hora (mejora por automatizaci√≥n)
"""

# SIMULACI√ìN DE DATOS - SISTEMA LOG√çSTICO
lambda_param = 14  # PAR√ÅMETRO MODIFICADO: nueva tasa esperada
tama√±o_muestra_logistica = 60  # PAR√ÅMETRO MODIFICADO: m√°s horas de an√°lisis
np.random.seed(42)  # Para reproducibilidad

muestra_logistica = np.random.poisson(lambda_param, tama√±o_muestra_logistica)

print("üöõ SISTEMA 1: CADENA LOG√çSTICA")
print("="*50)
print(f"üì¶ Muestra de pedidos por hora (primeros 15): {muestra_logistica[:15]}")
print(f"üìä Media muestral: {np.mean(muestra_logistica):.2f} pedidos/hora")
print(f"üìà Desviaci√≥n est√°ndar: {np.std(muestra_logistica):.2f}")

# PARTE 1: INTERVALO DE CONFIANZA (usando c√≥digo original)
def intervalo_confianza_poisson(muestra, confianza=0.95):
    media_muestral = np.mean(muestra)
    n = len(muestra)
    error_estandar = np.sqrt(media_muestral / n)
    z = stats.norm.ppf((1 + confianza) / 2)
    margen_error = z * error_estandar
    return media_muestral - margen_error, media_muestral + margen_error

ic_logistica = intervalo_confianza_poisson(muestra_logistica)
print(f"\nüìä INTERVALO DE CONFIANZA (95%):")
print(f"   Rango: {ic_logistica[0]:.2f} - {ic_logistica[1]:.2f} pedidos/hora")

# PARTE 2: CONTRASTE DE HIP√ìTESIS (usando c√≥digo original)
def prueba_hipotesis_poisson(muestra, lambda_0, alpha=0.05):
    media_muestral = np.mean(muestra)
    n = len(muestra)
    z = (media_muestral - lambda_0) / np.sqrt(lambda_0 / n)
    p_valor = 2 * (1 - stats.norm.cdf(abs(z)))
    return p_valor < alpha, p_valor

# H0: Œª = 12 (la tasa no ha cambiado)
# H1: Œª ‚â† 12 (la tasa ha cambiado significativamente)
lambda_0_logistica = 12  # Tasa hist√≥rica
rechazo_logistica, p_valor_logistica = prueba_hipotesis_poisson(muestra_logistica, lambda_0_logistica)

print(f"\nüß™ CONTRASTE DE HIP√ìTESIS:")
print(f"   H0: Œª = {lambda_0_logistica} pedidos/hora (sin cambio)")
print(f"   H1: Œª ‚â† {lambda_0_logistica} pedidos/hora (hay cambio)")
print(f"   P-valor: {p_valor_logistica:.4f}")
print(f"   ¬øSe rechaza H0?: {'S√ç' if rechazo_logistica else 'NO'}")

# INTERPRETACI√ìN EMPRESARIAL
print(f"\nüíº DECISI√ìN EMPRESARIAL:")
if rechazo_logistica:
    print("   ‚úÖ El nuevo sistema S√ç cambi√≥ significativamente la tasa de pedidos")
    print("   üìà LogiM√©xico debe reajustar plantilla y capacidad operativa")
else:
    print("   ‚ö†Ô∏è No hay evidencia suficiente de cambio en la tasa")
    print("   üìä Pueden mantener la operaci√≥n actual")

# =============================================================================
# SISTEMA 2: CONTROL DE CENTRO DE PRODUCCI√ìN
# Distribuci√≥n: BINOMIAL
# =============================================================================

"""
## üè≠ SISTEMA 2: CENTRO DE PRODUCCI√ìN - Manufacturas Precisi√≥n S.A.

**CONTEXTO EMPRESARIAL:**
Manufacturas Precisi√≥n S.A. produce componentes de frenos automotrices en Aguascalientes.
Instalaron nueva maquinaria y necesitan verificar si la calidad cambi√≥.
Tasa hist√≥rica de defectos: 3%

**PAR√ÅMETROS DEL AN√ÅLISIS:**
- Tasa hist√≥rica de defectos: 3%
- Piezas por turno: 500
- Turnos analizados: 40
- Nueva tasa esperada: 2.5% (mejora esperada)
"""

# SIMULACI√ìN DE DATOS - SISTEMA PRODUCCI√ìN
n_piezas = 500  # Piezas por turno
p_defecto = 0.025  # PAR√ÅMETRO MODIFICADO: mejora esperada (2.5% vs 3% hist√≥rico)
turnos = 40
np.random.seed(123)

muestra_produccion = np.random.binomial(n_piezas, p_defecto, turnos)

print("\n\nüè≠ SISTEMA 2: CENTRO DE PRODUCCI√ìN")
print("="*50)
print(f"üîß Defectos por turno (primeros 15): {muestra_produccion[:15]}")
print(f"üìä Promedio de defectos por turno: {np.mean(muestra_produccion):.1f}")
print(f"üìà Proporci√≥n estimada de defectos: {np.mean(muestra_produccion)/n_piezas:.4f} ({np.mean(muestra_produccion)/n_piezas*100:.2f}%)")

# PARTE 1: INTERVALO DE CONFIANZA (usando c√≥digo original)
def intervalo_confianza_binomial(muestra, n, confianza=0.95):
    p_estimado = np.mean(muestra) / n
    z = stats.norm.ppf((1 + confianza) / 2)
    margen_error = z * np.sqrt((p_estimado * (1 - p_estimado)) / len(muestra))
    return (p_estimado - margen_error, p_estimado + margen_error)

ic_produccion = intervalo_confianza_binomial(muestra_produccion, n_piezas)
print(f"\nüìä INTERVALO DE CONFIANZA (95%):")
print(f"   Proporci√≥n de defectos: {ic_produccion[0]:.4f} - {ic_produccion[1]:.4f}")
print(f"   En porcentaje: {ic_produccion[0]*100:.2f}% - {ic_produccion[1]*100:.2f}%")

# PARTE 2: CONTRASTE DE HIP√ìTESIS (usando c√≥digo original)
def prueba_hipotesis_binomial(muestra, n, p_0, alpha=0.05):
    p_estimado = np.mean(muestra) / n
    se = np.sqrt(p_0 * (1 - p_0) / len(muestra))
    z = (p_estimado - p_0) / se
    p_valor = 2 * (1 - stats.norm.cdf(abs(z)))
    return p_valor < alpha, p_valor

# H0: p = 0.03 (la calidad no ha cambiado)
# H1: p ‚â† 0.03 (la calidad ha cambiado)
p_0_produccion = 0.03  # Tasa hist√≥rica de defectos
rechazo_produccion, p_valor_produccion = prueba_hipotesis_binomial(muestra_produccion, n_piezas, p_0_produccion)

print(f"\nüß™ CONTRASTE DE HIP√ìTESIS:")
print(f"   H0: p = {p_0_produccion} (3% defectos - sin cambio)")
print(f"   H1: p ‚â† {p_0_produccion} (hay cambio en calidad)")
print(f"   P-valor: {p_valor_produccion:.4f}")
print(f"   ¬øSe rechaza H0?: {'S√ç' if rechazo_produccion else 'NO'}")

# INTERPRETACI√ìN EMPRESARIAL
print(f"\nüíº DECISI√ìN EMPRESARIAL:")
if rechazo_produccion:
    if np.mean(muestra_produccion)/n_piezas < p_0_produccion:
        print("   ‚úÖ ¬°EXCELENTE! La nueva maquinaria MEJOR√ì la calidad")
        print("   üéØ Pueden promocionar la mejora en calidad")
    else:
        print("   ‚ùå La nueva maquinaria EMPEOR√ì la calidad")
        print("   üîß Requieren ajustes urgentes en el proceso")
else:
    print("   ‚ö†Ô∏è La calidad se mantiene estable (3% defectos)")
    print("   üìä Pueden continuar con la operaci√≥n normal")

# =============================================================================
# SISTEMA 3: NIVEL DE SERVICIO DE ENTREGAS
# Distribuci√≥n: NORMAL
# =============================================================================

"""
## üöö SISTEMA 3: SERVICIO DE ENTREGAS - E-Commerce Plus

**CONTEXTO EMPRESARIAL:**
E-Commerce Plus compite con Amazon M√©xico prometiendo entregas en 4 d√≠as o menos.
Con nuevos centros de distribuci√≥n, necesitan verificar si cumplen esta promesa.
CEO requiere datos estad√≠sticos para decisiones comerciales.

**PAR√ÅMETROS DEL AN√ÅLISIS:**
- Promesa comercial: 4.0 d√≠as m√°ximo
- Muestra: 80 entregas
- Tiempo real esperado: 4.2 d√≠as (ligero retraso)
- Desviaci√≥n est√°ndar: 0.8 d√≠as (menor variabilidad)
"""

# SIMULACI√ìN DE DATOS - SISTEMA ENTREGAS
media_entrega = 4.2  # PAR√ÅMETRO MODIFICADO: ligeramente por encima de promesa
desv_std = 0.8  # PAR√ÅMETRO MODIFICADO: menor variabilidad
n_entregas = 80  # PAR√ÅMETRO MODIFICADO: m√°s entregas analizadas
np.random.seed(456)

muestra_entregas = np.random.normal(media_entrega, desv_std, n_entregas)

print("\n\nüöö SISTEMA 3: SERVICIO DE ENTREGAS")
print("="*50)
print(f"üì¶ Tiempos de entrega en d√≠as (primeros 15): {muestra_entregas[:15].round(2)}")
print(f"üìä Tiempo promedio de entrega: {np.mean(muestra_entregas):.2f} d√≠as")
print(f"üìà Desviaci√≥n est√°ndar: {np.std(muestra_entregas):.2f} d√≠as")

# PARTE 1: INTERVALO DE CONFIANZA (usando c√≥digo original)
def intervalo_confianza_normal(muestra, confianza=0.95):
    media_muestra = np.mean(muestra)
    error_estandar = stats.sem(muestra)
    return stats.t.interval(confianza, len(muestra)-1, loc=media_muestra, scale=error_estandar)

ic_entregas = intervalo_confianza_normal(muestra_entregas)
print(f"\nüìä INTERVALO DE CONFIANZA (95%):")
print(f"   Tiempo promedio real: {ic_entregas[0]:.2f} - {ic_entregas[1]:.2f} d√≠as")

# PARTE 2: CONTRASTE DE HIP√ìTESIS (usando c√≥digo original)
def prueba_hipotesis_normal(muestra, mu_0, alpha=0.05):
    t_stat, p_valor = stats.ttest_1samp(muestra, mu_0)
    return p_valor < alpha, p_valor

# H0: Œº = 4.0 (cumplimos la promesa de 4 d√≠as)
# H1: Œº ‚â† 4.0 (no cumplimos la promesa)
mu_0_entregas = 4.0  # Promesa comercial
rechazo_entregas, p_valor_entregas = prueba_hipotesis_normal(muestra_entregas, mu_0_entregas)

print(f"\nüß™ CONTRASTE DE HIP√ìTESIS:")
print(f"   H0: Œº = {mu_0_entregas} d√≠as (cumplimos promesa)")
print(f"   H1: Œº ‚â† {mu_0_entregas} d√≠as (no cumplimos promesa)")
print(f"   P-valor: {p_valor_entregas:.4f}")
print(f"   ¬øSe rechaza H0?: {'S√ç' if rechazo_entregas else 'NO'}")

# INTERPRETACI√ìN EMPRESARIAL
print(f"\nüíº DECISI√ìN EMPRESARIAL:")
if rechazo_entregas:
    if np.mean(muestra_entregas) > mu_0_entregas:
        print("   ‚ùå NO estamos cumpliendo la promesa de 4 d√≠as")
        print("   üö® Opciones: Mejorar log√≠stica O cambiar promesa comercial")
    else:
        print("   ‚úÖ ¬°Entregamos M√ÅS R√ÅPIDO que la promesa!")
        print("   üìà Oportunidad de mejorar la oferta comercial")
else:
    print("   ‚úÖ S√ç cumplimos la promesa de 4 d√≠as")
    print("   üí™ Pueden mantener o mejorar la oferta comercial")

# =============================================================================
# SISTEMA 4: SATISFACCI√ìN DE CLIENTES
# Distribuci√≥n: BINOMIAL
# =============================================================================

"""
## üòä SISTEMA 4: SATISFACCI√ìN DE CLIENTES - TecnoHogar M√©xico

**CONTEXTO EMPRESARIAL:**
TecnoHogar M√©xico fabrica electrodom√©sticos de l√≠nea blanca.
Lanzaron productos "smart" y buscan mantener 85% de satisfacci√≥n.
Necesitan medir el impacto de la nueva tecnolog√≠a en la satisfacci√≥n.

**PAR√ÅMETROS DEL AN√ÅLISIS:**
- Objetivo de satisfacci√≥n: 85%
- Clientes encuestados: 120
- Satisfacci√≥n esperada: 88% (mejora con productos smart)
"""

# SIMULACI√ìN DE DATOS - SISTEMA SATISFACCI√ìN
n_ensayo = 1  # Cada cliente: satisfecho (1) o no satisfecho (0)
p_satisfaccion = 0.88  # PAR√ÅMETRO MODIFICADO: mejora esperada con productos smart
n_clientes = 120  # PAR√ÅMETRO MODIFICADO: m√°s clientes encuestados
np.random.seed(789)

muestra_satisfaccion = np.random.binomial(n_ensayo, p_satisfaccion, n_clientes)

print("\n\nüòä SISTEMA 4: SATISFACCI√ìN DE CLIENTES")
print("="*50)
print(f"üë• Respuestas (1=satisfecho, 0=no) primeras 30: {muestra_satisfaccion[:30]}")
print(f"üìä Clientes satisfechos: {np.sum(muestra_satisfaccion)} de {n_clientes}")
print(f"üìà Proporci√≥n de satisfacci√≥n: {np.mean(muestra_satisfaccion):.3f} ({np.mean(muestra_satisfaccion)*100:.1f}%)")

# PARTE 1: INTERVALO DE CONFIANZA (usando c√≥digo original)
def intervalo_confianza_satisfaccion(muestra, confianza=0.95):
    p_estimado = np.mean(muestra)
    n = len(muestra)
    z = stats.norm.ppf((1 + confianza) / 2)
    margen_error = z * np.sqrt((p_estimado * (1 - p_estimado)) / n)
    return (p_estimado - margen_error, p_estimado + margen_error)

ic_satisfaccion = intervalo_confianza_satisfaccion(muestra_satisfaccion)
print(f"\nüìä INTERVALO DE CONFIANZA (95%):")
print(f"   Proporci√≥n de satisfacci√≥n: {ic_satisfaccion[0]:.3f} - {ic_satisfaccion[1]:.3f}")
print(f"   En porcentaje: {ic_satisfaccion[0]*100:.1f}% - {ic_satisfaccion[1]*100:.1f}%")

# PARTE 2: CONTRASTE DE HIP√ìTESIS (usando c√≥digo original)
def prueba_hipotesis_satisfaccion(muestra, p_0, alpha=0.05):
    p_estimado = np.mean(muestra)
    n = len(muestra)
    se = np.sqrt(p_0 * (1 - p_0) / n)
    z = (p_estimado - p_0) / se
    p_valor = 2 * (1 - stats.norm.cdf(abs(z)))
    return p_valor < alpha, p_valor

# H0: p = 0.85 (mantenemos el 85% de satisfacci√≥n)
# H1: p ‚â† 0.85 (la satisfacci√≥n ha cambiado)
p_0_satisfaccion = 0.85  # Objetivo de satisfacci√≥n
rechazo_satisfaccion, p_valor_satisfaccion = prueba_hipotesis_satisfaccion(muestra_satisfaccion, p_0_satisfaccion)

print(f"\nüß™ CONTRASTE DE HIP√ìTESIS:")
print(f"   H0: p = {p_0_satisfaccion} (85% satisfacci√≥n - objetivo)")
print(f"   H1: p ‚â† {p_0_satisfaccion} (satisfacci√≥n cambi√≥)")
print(f"   P-valor: {p_valor_satisfaccion:.4f}")
print(f"   ¬øSe rechaza H0?: {'S√ç' if rechazo_satisfaccion else 'NO'}")

# INTERPRETACI√ìN EMPRESARIAL
print(f"\nüíº DECISI√ìN EMPRESARIAL:")
if rechazo_satisfaccion:
    if np.mean(muestra_satisfaccion) > p_0_satisfaccion:
        print("   ‚úÖ ¬°EXCELENTE! Los productos smart MEJORARON la satisfacci√≥n")
        print("   üì¢ Pueden promocionar este logro en marketing")
    else:
        print("   ‚ùå Los productos smart REDUJERON la satisfacci√≥n")
        print("   üîß Necesitan revisar la experiencia del usuario")
else:
    print("   ‚ö†Ô∏è La satisfacci√≥n se mantiene estable (85%)")
    print("   üìä Pueden continuar con la estrategia actual")

# =============================================================================
# GR√ÅFICA DE DISTRIBUCIONES (OPCIONAL)
# =============================================================================

"""
## üìä VISUALIZACI√ìN DE LAS DISTRIBUCIONES
"""

plt.figure(figsize=(15, 10))

# Gr√°fica 1: Distribuci√≥n Poisson (Log√≠stica)
plt.subplot(2, 2, 1)
plt.hist(muestra_logistica, bins=15, alpha=0.7, color='blue', edgecolor='black')
plt.axvline(np.mean(muestra_logistica), color='red', linestyle='--', 
           label=f'Media: {np.mean(muestra_logistica):.1f}')
plt.axvline(lambda_0_logistica, color='green', linestyle='--', 
           label=f'Hist√≥rico: {lambda_0_logistica}')
plt.title('Sistema 1: Pedidos por Hora (Poisson)')
plt.xlabel('Pedidos por hora')
plt.ylabel('Frecuencia')
plt.legend()

# Gr√°fica 2: Distribuci√≥n Binomial (Producci√≥n)
plt.subplot(2, 2, 2)
plt.hist(muestra_produccion, bins=15, alpha=0.7, color='orange', edgecolor='black')
plt.axvline(np.mean(muestra_produccion), color='red', linestyle='--', 
           label=f'Media: {np.mean(muestra_produccion):.1f}')
plt.axvline(p_0_produccion * n_piezas, color='green', linestyle='--', 
           label=f'Hist√≥rico: {p_0_produccion * n_piezas:.1f}')
plt.title('Sistema 2: Defectos por Turno (Binomial)')
plt.xlabel('N√∫mero de defectos')
plt.ylabel('Frecuencia')
plt.legend()

# Gr√°fica 3: Distribuci√≥n Normal (Entregas)
plt.subplot(2, 2, 3)
plt.hist(muestra_entregas, bins=15, alpha=0.7, color='green', edgecolor='black')
plt.axvline(np.mean(muestra_entregas), color='red', linestyle='--', 
           label=f'Media: {np.mean(muestra_entregas):.1f}')
plt.axvline(mu_0_entregas, color='blue', linestyle='--', 
           label=f'Promesa: {mu_0_entregas}')
plt.title('Sistema 3: Tiempo de Entrega (Normal)')
plt.xlabel('D√≠as')
plt.ylabel('Frecuencia')
plt.legend()

# Gr√°fica 4: Distribuci√≥n Binomial (Satisfacci√≥n)
plt.subplot(2, 2, 4)
valores_satisfaccion = [0, 1]
conteos = [np.sum(muestra_satisfaccion == 0), np.sum(muestra_satisfaccion == 1)]
plt.bar(valores_satisfaccion, conteos, alpha=0.7, color='purple', edgecolor='black')
plt.title('Sistema 4: Satisfacci√≥n de Clientes')
plt.xlabel('Satisfacci√≥n (0=No, 1=S√≠)')
plt.ylabel('N√∫mero de clientes')
plt.xticks([0, 1], ['No Satisfecho', 'Satisfecho'])

plt.tight_layout()
plt.show()

# =============================================================================
# RESUMEN EJECUTIVO
# =============================================================================

print("\n\n" + "="*70)
print("üìã RESUMEN EJECUTIVO - INFERENCIA ESTAD√çSTICA")
print("="*70)

sistemas = [
    ("üöõ LogiM√©xico (Log√≠stica)", rechazo_logistica, p_valor_logistica),
    ("üè≠ Manufacturas Precisi√≥n (Producci√≥n)", rechazo_produccion, p_valor_produccion),
    ("üöö E-Commerce Plus (Entregas)", rechazo_entregas, p_valor_entregas),
    ("üòä TecnoHogar (Satisfacci√≥n)", rechazo_satisfaccion, p_valor_satisfaccion)
]

for i, (nombre, rechazo, p_valor) in enumerate(sistemas, 1):
    print(f"\n{i}. {nombre}")
    print(f"   P-valor: {p_valor:.4f}")
    print(f"   Decisi√≥n: {'RECHAZAR H0' if rechazo else 'NO RECHAZAR H0'}")
    print(f"   Estado: {'CAMBIO SIGNIFICATIVO' if rechazo else 'SIN CAMBIO SIGNIFICATIVO'}")

print(f"\nüéØ NIVEL DE CONFIANZA UTILIZADO: 95% (Œ± = 0.05)")
print(f"üìä TODOS LOS AN√ÅLISIS COMPLETADOS EXITOSAMENTE")
print("="*70)