## Problema N°1
**Prueba de Wilcoxon** 

Un grupo de 10 pacientes fue sometido a dos pruebas antes y después de un tratamiento en contra de la anemia, se tomaron los pesos respectivos:

![Ej1](../Images/ej1.png)

A un 6% de significancia utilice la prueba de Wilcoxon para verificar si el tratamiento hizo algún cambio.

Los parámetros relevantes son:
- Nivel de significacion ($\alpha$) = 0.06
- Tamano de muestra $n$ = 10

**Planteamos la hipotesis**

a = Sin tratamiento

b = Con metodo de tratamiento

* $H_0:Ua = Ub$
* $H_1:Ua \neq Ub$ 

In [42]:
import math
import scipy.stats as st
from IPython.display import display, Markdown, Latex

# Datos
n = 10
a = 0.06
antes =   [85,54,67,80,74,70,71,76,58,72]
despues = [80,50,73,78,70,60,74,70,60,70]
diferencias = []

# Calculamos la diferencia de los valores
for i in range(len(antes)):
    diferencias.append(antes[i]-despues[i])

# Imprimimos las diferencias
print("Diferencias:")
print(diferencias)


# Obtenemos el valor absoluto sin ordenar y creamos la lista orden (1,2,3...)
listaAbs=[]
orden=[]
for posc,numero in enumerate(diferencias):
    listaAbs.append(abs(numero))
    orden.append(posc+1)
print(listaAbs)

# Ordenamos e imprimimos las diferencias
listaOrdenada = sorted(listaAbs)


# Imprimimos las listas
print("Diferencia Ordenada y Con Valor absoluto")
print(listaOrdenada)
print("Orden De los Valores")
print(orden)

# Obtenemos el rango
rango = orden
valorSiguiente = 0
contador = 0
for posc,numero in enumerate(listaOrdenada):
    if (valorSiguiente==numero):
        if contador == 0:
            ValorRango = rango[posc-1]+0.5
            rango[posc]=ValorRango
            if rango[posc]>1:
                rango[posc-1]=ValorRango
            contador +=1
        elif contador >= 1:
            rango[posc]=rango[posc-1]
    else:
        contador = 0
    valorSiguiente = numero
rango[0] = 1
print("Rango")
print(rango)

# Lista de rangos en orden original:
rangosOrdenOriginal = []
for valor in listaAbs:
    indice = listaOrdenada.index(valor)  # Obtener el índice del valor en la lista original
    ValorRango = rango[indice]  # Obtener el rango correspondiente
    rangosOrdenOriginal.append(ValorRango)  # Agregar el rango a la nueva lista


# Calculamos la suma de los rangos para las diferencias Positivas y Negativas
Tpositivo = 0
TNegativo = 0
for posc,numero in enumerate(diferencias):
    if numero>0:
        Tpositivo += rangosOrdenOriginal[posc]
    else:
        TNegativo += rangosOrdenOriginal[posc]

# Mostramos La comparacion entre las filas de Diferencias Y Rangos
print("\nComparacion de Filas de Diferencias Y Rangos")
print(diferencias)
print(rangosOrdenOriginal)

# Identificamos la suma de rangos minima
Tminimo = 0
if Tpositivo>TNegativo:
    Tminimo = TNegativo
else:
    Tminimo = Tpositivo

print("\nT+ =",Tpositivo)
print("T- =",TNegativo)
print("T = Min(T+,T-) =",Tminimo)

# Reemplazamos en la formula de la E(T) E en funcion de T
print("\nReemplazamos en las Formulas")
E =  (n*(n+1)/4)
display(Latex(f"$$E(t)=\\frac{{{n}({n}+1)}}{4}=\\frac{{{n*(n+1)}}}{4}={E}$$"))

# Reemplazamos en la formula de la o(t) o en funcion de t
O = (n*(n+1)*(2*n+1)/24)
display(Latex(f"$$\sigma(t)=\\frac{{{n}({n}+1)(2*{n}+1)}}{{24}}=\\frac{{{n}({n+1})({2*n+1})}}{{24}}={O}$$"))

# Calculamos Z
Z = round((Tminimo - E)/math.sqrt(O),4)
display(Latex(f"$$Z=\\frac{{{Tminimo}-{E}}}{{\sqrt{{{O}}}}}=\\frac{{{Tminimo-E}}}{{{round(math.sqrt(O),3)}}}={Z}$$"))

# Calculamos Z Tabla
Z1 = a/2
Z2 = 1-(a/2)
Zt1 = round((st.norm.ppf(Z1)),3)
Zt2 = round((st.norm.ppf(Z2)),3)
print("Z(a/2) = Z(",Z1,") =",Zt1)
print("Z(1-(a/2)) = Z(",Z2,") =",Zt2)

# Comparamos resultados para la Hipotesis, Revisa La Hipotesis!!
if Z > Z1 and Z < Z2:
    print("Conclusion: Se Acepta H0")
else:
    print("Conclusion: Se rechaza H0")


Diferencias:
[5, 4, -6, 2, 4, 10, -3, 6, -2, 2]
[5, 4, 6, 2, 4, 10, 3, 6, 2, 2]
Diferencia Ordenada y Con Valor absoluto
[2, 2, 2, 3, 4, 4, 5, 6, 6, 10]
Orden De los Valores
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
Rango
[1, 1.5, 1.5, 4, 5.5, 5.5, 7, 8.5, 8.5, 10]

Comparacion de Filas de Diferencias Y Rangos
[5, 4, -6, 2, 4, 10, -3, 6, -2, 2]
[7, 5.5, 8.5, 1, 5.5, 10, 4, 8.5, 1, 1]

T+ = 38.5
T- = 13.5
T = Min(T+,T-) = 13.5

Reemplazamos en las Formulas


<IPython.core.display.Latex object>

<IPython.core.display.Latex object>

<IPython.core.display.Latex object>

Z(a/2) = Z( 0.03 ) = -1.881
Z(1-(a/2)) = Z( 0.97 ) = 1.881
Conclusion: Se rechaza H0


## Problema N°2
Un alumno vive en una casa con sistema eléctrico solar. A la misma hora de cada día, reúne lecturas del voltaje con un medidor conectado al sistema:

![ej2](../Images/ej2.png)

A un 5% de significancia utilice la prueba de Kruskall Wallis  para verificar si independiente del clima los medidas son similares (los voltajes provienen de una misma población).

1 . **Planteamiento de la hipotesis**

* Ho: Las muestras de voltaje provienen de poblaciones idénticas.
* H1: Las muestras de voltaje de papa provienen de poblaciones diferentes.

**Datos relevantes:**
- Nivel de Significacion ($\alpha$) = 0.05

In [59]:
import math
import scipy.stats as st
from IPython.display import display, Markdown, Latex

# Datos

a = 0.05
k = 3 # Numero de grupos
grupoA=[10.5,16,17.2,13.7,13.8]
grupoB=[12.7,16.5,16.6,12.9,13,13,16]
grupoC=[13.1,14.2,15.3,11.7,11.6,12.2]
# grupoD=[1.32,1.64,1.89,1.12,1.23]
diferencias = grupoA+grupoB+grupoC
n = len(diferencias)


# Ordenamos e imprimimos las diferencias
listaOrdenada = sorted(diferencias)

# Obtenemos el valor absoluto y le asignamos un valor de orden
listaOrdAbs=[]
orden=[]
for posc,numero in enumerate(listaOrdenada):
    listaOrdAbs.append(abs(numero))
    orden.append(posc+1)

# Obtenemos el rango
rango = orden
valorAnterior = 0
for posc,numero in enumerate(listaOrdAbs):
    if (valorAnterior==numero):
        ValorRango = (((posc)+(posc+1))/2)
        rango[posc-1]=ValorRango
        rango[posc]=ValorRango
    valorAnterior=numero

# Mostramos La comparacion entre las filas de Diferencias Y Rangos
print("\nComparacion de Filas de Diferencias Y Rangos")
print(listaOrdenada)
print(rango)

# Calcula la suma y el promedio para cada grupo
R2ni = 0
for nombre, grupo in zip(['Grupo A', 'Grupo B', 'Grupo C'], [grupoA, grupoB, grupoC]):
    sumaGrupo = 0
    promGrupo = 0
    rangos_grupo = []  # Almacenará los rangos correspondientes a cada valor del grupo
    
    for valor in grupo:
        indice = listaOrdenada.index(valor)  # Obtenemos el índice del valor en la lista ordenada
        rango_valor = rango[indice]  # Obtenemos el rango correspondiente
        rangos_grupo.append(rango_valor)  # Añadimos el rango a la lista de rangos del grupo
        sumaGrupo += rango_valor
    
    # Calcula el promedio
    if grupo:  # Asegura que el grupo no esté vacío para evitar dividir por cero
        promGrupo = sumaGrupo / len(grupo)  # Corrige la división aquí
    
    # Calculamos R^2_i/n_i
    R2ni += (sumaGrupo ** 2) / len(grupo)
    
    # Imprime los resultados
    print(f"\n{nombre}")
    print(grupo)
    print(rangos_grupo)
    print(f"Suma = {sumaGrupo}\nPromedio = {promGrupo}")

# Se calcula el estadistico H
H = (12/(n*(n+1)))*(R2ni)-(3*(n+1))
#H, p_value = st.kruskal(grupoA,grupoB,grupoC) #-> Forma Corta :)

print("\nEstadistico de Prueba H")
display(Latex(f"$$\\text{{H}}=\\frac{{12}}{{{n}({n}+1)}}*[{round(R2ni,3)}]-{3*(n+1)}={round(H,3)}$$"))

# Tabla Xi Cuadrado
Xi = round(st.chi2.ppf(1-a,k-1),3)
print("Valor Xi cuadrado:",Xi)

# Conclusion
if H>Xi:
    print("Conclusion: Se rechaza la H0")
else:
    print("Conclusion: Se acepta la H0")


Comparacion de Filas de Diferencias Y Rangos
[10.5, 11.6, 11.7, 12.2, 12.7, 12.9, 13, 13, 13.1, 13.7, 13.8, 14.2, 15.3, 16, 16, 16.5, 16.6, 17.2]
[1, 2, 3, 4, 5, 6, 7.5, 7.5, 9, 10, 11, 12, 13, 14.5, 14.5, 16, 17, 18]

Grupo A
[10.5, 16, 17.2, 13.7, 13.8]
[1, 14.5, 18, 10, 11]
Suma = 54.5
Promedio = 10.9

Grupo B
[12.7, 16.5, 16.6, 12.9, 13, 13, 16]
[5, 16, 17, 6, 7.5, 7.5, 14.5]
Suma = 73.5
Promedio = 10.5

Grupo C
[13.1, 14.2, 15.3, 11.7, 11.6, 12.2]
[9, 12, 13, 3, 2, 4]
Suma = 43
Promedio = 7.166666666666667

Estadistico de Prueba H


<IPython.core.display.Latex object>

Valor Xi cuadrado: 5.991
Conclusion: Se acepta la H0


## Problema N°3
Cierta máquina de última tecnología de empresa embotelladora produce muchos artículos, se ha contabilizado la cantidad de artículos en función a los defectos producidos como se puede ver en el siguiente cuadro. Un ingeniero Industrial sospecha que los defectos producidos por la máquina se ajustan a una distribución binomial. Para verificar ello se toma tres artículos por 110 días y se cuenta la cantidad de artículos con defectos por día:

![ej3](../Images/ej3.png)

Verificar si los datos siguen dicha distribución con probabilidad de éxito de 0.4485 , use un nivel de significación 5%.

1 . **Planteamiento de la hipotesis**

* H0: El numero de deatos se ajustan a una distribucion Binomial
* H1: El nuemero de datos no se ajustan a una distribucion Binomial

**Datos relevantes:**
- Nivel de Significacion ($\alpha$) = 0.05
- Frecuencia Observada $O_i$ = 3

In [12]:
import math
import scipy.stats as st

# Datos
a = 0.05
# Si P esta estimado m = 1
m = 0
TipoDistribucion = "Binomial"
O = 3
K = 4
fila1 = [0,1,2,3]
fila2 = [35,22,33,20]

# Calculamos Xi*Fi
xiFi = []
frecuenciaN = 0
sumaXiFi = 0
for posC,numero in enumerate(fila1):
    frecuenciaN += fila2[posC]
    valor = numero*fila2[posC]
    sumaXiFi += valor
    xiFi.append(valor)

# Calculamos el promedio
promedio = round(sumaXiFi/frecuenciaN,4)

# Estimamos el valor de p -> O*p = promedio
P = 0.4485

# Definimos las funciones para Distribucion Binomial y poisson
def poisson(k, lmbda):
    return round(math.exp(-lmbda) * (lmbda ** k) / math.factorial(k),4)

def distribucion_binomial(numero_exitos, ensayos, probabilidad_exito):
    combinaciones = math.comb(ensayos, numero_exitos)
    probabilidad_exito_n = probabilidad_exito ** numero_exitos
    probabilidad_fracaso_n = (1 - probabilidad_exito) ** (ensayos - numero_exitos)
    probabilidad = round(combinaciones * probabilidad_exito_n * probabilidad_fracaso_n,4)
    return probabilidad

# Calculamos la distribucion
if TipoDistribucion == "Poisson":
    lmbda = promedio
    Pi = []
    for Pos,numero in enumerate(fila1):
        probabilidad = poisson(numero,lmbda)
        Pi.append(probabilidad)
elif TipoDistribucion == "Binomial":
    Pi = []
    for Pos,numero in enumerate(fila1):
        probabilidad = distribucion_binomial(numero, O, P)
        Pi.append(probabilidad)

# Calculamos el valor esparado de la funcion Ei
Ei = []
for posC,numero in enumerate(Pi):
    valor = round(numero*frecuenciaN,3)
    Ei.append(valor)

# Calculamos Oi-Ei,(Oi-Ei)^2 y (Oi-Ei)^2/Ei
OiEi = []
OiEi_2 = []
OiEi_2_Ei = []
XiCalculado = 0
for posC,numero in enumerate(fila2):
    valor1 = round(numero-Ei[posC],3)
    valor2 = round(valor1**2,3)
    valor3 = round(valor2/Ei[posC],3)
    XiCalculado +=valor3
    OiEi.append(valor1)
    OiEi_2.append(valor2)
    OiEi_2_Ei.append(valor3)

# Hallamos Xi Tabular
gl = K-m-1
XiTabular = round(st.chi2.ppf(1-a,gl),3)

print("Numero Accidentes =",fila1)
print("Frecuencia (Fi) =",fila2,"| Total n =",frecuenciaN)
print("Xi*Fi =",xiFi,"| Total =",sumaXiFi)
print("Promedio Distribucion Binomial (Xi*Fi)/n =",promedio)
print("Pi =",Pi)
print("Ei =",Ei)
print("Oi-Ei =",OiEi)
print("Oi-Ei^2 =",OiEi_2)
print("(Oi-Ei^2)/Ei =",OiEi_2_Ei,"\nXi calculado =",XiCalculado)
print("Xi Tabular",XiTabular)

# Conclusion de la Hipotesis
if XiCalculado <= XiTabular:
    print("Conclusion: (XiCalculado <= XiTabular) Se Acepta H0")
else:
    print("Conclusion: (XiCalculado > XiTabular) Se Rechaza H0")

Numero Accidentes = [0, 1, 2, 3]
Frecuencia (Fi) = [35, 22, 33, 20] | Total n = 110
Xi*Fi = [0, 22, 66, 60] | Total = 148
Promedio Distribucion Binomial (Xi*Fi)/n = 1.3455
Pi = [0.1677, 0.4092, 0.3328, 0.0902]
Ei = [18.447, 45.012, 36.608, 9.922]
Oi-Ei = [16.553, -23.012, -3.608, 10.078]
Oi-Ei^2 = [274.002, 529.552, 13.018, 101.566]
(Oi-Ei^2)/Ei = [14.853, 11.765, 0.356, 10.236] 
Xi calculado = 37.21000000000001
Xi Tabular 7.815
Conclusion: (XiCalculado > XiTabular) Se Rechaza H0


## Problema N°4
Un pasajero tomó los tiempos que espera para abordar su vuelo en cada uno de sus 12 viajes. Afirma que la mediana del tiempo de espera es de 50 min. En base a los siguientes datos muestrales:

![ej4](../Images/ej4.png))

A un 8% de significancia ¿El pasajero tiene razón? (Utilizar una de las 4 probabilidades P=2P(R+<=5)=1  , o P=2P(R+>=5)=1.4512 , o  P=P(R+<=5)=0.05   , o  P=2P(R+>=5)=0.7256 )

**Paso 1-Identificar el tipo de Prueba**

*Prueba bilateral*
$$
\begin{array}{c}H_o{:}Me=50\\H_1{:}Me\neq50\end{array}
$$

Datos relevantes:

- Nivel de significacion ($\alpha$) = O.08
- Tamño de la muestra ($n$) = 12
- Media ($X_i$) = 50

In [6]:
import math
datos = [48,55,42,50,54,46,51,46,48,52,46,53]

# Declaramos variables conocidas
a = 0.08
n = 12
Xi = 50
arMas = 0
TipoPrueba = "Bilateral"

# Aplicamos el signo de la diferencia a+ ó Comparacion con la mediana
for numero in datos:
    if (numero-Xi>0):
        arMas+=1
    elif(numero-Xi==0):
        n-=1

# Definimos las funciones P.U.S Y P.U.I
def pus(nElementos,valorRmas):
    P = 0
    resultados = []
    for i in range(valorRmas,nElementos+1):
        # Se aplica el coeficiente binomial
        P += 2 * math.comb(nElementos,i) * (0.5**i) * (0.5 ** (nElementos-i))
        resultados.append(P)
        print ("(",nElementos,"/",i,")*0.5^",i,"*0.5^",nElementos-i,"=",resultados[valorRmas-i])
    print("\n")
    return P

def pui(nElementos,valorRmas):
    P = 0
    resultados = []
    for i in range(0,valorRmas+1):
        # Se aplica el coeficiente binomial
        P += math.comb(nElementos,i) * (0.5**i) * (0.5 ** (nElementos-i))
        resultados.append(P)
        print ("(",nElementos,"/",i,")*0.5^",i,"*0.5^",nElementos-i,"=",resultados[i])
    return P

print("Valor de a r+ =",arMas)

# Verficamos el valor de a r+ 
if TipoPrueba == "Bilateral":
    print("Se aplica prueba Bilateral\n")
    P1 = pus(n,arMas)
    P2 = pui(n,arMas)
    
    print("\nPrueba Bilateral:\n(P=2*P(R+>=r+)) =",P1)
    print("(P=2*P(R+<=r+)) =",P2*2)
    print("\nP.U.S = (P=P(R+>=r+)) =",P1/2)
    print("P.U.I = (P=P(R+<=r+)) =",P2)
    

    if P2*2>a:
        print("P =",round(P2*2,4),">",a,"\nConclusion: No se rechaza H0")
    else:
        print("P =",round(P1,4),"<",a,"\nConclusion: Se rechaza H0")

else:
    print("Tipo de Prueba No especificado\nSegun r+ > n/2, Se aplica:")
    if (arMas>(n/2)):
        print("Prueba unilateral Superior\n")
        P=pus(n,arMas)
    else:
        print("Prueba unilateral Inferior\n")
        P=pui(n,arMas)

    # Regla de decicion de P es <= que a
    if (P>a):
        print("P =",round(P,4),">",a,"\nConclusion: No se rechaza H0")
    else:
        print("P =",round(P,4),"<",a,"\nConclusion: Se rechaza H0")



Valor de a r+ = 5
Se aplica prueba Bilateral

( 11 / 5 )*0.5^ 5 *0.5^ 6 = 0.451171875
( 11 / 6 )*0.5^ 6 *0.5^ 5 = 0.90234375
( 11 / 7 )*0.5^ 7 *0.5^ 4 = 0.90234375
( 11 / 8 )*0.5^ 8 *0.5^ 3 = 0.90234375
( 11 / 9 )*0.5^ 9 *0.5^ 2 = 0.90234375
( 11 / 10 )*0.5^ 10 *0.5^ 1 = 0.90234375
( 11 / 11 )*0.5^ 11 *0.5^ 0 = 0.90234375


( 11 / 0 )*0.5^ 0 *0.5^ 11 = 0.00048828125
( 11 / 1 )*0.5^ 1 *0.5^ 10 = 0.005859375
( 11 / 2 )*0.5^ 2 *0.5^ 9 = 0.03271484375
( 11 / 3 )*0.5^ 3 *0.5^ 8 = 0.11328125
( 11 / 4 )*0.5^ 4 *0.5^ 7 = 0.2744140625
( 11 / 5 )*0.5^ 5 *0.5^ 6 = 0.5

Prueba Bilateral:
(P=2*P(R+>=r+)) = 1.451171875
(P=2*P(R+<=r+)) = 1.0

P.U.S = (P=P(R+>=r+)) = 0.7255859375
P.U.I = (P=P(R+<=r+)) = 0.5
P = 1.0 > 0.08 
Conclusion: No se rechaza H0


## Problema N°5
Una agencia de publicidad desea saber si el género de los consumidores es independiente de sus preferencias por 2 marcas de café; A y B. La respuesta determinará si se deben diseñar diferentes anuncios dirigidos a los hombres y otros diferentes para las mujeres. Realice la prueba con un nivel de significancia del 5%.

![ej5](../Images/Ej5.png)

[Nota: muestre todos los pasos necesarios y la interpretación del resultado de acuerdo con el problema dado]

1 . **Planteamiento de la hipotesis**

* H0: No existe relación entre las preferencias y el genero
* H1: Existe relación entre las preferencias y el genero

**Datos relevantes:**
- Nivel de Significacion ($\alpha$) = 0.05

In [12]:
import math
import scipy.stats as st

# Datos
a = 0.05
columnas = [[18,12], [32, 18]]

# Se calcula el total general y los totales por fila y columna
TotalGeneral = sum(sum(columna) for columna in columnas)
TotalFila = [sum(columna) for columna in columnas]
TotalColumna = [sum(fila[i] for fila in columnas) for i in range(len(columnas[0]))]

# Se calculan los valores esperados (Ei) para cada columna
Ei = [[round((fila_total * columna_total) / TotalGeneral, 3) for columna_total in TotalColumna] for fila_total in TotalFila]

# Se calcula el chi-cuadrado observado (XiCalculado)
XiCalculado = sum((columnas[fila][columna] - Ei[fila][columna])**2 / Ei[fila][columna] for fila in range(len(columnas)) for columna in range(len(columnas[0])))

# Se calcula el chi-cuadrado tabular (XiTabular)
gl = (len(TotalFila) - 1) * (len(TotalColumna) - 1)
XiTabular = round(st.chi2.ppf(1 - a, gl), 3)

# Mostrar resultados
for i, columna in enumerate(columnas):
    print(f"Oi columna {i+1}:", columna)
    print(f"Ei columna {i+1}:", Ei[i])

print("\nTotal Columna:", TotalFila)
print("Total Fila:", TotalColumna)
print("Total General:", TotalGeneral)
print("Xi cuadrado Calculado:", XiCalculado)
print("Xi cuadrado Tabular:", XiTabular)

# Conclusion de la Hipotesis
if XiCalculado <= XiTabular:
    print("Conclusion: (XiCalculado <= XiTabular) Se Acepta H0")
else:
    print("Conclusion: (XiCalculado > XiTabular) Se Rechaza H0")

Oi columna 1: [18, 12]
Ei columna 1: [18.75, 11.25]
Oi columna 2: [32, 18]
Ei columna 2: [31.25, 18.75]

Total Columna: [30, 50]
Total Fila: [50, 30]
Total General: 80
Xi cuadrado Calculado: 0.128
Xi cuadrado Tabular: 3.841
Conclusion: (XiCalculado <= XiTabular) Se Acepta H0
