# Problemario de bloqueo

In [318]:
import pandas as pd
from io import StringIO
from statsmodels.formula.api import ols
import statsmodels.api as sm
from scipy import stats
import matplotlib.pyplot as plt
from scipy.stats import bartlett

## **Diseño en Bloques Completamente al Azar**

### 1:
Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación:

| Marca de atomizador | Réplica 1 | Réplica 2 | Réplica 3 | Réplica 4 | Réplica 5 | Réplica 6 |
|----------------------|-----------|-----------|-----------|-----------|-----------|-----------|
| 1                   | 72        | 65        | 67        | 75        | 62        | 73        |
| 2                   | 55        | 59        | 68        | 70        | 53        | 50        |
| 3                   | 64        | 74        | 61        | 58        | 51        | 69        |

**Preguntas:**<br>
a) Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico.  
b) ¿Existe diferencia entre la efectividad promedio de los atomizadores?  
c) ¿Hay algún atomizador mejor? Argumente su respuesta.  
d) ¿Hay diferencias significativas en los resultados de diferentes días en que se realizó el experimento? Argumente su respuesta.  
e) Verifique los supuestos de normalidad y de igual varianza entre las marcas.


---
**a)**
+ Hipotesis: Como se puede analizar según la problematica se podría definir a las Hipótesis como H0: El atomizador que mata a las moscas tiene una variación en su aplicación por lo que se podría considerar eficiente en su mayoría de réplicas ya que mata a más del 50% en cada prueba.
Haciendo que H1: El Atomizador no logra matar a la mayoría de las moscas en las replicas


In [319]:
#Italia Alexandra Perez Gutierrez
#Bloque: Marca de Atomizador
#Variable de interés: Replica 1,2,3,4,5,6
#Variable de comparación (respuesta): Moscas muertas en porcentaje

data=  '''
Atomizador,Replica,Valor
1,1,72
1,2,65
1,3,67
1,4,75
1,5,62
1,6,73
2,1,55
2,2,59
2,3,68
2,4,70
2,5,53
2,6,50
3,1,64
3,2,74
3,3,61
3,4,58
3,5,51
3,6,69
'''
df = pd.read_csv(StringIO(data))
df

Unnamed: 0,Atomizador,Replica,Valor
0,1,1,72
1,1,2,65
2,1,3,67
3,1,4,75
4,1,5,62
5,1,6,73
6,2,1,55
7,2,2,59
8,2,3,68
9,2,4,70


In [320]:
#Italia Alexandra Perez Gutierrez

nivel_de_significancia = 0.05

bloques = 'Atomizador'    # La variable que no me interesa comparar
interes = 'Replica'      # La variable que me interesa comparar
respuesta = 'Valor'     # La medición que me permite hacer la comparación

# NO MODIFICAR de esta línea hacia abajo
# Realizar el modelo ANOVA de dos vías
modelo = ols(f'{respuesta} ~ C({interes}) + C({bloques})', data=df).fit()
tabla_anova = sm.stats.anova_lm(modelo, typ=2)

# Mostrar resultados
print("Resultados del ANOVA:")
print(tabla_anova)

# Interpretar resultados
if tabla_anova["PR(>F)"][f"C({interes})"] < nivel_de_significancia:
    print("\nConclusión: Hay diferencias significativas entre los tratamientos.")
else:
    print("\nConclusión: No hay diferencias significativas entre los tratamientos.")

if tabla_anova["PR(>F)"][f"C({bloques})"] < nivel_de_significancia:
    print("Conclusión: Hay diferencias significativas entre los bloques.")
else:
    print("Conclusión: No hay diferencias significativas entre los bloques.")

Resultados del ANOVA:
                   sum_sq    df         F    PR(>F)
C(Replica)     281.333333   5.0  1.093973  0.420718
C(Atomizador)  296.333333   2.0  2.880752  0.102804
Residual       514.333333  10.0       NaN       NaN

Conclusión: No hay diferencias significativas entre los tratamientos.
Conclusión: No hay diferencias significativas entre los bloques.


**b)**
+ Según el resultado de ANOVA no hay diferencias significativas entre la marca de los atomizadores y el porcentaje de moscas muertas, por lo que se podría concluir que independientemente del atomizador a utilizar estos no tienen tanta variación en su uso lo que podría decir que son eficientes entre su distintiva marca

**c)**
+ A mi consideración según los resultados de la tabla la Marca de Atomizador número 1 es la mejor ya que la variación entre cada réplica no es demasiada y no baja del 60% lo que podría indicar que se mantiene mejor y mata a más moscas

**d)**
+ Si, entre las distintas marcas hay mucha diferencia ya que si se hace la comparación entre la propia marca con sus replicas de cierta manera se encuentra en un margen estable pero cuando se hace la comparación con las otras se puede visualizar una diferencia significativa entre una y otra y el como si afecta el número de la marca en la eficiencia que tiene para matar moscas.

**e)**


In [321]:
#Italia Alexandra Perez Gutierrez
# Prueba de Shapiro-Wilk para la normalidad
shapiro_test = stats.shapiro(df['Valor'])
print("Prueba de Shapiro-Wilk:")
print(f"Estadístico: {shapiro_test.statistic}")
print(f"Valor p: {shapiro_test.pvalue}")


Prueba de Shapiro-Wilk:
Estadístico: 0.9493495918996288
Valor p: 0.4149049988871177


In [322]:
#Italia Alexandra Perez Gutierrez
#Prueba Bartlett para las Varianzas
# Resultados
stat, p_value = bartlett(df['Valor'][df['Atomizador'] == 1],
                         df['Valor'][df['Atomizador'] == 2],
                         df['Valor'][df['Atomizador'] == 3])

print("Estadístico de Bartlett:", stat)
print("Valor p:", p_value)

# Interpretación
if p_value < nivel_de_significancia:
    print("Rechazamos la hipótesis nula: Las varianzas no son iguales.")
else:
    print("No podemos rechazar la hipótesis nula: Las varianzas son iguales.")

Estadístico de Bartlett: 1.1889279049230643
Valor p: 0.5518583088826501
No podemos rechazar la hipótesis nula: Las varianzas son iguales.


---

###2:
En una empresa lechera se tienen varios silos para almacenar leche (cisternas de 60 000 L). Un aspecto crítico para que se conserve la leche es la temperatura de almacenamiento. Se sospecha que en algunos silos hay problemas, por ello, durante cinco días se decide registrar la temperatura a cierta hora crítica. Obviamente la temperatura de un día a otro es una fuente de variabilidad que podría impactar la variabilidad total.

| Silo | Lunes | Martes | Miércoles | Jueves | Viernes |
|------|-------|--------|-----------|--------|---------|
| A    | 4.0   | 4.0    | 5.0       | 0.5    | 3.0     |
| B    | 5.0   | 6.0    | 2.0       | 4.0    | 4.0     |
| C    | 4.5   | 4.0    | 3.5       | 2.0    | 3.0     |
| D    | 2.5   | 4.0    | 6.5       | 4.5    | 4.0     |
| E    | 4.0   | 4.0    | 3.5       | 2.0    | 4.0     |

**Preguntas:**<br>
a) En este problema, ¿cuál es el factor de tratamiento y cuál el factor de bloque?  
b) Suponga un DBCA (Diseño de Bloques Completamente al Azar), formule las hipótesis adecuadas y el modelo estadístico.  
c) ¿Hay diferencia entre los silos?  
d) ¿La temperatura de un día a otro es diferente?  
e) Revise residuos, ¿hay algún problema evidente?


---
**a)**
+ Considero que el factor de tratamiento son los Silos ya que son el objeto clave que mantiene la temperetura para la conservación de la leche y el factor de bloque serían los días de la semana ya que estos solo ayudarán a visualizar que Silo necesita tratamiento pero como tal no son tan relevantes.

**b)**
+ H0: La temperatura de los Silos es variada a horas críticas por lo que se tendrá que realizar un mantenimiento a estos para conservar la refrigeración de la Leche.
+ H1: La temperatura de los Silos es estable por lo que no habrá que realizar ningún mantenimiento

**c)**
+ Lo que nos puede mencionar la prueba Anova de la tabla es que no hay diferencias significativas entre los cambios de temperatura que hay en el silo durante los días de la semana, sin embargo, a lo que se puede visualizar en la tabla si hay variaciones significativas entre los distintos días de la semana por lo que si se tendría que realizar un mantenimiento.

**d)**
+ Si, en algunas de las compraciones se maniene estable por dos días seguidos y luego tiene una decaída demasiado alta para después regresar a la normalidad



In [323]:
#Italia Alexandra Perez Gutierrez
#Bloque: Días
#Variable de interés: Silo
#Variable de comparación (respuesta): Temperatura

data = """
Silo,Día,Valor
A,Lunes,4.0
A,Martes,4.0
A,Miércoles,5.0
A,Jueves,0.5
A,Viernes,3.0
B,Lunes,5.0
B,Martes,6.0
B,Miércoles,2.0
B,Jueves,4.0
B,Viernes,4.0
C,Lunes,4.5
C,Martes,4.0
C,Miércoles,3.5
C,Jueves,2.0
C,Viernes,3.0
D,Lunes,2.5
D,Martes,4.0
D,Miércoles,6.5
D,Jueves,4.5
D,Viernes,4.0
E,Lunes,4.0
E,Martes,4.0
E,Miércoles,3.5
E,Jueves,2.0
E,Viernes,4.0
"""

# Cargar los datos en un DataFrame
df = pd.read_csv(StringIO(data))

df

Unnamed: 0,Silo,Día,Valor
0,A,Lunes,4.0
1,A,Martes,4.0
2,A,Miércoles,5.0
3,A,Jueves,0.5
4,A,Viernes,3.0
5,B,Lunes,5.0
6,B,Martes,6.0
7,B,Miércoles,2.0
8,B,Jueves,4.0
9,B,Viernes,4.0


In [324]:
#Italia Alexandra Perez Gutierrez

nivel_de_significancia = 0.05

bloques = 'Día'    # La variable que no me interesa comparar
interes = 'Silo'      # La variable que me interesa comparar
respuesta = 'Valor'     # La medición que me permite hacer la comparación

# NO MODIFICAR de esta línea hacia abajo
# Realizar el modelo ANOVA de dos vías
modelo = ols(f'{respuesta} ~ C({interes}) + C({bloques})', data=df).fit()
tabla_anova = sm.stats.anova_lm(modelo, typ=2)

# Mostrar resultados
print("Resultados del ANOVA:")
print(tabla_anova)

# Interpretar resultados
if tabla_anova["PR(>F)"][f"C({interes})"] < nivel_de_significancia:
    print("\nConclusión: Hay diferencias significativas entre los tratamientos.")
else:
    print("\nConclusión: No hay diferencias significativas entre los tratamientos.")

if tabla_anova["PR(>F)"][f"C({bloques})"] < nivel_de_significancia:
    print("Conclusión: Hay diferencias significativas entre los bloques.")
else:
    print("Conclusión: No hay diferencias significativas entre los bloques.")

Resultados del ANOVA:
          sum_sq    df         F    PR(>F)
C(Silo)     4.46   4.0  0.690402  0.609212
C(Día)      9.76   4.0  1.510836  0.246022
Residual   25.84  16.0       NaN       NaN

Conclusión: No hay diferencias significativas entre los tratamientos.
Conclusión: No hay diferencias significativas entre los bloques.


**e)**
+ Se puede visualizar que en la columna F menciona que no hay residuos existentes pero cuando se desglosan de cierta manera se muestran de manera eficiente todos aquellos residuos de los datos

In [325]:
#Italia Alexandra Perez Gutierrez

modelo = ols('Valor ~ C(Silo) + C(Día)', data=df).fit()

# Obtener los residuos
residuos = modelo.resid

# Agregar los residuos al DataFrame
df['Residuos'] = residuos

# Imprimir el DataFrame con los residuos
print(df)

   Silo        Día  Valor  Residuos
0     A      Lunes    4.0      0.44
1     A     Martes    4.0      0.04
2     A  Miércoles    5.0      1.34
3     A     Jueves    0.5     -1.66
4     A    Viernes    3.0     -0.16
5     B      Lunes    5.0      0.54
6     B     Martes    6.0      1.14
7     B  Miércoles    2.0     -2.56
8     B     Jueves    4.0      0.94
9     B    Viernes    4.0     -0.06
10    C      Lunes    4.5      0.84
11    C     Martes    4.0     -0.06
12    C  Miércoles    3.5     -0.26
13    C     Jueves    2.0     -0.26
14    C    Viernes    3.0     -0.26
15    D      Lunes    2.5     -2.06
16    D     Martes    4.0     -0.96
17    D  Miércoles    6.5      1.84
18    D     Jueves    4.5      1.34
19    D    Viernes    4.0     -0.16
20    E      Lunes    4.0      0.24
21    E     Martes    4.0     -0.16
22    E  Miércoles    3.5     -0.36
23    E     Jueves    2.0     -0.36
24    E    Viernes    4.0      0.64


---

###3:
Se diseñó un experimento para estudiar el rendimiento de cuatro detergentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especial diseñado para 12 cargas de lavado, distribuidas en tres modelos de lavadoras:

| Detergente | Lavadora 1 | Lavadora 2 | Lavadora 3 |
|------------|------------|------------|------------|
| A          | 45         | 43         | 51         |
| B          | 47         | 44         | 52         |
| C          | 50         | 49         | 57         |
| D          | 42         | 37         | 49         |

**Preguntas:**<br>
a) Señale el nombre del diseño experimental utilizado.  
b) Formule la hipótesis que se quiere probar en este problema.  
c) Realice el análisis estadístico más apropiado para estos datos y obtenga conclusiones.  



---
**a)**
+ Se utilizó el **Diseño en Bloques Completamente al Azar**

**b)**
+ H0: Los detergentes no tienen un buen rendimiento despues de 12 cargas de lavado
+ H1: Los detergentes se mantienen despues de 12 cargas de lavado lo que podría aplicarse más pruebasnpara verificar su límite

In [326]:
#Italia Alexandra Perez Gutierrez
#Bloque: Detergente
#Variable de interés: Lavadora 1,2 y 3
#Variable de comparación (respuesta): Rendimiento de los Detergentes

data = """
Detergente,Lavadora,Valor
A,Lavadora 1,45
A,Lavadora 2,43
A,Lavadora 3,51
B,Lavadora 1,47
B,Lavadora 2,44
B,Lavadora 3,52
C,Lavadora 1,50
C,Lavadora 2,49
C,Lavadora 3,57
D,Lavadora 1,42
D,Lavadora 2,37
D,Lavadora 3,49
"""

# Cargar los datos en un DataFrame
df = pd.read_csv(StringIO(data))

df

Unnamed: 0,Detergente,Lavadora,Valor
0,A,Lavadora 1,45
1,A,Lavadora 2,43
2,A,Lavadora 3,51
3,B,Lavadora 1,47
4,B,Lavadora 2,44
5,B,Lavadora 3,52
6,C,Lavadora 1,50
7,C,Lavadora 2,49
8,C,Lavadora 3,57
9,D,Lavadora 1,42


In [327]:
#Italia Alexandra Perez Gutierrez

nivel_de_significancia = 0.05

bloques = 'Detergente'    # La variable que no me interesa comparar
interes = 'Lavadora'      # La variable que me interesa comparar
respuesta = 'Valor'     # La medición que me permite hacer la comparación

# NO MODIFICAR de esta línea hacia abajo
# Realizar el modelo ANOVA de dos vías
modelo = ols(f'{respuesta} ~ C({interes}) + C({bloques})', data=df).fit()
tabla_anova = sm.stats.anova_lm(modelo, typ=2)

# Mostrar resultados
print("Resultados del ANOVA:")
print(tabla_anova)

# Interpretar resultados
if tabla_anova["PR(>F)"][f"C({interes})"] < nivel_de_significancia:
    print("\nConclusión: Hay diferencias significativas entre los tratamientos.")
else:
    print("\nConclusión: No hay diferencias significativas entre los tratamientos.")

if tabla_anova["PR(>F)"][f"C({bloques})"] < nivel_de_significancia:
    print("Conclusión: Hay diferencias significativas entre los bloques.")
else:
    print("Conclusión: No hay diferencias significativas entre los bloques.")

Resultados del ANOVA:
                   sum_sq   df          F    PR(>F)
C(Lavadora)    170.166667  2.0  65.170213  0.000085
C(Detergente)  133.666667  3.0  34.127660  0.000363
Residual         7.833333  6.0        NaN       NaN

Conclusión: Hay diferencias significativas entre los tratamientos.
Conclusión: Hay diferencias significativas entre los bloques.


**c)**
+ Se podría concluir que hay diferencias significativas entre los detergentes y su rendimiento lo que diría que los detergentes no rinden demasiado después de su uso en distitas lavadoras, lo que podría decir que las lavadoras pueen tener algún defecto
---

##Diseño en Cuadro Latino:

---
###4:
Se comprueba el peso en gramos de un material de tres proveedores: **A, B y C**, por tres diferentes inspectores: **I, II y III**, utilizando tres diferentes escalas: **1, 2 y 3**. El experimento se lleva a cabo como el siguiente cuadro latino:

| Inspector | Escala 1 | Escala 2 | Escala 3 |
|-----------|----------|----------|----------|
| I         | A = 16   | B = 10   | C = 11   |
| II        | B = 15   | C = 9    | A = 14   |
| III       | C = 13   | A = 11   | B = 13   |

**Preguntas:**<br>
a) ¿Hay diferencias entre los proveedores?  
b) ¿Hay diferencias entre los inspectores y entre las escalas?  
c) Si el peso debe ser 15 g, ¿cuál proveedor es mejor?  
d) Si algún factor de bloque es no significativo, elimínelo y haga el análisis adecuado.  


---
**a)**
+ Según lo interpretado por INOVA hay diferencias significativas entre los proveedores y la escala y visualmente con solo ver la tabla se puede concluir que si hay diferencia entre una y otra lo que diría que los gramos del material que traen no está cumpliendo con el peso que se necesita

**b)**
+ Si hay diferencia entre cada inspección ya que varía por cierta cantidad de gramos en cada uno y no todos exactamente son de 15

**c)**
+ Si se debe de elegir a un diría que el segundo ya que su variación no es por mucha cantidad y se mantiene más estable cuando se realizan las inspecciones, además la cantidad es más exacta


In [328]:
#Italia Alexandra Perez Gutierrez
#Bloque 1: Inspector I,II,III
#Bloque 2: Escala 1,2,3
#Variable de interés: Proveedor A,B,C
#Variable de comparación (respuesta): Peso en Gramos

data = """
Inspector,Escala,Proveedores,Valor
I,Escala 1,A,16
I,Escala 2,B,10
I,Escala 3,C,11
II,Escala 1,B,15
II,Escala 2,C,9
II,Escala 3,A,14
III,Escala 1,C,13
III,Escala 2,A,11
III,Escala 3,B,13
"""

# Cargar los datos en un DataFrame
df = pd.read_csv(StringIO(data))

df

Unnamed: 0,Inspector,Escala,Proveedores,Valor
0,I,Escala 1,A,16
1,I,Escala 2,B,10
2,I,Escala 3,C,11
3,II,Escala 1,B,15
4,II,Escala 2,C,9
5,II,Escala 3,A,14
6,III,Escala 1,C,13
7,III,Escala 2,A,11
8,III,Escala 3,B,13


In [329]:
#Italia Alexandra Perez Gutierrez
# Nivel de significancia
nivel_de_significancia = 0.05

# Configuración de variables
bloque_1 = 'Inspector'   # Primer bloque (factor no principal)
bloque_2 = 'Escala'      # Segundo bloque (factor no principal)
interes = 'Proveedores'       # Variable de interés (tratamiento)
respuesta = 'Valor'  # Variable de respuesta (medición) que permite la comparación

# De aquí para abajo, no mover
# Crear el modelo ANOVA para un cuadro latino
modelo = ols(f'{respuesta} ~ C({interes}) + C({bloque_1}) + C({bloque_2})', data=df).fit()
tabla_anova = sm.stats.anova_lm(modelo, typ=2)

# Mostrar resultados
print("Resultados del ANOVA para el Cuadro Latino:")
print(tabla_anova)

# Interpretar resultados
if tabla_anova["PR(>F)"][f"C({interes})"] < nivel_de_significancia:
    print(f"\nConclusión: Hay diferencias significativas: {interes}.")
else:
    print(f"\nConclusión: No hay diferencias significativas: {interes}.")

if tabla_anova["PR(>F)"][f"C({bloque_1})"] < nivel_de_significancia:
    print(f"Conclusión: Hay diferencias significativas: {bloque_1}.")
else:
    print(f"Conclusión: No hay diferencias significativas: {bloque_1}.")

if tabla_anova["PR(>F)"][f"C({bloque_2})"] < nivel_de_significancia:
    print(f"Conclusión: Hay diferencias significativas: {bloque_2}.")
else:
    print(f"Conclusión: No hay diferencias significativas: {bloque_2}.")

Resultados del ANOVA para el Cuadro Latino:
                   sum_sq   df      F    PR(>F)
C(Proveedores)  10.888889  2.0   49.0  0.020000
C(Inspector)     0.222222  2.0    1.0  0.500000
C(Escala)       32.888889  2.0  148.0  0.006711
Residual         0.222222  2.0    NaN       NaN

Conclusión: Hay diferencias significativas: Proveedores.
Conclusión: No hay diferencias significativas: Inspector.
Conclusión: Hay diferencias significativas: Escala.


---

###5:
Cuando se comparan varios fertilizantes o diferentes variedades de cierto cultivo, es típico que se deba considerar el gradiente de fertilidad del suelo (factor columna) o los efectos residuales de cultivos previos (factor renglón). Considerando estos factores de bloque, Gomez y Gomez (1984) plantean un experimento en cuadro latino para comparar, en cuanto a rendimiento en toneladas por hectárea, tres variedades de maíz híbrido (**A, B, C**) y una variedad control (**D**). Para ello, se utiliza un campo agrícola cuadrado de 16 hectáreas, dividido en parcelas de una hectárea. Los datos de rendimiento obtenidos en cada parcela se muestran a continuación:

| Ren\Col | 1       | 2       | 3       | 4       |
|---------|---------|---------|---------|---------|
| 1       | 1.640(B)| 1.210(D)| 1.425(C)| 1.345(A)|
| 2       | 1.475(C)| 1.185(A)| 1.400(D)| 1.290(B)|
| 3       | 1.670(A)| 0.710(C)| 1.665(B)| 1.180(D)|
| 4       | 1.565(D)| 1.290(B)| 1.655(A)| 0.660(C)|

**Preguntas y ejercicios:**<br>
a) ¿Existen diferencias en los rendimientos de las diferentes variedades de maíz?  
b) ¿Cuál de los factores de bloque tuvo efectos?  
c) ¿Se habrían detectado las mismas diferencias en los tratamientos con un diseño completamente al azar?  
d) ¿Y con un diseño en bloques completos al azar?  


---
**a)**
+ De manera general se puede visualizar una gran variedad entre cada una de las variedades en el maíz, unas de cierta manera manteniendose muy estables y las otras bajando debido a que puede que hayan quedado residuales de cultivos anteriores o la fertilidad del suelo haya estado muy mal en ciertas hectareas

**b)**
+ Según los resultados de ANOVA la fertilidad de la hectárea fue la que tuvo efectos en el experimento

**c)**
+ Siento que igual no se hubiera podido visualizar de manera más detallada como en este diseño, siento que lo único que se vería sería un diseño general de todo esto

In [330]:
#Italia Alexandra Perez Gutierrez
#Bloque 1: Ren 1,2,3,4
#Bloque 2: Col 1,2,3,4
#Variable de interés: Fertilizante A,B,C,D
#Variable de comparación (respuesta): Rendimiento del Fertilizante

data = """
Ren,Col,Fertilizante,Rendimiento
1,1,B,1.640
1,2,D,1.210
1,3,C,1.425
1,4,A,1.345
2,1,C,1.475
2,2,A,1.185
2,3,D,1.400
2,4,B,1.290
3,1,A,1.670
3,2,C,0.710
3,3,B,1.665
3,4,D,1.180
4,1,D,1.565
4,2,B,1.290
4,3,A,1.655
4,4,C,0.660
"""

# Cargar los datos en un DataFrame
df = pd.read_csv(StringIO(data))

df

Unnamed: 0,Ren,Col,Fertilizante,Rendimiento
0,1,1,B,1.64
1,1,2,D,1.21
2,1,3,C,1.425
3,1,4,A,1.345
4,2,1,C,1.475
5,2,2,A,1.185
6,2,3,D,1.4
7,2,4,B,1.29
8,3,1,A,1.67
9,3,2,C,0.71


In [331]:
#Italia Alexandra Perez Gutierrez
# Nivel de significancia
nivel_de_significancia = 0.05

# Configuración de variables
bloque_1 = 'Ren'   # Primer bloque (factor no principal)
bloque_2 = 'Col'      # Segundo bloque (factor no principal)
interes = 'Fertilizante'       # Variable de interés (tratamiento)
respuesta = 'Rendimiento'  # Variable de respuesta (medición) que permite la comparación

# De aquí para abajo, no mover
# Crear el modelo ANOVA para un cuadro latino
modelo = ols(f'{respuesta} ~ C({interes}) + C({bloque_1}) + C({bloque_2})', data=df).fit()
tabla_anova = sm.stats.anova_lm(modelo, typ=2)

# Mostrar resultados
print("Resultados del ANOVA para el Cuadro Latino:")
print(tabla_anova)

# Interpretar resultados
if tabla_anova["PR(>F)"][f"C({interes})"] < nivel_de_significancia:
    print(f"\nConclusión: Hay diferencias significativas: {interes}.")
else:
    print(f"\nConclusión: No hay diferencias significativas: {interes}.")

if tabla_anova["PR(>F)"][f"C({bloque_1})"] < nivel_de_significancia:
    print(f"Conclusión: Hay diferencias significativas: {bloque_1}.")
else:
    print(f"Conclusión: No hay diferencias significativas: {bloque_1}.")

if tabla_anova["PR(>F)"][f"C({bloque_2})"] < nivel_de_significancia:
    print(f"Conclusión: Hay diferencias significativas: {bloque_2}.")
else:
    print(f"Conclusión: No hay diferencias significativas: {bloque_2}.")

Resultados del ANOVA para el Cuadro Latino:
                   sum_sq   df          F    PR(>F)
C(Fertilizante)  0.426842  3.0   6.587865  0.025092
C(Ren)           0.030155  3.0   0.465406  0.716972
C(Col)           0.827342  3.0  12.769166  0.005148
Residual         0.129584  6.0        NaN       NaN

Conclusión: Hay diferencias significativas: Fertilizante.
Conclusión: No hay diferencias significativas: Ren.
Conclusión: Hay diferencias significativas: Col.


**d)**

In [332]:
#Italia Alexandra Perez Gutierrez

nivel_de_significancia = 0.05

bloques = 'Col'    # La variable que no me interesa comparar
interes = 'Fertilizante'      # La variable que me interesa comparar
respuesta ='Rendimiento'     # La medición que me permite hacer la comparación

# NO MODIFICAR de esta línea hacia abajo
# Realizar el modelo ANOVA de dos vías
modelo = ols(f'{respuesta} ~ C({interes}) + C({bloques})', data=df).fit()
tabla_anova = sm.stats.anova_lm(modelo, typ=2)

# Mostrar resultados
print("Resultados del ANOVA:")
print(tabla_anova)

# Interpretar resultados
if tabla_anova["PR(>F)"][f"C({interes})"] < nivel_de_significancia:
    print("\nConclusión: Hay diferencias significativas entre los tratamientos.")
else:
    print("\nConclusión: No hay diferencias significativas entre los tratamientos.")

if tabla_anova["PR(>F)"][f"C({bloques})"] < nivel_de_significancia:
    print("Conclusión: Hay diferencias significativas entre los bloques.")
else:
    print("Conclusión: No hay diferencias significativas entre los bloques.")

Resultados del ANOVA:
                   sum_sq   df          F    PR(>F)
C(Fertilizante)  0.426842  3.0   8.016365  0.006543
C(Col)           0.827342  3.0  15.538006  0.000665
Residual         0.159739  9.0        NaN       NaN

Conclusión: Hay diferencias significativas entre los tratamientos.
Conclusión: Hay diferencias significativas entre los bloques.
