**<p style="font-size: 35px; text-align: center">Analysis of Variance</p>**



***<center>Miguel Ángel Vélez Guerra</center>***

<hr/>

![anova](https://i.pinimg.com/originals/47/01/3b/47013becd153df62e9ee817a46e5a2ba.png)

<hr/>
<hr/>

In [None]:
#-------Importing from other folder------#

import sys
sys.path.insert(0, "../resources/")

import mstats as ms

#-----------Miguel's statistics----------#

In [None]:
import scipy.stats as ss
import numpy as np

<hr/>
<hr/>

## 1. Análisis de varianza a una vía
El director administrativo de una empresa industrial desea determinar si los tres
programas de capacitación distintos tienen efectos diferentes en los niveles de
productividad de los empleados. Se seleccionan aleatoriamente 14 empleados y se
asignan a uno de los tres programas. Al terminar la capacitación, cada empleado
responde un examen para determinar su competencia. Se colocan cuatro empleados
en el primer programa de capacitación y cinco en cada uno de los otros dos
programas. Cada uno de estos tres grupos se trata de manera independiente como
nuestras separadas.

![image.png](attachment:image.png)

In [None]:
programa1 = [85, 72, 83, 80] # Resultados de la muestra 1
programa2 = [80, 84, 81, 78, 82] # Resultados de la muestra 2
programa3 = [82, 80, 85, 90, 88] # Resultados de la muestra 3

n_programas = 14 # Número total de observaciones
c_programas = 3 # Número total de tratamientos

alpha_programas = 0.05 # Nivel de significancia

**Ho:** μ1 = μ2 = μ3

**Ha:** μ1 ≠ μ2 ≠ μ3

**Encontramos las medias por cada tratamiento y la gran media**

In [None]:
mean_programa1 = np.mean(programa1)
mean_programa2 = np.mean(programa2)
mean_programa3 = np.mean(programa3)

bigmean_programas = np.mean(programa1 + programa2 + programa3)

### **Vamos a encontrar las sumas de los cuadrados**

**Suma de cuadrados total**

In [None]:
sct_programas = ms.anova.get_sct(programa1, programa2, programa3)
sct_programas

**Suma de cuadrados de los tratamientos**

In [None]:
sctr_programas = ms.anova.get_sctr(programa1, programa2, programa3)
sctr_programas

**Suma de cuadrados del error**

In [None]:
sce_programas = ms.anova.get_sce(programa1, programa2, programa3)
sce_programas

### Vamos a encontrar los cuadrados medios

**Cuadrado medio total**

In [None]:
cmt_programas = ms.anova.get_cmt(programa1, programa2, programa3)
cmt_programas

**Cuadrado medio del tratamiento**

In [None]:
cmtr_programas = ms.anova.get_cmtr(programa1, programa2, programa3)
cmtr_programas

**Cuadrado medio del error**

In [None]:
cme_programas = ms.anova.get_cme(programa1, programa2, programa3)
cme_programas

### Vamos a encontrar la razón F

In [None]:
f_programas = ms.anova.get_fratio(programa1, programa2, programa3)
f_programas

**Valor crítico**

In [None]:
df1_programas = c_programas - 1
df2_programas = n_programas - c_programas
ms.hypothesis.crit_val_f(df1_programas, df2_programas, alpha_programas)

### Regla de decisión

Debido a que el valor de la razón f es **1.9431643625192017** que es menor al valor crítico encontrado **3.9822979570944836**, cae en la zona de no rechazo. Por lo que el CEO no debería rechazar la hipótesis de que el puntaje de prueba son los mismos en todos los tratamiento.

<hr/>
<hr/>

## 2. Análisis de varianza a una vía
Robert Shade es vicepresidente de mercadeo en First City Bank en
Atlanta. Los recientes esfuerzos promocionales para atraer nuevos depositantes incluyen
algunos juegos y premios en cuatro sucursales del banco. Shade está convencido de que
diferentes tipos de premios atraerían a diferentes grupos de ingreso. Las personas de un
nivel de ingreso prefieren los regalos, mientras que los de otro grupo de ingreso pueden
sentirse más atraídas por viajes gratuitos a sitios favoritos para pasar vacaciones. Shade
decide utilizar el monto de los depósitos como una media representativa del ingreso. El
desea determinar si existe una diferencia en el nivel promedio de depósitos entre las
cuatro sucursales. Si se halla alguna diferencia, Shade ofrecerá una diversidad de
premios promocionales. Se desea un alfa del 5%.

![image.png](attachment:image.png)

In [None]:
sucursal1 = [5.1, 4.9, 5.6, 4.8, 3.8, 5.1, 4.8] # Resultados de la muestra 1
sucursal2 = [1.9, 1.9, 2.1, 2.4, 2.1, 3.1, 2.5] # Resultados de la muestra 2
sucursal3 = [3.6, 4.2, 4.5, 4.8, 3.9, 4.1, 5.1] # Resultados de la muestra 3
sucursal4 = [1.3, 1.5, 0.9, 1.0, 1.9, 1.5, 2.1] # Resultados de la muestra 4

n_depositos = 7*4 # Número total de observaciones
c_sucursales = 4 # Número total de tratamientos

alpha_sucursales = 0.05 # Nivel de significancia

In [None]:
ms.anova.get_fratio(sucursal1, sucursal2, sucursal3, sucursal4)