<a href="https://colab.research.google.com/github/munozariasjm/BasicStats/blob/main/InterConfi.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Intervalos de confianza 

*por:* José Miguel Muñoz


(Me escriben si tienen preguntas/problemas con el código)



---



---
Ejecutar esta sección antes de empezar!


In [None]:
import numpy as np
import pandas as pd
import scipy.stats as st
from scipy.stats import norm



---


## Intervalo Normal

* Muestra muy grande y varianza poblacional conocida
* Muestra pequeña y población normal con sigma conocida
* Muestra grande y sigma muestral conocida


In [None]:
def IntervaloZ(mu,sigma,n,confi=0.95):
  alfa=1-confi
  zs=st.norm.ppf(alfa/2)
  max=mu-zs*(sigma/n**0.5);min=mu+zs*(sigma/n**0.5)
  print("Intervalo al {} % de confianza para Diferencia de media:".format(100*confi))
  print("Intervalo ===  ({:.4f} , {:.4f})".format(min,max))

IntervaloZ(0.6,0.012,25)

Intervalo al 95.0 % de confianza para Diferencia de media:
Intervalo ===  (0.5953 , 0.6047)




---

## Intervalo T

In [None]:
def IntervaloT(mu,sigma,n,confi=0.95): print(st.t.interval(confi, n-1, loc=mu, scale=sigma/np.sqrt(n)))
def IntervaloTMuestra(x,confi=0.95): print(st.t.interval(confi, len(x)-1, np.mean(x),st.sem(x)))

IntervaloTMuestra([95, 16, 11, 3, 42, 71, 225, 64, 87, 123],0.95)




---

## Intervalo diferencia medias

In [None]:
def IntervaloDifZ(mu1,s1,n1,mu2,s2,n2,confi=0.95,si=False):
  se=((((s1**2)/n1) + ((s2**2)/n2)))**0.5
  alfa=1-confi
  zs=st.norm.ppf(alfa/2)
  max=mu1-mu2+(zs*se);min=mu1-mu2-(zs*se)
  if si: print("El error estándar es: {:.4f}".format(se))
  print("Intervalo al {} % de confianza para Diferencia de media:".format(100*confi))
  print("Intervalo ===  ({:.4f} , {:.4f})".format(max,min))

IntervaloDifZ(76.12,2.53,6,74.61,8.61,9)

Intervalo al 95.0 % de confianza para Diferencia de media:
Intervalo ===  (-4.4683 , 7.4883)




---
## Intervalo T dos Muestras


Si se tienen dos poblaciones normales con la misma $\sigma$ desconocida, el siguiente intervalo estima la diferencia de las medias 

In [None]:
def IntervaloTDos(mu1,s1,n1,mu2,s2,n2,confi=0.95,nu=0):
  if not nu==0: nu=input("Si las varianzas son diferentes, ingrese nu: ")
  else: nu=n1+n2-2
  sp=(((n1-1)*s1**2+(n2-1)*s2**2)/(n1+n2-2))**0.5
  alfa=1-confi
  zs=st.t.ppf(alfa/2,nu)
  max=mu1-mu2+(zs*sp*((1/n1)+(1/n2))**0.5);min=mu1-mu2-(zs*sp*((1/n1)+(1/n2))**0.5)
  print("Intervalo al {} % de confianza para Diferencia de media:".format(100*confi))
  print("Intervalo ===  ({:.4f} , {:.4f})".format(max,min))

IntervaloTDos()


---
## Intervalo Proporción
Sea $x$~$b(n,p)$ donde $\hat{p}=\frac{x}{n}$


In [None]:
def IntervaloProp(x,n,confi=0.95):
  p=x/n
  alfa=1-confi
  zs=st.norm.ppf(alfa/2)
  errorMuestreo=zs*(p*(1-p)/n)**0.5
  max=p+errorMuestreo;min=p-errorMuestreo
  print("Intervalo al {} % de confianza para Proporción:".format(100*confi))
  print("Intervalo ===>  ({:.4f} , {:.4f})".format(max,min))

IntervaloProp(200,600,0.99)



---

## Intervalo Para diferencia de proporciones

In [None]:
def IntervaloDifPror(x,n,y,m,confi=0.95):
  p1=x/n;p2=y/m
  alfa=1-confi
  zs=st.norm.ppf(alfa/2)
  dp=p1-p2
  errorMuestreo=zs*((p1*(1-p1)/n)+(p2*(1-p2)/m))**0.5
  max=dp+errorMuestreo;min=dp-errorMuestreo
  print("Intervalo al {} % de confianza para Diferencia de Proporciones:".format(100*confi))
  print("Intervalo ===>  ({} , {})".format(max,min))


IntervaloDifPror(126,300,125,250,0.9)

Intervalo al 90.0 % de confianza para Diferencia de Proporciones:
Intervalo ===>  (-0.1500174602425773 , -0.00998253975742272)




---
## Intervalo para Sigma Cuadradro


Supongamos que tenemos una muestra población normal con desviación $s_x$, la siguiente función calcula el intervalo de confianza para una $\sigma^2$

Si busca un intervalo para la $\sigma$ (desviación), poner Desv=True. (Es falso por default)



In [None]:
def IntervaloVar(s,n,confi=0.95,Desv=False):
  alfa=1-confi
  z1=st.chi2.ppf(alfa/2, n-1,loc=0, scale=1)
  z2=st.chi2.ppf(1-(alfa/2), n-1,loc=0, scale=1)
  min=(n-1)*(s**2)/z1;max=(n-1)*(s**2)/z2
  if Desv==False:
    print("Intervalo al {} % de confianza para Varianza".format(100*confi))
    print("Intervalo ===>  ({:.4f} , {:.4f})".format(max,min))
  else: 
    print("Intervalo al {} % de confianza para Desviación".format(100*confi))
    print("Intervalo ===>  ({:.4f} , {:.4f})".format(max**0.5,min**0.5))


IntervaloVar(2,25,0.98)



---
## Intervalo para Razón de Varianzas

Partiendo de dos poblaciones normales con $s_1$ y $s_2$ conocidos, la función calcula un intervalo de confianza para la razón de varianzas: $\frac{\sigma^2_1}{\sigma^2_2}$


In [None]:
def IntervaloRazonVarianza(s1,s2,n,m,confi=0.95):
  alfa=1-confi
  z1=st.f.ppf(1-(alfa/2), n-1,m-1)
  z2=st.f.ppf((alfa/2), n-1,m-1)
  max=z1*(s2/s1)**2;min=z2*(s2/s1)**2
  pval=(1-st.f.cdf(z1,n-1,m-1)+(st.f.cdf(z2,n-1,m-1)))
  print("Intervalo al {} % de confianza para Razón de Varianzas".format(100*confi))
  print("Intervalo ===>  ({:.4f} , {:.4f})".format(min,max))
  print("P-value ===>  {:.4f} ".format(pval))
IntervaloRazonVarianza(0.25,0.45,21,16)



---



---

# Puebas de HIPÓTESIS


## Pueba Normal para media

In [None]:
def PruebaNormalZ(prom,mu,sigma,n,confi=0.95):
  colas=input("Ingrese up, down o dos: ")
  alfa=1-confi
  z=np.abs(prom-mu)/(sigma/(n**0.5))
  if colas=="dos":  pval=(1-st.norm.cdf(z))*2
  if colas=="up": pval=1-st.norm.cdf(z)
  elif colas=="down": pval=st.norm.cdf(z)
  print("Valor-p ===> {}".format(pval))
  if pval<=alfa: print("Con una confianza de {}%, RECHAZAR la hipótesis".format(confi*100))
  else: print("Con una confianza de {}%, NO rechazar la hipótesis".format(confi*100))

PruebaNormalZ(3.07,3,0.4,64)

Ingrese up, down o dos: up
Valor-p ===> 0.08075665923377151
Con una confianza de 95.0%, NO rechazar la hipótesis


## Prueba T para media

In [None]:
def PruebaT(prom,mu,sigma,n,confi=0.95):
  colas=input("Ingrese up, down o dos: ")
  alfa=1-confi
  z=np.abs(prom-mu)/(sigma/(n**0.5))
  if colas=="dos":  pval=2-2*st.t.cdf(z,n-1)
  if colas=="up": pval=1-st.t.cdf(z,n-1)
  elif colas=="down": pval=st.t.cdf(z,n-1)
  print("Valor-p ===> {}".format(pval))
  if pval<=alfa: print("Con una confianza de {}%, RECHAZAR la hipótesis".format(confi*100))
  else: print("Con una confianza de {}%, NO rechazar la hipótesis".format(confi*100))

PruebaT()



Ingrese up, down o dos: dos
Valor-p ===> 0.325313192250412
Con una confianza de 95.0%, NO rechazar la hipótesis


## Prueba Z Diferencia Medias

In [None]:
def PruebaDiferenciaZ(MU,mu1,s1,n1,mu2,s2,n2,confi=0.95):
  colas=input("Ingrese up, down o dos: ")
  alfa=1-confi
  se=((((s1**2)/n1) + ((s2**2)/n2)))**0.5
  z=mu1-mu2-MU/(se)
  if colas=="dos":  pval=(1-st.norm.cdf(z))*2
  if colas=="up": pval=st.norm.cdf(z)
  elif colas=="down": pval=1-st.norm.cdf(z)
  print("Valor-p ===> {:.4f}".format(pval))
  if pval<=alfa: print("Con una confianza de {}%, RECHAZAR la hipótesis".format(confi*100))
  else: print("Con una confianza de {}%, NO rechazar la hipótesis".format(confi*100))

PruebaDiferenciaZ(8,118,102**0.5,64,109,87**0.5,64)


KeyboardInterrupt: ignored

## Prueba T diferencia medias


In [None]:
def PruebaDiferenciaT(MU,mu1,s1,n1,mu2,s2,n2,confi=0.95):
  sp=(((n1-1)*s1**2+(n2-1)*s2**2)/(n1+n2-2))**0.5
  alfa=1-confi
  nu=n1+n2-2
  z=(mu1-mu2-MU)/(sp*((1/n1)+(1/n2)**0.5))
  colas=input("Ingrese up, down o dos: ")
  if colas=="dos":  pval=2-2*st.t.cdf(z,nu)
  if colas=="up": pval=1-st.t.cdf(z,nu)
  elif colas=="down": pval=st.t.cdf(z,nu)
  print("Valor-p ===> {}".format(pval))
  if pval<=alfa: print("Con una confianza de {}%, RECHAZAR la hipótesis".format(confi*100))
  else: print("Con una confianza de {}%, NO rechazar la hipótesis".format(confi*100))
PruebaDiferenciaT(8,118,102**0.5,64,109,87**0.5,64,)

## Intervalo Proporción

In [None]:
def PruebaProporcion(x,n,po,confi=0.95):
  colas=input("Ingrese up, down o dos: ")
  alfa=1-confi
  pe=x/n
  z=np.abs(pe-po)/(((po*(1-po))/n)**0.5)

  if colas=="dos":  pval=(1-st.norm.cdf(z))*2;pval2=st.binom_test(x, n, po, alternative='two-sided')
  if colas=="up": pval=st.norm.cdf(z);pval2=st.binom_test(x, n, po, alternative='less')
  elif colas=="down": pval=1-st.norm.cdf(z);pval2=st.binom_test(x, n, po, alternative='greater')
  print(pval2)
  print("Valor-p ===> {}".format(pval))
  if pval<=alfa: print("Con una confianza de {}%, RECHAZAR la hipótesis".format(confi*100))
  else: print("Con una confianza de {}%, NO rechazar la hipótesis".format(confi*100))

PruebaProporcion(75,100,0.7)

Ingrese up, down o dos: down
0.16313010446635196
Valor-p ===> 0.1376167620374169
Con una confianza de 95.0%, NO rechazar la hipótesis


## Prueba diferencia de proporciones

In [None]:
def PruebaDiferenciaProporcion(x,n,y,m,confi=0.95):
  colas=input("Ingrese up, down o dos: ")
  pe=(x+y)/(n+m)
  alfa=1-confi
  p1=x/n;p2=y/m
  se=( pe*(1-pe)* ((1/n) + (1/m)) )**0.5
  z=np.abs(p1-p2)/(se)
  if colas=="dos":  pval=(1-st.norm.cdf(z))*2
  if colas=="up": pval=st.norm.cdf(z)
  elif colas=="down": pval=st.norm.cdf(-z)
  print("Valor-p ===> {:.4f}".format(pval))
  if pval<=alfa: print("Con una confianza de {}%, RECHAZAR la hipótesis".format(confi*100))
  else: print("Con una confianza de {}%, NO rechazar la hipótesis".format(confi*100))

PruebaDiferenciaProporcion(126,300,125,250,0.99)

## Prueba para $\sigma^2$

In [None]:
def PruebaSigma(s,sigma0,n,confi=0.95):
  z=(n-1)*(s**2)/sigma0**2
  nu=n-1;alfa=1-confi
  colas=input("Ingrese up, down o dos: ")
  if colas=="dos":  pval=2*np.min([st.chi2.cdf(z,nu),1-st.chi2.cdf(z,nu)])
  if colas=="up": pval=st.chi2.cdf(z,nu)
  elif colas=="down": pval=1-st.chi2.cdf(z,nu)
  print("Valor-p ===> {}".format(pval))
  if pval<=alfa: print("Con una confianza de {}%, RECHAZAR la hipótesis".format(confi*100))
  else: print("Con una confianza de {}%, NO rechazar la hipótesis".format(confi*100))

PruebaSigma(4000,2000,100,0.975)

Ingrese up, down o dos: dos
Valor-p ===> 0.0
Con una confianza de 97.5%, RECHAZAR la hipótesis





---



---


# Prueba de bondad de ajuste

In [None]:


#datos=np.arange([])
fObs=[63,23,14]
#mu=datos*fObs
F=lambda x: st.poisson.pmf(x,0.52)
expect=[F(i)*100 for i in [0,1]]
expect.append(100-np.sum(expect));print(expect)

Para Poisson: 

```
poisson.cdf(x, mu)
```



In [None]:
for k in expect:
   if k<5: print("Debe juntar celdas")
def bondAjuste(fObs,expect,t,confi=0.95):
  alfa=1-confi
  nu=t
  dis,pval=st.chisquare(fObs, expect, ddof=nu)
  print("Valor-p ===> {:.4f}".format(pval))
  if pval<=alfa: print("Con una confianza de {}%, RECHAZAR la hipótesis".format(confi*100))
  else: print("Con una confianza de {}%, ACEPTAR la hipótesis".format(confi*100))
bondAjuste(fObs,expect,1)