# PROBLEMAS DE PROBABILIDAD PARA ECONOMISTAS:
# INDICE

- [DOCUMENTOS COMPLEMENTARIOS](#DOCUMENTOS-COMPLEMENTARIOS)
    - [CARPETA CON TODOS LOS PDFS (enlace externo)](https://drive.google.com/folderview?id=0B_kK0s_MMsRrZV96NVFzdDR0WmM&usp=sharing)
        - [APUNTES](#APUNTES)



# [PROBLEMAS DE ESTIMACIÓN DE INTERVALOS DE CONFIANZA](#PROBLEMAS-ESTIMACIÓN-DE-INTERVALOS-DE-CONFIANZA)


## [INTERVALOS PARA LA MEDIA:](#INTERVALOS-PARA-LA-MEDIA)
- [PROBLEMA 1](#PROBLEMA-1)
- [PROBLEMA 2](#PROBLEMA-2)
- [PROBLEMA 3](#PROBLEMA-3)


## [INTERVALO PARA LA PROPORCIÓN:](#INTERVALO-PARA-LA-PROPORCIÓN)
- [PROBLEMA 4](#PROBLEMA-4)
- [PROBLEMA 5](#PROBLEMA-5)


## [INTERVALO PARA LA VARIANZA:](#INTERVALO-PARA-LA-VARIANZA)
- [PROBLEMA 6](#PROBLEMA-6)
- [PROBLEMA 7](#PROBLEMA-7)
- [PROBLEMA 8](#PROBLEMA-8)


## [PROBLEMAS VARIOS:](#PROBLEMAS-VARIOS)
- [PROBLEMA 9](#PROBLEMA-9)
- [PROBLEMA 10](#PROBLEMA-10)
- [PROBLEMA 11](#PROBLEMA-11)
- [PROBLEMA 12](#PROBLEMA-12)
- [PROBLEMA 13](#PROBLEMA-13)
- [PROBLEMA 14](#PROBLEMA-14)
- [PROBLEMA 15](#PROBLEMA-15)
- [PROBLEMA 16](#PROBLEMA-16)

In [1]:
from __future__ import division

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as st
import prettyplotlib as ppl
import seaborn as sns

sns.set(style="ticks", palette="Set2")
sns.despine()

from IPython.display import Latex, HTML, IFrame, display
from IPython.html.widgets import interact, interactive, ToggleButtons

%matplotlib inline



# DOCUMENTOS COMPLEMENTARIOS

ENLACE A LA CARPETA [AQUI](https://drive.google.com/folderview?id=0B_kK0s_MMsRrV0Rqb3dueXhZN3c&usp=drive_web)


## APUNTES

- [INDICE ^](#INDICE)


In [2]:
contrastes = "https://docs.google.com/file/d/0B_kK0s_MMsRrT3pqT3gyR2kyTDA/preview"
tablas = "https://docs.google.com/file/d/0B_kK0s_MMsRrUzhOQldjVHk5MDA/preview"

teoria_diap = "https://docs.google.com/file/d/0B_kK0s_MMsRrajl3bWJoQ0FLckU/preview"
teoria = "https://docs.google.com/file/d/0B_kK0s_MMsRrQnBNaFEybjlKMFE/preview"
problemas = "https://docs.google.com/file/d/0B_kK0s_MMsRrTTk0WGNwLWg5Y1U/preview"

def pdf_show(url):
    pdf = HTML('<iframe src=%r width="600" height="600"></iframe>' % url)
    display(pdf)

pdf = interactive(pdf_show, url={'contrastes': contrastes, 
                                 'tablas': tablas,
                                 'teoria_diap': teoria_diap,
                                 'teoria': teoria, 
                                 'problemas':problemas})
display(pdf)

# TEMA 5
# PROBLEMAS ESTIMACIÓN DE INTERVALOS DE CONFIANZA
## INTERVALOS PARA LA MEDIA

# PROBLEMA 1

Con objeto de establecer una garantía sobre un determinado tipo de neumáticos, se ha observado la vida, en kilómetros realizados, **de 100 neumáticos** sobre una pista de pruebas, en idénticas condiciones. **El número de kilómetros que cada uno de estos neumáticos** puede realizar es una **variable aleatoria no necesariamente normal**, con **media desconocida** y **desviación típica 1500 Km**. 

Obtener un intervalo de **confianza al 99%** para la vida media de los neumáticos (suponer que se puede aplicar el TCL). 

Si, para una **muestra de 100 neumáticos**, se obtuvo un **recorrido medio de 32000 Km**, calcular dicho intervalo.


[INDICE ^](#INDICE)  - - - - - - - - - [APUNTES](#APUNTES)

In [3]:
# datos:

n = 100  # tamaño de la muestra
media = 32000  # media muestral
dt = 1500  # desviacion tipica de la muestra
nc = 0.99  # nivel de confianza
ns = 0.01  # nivel de significación


Sabemos:

1. Se trata de un problema de $\mu$ desconocida y varianza conocida. 
1. Nos dicen que podemos aplicar el TCL, por lo que VA ~ N(µ,σ).
    1. Se cumple que: **n grande**, **v.a. independientes**

Con esta información podemos acotar la resolución del problema a: 

$$ IC(\mu) = \bar{x} ± Z_{\frac{\alpha}{2}} · \frac{\sigma}{\sqrt{n}}$$



In [4]:
z = abs(st.norm(0,1).ppf(ns / 2))  # valor de la normal tipificada para alfa ½
ic_inf = media - z * dt / np.sqrt(n)  # intervalo de confianza inferior
ic_sup = media + z * dt / np.sqrt(n)  # intervalo de confianza superior

print 'INTERVALO DE CONFIANZA:'
Latex(r'$ %s < \bar{x} < %s $'
      % (round(ic_inf,3), round(ic_sup,3)))

INTERVALO DE CONFIANZA:


<IPython.core.display.Latex object>


[INDICE ^](#INDICE)  - - - - - - - - - [APUNTES](#APUNTES)


# PROBLEMA 2

El fabricante de ciertos tubos fluorescentes afirma que tienen **una duración media de 5000 horas**, y así lo expresa en su propaganda. La Asociación de Consumidores ha recibido varias quejas sobre estos tubos, y decide encargar un estudio sobre el tema.

Al tomar una **muestra de 145 tubos** de ese tipo, se encontró que la **duración media es de 4850** con una **desviación típica de 650 horas**. 

Obtener el intervalo de confianza a un **nivel del 95%** para la duración media real de los tubos. 

Con este resultado ¿qué postura tomará en el tema la Asociación de Consumidores?

---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [5]:
# datos:

mu = 5000  # media poblacional
n = 145  # tamaño de la muestra
media = 4850  # media muestral
dt = 650  # desviacion tipica
nc = 0.95  # nivel de confianza
ns = 1 - nc  # nivel de significacion

SABEMOS:

1. µ conocida
1. σ desconocida
1. n grande

Con esta información, aplicando el TCL para normalidad, podemos calcular el IC:

$$ \bar{x} ± Z_{\frac{\alpha}{2}} · \frac{S_1}{\sqrt{n}} $$

In [6]:
z = st.norm(0,1).ppf(ns / 2)  # valor de z para el que deja una prob. de alfa ½
s1 = np.sqrt(dt ** 2 * n / (n - 1))  # cuasi-desviación típica
ee = s1 / np.sqrt(n)
k = abs(z * ee)  # k (constante) = z * error estandar 
ic_inf = media - k
ic_sup = media + k

Latex(r'''
INTERVALO DE CONFIANZA: 
[$ %s < \bar{x} < %s$]''' 
      % (round(ic_inf, 2), round(ic_sup, 2)))

<IPython.core.display.Latex object>

### CONCLUSIÓN:

La asosciación deberá denunciar ya que existe suficiente evidencia para aceptar la hipóstesis de que la media no es 5000 horas.


[INDICE ^](#INDICE)  - - - - - - - - - [APUNTES](#APUNTES)


# PROBLEMA 3

Una muestra aleatoria de los **salarios por hora** para nueve mecánicos de automóviles proporcionó los siguientes datos (en dólares): 10,5, 11, 9,5, 12, 10, 11,5, 13, 9, 8,5. 

Bajo la suposición de que el muestreo se llevó a cabo sobre una **población normal**, construir intervalos de confianza a un **nivel del 95%** para los salarios medios por hora.

---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [7]:
# datos:
x = [10.5, 11, 9.5, 12, 10, 11.5, 13, 9, 8.5]

n = len(x)
media = np.mean(x)
var = np.var(x)
s1 = np.sqrt(var * n / (n-1))
nc = 95 / 100
ns = 1 - nc

SABEMOS:

1. Población Normal
1. Varianza desconocida
1. n pequeño

Por tanto, no podemos aplicar TCL, en cambio tenemos que usar la distribución t-student para poder aproximar:

$$ IC(\mu) = \bar{x} ± t_{n-1,\frac{\alpha}{2}} · \frac{S_1}{\sqrt{n}} $$

In [8]:
t = st.t.ppf(ns / 2, n - 1)  # valor de la t-student para alfa ½ y n-1
ee = s1 / np.sqrt(n)  # error estandar

ic_sup = media - t * ee  # intervalo de confianza superior
ic_inf = media + t * ee  # intervalo de confianza inferior

Latex(r'[ $%s < \bar{x} < %s$ ]' % (round(ic_inf, 2), round(ic_sup, 2)))

<IPython.core.display.Latex object>

### ALTERNATIVAMENTE

Podemos calcular el intervalo de confianza usando el método `interval()`

In [9]:
print 'IC(µ) =', np.round(st.t.interval(0.95, n-1, loc=media, scale=ee), 3)

IC(µ) = [  9.428  11.683]



[INDICE ^](#INDICE)  - - - - - - - - - [APUNTES](#APUNTES)

# INTERVALO PARA LA PROPORCIÓN
# PROBLEMA 4

En una encuesta previa a las elecciones en las que hay dos candidatos, A y B, se ha tomado una **muestra aleatoria simple de 250 electores** que se suponen representativos de la población votante y se ha obtenido que **el 60% votarán al candidato A y el 40% al B.**

Encontrar entre qué **límites estará la proporción** de votantes que se inclinan por el **candidato A**, a un nivel de **confianza del 95%**. 

¿Qué se concluye del intervalo?


---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [10]:
# DATOS:

n = 250  # tamaño de la muestra
pa = 0.6  # proporción de votantes de A
pb = 0.4  # proporción de votantes de B
nc = 0.95  # nivel de confianza
ns = 1 - nc  # nivel de significación

SABEMOS:

1. Tenemos todos los datos necesarios para aplicar la ecuación.

$$ Z_{\frac{\alpha}{2}} = \frac{ \hat{p} - p}{ \sqrt{ \hat{p} · (1-\hat{p}) }} · \sqrt{n} $$

Despejando **$p$**:

$$IC(p) = \hat{p} ± Z_{ \frac{\alpha}{2} } · \frac{ \sqrt{ \hat{p} · (1 - \hat{p} ) }}{ \sqrt{n} }
$$

In [11]:
z = abs(st.norm.ppf(ns/2))
ee = np.sqrt(pa * pb / n)

ic = (pa - z * ee, pa + z * ee)
print 'INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE A =', ic

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE A = (0.53927273702968026, 0.6607272629703197)


### CONCLUSIÓN
Por tanto podemos afirmar que el __candidato A__ está __por delante del candidato B__, ya que con un 95% de probabilidad la proporción de votantes de A está entre 0.54 y 0.66.



[INDICE ^](#INDICE)  - - - - - - - - - [APUNTES](#APUNTES)

# PROBLEMA 5

Se recibe un gran lote de artículos proveniente de un fabricante que asegura que el __porcentaje de artículos defectuosos__ en la producción __es del 1%.__ 

Al seleccionar una __muestra aleatoria de 200__ artículos y después de inspeccionarlos, se __descubren 8 defectuosos__. 

Obtener el intervalo de confianza con un __nivel del 90%__ para la verdadera proporción de artículos defectuosos en el proceso. 

¿Qué se puede concluir con respecto a la afirmación del fabricante?

---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [12]:
# DATOS:

ppd = 0.01  # proporcion POBLACIONAL de defectuosos
pmd = 8 / 200  # proporcion MUESRTAL de defectuosos
nc = 0.9  # nivel de confianza


SABEMOS:

1. Desconocemos la distribución
1. n grande
    1. Aplicamos el TCL para __suponer normalidad__

$$ IC(p) = \hat{p} ± Z_{\frac{\alpha}{2}} · \sqrt{\frac{\hat{p}·(1-\hat{p})}{n}}  $$

In [13]:
ee = np.sqrt(pmd * (1 - pmd) / n)

st.norm.interval(nc, loc=pmd, scale=ee)

(0.019614429746777854, 0.060385570253222137)

### CONCLUSIÓN
Vemos que la proporción está fuera del IC para la proporción, esto es evidencia para afirmar que el proveedor está equivocado o miente.


[INDICE ^](#INDICE)  - - - - - - - - - [APUNTES](#APUNTES)

# INTERVALO PARA LA VARIANZA
# PROBLEMA 6

Un fabricante de relojes desea calcular un intervalo de confianza de la **desviación típica de los tiempos marcados en 100 horas** por todos los relojes del mismo modelo con respecto a un reloj que toma como referencia. Para ello, puso en **marcha 11** de tales relojes escogidos **al azar** durante **100 horas** y encontró que la **desviación típica muestral** de los once tiempos marcados por ellos **fue de 50 segundos**.

Hallar un intervalo de confianza de la desviación típica a un **nivel del 99%**, suponiendo que la población de los tiempos marcados por todos los relojes del mismo modelo en **100 horas obedece a la distribución normal.**

----
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [14]:
# Datos:

# x = La hora que marcan los relojes ~ N(µ,σ) 
# muestra = 11 >> x_i ~ N(100 * 60 ,50)

n = 11  # tamaño de la muestra
media = 100  # media muestral
dt = 50 / 60  # desviación típica muestral
nc = 0.99  # nivel de confianza
ns = 1 - nc  # nivel de significación


SABEMOS:

1. Distribución Normal
1. Muestra pequeña = 11
1. desviación típica muestral = 50 seg (50/60 horas)
1. media muestral = 100 horas
1. Nivel de confianza = 99%
1. Unidades HORAS **(! cuidado con las unidades)**
1. NOS PIDEN EL IC DE LA __DESVIACIÓN TÍPICA POBLACIONAL__

### Para calcular los intervalos necesitamos:

$$ \chi^2_{n-1 ; \frac{\alpha}{2}} = \frac{(n-1) · S_1^2}{\sigma^2} $$

### Despejando:

$$ IC(σ^2) =  \frac{(n-1)·S_1^2}{\chi^2_{(n-1), 1-\frac{\alpha}{2}}}, \frac{(n-1)·S_1^2}{\chi^2_{(n-1), \frac{\alpha}{2}}}  $$



In [15]:
s1 = np.sqrt(dt ** 2 * n / (n - 1))

numerador = (n - 1) * s1 ** 2

ic_sup = numerador / st.chi2.ppf(ns / 2, n-1)
ic_inf = numerador / st.chi2.ppf(q=1 - ns / 2, df=n-1)

# OJO CON LAS UNIDADES
# los intervalos son para la varianza poblacional por tanto:

ic_sup = np.sqrt(ic_sup)
ic_inf = np.sqrt(ic_inf)

# las unidades las pasamos a horas por tanto las llevamos a segundos:

ic_sup *= 60
ic_inf *= 60

print 'IC(σ) =', (round(ic_inf,2), round(ic_sup,2))

IC(σ) = (33.04, 112.94)


 ## ALTERNATIVAMENTE

In [16]:
print 'IC(σ) =', np.round(sorted(np.sqrt(np.divide(numerador,st.chi2.interval(alpha=nc, df=n-1)))*60), 3)

IC(σ) = [  33.042  112.942]



[INDICE ^](#INDICE)  - - - - - - - - - [APUNTES](#APUNTES)

# PROBLEMA 7

Una clínica ofrece un programa de adelgazamiento. Según sus historiales, una __muestra aleatoria de 10 pacientes__ había experimentado las siguientes pérdidas de peso (en Kg) al término del programa:

x = [18.2, 25.9, 6.3, 11.8, 15.4, 20.3, 16.8, 19.5, 12.3, 17.2]

__Hallar un intervalo de confianza al 90%__ de la __desviación típica poblacional__ de las __pérdidas de peso__ de los clientes de este programa de adelgazamiento. 

- ¿Cuáles son __los supuestos__, si los hay, para estimar este intervalo? 
- ¿Podría decirse que dicha __desviación es superior a 2 Kg__? 

---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [17]:
# DATOS:
# x = Perdida de peso en kg 

n = 10  # tamaño muestral
x = [18.2, 25.9, 6.3, 11.8, 15.4, 20.3, 16.8, 19.5, 12.3, 17.2]
nc = 0.9

SABEMOS: 

1. Tamaño muestral pequeño.
1. No sabemos la distribución que sigue la población.

### Nos Piden:

Para poder estimar el intervalo se debe cumplir:

- m.a.s
    - independencia
- VA: X ~ N(µ,σ)
    - Muestra de poblacion normal
    - n grande: TCL

Con esto garantizamos el cumplimiento del intervalo.

Para calcular el IC(σ^2):

$$  \frac{(n-1)·S_1^2}{\chi^2_{(n-1), 1-\frac{\alpha}{2}}}, \frac{(n-1)·S_1^2}{\chi^2_{(n-1), \frac{\alpha}{2}}}  $$

In [18]:
# IC para la desviacion tipica
# confirmar si la dt > 2 kg
s1 = np.sqrt(np.var(x) * n / (n - 1))  # cuasidesviacion tipica
numerador = (n - 1) * s1 ** 2  # numerador del cociente del intervalo de confianza

print sorted(np.sqrt(np.divide(numerador,st.chi2.interval(df=(n-1), alpha=nc))))

[3.920732885572868, 8.8440485699319975]


### CONCLUSIÓN

Dado que el intervalo de confianza es estrictamente mayor que 2, podemos afirmar con un nivel de confianza del 90% que la desviación típica es mayor que 2.

- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMA 8

Un psicólogo quiere __estimar la desviación típica__ de las puntuaciones obtenidas por los empleados en un test. Una __muestra aleatoria de 18 empleados__ dio como resultado una __cuasidesviación típica de 10,4__. 

Hallar un intervalo de confianza del 95% para la desviación típica poblacional. 

- ¿Cuáles son los supuestos, si los hay, para estimar este intervalo? 
- El año pasado se concluyó que dicha __desviación típica era igual a 15__. A partir del intervalo calculado, ¿puede decirse que se ha incrementado __el grado de homogeneidad__ de los empleados? 


---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

Sabemos que para calcular el IC(σ^2):

$$  \frac{(n-1)·S_1^2}{\chi^2_{(n-1), 1-\frac{\alpha}{2}}}, \frac{(n-1)·S_1^2}{\chi^2_{(n-1), \frac{\alpha}{2}}}  $$

In [19]:
# datos:

n = 18
s1 = 10.4
s1_anterior = 15 ** 2 * n / (n - 1)
nc = 95/100
alpha = 1 - nc
numerador = (n - 1) * s1 ** 2
numerador_ant = (n - 1) * s1_anterior ** 2

print sorted(np.sqrt((numerador / st.chi2.ppf(df=n-1, q=alpha/2), numerador / st.chi2.ppf(df=n-1, q=1-alpha/2))))
print map(lambda x: round(x,2),sorted(np.sqrt(np.divide(numerador, st.chi2.interval(alpha=nc, df=n-1)))))
print u'σ =', np.mean(map(lambda x: round(x,2),sorted(np.sqrt(np.divide(numerador, st.chi2.interval(alpha=nc, df=n-1))))))

[7.8040309896560753, 15.591097497603753]
[7.8, 15.59]
σ = 11.695


Los supuestos para estimar este intervalo son:

1. m.a.s.
    - independencia
1. Normalidad de la población

Para poder decir si se ha incrementado el grado de homogeneidad de los empleados, debemos comparar ambas estimaciones puntuales.

Hay que tener en cuenta que nos dicen que la desviación típica del año anterior fue de 15, dado que 15 se encuentra dentro del intervalo de confianza para un nivel de confianza del 95%, __no podemos afirmar que se haya incrementado el grado de homogeneidad.__


- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMAS VARIOS

# PROBLEMA 9

Se realiza un test a un grupo de alumnos __escogidos al azar__ y se mide el __número de respuestas correctas__, siendo los resultados: 

resultados = [74, 65, 59, 82, 60, 68, 72, 69, 71, 86, 44, 59]

__Construir sendos intervalos de confianza__, para un __nivel del 95%__, para la __media__ y __la varianza__ de la población de alumnos. 

__Suponer normalidad__ en la distribución del número de respuestas. 


---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)


### RECORDAR:

$$ IC(\mu) = \bar{x} ± t_{n-1,\frac{\alpha}{2}} · \frac{S_1}{\sqrt{n}} $$

$$ IC(σ^2) =  \frac{(n-1)·S_1^2}{\chi^2_{(n-1), 1-\frac{\alpha}{2}}}, \frac{(n-1)·S_1^2}{\chi^2_{(n-1), \frac{\alpha}{2}}}  $$

In [20]:
# datos: 

resultados = [74, 65, 59, 82, 60, 68, 72, 69, 71, 86, 44, 59]
nc = 95/100

n = len(resultados)
media = np.mean(resultados)
var = np.var(resultados)

s1 = np.sqrt(var * n / (n - 1))
ee = s1 / np.sqrt(n)

numerador = (n - 1) * s1 ** 2

print u'IC(µ) =', map(lambda x: round(x,2), 
                      st.t.interval(alpha=nc, df=n-1, loc=media, scale=ee))
print u'IC(σ) =', map(lambda x: round(x,2), 
                      sorted(np.divide(numerador, st.chi2.interval(df=n-1,alpha=nc))))

IC(µ) = [60.28, 74.56]
IC(σ) = [63.36, 364.0]


- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMA 10

La Cámara de Comercio de una ciudad está interesada en __estimar la cantidad media de dinero que gasta una persona__ que asiste a convenciones por día. 

De las distintas convenciones que se llevan a cabo en la ciudad, se __seleccionaron al azar a 16 personas__ y se les preguntó la cantidad que gastaban por día. Se obtuvo la siguiente información (en euros) 

gasto = [150, 175, 163, 148, 142, 189, 135, 174, 168, 152, 158, 184, 134, 146, 155, 163]

Si se supone que la cantidad de dinero gastado en un día es una__v.a. normal__, __obtener el intervalo de confianza a un nivel del 99%__ para la cantidad media real. 

¿Se puede suponer que dicha cantidad es __superior a 150 euros__? 


---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [21]:
# datos:

gasto = [150, 175, 163, 148, 142, 189, 135, 174, 168, 152, 158, 184, 134, 146, 155, 163]

n = len(gasto)
media = np.mean(gasto)
var = np.var(gasto)
s1 = np.sqrt(var * n / (n - 1))
ee = s1 / np.sqrt(n)
nc = 99/100

print 'IC(µ) =', map(lambda x: round(x,2),st.t.interval(df=n-1, alpha=nc, loc=media, scale=ee))


IC(µ) = [146.41, 170.59]


### CONCLUSIÓN:

Dado que en el IC hay valores menores que 150 no podemos suponer que dicha cantidad es superior para un nivel de confianza del 99%. 

- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMA 11

En una __muestra aleatoria simple de 147 directores__ de recursos humanos que examinaban a los candidatos para las ofertas de trabajo de la empresa, __85 afirmaron que el expediente académico jugaba un papel fundamental__ para la contratación. 

__Calcula el intervalo de confianza al 95% para la proporción poblacional__ de directores de recursos humanos que comparten esa opinión. 


---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [22]:
# datos:

n = 147
pa = 85/147
nc = 95/100

ee = np.sqrt(pa * (1 - pa) / n)

print 'IC(p) =', np.round(st.norm.interval(alpha=nc, loc=pa, scale=ee), 3)

IC(p) = [ 0.498  0.658]


- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMA 12

En un estudio sobre creación de empresas se ha obtenido que en el último año __se crearon 150 empresas__ y __32 de ellas tuvieron que cerrar antes del primer año__. 

__Calcula un intervalo de confianza a un nivel del 99% para la proporción real__ de empresas nuevas que tienen que cerrar antes del primer año. 


---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [23]:
# datos:

n = 150
pa = 32 / n
nc = 99/100

ee = np.sqrt(pa * (1 - pa) / n)

print 'IC(p) =', np.round(st.norm.interval(alpha=nc, loc=pa, scale=ee), 3)

IC(p) = [ 0.127  0.299]


- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMA 13

__La rentabilidad diaria__ de un activo financiero que cotiza en la Bolsa de Madrid se puede explicar mediante una__ variable normal__. Se ha estudiado su rentabilidad durante__ 101 días __y se ha obtenido un __rendimiento medio del 0,75%__ con una __cuasidesviación típica de 1,23%__. 

__Calcula los intervalos de confianza a un nivel del 95%__ para la rentabilidad __media real__ del activo y para su __riesgo de inversión__ (varianza real de la rentabilidad).

---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [24]:
# datos:

n = 101
media = 0.75/100
s1 = 1.23 / 100
nc = 95/100

ee = s1 / np.sqrt(n)
numerador = (n - 1) * s1 ** 2

print 'IC(µ) =', np.round(np.multiply(st.norm.interval(alpha=nc, 
                                                       loc=media, 
                                                       scale=ee), 100), 3)
print 'IC(σ) =', np.round(sorted(np.divide(numerador, 
                                           st.chi2.interval(df=n-1, 
                                                            alpha=nc)) * 100 ** 2), 3)


IC(µ) = [ 0.51  0.99]
IC(σ) = [ 1.168  2.038]


- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMA 14

Sabemos que la__ desviación típica__ del consumo diario de energía de una empresa __es de 200 kW/h__. Se ha observado el __consumo de energía durante 45 días__ y se ha calculado que el __consumo medio diario ha sido 2156 kW/h.__

__Calcula el intervalo de confianza a un nivel del 90%__ para el consumo diario __medio__ real de la empresa.


---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [25]:
# datos:

dt = 200
n = 45
media = 2156
nc = 90/100
s1 = np.sqrt(200 ** 2 * n / (n - 1))
ee = s1 / np.sqrt(n)

print 'IC(µ) =', np.round(st.norm.interval(alpha=nc, loc=media, scale=ee), 3)

IC(µ) = [ 2106.406  2205.594]


- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMA 15

El __índice de productividad de los trabajadores__ de una empresa se puede explicar mediante una __variable aleatoria normal__ con __desviación típica 12__. Se han __elegido al azar a 10 trabajadores__ y __el índice medio ha sido 78__. 

__Con un nivel de confianza del 95% estima con un intervalo el índice medio real__ de productividad de los trabajadores de la empresa. 


---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [26]:
# datos:

dt = 12
n = 10
media = 78
nc = 95/100
s1 = np.sqrt(dt ** 2 * n / (n - 1))
ee = s1 / np.sqrt(n)

print 'IC(µ) =', np.round(st.norm.interval(alpha=nc, loc=media, scale=ee), 3)

IC(µ) = [ 70.16  85.84]


- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

# PROBLEMA 16

Una empresa de alquiler de vehículos quiere conocer el __número medio de días que permanece un automóvil en el taller de reparaciones durante un año__. Se han __observado 9 coches__ y el número de días en el taller ha sido: 

media = [5, 12, 10, 19, 15, 8, 25, 17 y 14]

__Especifica qué condiciones son necesarias__ para estimar mediante un intervalo de confianza el número medio real de días en un año que pasa un vehículo en el taller. __Calcula dicha estimación__ para un nivel de __confianza del 95%.__

---
- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)

In [27]:
n = 9
x = [5, 12, 10, 19, 15, 8, 25, 17, 14]
media = np.mean(x)
var = np.var(x)
s1 = np.sqrt(var * n / (n - 1))
ee = s1 / np.sqrt(n)

print 'IC(µ) =', np.round(st.t.interval(df=n-1, alpha=nc, loc=media, scale=ee),3)

IC(µ) = [  9.238  18.54 ]


Para poder calcular el intervalo es necesario que la distribución siga una normal, dado que el tamaño de la muestra es pequeño (No se puede aplicar TCL).

- [INDICE ^](#INDICE)
- [APUNTES](#APUNTES)