 ___
# Atividade: Combinação linear de variáveis aleatórias 

## Contexto Prático

___

## Aula 17

**Preparo Prévio:**
1. Montgomery e Runger (6ª Edição): Seção 5.4 (págs 148 a 152). 

**Hoje:**
1. Reconhecer as variáveis aleatórias de interesse em um problema qualquer. 
2. Aplicar propriedades de esperança e variância quando há combinação linear entre variáveis aleatórias.


**Próxima aula:**
1. Leitura prévia necessária: Magalhães e Lima (7ª Edição): Seção 7.3 (págs 234 a 240).
2. Leitura prévia necessária: Montgomery e Runger (6ª Edição): Capítulo 7 (até Seção 7-2) (págs 191 a 198)
___

In [None]:
%matplotlib inline

import os
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from scipy import stats


In [None]:
print('Esperamos trabalhar no diretório')
print(os.getcwd())

___
## Motivação 

## Soma de variáveis INDEPENDENTES e soma de variáveis CORRELACIONADAS: $X + Y$

Você foi designado pelo seu grupo de Acionamentos para comprar os componentes para o projeto final. 

Depois de cotar em diversas lojas, apurou-se que um pacote com mil peças de resistor de carbono 1/8w tem o preço distribuído como uma normal com média 21 reais e desvio padrão de 2 reais, ou seja, $X$~$N(21;4)$.

Já um pacote de jumpers/fios macho-fêmea com 40 unidades de 20 cm tem o preço distribuído como uma normal com média 18,90 reais e desvio padrão de 1,50 reais, ou seja, $Y$~$N(18,90;2,25)$.

Dado que você vai precisar dos componentes citados acima, se todos os grupos ($n$) comprarem aleatóriamente em alguma loja, qual será a média e o desvio padrão do gasto dos grupos?

No fundo, desejamos saber: Qual é $\mu_G$ e $\sigma_G$, em que:

$$G = X + Y,$$

e $X$ e $Y$ são definidos pelos modelos citados acima.

**Inicialmente, assuma que os preços dos produtos sejam independentes (itens 1 até 5).**
  
**Assuma inicialmente que haja 100 grupos. Assim, simule $n=100$ valores de cada uma das variáveis aleatórias ($X$ e $Y$) respeitando as distribuições fornecidas.**

Faça:

1. Calcule a correlação entre os valores simulados de X e de Y.

2. Obtenha o gasto de cada grupo (que é igual ao gasto com a compra de um pacotinho de resistores MAIS um jumper nas especificações acima descritos) e calcule a esperança e a variância do gasto de um grupo. 
    
3. Agora calcule esperança e variância de $G=X+Y$ utilizando propriedades de esperança e variância da soma de variáveis aleatórias, conforme descritos nos slides das aulas. Compare com os resultados do item anterior e tire conclusões.
    
4. Construa um histograma com os valores do gasto e verifique se tal formato se assemelha a uma distribuição normal.
    
5. **Repita os itens de (1) a (4), assumindo $n=1.000$ e depois $n=10.000$.**

6. **Repita os itens de (1) a (5), assumindo que os preços dos produtos sejam correlacionados e que essa correlação seja de 0,85. Atenção: aqui será necessário consultar o uso do comando `np.random.multivariate_normal( )`.**

___


### SIMULAÇÃO DE X E Y CONSIDERANDO AS MESMAS INDEPENDENTES

In [None]:
#Informações do enunciado
muX = 21
varX = 4
muY = 18.90
varY = 2.25

#correlação entre X e Y - FORÇANDO INDEPENDÊNCIA ENTRE AS VARIÁVEIS
corXY = 0

#covariância entre X e Y
covXY = corXY*(varX*varY)**(0.5)

#Médias de X e Y e matriz com variâncias e covariância entre X e Y
mean = [muX, muY]
cov = [[varX, covXY], [covXY, varY]]  # diagonal covariance

print('Média de X e Y:', mean)
print('Variâncias e Covariância entre X e Y:', cov)

In [None]:
n=100
x = stats.norm.rvs(loc=muX, scale=varX**(1/2), size=n)
y = stats.norm.rvs(loc=muY, scale=varY**(1/2), size=n)

#OU DA FORMA ABAIXO PARA FORÇAR A INDEPENDÊNCIA NA SIMULAÇÃO MULTIVARIADA
#n=100
#x, y = np.random.multivariate_normal(mean, cov, n).T

#print("Matriz de covariâncias a partir dos n valores simulados:")
#print(np.cov(x,y))

___
**RESPOSTAS PARA OS ITENS 1 A 5:**

In [None]:
#item 1
#Cálculo da Correlação entre X e Y - via Numpy
np.corrcoef(x,y)

In [None]:
#item 1
#Cálculo da Correlação entre X e Y - via Pandas
pd.Series(x).corr(pd.Series(y))

In [None]:
#item 2
#Construção do Gasto = X+Y
g=[]
for i in range(n):
    g.append(x[i]+y[i])         

mediaG=np.mean(g)
variG=np.var(g)

print("Esperança e variância de G usando os novos valores de G:")
print("Esperança de G=",mediaG)
print("Variância de G=",variG)


In [None]:
#item 3
#Esperança e variância de G usando propriedades de soma de variáveis aleatórias


In [None]:
#item 4
f, (ax1,ax2,ax3) = plt.subplots(1,3,figsize=(16,8))

xx = sorted(x)
ax1.hist(xx, bins=15, density=True, histtype='stepfilled', alpha=0.2)
ax1.plot(xx, stats.norm.pdf(xx, loc=muX, scale=varX**0.5), lw=3, alpha=0.6)
ax1.set_title('RESISTORES')
ax1.set_xlabel('preço resistores')
ax1.set_ylabel('Densidade')
ax1.set_xlim(10,30)
ax1.set_ylim(0,.30)

yy = sorted(y)
ax2.hist(yy, bins=15, density=True, histtype='stepfilled', alpha=0.2)
ax2.plot(yy, stats.norm.pdf(yy, loc=muY, scale=varY**0.5), 'b', lw=3, alpha=0.6)
ax2.set_title('JUMPERS')
ax2.set_xlabel('preço jumpers')
ax2.set_ylabel('Densidade')
ax2.set_xlim(10,30)
ax2.set_ylim(0,.30)

gg = sorted(g)
ax3.hist(gg, bins=15, density=True, histtype='stepfilled', alpha=0.2)
ax3.plot(gg, stats.norm.pdf(gg, loc=mediaG, scale=variG**0.5), 'r', lw=3, alpha=0.6)
ax3.set_title('GASTO')
ax3.set_xlabel('preço gasto')
ax3.set_ylabel('Densidade')
ax3.set_xlim(20,60)
ax3.set_ylim(0,.30)

plt.tight_layout(1)
plt.show()

In [None]:
#item 5
#n=1000 e n=10000

___
### Assumindo correlação igual a 0,85 entre X e Y!

### SIMULAÇÃO DE X E Y CONSIDERANDO AS MESMAS DEPENDENTES:

In [None]:
#item 6

In [None]:
#Informações do enunciado
muX = 21
varX = 4
muY = 18.90
varY = 2.25

#correlação entre X e Y - DEPENDÊNCIA
corXY = 0.85

#covariância entre X e Y
covXY = corXY*(varX*varY)**(0.5)

#Médias de X e Y e matriz com variâncias e covariância entre X e Y
mean = [muX, muY]
cov = [[varX, covXY], [covXY, varY]]  # diagonal covariance

print('Média de X e Y:', mean)
print('Variâncias e Covariância entre X e Y:', cov)

In [None]:
#Simule x e y


___
**RESPOSTAS PARA ITEM 6 - REPETINDO ITENS 1 A 5 COM DEPENDÊNCIA:**

In [None]:
#item 6.1
#Cálculo da Correlação entre X e Y - via Pandas



In [None]:
#item 6.2
#Construção do Gasto = X+Y



In [None]:
#item 6.3
#Esperança e variância de G usando propriedades de soma de variáveis aleatórias



In [None]:
#item 6.4




In [None]:
#item 6.5
#n=1000 e n=10000



___
# EXERCÍCIOS:

___
## Exercício 1 

Um processo industrial pode ser executado em duas etapas independentes. O tempo gasto em cada etapa segue uma distribuição com média de 5 horas e desvio-padrão de 10 horas. 
Um engenheiro resolveu modificar o processo de produção fazendo com que seja executado numa única fase, cujo tempo de execução é o dobro da primeira etapa do processo atual.
Vale a pena adotar o processo proposto pelo engenheiro?


___
## Exercício 2 

Uma pessoa irá comprar uma camisa e uma calça. Os dois produtos serão adquiridos numa mesma loja. O preço da camisa segue uma distribuição aproximadamente normal de média 45,00 reais e desvio-padrão 3,00 reais. O preço da calça segue uma distribuição aproximadamente normal de média 60,00 reais e desvio-padrão 5,00 reais. Sabe-se ainda que a correlação entre os preços da camisa e da calça é da ordem de 0,25 e que o gasto com a compra de uma camisa e uma calça seja modelado por uma distribuição normal.

a) Uma pessoa possui apenas 95,00 reais para comprar a camisa e a calça, indo a um único estabelecimento escolhido ao acaso, qual é a probabilidade de conseguir comprar os dois produtos? Considere que o gasto total com a compra de uma calça e uma camisa também segue uma distribuição aproximadamente normal.

b) Indo a um único estabelecimento, qual a probabilidade de se pagar mais caro na camisa do que na calça?



___
## Exercício 3

O preço de compra, em reais, de cada unidade da matéria-prima M1 não é fixo (único), pois pode variar de região para região brasileira. Neste caso, assuma que o preço de M1 pode ser modelado por uma distribuição normal com média 15 reais e desvio padrão 3 reais. 

a) Qual é o menor valor cobrado pela matéria-prima M1 referente aos 39% dos locais mais careiros?

b) Um determinado produto, que será lançado no mercado, é composto por três unidades de mesmo valor da matéria-prima M1. Ainda, na fabricação desse produto, há um custo fixo de 30 reais por produto produzido. O valor comercializado de cada produto será definido para que se tenha um lucro de 35% sobre o valor da etiqueta. Encontre a esperança, variância e distribuição do valor comercializado de cada produto.
