# Introdução aos Modelos Estatísticos com R

## Autor: Luiz Affonso Guedes 
Última atualização: abril de 2018
## Obtetivo
- Apresentar uma introdução à estatítica com suporte da linguagem R

## Conteúdo
- Revisão de R: manipular frames e arquivos
- Como manipular um arquivo Excell em R
- Funções de estatística básica em R
- Gráficos estatísitcos básicos em R
- Distribuições estatísticas discretas e contínuas (modelos) em R
- Exercícios


# Como carregar um dado já disponível
- comando data(dado)

In [None]:
data(mtcars)
head(mtcars)

In [None]:
data(airquality) # carrega os dados
airquality # mostra os dados

In [None]:
is.data.frame(airquality) # verifica se é um data-frame
names(airquality) # nome das colunas (variáveis)
dim(airquality) # dimensões do data-frame
help(airquality) # mostra o ‘‘help’’que explica os dados

In [None]:
summary(airquality) # sumário
summary(airquality[,1:4]) # sumário das 4 primeiras variáveis


In [None]:
#airquality
airquality$Wind
mean(airquality$Temp) # média das temperaturas no período
mean(airquality$Ozone) # média do Ozone no período - note a resposta NA
airquality$Ozone # a razão é que existem ‘‘dados perdidos’’ na variável Ozone
mean(airquality$Ozone, na.rm=T) # média do Ozone no período - retirando valores perdido

 # Como ler e escrever um arquivo de Texto
 - read.table("amostras.txt",header=TRUE)
 - write.table(dado, file = "arquivo.txt")

In [None]:
#tabela1 <- read.table(arquivo2.txt, header = TRUE)
#tabela11
a<- c(1,2,3)
b<- c(4,5,6)
cov(a,b)
cor(a,b)

 # Como ler e escrever um arquivo Excell em R
 - read.table("arquivo.csv", head=T, sep=":", dec=",")
 - read.csv("arquivo.csv")
 - read.csv2("arquivo.csv") 
 - write.csv2(dado, file = "arquivo.csv", row.names = FALSE) 

In [None]:
dado <- read.csv2("nome_do_arquivo.csv")  # por exemplo: imd_student_blind.csv
str(dado)

In [None]:
dado[1:5,]

In [None]:
mean(dado$nota)
sd(dado$nota)
min(dado$nota)
max(dado$nota)
max(dado$nota) - min(dado$nota)

Obtendo uma subtabela
- tabela.parametro1 <- subset(tabela, parametro==1)
- x <- subset(tabela, parametro1 == "A" & parametro2 >3)


In [None]:
#x <- subset(dado, ano_ingresso==2014)
#head(x)
#unique(dado$ano_ingresso) 
#unique(x$ano_ingresso)

X <- subset(dado, ano_ingresso==2014 & status=="ATIVO")
y <- subset(dado, ano_ingresso==2014 & status=="CANCELADO")

media_x <- mean(x$nota)
media_y <- mean(y$nota)

media_x > media_y

print("Media dos alunos ativos em 2014 ")
media_x

print("Media dos alunos cancelados em 2014 ")
media_y

#head(y)

In [None]:
#X <- subset(dado, ano_ingresso==2014 & status=="ATIVO")
#y <- subset(dado, ano_ingresso==2014 & status=="CANCELADO")
media <- mean(x$nota)
media
acima <- subset(x, nota > media)
acima

In [None]:
print("Cálculo da probilidade de anos de 2014 terem Status CANCELADO - proporção")


Exemplo com coeficiente de correlação
- cor(x,y)
- cov(x,y)

In [None]:
x <- c(1,2,3,4,5)
y<- c(2,4,6,8,10)
z <- c(4,8,12,16,20)

w <- 10*x 
print("---- variavel x ------")
mean(x)
sd(x)
var(x)

print("---- variavel y ------")
mean(y)
sd(y)
var(y)

print("---- variavel z ------")
mean(z)
sd(z)
var(z)

print("---- variavel w ------")
mean(w)
sd(w)
var(w)

In [None]:
x
y
z
t <- -2*x
t

cov(x,y)
cor(x,y)

cov(x,z)
cor(x,z)

cov(x,t)
cor(x,t)

In [None]:
r<-c(1,2,4,4,1)
cov(x,r)
cor(x,r)

In [None]:
print("Exemplo de uso de do coeficiente de correlação sobre dados de tabela-frames")
(nrow(y)/(nrow(x)+nrow(y))) *100

# Instalação de Pacotes em R
– install.packages(“package_name”)
ou
– install.packages(vector_of_packages_names)
– Exemplos: 
    - install.packages(“plyr")
    - install.packages(c(“plyr”,“moments”))
    
- Para carregar uma biblioteca:
– library(“nome”)  OU require(“nome”)

# Funções de estatística básica em R

Algumas funções úteis que operam sobre vetores:
- length(vetorX) ; obtém a dimensão do vetor
- mean(vetorX) ; obtém o valor médio dos valores dos elementos de um vetor
- max(vetorX); obtém o valor máximo entre os elementos de um vetor
- min(vetorX); obtém o valor mínimo entre os elementos de um vetor
- sd(vetorX); obtém o desvio padrão dos valores dos elementos de um vetor
- var(vetorX); obtém a variância dos valores dos elementos de um vetor
- cor(x,y); coeficiente de correlação
- cov(x,y); covariância
- median(vetorX); obtém a mediana dos valores dos elementos de um vetor
- quantile(vetorX,percentual); Produz as quantidades de amostra correspondentes às probabilidades dadas
- summary(vetorX); imprime na tela um sumário sobre o vetorX

In [None]:
quantile(acima$nota)
quantile(dado$nota)

In [None]:
# install.packages(“packagename”)
print("Programa exemplificando o uso de funções com vetores")
vetorX <- c(1,2,3,2,1)
length(vetorX)
mean(vetorX)
max(vetorX)
min(vetorX)
sd(vetorX)
var(vetorX)
median(vetorX)
quantile(vetorX,0.25)
quantile(vetorX,0.50)
quantile(vetorX,0.75)
quantile(vetorX,0.90)
quantile(vetorX,1)
summary(vetorX)

In [None]:
# Exercício
print("Exercício: Escreva um Programa similar ao anterior para vetorY e vetorZ")
vetorY <- c(5,20,40,50,55,70,80,80,90,100)
vetorZ <- c(10,20,30,40,50,60,70,80,90)
# escrever o programa


# Gráficos estatísticos básicos em R
- Gráficos de linha
- plot(vetorX), plot(vetorX, vetorY), plot(vetorY~vetorX) - Gráficos de pontos 
- hist(vetorX) - Histogramas
- boxplot(vetorX, vetorLabels) - Gráficos de box
- barplot(vetorX)

In [None]:
riqueza <- c(15,18,22,24,25,30,31,34,37,39,41,45)
area <- c(2,4.5,6,10,30,34,50,56,60,77.5,80,85)
area
area.cate <- rep(c("pequeno", "grande"), each=6)
area.cate


In [None]:
plot(riqueza~area)
plot(area,riqueza) # o mesmo que o anterior
boxplot(riqueza~area.cate)
barplot(riqueza)

In [None]:
#hist(riqueza)
hist(dado[dado$ano_ingresso == 2014,]$nota)


In [None]:
alunos_ativos <- subset(dado, ano_ingresso==2014 & status=="ATIVO" & status.disciplina == "Aprovado")
hist(alunos_ativos$nota)

DICA: Como Salvar Gráficos em formatos importantes
- Formatos: pdf(),png(),svg(),jpeg(),…, LaTeX


In [None]:
print("Exemplo de como salvar um gráfico no formato .pdf")
n <- rnorm(1000)
pdf("myplot.pdf")
plot(n)
dev.off()

#  Distribuições estatísticas discretas e contínuas (modelos) em R

Distribuição Uniforme
- dunif(x, min=0, max=1, opções); fornece a probabilidade dado a quantidade/quartil
- punif(q, min=0, max=1, opções); fornece a densidade
- qunif(p, min=0, max=1, opções); fornece a distribuição
- runif(n, min=0, max=1); gera n amostras seguindo uma Distribuição Uniforme, com defaults mínimo igual 0 e máximo
    - x: vetor contendo os quantis.
    - min: limite inferior da distribuição.
    - max: limite superior da distribuição.
    - q: vetor contendo os quantis.
    - p: vetor contendo as probabilidades.
    - n: número de observações.

In [None]:
?punif

In [None]:
a <- runif(100000, min = 0, max = 10)
mean(a)
var(a)
sd(a)
min(a)
max(a)
quantile(a,0.5)
summary(a)
#plot(a)
hist(a)
plot(dunif(a))
# a

In [None]:
b<- dunif(a, min = 0, max = 1)
plot(b)
c <- punif(a, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
hist(c)

d <- qunif(c, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
hist(d)

In [None]:
u <- runif(20)
u
## The following relations always hold :
punif(u) == u
dunif(u) == 1

Como obter uma distribuição discreta via uma distribuição uniforme
- Gerar uma distribuição de Bernoulli a apartir de uma distribuição uniforme
    - Seja a VA X com distribuição uniforme U entre 0 e 1: X~U(0,1).
    - Então: X=1; U < p e X=0; U > = p

In [None]:
print("Programa para gerar uma distribuição de Bernoulli, com p= 0.5, a partir de uma distribição uniforme")
p = 0.5
U = runif(1, min = 0, max = 1)
X = (U < p)
print("Sumário de X")
summary(X)
print("Sumário de U")
summary(U)

Programa que simula n lançamento de uma moeda honesta (=0.5)

In [None]:
n = 1000;
U = runif(n, min = 0, max = 1)
toss = U < 0.5
a = numeric(n + 1)
avg = numeric(n)
for(i in 2 : n + 1)
{
a[i] = a[i-1] + toss[i-1]
avg[i-1] = a[i]/(i-1)
}
plot(1 : n, avg[1 : n], type = "l", lwd = 5, col = "blue", ylab = "ProportionofHeads",
xlab = "CoinT ossNumber", cex.main = 1.25, cex.lab = 1.5, cex.axis = 1.75)

In [None]:
n = 100;
U = runif(n, min = 0, max = 1)
toss = U < 0.5
a = numeric(n + 1)
avg = numeric(n)
for(i in 2 : n + 1)
{
a[i] = a[i-1] + toss[i-1]
avg[i-1] = a[i]/(i-1)
}
plot(1 : n, avg[1 : n], type = "l", lwd = 5, col = "blue", ylab = "ProportionofHeads",
xlab = "CoinT ossNumber", cex.main = 1.25, cex.lab = 1.5, cex.axis = 1.75)

In [None]:
# Código similar ao anterior

n = 1000;
U = runif(n, min = 0, max = 1)
vez = numeric(n)
media_acumulada = numeric(n)

for(i in 1 : n)
{
 if(U[i] <0.5)  vez[i] <- 1  
 if (i == 1) {media_acumulada <- vez[i]}
    
 else
    {media_acumulada[i] <- ( (i-1) * media_acumulada[i-1] + vez[i] ) / i}
 }
    
plot(1 : n, media_acumulada[1 : n], type = "l", lwd = 5, col = "blue", ylab = "ProportionofHeads",
xlab = "CoinT ossNumber", cex.main = 1.25, cex.lab = 1.5, cex.axis = 1.75)

In [None]:
# Código similar ao anterior

n = 1000;
U = runif(n, min = 0, max = 1)
X = round(U)

media_acumulada = numeric(n);

for(i in 1 : n)  media_acumulada[i] <- sum(X[1:i])/i
    
plot(1 : n, media_acumulada[1 : n], type = "l", lwd = 5, col = "blue", ylab = "ProportionofHeads",
xlab = "CoinT ossNumber", cex.main = 1.25, cex.lab = 1.5, cex.axis = 1.75)


In [None]:
# Cálculo da variância para os n pontos

n = 1000;
U = runif(n, min = 0, max = 1)
X = round(U)

media_acumulada = numeric(n);
segundoMomento_acumulado = numeric(n);
variancia_acumulada = numeric(n);

for(i in 1 : n) {
 media_acumulada[i] <- sum(X[1:i])/i
 segundoMomento_acumulado[i] <- sum(X[1:i]*X[1:i])/i   
}
variancia_acumulada = segundoMomento_acumulado - media_acumulada*media_acumulada
    
plot(1 : n, variancia_acumulada[1 : n], type = "l", lwd = 5, col = "blue", ylab = "ProportionofHeads",
xlab = "CoinT ossNumber", cex.main = 1.25, cex.lab = 1.5, cex.axis = 1.75)

#variancia_estimada <- variancia_acumulada[n] /seq(1, n, by=1)
#plot(1 : n, variancia_estimada[1 : n], type = "l", lwd = 5, col = "blue", ylab = "ProportionofHeads",
#xlab = "CoinT ossNumber", cex.main = 1.25, cex.lab = 1.5, cex.axis = 1.75)

#hist(media_acumulada) # a estimativa é uma VA com distribuiçào Normal
    
#mean(media_acumulada)   
#var(media_acumulada)   

Exercício 01:
    - Escreva um programa que simule 10000 lançamentos de um dado honesto.
    - Calcule média, variância, valor máximo, valor mínimo. Compare com os valores teóricos.
    - Plot o histograma.

In [None]:
print("Programa de simulação de lançamento de dado")


Como obter uma distribuição discreta via uma distribuição uniforme
- Gerar uma distribuição de Binomial.
- Lema: se X1; X2; ...; Xn são VA independentes seguindo distribuição de Bernoulli(p), então a VA X = X1 + X2 + ... + Xn segue uma distribuição Binomial(n; p).

Exercício 02:
- Gere 1000 amostras seguindo uma distribuição Binomial(50,0.2).
- Calcule sua média, variância e desvio padrão. Compare com os valores teóricos.
- Gere o histograma.

In [None]:
print("Programa que gerar 1000 amostras seguindo uma distribuição Binomial(50,0.2)")


Como obter uma distribuição contínua via uma distribuição uniforme?
- Utilizar o método da transformação inversa
- No caso, para transformar uma distribuição uniforme X~Unif(0,1) em uma distribuição exponencial decrescente, utiliza-se -ln(U). 

In [None]:
U <- runif(1000, min = 0, max = 1)
X <- -log(U)
print("Sumário de U")
summary(U)
print("Sumário de X")
summary(X)
#plot(U)
hist(U)
#plot(X)
hist(X)

Exercício 3:
- Gere 1000 amostras seguindo uma distribuição exponencial de média 2. Dica: Pode-se utilizar variância (produto) ou média (soma). 
- Calcule sua média, variância e desvio padrão. Compare com os valores teóricos.
- Gere o seu histograma.

In [None]:
print("Escreva o programa aqui")

Como obter um distribuição contínua via uma distribuição uniforme?
- Distribuição Gama
    - Teorema: Sejam n V.A. independentes (X1;X2;    ;Xn) seguindo dsitribuições exponenciais com média "lambda". Então, a V.A. Y (Y = X1 + X2 +    + Xn) segue uma distribuição Gama, com parâmetros "n" e "lambda". Y~Gamma(n,lambda).

- Exercício:
    - Gere 1000 amostras seguindo uma distribuição Gamma(20,1).
    - Calcule sua média, variância e desvio padrão. Compare com os valores teóricos.
    - Gere o seu histograma.
    

In [None]:
print("Escrever o Programa aqui....")
print("Programa para Gerar Distribuição Gama via uma distribuição Uniforme")

Desafio: Como obter uma distribuição de Poisson via distribuição uniforme?
- ?????

In [None]:
print("Programa para Gerar Distribuição de Poisson via uma distribuição Uniforme")

Como obter um distribuição contínua via uma distribuição uniforme?
- Distribuição Gaussiana (Via algoritmo de Box-Muller)


In [None]:
print("Programa que gera 500 amostras seguindo Distribuição Gaussiana via uma distribuição Uniforme - Algoritmo de Box=Muller")
n = 50000
U1 = runif(n, min = 0, max = 1)
U2 = runif(n, min = 0, max = 1)
Z1 = sqrt(-2 * log(U1)) *  cos(2 *  pi *  U2)
Z2 = sqrt(-2 * log(U1)) * sin(2 *  pi *  U2)
hist(Z1, col = "wheat", label = T)
summary(Z1)
summary(Z2)
var(Z1)
var(Z2)

# Distribuições Discretas Importantes

R já possui as distribuições mais importantes;
- Binomial:
    - dbinom(x, n, p, opções)
    - pbinom(q, n, p, opções)
    - qbinom(prob, n, p, opções)
    - rbinom(num_amostras, n, p)
        - x: vetor contendo o número total de sucessos em n ensaios de Bernoulli.
        - p: probabilidade de sucesso.
        - q: vetor contendo os quantis em n ensaios de Bernoulli.
        - prob: vetor contendo as probabilidades em n ensaios de Bernoulli.
        - num_amostras: número de observações.
        - n: número de ensaios de Bernoulli.
- Geométrica
    - dgeom(x, prob, opções)
    - pgeom(q, prob, opções)
    - qgeom(p, prob, opções)
    - rgeom(n, prob)
        - x: vetor contendo o número de falhas ocorridas em uma sequência de Bernoulli antes do sucesso.
        - prob: probabilidade de sucesso em cada tentativa.
        - q: vetor contendo os quantis
        - p: vetor contendo as probabilidades
        - n: número de observações.
- Hipergeométrica
    - dhyper(x, m, n, k, opções)
    - phyper(q, m, n, k, opções)
    - qhyper(p, m, n, k, opções)
    - rhyper(nn, m, n, k)
        - x: vetor contendo o número de elementos com a característica A extraídos sem reposição de uma urna que contém elementos com aracterísticas A e B.
        - cm: número de elementos com a característica A.
        - n: número de elementos com a característica B.
        - k: número de elementos extraídos da urna.
        - q: vetor contendo os quantis.
        - p: vetor contendo as probabilidades.
        - nn: número de observações.
- Poisson
    - dpois(x, lambda, opções)
    - ppois(q, lambda, opções)
    - qpois(prob, lambda, opções)
    - rpois(obs, lambda)
        - x: vetor contendo o número de ocorrências.
        - lambda: número médio de eventos ocorrendo no intervalo considerado.
        - q: vetor contendo os quantis.
        - prob: vetor contendo as probabilidades.
        - obs: número de observações.

Exercício: Distribuição Binomial
- Escreva uma programa que plote as fpds das seguintes distribuições Binomiais: 
    - binomial(10,0.3), binomial(10,0.6)
    - binomial(20,0.3), binomial(20,0.6)

In [None]:
print("Escreva o Programa com distribuição Binomial")


Exercício: Distribuição Binomial
- Escreva um programa que gere 10.000 amostras segundo uma distribuição binomial(m,p).
- Obter o seu histograma, média e variância e compare com os valores teóricos.

In [None]:
print("Escreva o Programa com distribuição Binomial")

Exercício: Distribuição Geométrica
- Em construção
- ...

In [None]:
print("Programa com distribuição Geométrica")
print("Em construção ...")

Exercício: Distribuição Hipergeométrica
- Em construção
- ...

In [None]:
print("Programa com distribuição Hipergeométrica")
print("Em construção ...")

Exercício: Distribuição Poisson
- Escreva um programa que plote as fpds da distribuição de Poisson com lambda= 1, 5 e 10. 

In [None]:
print("Escreva o Programa aqui")

Exercício: Dsitribuição de Poisson
- Escreva um programa que gere 10.000 amostras segundo uma distribuição de poisson(lambda).
- Obter o seu histograma, média e variância e compare com os valores teóricos.


In [None]:
print("Escreva o Programa aqui")


# Distribuições Contínuas Importantes

R já possui as distribuições mais importantes.
- Uniforme:
    - dunif(x, min=0, max=1, opções); fornece a probabilidade dado a quantidade/quartil
    - punif(q, min=0, max=1, opções); fornece a densidade
    - qunif(p, min=0, max=1, opções); fornece a distribuição
    - runif(n, min=0, max=1); gera n amostras seguindo uma Distribuição Uniforme, com defaults mínimo igual 0 e máximo
        - x: vetor contendo os quantis.
        - min: limite inferior da distribuição.
        - max: limite superior da distribuição.
        - q: vetor contendo os quantis.
        - p: vetor contendo as probabilidades.
        - n: número de observações.
- Exponencial
    - dexp(x, rate=1, opções)
    - pexp(q, rate=1, opções)
    - qexp(p, rate=1, opções)
    - rexp(n, rate = 1)
        - x: vetor contendo os quantis.
        - rate: parâmetro da distribuição.
        - q: vetor contendo os quantis.
        - p: vetor contendo as probabilidades.
        - n: número de observações.
            
- Gaussiana (Normal)
    - dnorm(x, mean=0, sd=1, opções)
    - pnorm(q, mean=0, sd=1, opções)
    - qnorm(p, mean=0, sd=1, opções)
    - rnorm(n, mean=0, sd=1)
        - x: vetor contendo os quantis.
        - mean: média da distribuição.
        - sd: desvio padrão da distribuição.
        - q: vetor contendo os quantis.
        - p: vetor contendo as probabilidades.
        - n: número de observações.    
- Gama:
    - dgamma(x, shape, rate = 1, opções)
    - pgamma(q, shape, rate = 1, opções)
    - qgamma(p, shape, rate = 1, opções)
    - rgamma(n, shape, rate = 1)
        - x: vetor contendo os quantis.
        - shape: parâmetro da distribuição.
        - rate: parâmetro da distribuição.
        - q: vetor contendo os quantis.
        - p: vetor contendo as probabilidades.
        - n: número de observações.
        
- Qui-quadrado
    - dchisq(x, df, ncp=0, opções)
    - pchisq(q, df, ncp=0, opções)
    - qchisq(p, df, ncp=0, opções)
    - rchisq(n, df, ncp=0)
        - x: vetor contendo os quantis.
        - df: graus de liberdade.
        - ncp: parâmetro de não centralidade.
        - q: vetor contendo os quantis.
        - p: vetor contendo as probabilidades.
        - n: número de observações.
- Student
    - dt(x, df, ncp=0, opções)
    - pt(q, df, ncp=0, opções)
    - qt(p, df, opções)
    - rt(n, df)
        - x: vetor contendo os quantis.
        - df: graus de liberdade.
        - ncp: parâmetro de não centralidade.
        - q: vetor contendo os quantis.
        - p: vetor contendo as probabilidades.
        - n: número de observações.
        
- F-Snedecor
    - df(x, df1, df2, opções)
    - pf(q, df1, df2, ncp=0, opções)
    - qf(p, df1, df2, opções)
    - rf(n, df1, df2)
        - x: vetor contendo os quantis.
        - df1: graus de liberdade do numerador.
        - df2: graus de liberdade do denominador.
        - q: vetor contendo os quantis.
        - ncp: parâmetro de não centralidade.
        - p: vetor contendo as probabilidades.
        - n: número de observações.



# Exercícios com Distribuição Exponencial

Exponencial

    dexp(x, rate=1, opções)
    pexp(q, rate=1, opções)
    qexp(p, rate=1, opções)
    rexp(n, rate = 1)
        x: vetor contendo os quantis.
        rate: parâmetro da distribuição.
        q: vetor contendo os quantis.
        p: vetor contendo as probabilidades.
        n: número de observações.



In [None]:
a1 <- rexp(10000,rate=.5)
mean(a1)
var(a1)
sd(a1)
hist(a1)


In [None]:
a2 <- rexp(10000,rate=.9)
mean(a2)
var(a2)
sd(a2)
hist(a2)

Exercício - Plote o gráfico teórico da distribuição exponencial de rate = .9. Sobreponha esse gráfico ao histograma do programa anterior.


In [None]:
print("Escreva o programa aqui.")

Exercício - Reprodução o gráfico da Figura 4.5 do livro texto.

In [None]:
print("Escreva o programa aqui.")

# Exercícios com Distribuição Gaussiana - Normal

Exercício: Soma de distribuições uniformes
- Seja a V.A. Y, dada por Y = X1, X2, ..., Xn. Onde Xi é uma variável aleatória uniforme entre 0 e 1.
- Gere 10.000 amostras de Y; calcule E[Y], Var[Y] e mediana e apresente seu histograma, para:
    - n=1; n=2, n=3, n=4, ..., n = 12.
- O que ocorre com f(Y) a madida que n aumenta?
- Como se pode gerar uma V.A. Z~N(0,1)?

In [None]:
print("Escreva o programa aqui")

x1<- runif(1000000)
x2<- runif(1000000)
x3<- runif(1000000)
x4<- runif(1000000)
x5<- runif(1000000)
x6<- runif(1000000)
x7<- runif(1000000)
x8<- runif(1000000)

Y <- x1 + x2 + x3 + x4 + x5 + x6 +x7 +x8

mean(Y)
var(Y)
hist(Y)

In [None]:
print("Escreva o programa aqui")

Y <- numeric(1000000)

for(i in 1:12)
{
 Y <- Y + runif(1000000)    
}
 print("Valores de Y2")
mean(Y)
var(Y)
summary(Y)
hist(Y)

Exercício: Distribuição de Gaussiana
- Plot o gráfico de f(x), para X~N(0,1)

In [None]:
print("Programa que plota uma função densidade de probabilidade gaussiana, com média 0 e variância 1")
x <- seq(-6, 6, by=0.1)
y <- dnorm(x)
plot(x, y, type="l")

Exercício 04: Distribuição de Gaussiana
- Generalize o programa anterior para X~N(mi,sigma)
    - teste com vários valores de mi e sigma. Sendo sigma > 0.

In [None]:
print("Programa que plota uma função densidade de probabilidade gaussiana, com média mi e variância sigma")

Exercício: Distribuição de Gaussiana
- Pode-se plotar uma f(x) gaussiana via a sua fórmula.

In [None]:
print("Programa que plota uma função densidade de probabilidade gaussiana, com média mi e variância sigma")
sigma <- 1
mi <- 0
X <- seq(-6, 6, by=0.1)
fx = (1/(sigma*sqrt(2*pi)) ) * exp(- (X-mi)*(X-mi)/(2*sigma*sigma))
plot(X, fx, type="l")

In [None]:
print("Programa que plota o histograma e a curva da função densidade gaussiana") 
x=rnorm(100)
hist(x,probability=TRUE,col="lightblue",main="Normal(0,1)",ylab="Densidade", ylim=c(0,0.5),xlim=c(-3,3))
curve(dnorm(x),add=T)

Exercício: Distribuição de Gaussiana
- Teorema: A soma de V.A. gaussianas independentes também é uma distribuição gaussiana.
- Complete o programa a baixo, para:
    - soma de n variáveis (n=3,4,5).
    - calcule média e variância da distribuição resultante. Compare com os valores teóricos.

In [None]:
print("Generalize o programa para some de n VA, com médias e variâncias genéricas")
n = 50000
X1 = rnorm(n,0,1)
X2 = rnorm(n,0,4)
Z = X1 + X2
hist(Z, col = "wheat", label = F)

Exercício: Distribuição de Gaussiana
- Dado uma VA X~N(0,1), obter média, variância e histograma para a Y=a.X+b, quando:
    - (a=2, b=3), (a=2, b=-3), (a=-2, b=3),(a=-2, b=3).
- Compare com os valores teóricos.

In [None]:
print("Programa: distribuição gaussiana genérica")
n = 50000
a = 2
b = 3
X = rnorm(n,0,1)
Y = a * X + b
summary(X)
summary(Y)
str(var(Y))
hist(Y, col = "wheat", label = F)

In [None]:
Exercício: Distribuição de Gaussiana
- Função distribuição gaussiana F(x).
- Utilizar pnorm(vetorX) ou pnorm(valorX)


In [None]:
print("programa que plota uma distribuição gaussiana - Fx - Curva S")
x <- seq(-6, 6, by=0.1)
y <- pnorm(x) # média 0 e variância 1
F0 = pnorm(0)  # F(0)
F1n = pnorm(-1) # F(-1)
F2n = pnorm(-2) # F(-2)
F2 = pnorm(2) # F(2)
F0
F1n
print("Corresponde à área entre +- 2*sigma")
F2-F2n 

plot(x, y, type="l")

Exercício: Distribuição de Gaussiana
- qnorm(.) é a inversa de pnorm(.).
    - q vem de quartil; para gerar o 1o quartil de uma normal de média 5 e desvio-padrão 3, basta fazer qnorm(0.25, mean = 5, sd = 3) (o valor é 2.976531). 
    - quando não se define os outros 2 e 3, assume-se média 0 e variância 1.
    - Analogamente, qnorm() também pode receber um vetor de probabilidades, assim, a sequência abaixo é a inversa da curva-S:

In [None]:
print("Programa exemplificando o uso da função qnorm(.) ")  
x <- seq(0.001, 0.999, length=1000)
y <- qnorm(x)
quartis = qnorm(c(0,0.25,0.5, 0.75, 1.0))
str(quartis)
plot(x, y, type="l")

# Exercícios com Distribuição  Gama
           
- Gama:
    - dgamma(x, shape, rate = 1, opções)
    - pgamma(q, shape, rate = 1, opções)
    - qgamma(p, shape, rate = 1, opções)
    - rgamma(n, shape, rate = 1)
        - x: vetor contendo os quantis.
        - shape: parâmetro da distribuição.
        - rate: parâmetro da distribuição.
        - q: vetor contendo os quantis.
        - p: vetor contendo as probabilidades.
        - n: número de observações.

In [2]:
print("Função Gama - Generalização da função fatorial")
fGama = gamma(3.5)
fGama

[1] "Função Gama - Generalização da função fatorial"


Exercício: Plote num mesmo gráfico as seguintes fdp da distribuição Gama:
- gama(0.5,1)
- gama(2,1)
- gama(3,1)
- gama(4,1)
- gama(5,1)

In [None]:
print("Escreva o programa aqui")


Exercício: Plote a pdf da distribiçã gama(50,1) e analise o resultado.

In [None]:
print("Escreva o programa aqui")

Exercício:
- Dada uma distribuição Gama X~Gama(alfa, lambda), se alfa=1, então essa distribuição se torna uma exponencial.
- Escreva uma programa que trace 03 distribuições gama com alafa =1 e lambda = [.1,0.2, 0.5, 1] e compare com as respectivas exeponenciais. 

In [None]:
print("Escreva o programa aqui")

Exercício: 
- Segundo a teoria, a soma de n VAs independentes seguindo distribuição Gama, também é um distribuição gama.
- Para verificar isto, escreva um programa que obtenha uma VA x que é a soma de 3 VAs independentes (10.000 amostras, cada) que seguem a distribuição gama. Plote o gráfico da fdp de X.

In [None]:
print("Escreva o programa aqui")

# Exercícios com Distribuição  Qui-quadrado

Exercícios: 
- Uma VA X seguindo uma distribuição Qui-quadrado de grau n é a soma do quadrado de n VAs independentes que seguem distribuições normais padrões.
- Escreva um programa que obtenha uma VA seguindo uma distribuição Qui-quadrado de grau n a partir de n VAs normais padrões independentes.
    - Utilize 10.000 amostras para cara VA.
    - plote histograma dessa VA e compare com a correspondente Qui-quadrada.
    - obtenha os valores d emédia e variância e compere os valores teóricos.



In [None]:
print("Escreva o programa aqui")

Exercício:
- Uma distribuição Qui-quadrado com n graus de liberdade corresponde a uma distribuição Gama com parâmetros alfa = n/2 e lambda = 1/2.
- Escreva um programa que trace num mesmo gráfico as fdps de qui-quadrada de grau n e de uma gama(n/,1/2).


In [None]:
print("Escreva o programa aqui")

# Exercícios com Distribuição Student

Exercício:
- Escreva um programa que gere k amostras segundo uma distribuição Student de grau n a partir apenas de distribuições normais padrões.

In [None]:
print("Escreva o programa aqui")

In [None]:
Exercício:
- Escreva um programa que plote num mesmo gráfico as fdps de Student com grau de liberdade 1, 5 e 10. 
- Compare o resultado com a pdf da distribuição normal padrão.