In [1]:
# Exemplo de caminho: pode ser uma pasta dentro do seu diretório home
# Lembre-se que o R pode adicionar subdiretórios específicos da versão/arquitetura
meu_caminho_biblioteca <- "~/R/library"

# Define a variável de ambiente R_LIBS_USER para a sessão atual
Sys.setenv(R_LIBS_USER = meu_caminho_biblioteca)

# Verifica o valor da variável de ambiente
Sys.getenv("R_LIBS_USER")

# Mostra todos os caminhos de biblioteca que o R está usando
# O seu novo caminho deve aparecer aqui, geralmente como o primeiro da lista.
.libPaths()

In [3]:
################################################################################
#                       MANUAL DE ANÁLISE DE DADOS                             #
#                  Luiz Paulo Fávero e Patrícia Belfiore                       #
#                              Capítulo 03                                     #
################################################################################

################################################################################
#               INSTALAÇÃO E CARREGAMENTO DE PACOTES NECESSÁRIOS               #
################################################################################
# Pacotes utilizados
pacotes <- c("tidyverse", #carregar outros pacotes do R
             "knitr", "kableExtra", #formatação de tabelas
             "sjPlot", #tabelas de contingência
             "DescTools", #diferentes medidas de associação
             "vcd", #diferentes medidas de associação
             "lsr", #coeficiente V de Cramer
             "rcompanion", #coeficiente V de Cramer
             "correlation", #gráfico da correlação de Pearson
             "PerformanceAnalytics", #gráfico da correlação de Pearson com histogramas
             "plotly") #plataforma gráfica

if(sum(as.numeric(!pacotes %in% installed.packages())) != 0){
  instalador <- pacotes[!pacotes %in% installed.packages()]
  for(i in 1:length(instalador)) {
    install.packages(instalador, dependencies = T, lib = meu_caminho_biblioteca)
    break()}
  sapply(pacotes, require, character = T, lib = meu_caminho_biblioteca) 
} else {
  sapply(pacotes, require, character = T, lib = meu_caminho_biblioteca) 
}


“dependency ‘RDCOMClient’ is not available”
also installing the dependencies ‘Deriv’, ‘microbenchmark’, ‘rbibutils’, ‘inline’, ‘QuickJSR’, ‘checkmate’, ‘tensorA’, ‘distributional’, ‘reshape2’, ‘Brobdingnag’, ‘doBy’, ‘Rdpack’, ‘colourpicker’, ‘gtools’, ‘shinyjs’, ‘shinythemes’, ‘threejs’, ‘diffobj’, ‘TH.data’, ‘elliptic’, ‘contfrac’, ‘deSolve’, ‘tweenr’, ‘polyclip’, ‘V8’, ‘reactR’, ‘corrplot’, ‘pcaPP’, ‘effectsize’, ‘rstan’, ‘loo’, ‘posterior’, ‘rstantools’, ‘bayesplot’, ‘bridgesampling’, ‘future.apply’, ‘matrixStats’, ‘nleqslv’, ‘coda’, ‘abind’, ‘carData’, ‘Formula’, ‘pbkrtest’, ‘colorspace’, ‘estimability’, ‘numDeriv’, ‘reformulas’, ‘RcppEigen’, ‘minqa’, ‘mnormt’, ‘shinystan’, ‘RcppParallel’, ‘StanHeaders’, ‘BH’, ‘mitools’, ‘RcppArmadillo’, ‘brio’, ‘praise’, ‘waldo’, ‘rootSolve’, ‘lmom’, ‘libcoin’, ‘modeltools’, ‘multcomp’, ‘pbapply’, ‘MatrixModels’, ‘hypergeo’, ‘gsl’, ‘ggforce’, ‘igraph’, ‘viridis’, ‘graphlayouts’, ‘bigD’, ‘bitops’, ‘juicyjuice’, ‘markdown’, ‘reactable’, ‘htmlTable’,

In [4]:

################################################################################
#              DESCRIÇÃO E EXPLORAÇÃO DO DATASET 'PlanoSaude'                  #
################################################################################

# Substitua o caminho abaixo pelo diretório correto onde o arquivo está localizado

# 1. Obter o diretório base atual
# digite pwd no terminal para descobrir o seu base_dir, ou teste com getwd() no R
base_dir <- "/workspaces/Stats-In-Codespace"

# 2. Definir o caminho do diretório desejado
caminho_diretorio <- file.path(base_dir, "Aula1", "Cap3-Favero")

# 5. Agora que o diretório garantidamente existe, definir como diretório de trabalho
setwd(caminho_diretorio)

# 6. (Opcional) Verificar se o diretório de trabalho foi alterado com sucesso
print(paste("Diretório de trabalho atual:", getwd()))

# Carregamento da base de dados
load(file = "PlanoSaude.RData")


[1] "Diretório de trabalho atual: /workspaces/Stats-In-Codespace/Aula1/Cap3-Favero"


In [5]:
# Visualização da base de dados
PlanoSaude %>%
  kable() %>%
  kable_styling(bootstrap_options = "striped", 
                full_width = F, 
                font_size = 20)

# Tabela de contingência para as variáveis 'operadora' e 'satisfacao'
table(PlanoSaude$operadora, PlanoSaude$satisfacao)

# Exemplo de uma tabela de contingências mais elegante
sjt.xtab(var.row = PlanoSaude$operadora,
         var.col = PlanoSaude$satisfacao)

# Exemplo de uma tabela de contingências mais elegante, com a distribuição
#conjunta de frequências relativas em relação ao total de cada linha,
#ao total de cada coluna e ao total geral
sjt.xtab(var.row = PlanoSaude$operadora,
         var.col = PlanoSaude$satisfacao,
         show.cell.prc = TRUE, #frequências relativas em relação ao total geral
         show.row.prc = TRUE, #frequências relativas em relação ao total de cada linha
         show.col.prc = TRUE) #frequências relativas em relação ao total de cada coluna

# Medida de associação - estatística qui-quadrado e teste
qui2 <- chisq.test(PlanoSaude$operadora, PlanoSaude$satisfacao)
qui2

qui2$statistic
qui2$parameter
qui2$p.value
qui2$method

# Exemplo de uma tabela de contingências mais elegante, com valores observados
#e esperados
sjt.xtab(var.row = PlanoSaude$operadora,
         var.col = PlanoSaude$satisfacao,
         show.exp = TRUE) #valores esperados

# Valores observados, esperados
qui2$observed #valores observados
qui2$expected #valores esperados
qui2$residuals #Resíduos padronizados
qui2$stdres #Resíduos padronizados ajustados


“'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")”
“'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")”


<table class="table table-striped" style="font-size: 20px; width: auto !important; margin-left: auto; margin-right: auto;">
 <thead>
  <tr>
   <th style="text-align:left;"> operadora </th>
   <th style="text-align:left;"> satisfacao </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:left;"> total health </td>
   <td style="text-align:left;"> baixo </td>
  </tr>
  <tr>
   <td style="text-align:left;"> total health </td>
   <td style="text-align:left;"> baixo </td>
  </tr>
  <tr>
   <td style="text-align:left;"> total health </td>
   <td style="text-align:left;"> baixo </td>
  </tr>
  <tr>
   <td style="text-align:left;"> total health </td>
   <td style="text-align:left;"> baixo </td>
  </tr>
  <tr>
   <td style="text-align:left;"> total health </td>
   <td style="text-align:left;"> baixo </td>
  </tr>
  <tr>
   <td style="text-align:left;"> total health </td>
   <td style="text-align:left;"> baixo </td>
  </tr>
  <tr>
   <td style="text-align:left;"> total health </td>
   <

              
               alto baixo medio
  mena saude      4    24    32
  total health   12    40    16
  viva vida      16    32    24


	Pearson's Chi-squared test

data:  PlanoSaude$operadora and PlanoSaude$satisfacao
X-squared = 15.861, df = 4, p-value = 0.003212


                    PlanoSaude$satisfacao
PlanoSaude$operadora alto baixo medio
        mena saude      4    24    32
        total health   12    40    16
        viva vida      16    32    24

Unnamed: 0,alto,baixo,medio
mena saude,9.6,28.8,21.6
total health,10.88,32.64,24.48
viva vida,11.52,34.56,25.92


                    PlanoSaude$satisfacao
PlanoSaude$operadora       alto      baixo      medio
        mena saude   -1.8073922 -0.8944272  2.2377237
        total health  0.3395499  1.2882577 -1.7139184
        viva vida     1.3199327 -0.4354648 -0.3771236

                    PlanoSaude$satisfacao
PlanoSaude$operadora       alto      baixo      medio
        mena saude   -2.3570226 -1.4824986  3.3432392
        total health  0.4560285  2.1990196 -2.6371097
        viva vida     1.8002057 -0.7548514 -0.5892557

In [6]:

################################################################################
#           DESCRIÇÃO E EXPLORAÇÃO DO DATASET 'Segmentação_Mercado'            #
################################################################################

# Carregamento da base de dados
load(file = "Segmentação_Mercado.RData")

# Visualização da base de dados
Segmentação_Mercado %>%
  kable() %>%
  kable_styling(bootstrap_options = "striped", 
                full_width = F, 
                font_size = 20)

# Coeficiente de contingência
ContCoef(Segmentação_Mercado$roupa, Segmentação_Mercado$regiao, correct = FALSE)

# Coeficiente V de Cramer
cramerV(Segmentação_Mercado$roupa, Segmentação_Mercado$regiao, bias.correct = FALSE)

cramersV(Segmentação_Mercado$roupa, Segmentação_Mercado$regiao)

# Diferentes medidas de associação
Assocs(table(Segmentação_Mercado$roupa, Segmentação_Mercado$regiao))

assocstats(xtabs(~Segmentação_Mercado$roupa + Segmentação_Mercado$regiao))



“'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")”
“'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")”


<table class="table table-striped" style="font-size: 20px; width: auto !important; margin-left: auto; margin-right: auto;">
 <thead>
  <tr>
   <th style="text-align:left;"> roupa </th>
   <th style="text-align:left;"> regiao </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:left;"> gravata </td>
   <td style="text-align:left;"> sul </td>
  </tr>
  <tr>
   <td style="text-align:left;"> camisa polo </td>
   <td style="text-align:left;"> norte </td>
  </tr>
  <tr>
   <td style="text-align:left;"> camisa social </td>
   <td style="text-align:left;"> sul </td>
  </tr>
  <tr>
   <td style="text-align:left;"> calca </td>
   <td style="text-align:left;"> norte </td>
  </tr>
  <tr>
   <td style="text-align:left;"> gravata </td>
   <td style="text-align:left;"> sul </td>
  </tr>
  <tr>
   <td style="text-align:left;"> camisa polo </td>
   <td style="text-align:left;"> centro </td>
  </tr>
  <tr>
   <td style="text-align:left;"> camisa polo </td>
   <td style="text-align:left;"> les

“Chi-squared approximation may be incorrect”


Unnamed: 0,estimate,lwr.ci,upr.ci
Contingency Coeff.,0.69038794,,
Cramer V,0.55097317,0.0,0.6957293
Kendall Tau-b,0.04109685,-0.39524808,0.4774418
Goodman Kruskal Gamma,0.05172414,-0.49752756,0.6009758
Stuart Tau-c,0.04,-0.38476941,0.4647694
Somers D C|R,0.04081633,-0.39231795,0.4739506
Somers D R|C,0.04137931,-0.39790132,0.4806599
Pearson Correlation,0.06514484,-0.38857785,0.4934407
Spearman Correlation,0.06948464,-0.38487028,0.4967317
Lambda C|R,0.30769231,0.0,0.7422475


ERROR: Error in assocstats(xtabs(~Segmentação_Mercado$roupa + Segmentação_Mercado$regiao)): could not find function "assocstats"


In [7]:

################################################################################
#                 DESCRIÇÃO E EXPLORAÇÃO DO DATASET 'Notas'                    #
################################################################################

# Carregamento da base de dados
load(file = "Notas.RData")

# Visualização da base de dados
Notas %>%
  kable() %>%
  kable_styling(bootstrap_options = "striped", 
                full_width = F, 
                font_size = 20)

# Coeficiente de correlação de Spearman
cor.test(Notas$simulação, Notas$finanças, method = "spearman",
         alternative = "two.sided")



“'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")”
“'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")”


<table class="table table-striped" style="font-size: 20px; width: auto !important; margin-left: auto; margin-right: auto;">
 <thead>
  <tr>
   <th style="text-align:right;"> simulação </th>
   <th style="text-align:right;"> finanças </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:right;"> 5 </td>
   <td style="text-align:right;"> 6 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 7 </td>
   <td style="text-align:right;"> 5 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 8 </td>
   <td style="text-align:right;"> 8 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 6 </td>
   <td style="text-align:right;"> 9 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 4 </td>
   <td style="text-align:right;"> 2 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 2 </td>
   <td style="text-align:right;"> 4 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 10 </td>
   <td style="text-align:right;"> 7 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 


	Spearman's rank correlation rho

data:  Notas$simulação and Notas$finanças
S = 40, p-value = 0.01592
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.7575758 


In [8]:

################################################################################
#              DESCRIÇÃO E EXPLORAÇÃO DO DATASET 'Renda_Estudo'                #
################################################################################

# Carregamento da base de dados
load(file = "Renda_Estudo.RData")

# Visualização da base de dados
Renda_Estudo %>%
  kable() %>%
  kable_styling(bootstrap_options = "striped", 
                full_width = F, 
                font_size = 20)

# Diagrama de dispersão
ggplotly(
  ggplot(Renda_Estudo, aes(x = anosdeestudo, y = rendafamiliar)) +
    geom_point(color = "darkblue", size = 2.5) +
    xlab("Anos de Estudo") +
    ylab("Renda Familiar") +
    theme_light()
)

# Medidas de correlação
# Covariância
cov(Renda_Estudo$rendafamiliar, Renda_Estudo$anosdeestudo)

# Coeficiente de correlação de Pearson
cor(Renda_Estudo$rendafamiliar, Renda_Estudo$anosdeestudo)

# Gráfico da correlação de Pearson
Renda_Estudo %>% 
  correlation(method = "pearson") %>%
  plot()

# Gráfico da correlação de Pearson com histogramas das variáveis
chart.Correlation(Renda_Estudo, histogram = TRUE)

################################################################################

“'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")”
“'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")”


<table class="table table-striped" style="font-size: 20px; width: auto !important; margin-left: auto; margin-right: auto;">
 <thead>
  <tr>
   <th style="text-align:right;"> rendafamiliar </th>
   <th style="text-align:right;"> anosdeestudo </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:right;"> 1961 </td>
   <td style="text-align:right;"> 7.6 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 4180 </td>
   <td style="text-align:right;"> 8.4 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 1093 </td>
   <td style="text-align:right;"> 5.8 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 1311 </td>
   <td style="text-align:right;"> 6.8 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 1248 </td>
   <td style="text-align:right;"> 7.0 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 2359 </td>
   <td style="text-align:right;"> 8.0 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 2400 </td>
   <td style="text-align:right;"> 8.4 </td>
  </tr>

ERROR: Error in pm[[2]]: subscript out of bounds
