<a href="https://colab.research.google.com/github/barbaradinizabreu/pesquisa-subjetividade/blob/main/R_Coleta_tratamento_dados_PNAD.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Notebook criado apenas para ser um rascunho e facilitar a coleta, tratamento e análise exploratória dos dados

Documentação: https://www.rdocumentation.org/



**Dicas** (em Python):

[Microdados em Python: um pacote para ler dados da PNAD e POF](https://medium.com/data-hackers/microdados-em-python-um-pacote-para-ler-dados-da-pnad-e-pof-e254cf18477d)

[Como ler dados da PNS 2019 usando Python por meio do Google Colab](https://www.youtube.com/watch?v=k4fCnep7WlA) *não é o mesmo bando de dados, mas é parecido

# Básico

In [None]:
#pacotes necessários
install.packages("dplyr")
install.packages("PNADcIBGE")

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)



In [None]:
#carregar pacotes
library(dplyr)
library(survey)
library(PNADcIBGE)

# Dados

In [None]:
dados_2023_3 <- get_pnadc(year=2023, quarter=3, design=FALSE, labels=TRUE)

`design = FALSE` retorna um tibble (uma espécie de dataframe do R), `TRUE` retorna um survey

Adicionar parâmetro `vars` para importar apenas as variáveis necessárias, por default todas são importadas

Exemplo:

    variaveis_selecionadas <- c("UF","V2001","V2005","V2007")
    
    dadosPNADc <- get_pnadc(year=2017, quarter=4, vars=variaveis_selecionadas)

In [None]:
#nome das variáveis
names(dados_2023_3)

In [None]:
head(dados_2023_3)

Ano,Trimestre,UF,Capital,RM_RIDE,UPA,Estrato,V1008,V1014,V1016,⋯,V1028194,V1028195,V1028196,V1028197,V1028198,V1028199,V1028200,ID_DOMICILIO,Habitual,Efetivo
<chr>,<chr>,<fct>,<fct>,<fct>,<chr>,<chr>,<chr>,<chr>,<chr>,⋯,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,<dbl>,<dbl>
2023,3,Rondônia,Município de Porto Velho (RO),,110000016,1110011,1,10,4,⋯,325.8103,291.3309,314.8075,0,0,667.2974,0,1100000160110,1.074869,1.079602
2023,3,Rondônia,Município de Porto Velho (RO),,110000016,1110011,1,10,4,⋯,325.8103,291.3309,314.8075,0,0,667.2974,0,1100000160110,1.074869,1.079602
2023,3,Rondônia,Município de Porto Velho (RO),,110000016,1110011,2,10,4,⋯,180.1475,159.1869,169.3841,0,0,342.5645,0,1100000160210,1.074869,1.079602
2023,3,Rondônia,Município de Porto Velho (RO),,110000016,1110011,3,10,4,⋯,382.0095,339.4889,355.9152,0,0,702.6023,0,1100000160310,1.074869,1.079602
2023,3,Rondônia,Município de Porto Velho (RO),,110000016,1110011,3,10,4,⋯,382.0095,339.4889,355.9152,0,0,702.6023,0,1100000160310,1.074869,1.079602
2023,3,Rondônia,Município de Porto Velho (RO),,110000016,1110011,4,10,4,⋯,249.5689,224.9099,234.4539,0,0,497.1048,0,1100000160410,1.074869,1.079602


In [None]:
str(dados_2023_3)

tibble [479,873 × 423] (S3: tbl_df/tbl/data.frame)
 $ Ano         : chr [1:479873] "2023" "2023" "2023" "2023" ...
 $ Trimestre   : chr [1:479873] "3" "3" "3" "3" ...
 $ UF          : Factor w/ 27 levels "Rondônia","Acre",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ Capital     : Factor w/ 27 levels "Município de Porto Velho (RO)",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ RM_RIDE     : Factor w/ 21 levels "Região Metropolitana de Manaus (AM)",..: NA NA NA NA NA NA NA NA NA NA ...
 $ UPA         : chr [1:479873] "110000016" "110000016" "110000016" "110000016" ...
 $ Estrato     : chr [1:479873] "1110011" "1110011" "1110011" "1110011" ...
 $ V1008       : chr [1:479873] "01" "01" "02" "03" ...
 $ V1014       : chr [1:479873] "10" "10" "10" "10" ...
 $ V1016       : chr [1:479873] "4" "4" "4" "4" ...
 $ V1022       : Factor w/ 2 levels "Urbana","Rural": 1 1 1 1 1 1 1 1 1 1 ...
 $ V1023       : Factor w/ 4 levels "Capital","Resto da RM (Região Metropolitana, excluindo a capital)",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ V10

`factor` representa variáveis categórias

`%>%` significa `e então`

**Algumas funções interessantes do pacote `dplyr`**

`mutate()`: adiciona novas variáveis em função de variáveis existentes ou não

`select()`: possibilita a escolha de variáveis com base em seus nomes, para
serem mantidas ou excluídas do conjunto de dados

`filter()`: permite escolher casos com base em seus valores, podendo ser utilizado para variáveis categóricas, contínuas ou uma combinação de distintos
tipos de variáveis

`summarise()`: possibilita a criação/transformação de variáveis por meio de uma
fórmula de cálculo predefinida

`arrange()`: permite alterar/reordenar as linhas de um conjunto de dados

`group_by()`: possibilita que se execute qualquer uma dessas operações “por
grupo”

[Fonte](https://repositorio.ufrn.br/server/api/core/bitstreams/a8aa616a-51aa-416d-a26b-8b420e61cd78/content)

In [None]:
dados_2023_3 %>%
  filter(UF == "Minas Gerais")

Ano,Trimestre,UF,Capital,RM_RIDE,UPA,Estrato,V1008,V1014,V1016,⋯,V1028194,V1028195,V1028196,V1028197,V1028198,V1028199,V1028200,ID_DOMICILIO,Habitual,Efetivo
<chr>,<chr>,<fct>,<fct>,<fct>,<chr>,<chr>,<chr>,<chr>,<chr>,⋯,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,<dbl>,<dbl>
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,01,10,5,⋯,634.2538,0.0000,685.3165,0,696.6791,0,687.2363,3100412100110,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,01,10,5,⋯,634.2538,0.0000,685.3165,0,696.6791,0,687.2363,3100412100110,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,02,10,5,⋯,936.5501,0.0000,943.7046,0,973.6742,0,980.2739,3100412100210,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,02,10,5,⋯,936.5501,0.0000,943.7046,0,973.6742,0,980.2739,3100412100210,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,03,10,5,⋯,545.7090,0.0000,546.7870,0,576.3776,0,564.9423,3100412100310,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,03,10,5,⋯,545.7090,0.0000,546.7870,0,576.3776,0,564.9423,3100412100310,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,04,10,5,⋯,578.6639,0.0000,537.8354,0,533.8028,0,586.3673,3100412100410,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,05,10,5,⋯,687.6341,0.0000,675.2866,0,708.8784,0,695.8344,3100412100510,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,05,10,5,⋯,687.6341,0.0000,675.2866,0,708.8784,0,695.8344,3100412100510,1.092827,1.092867
2023,3,Minas Gerais,Município de Belo Horizonte (MG),Região Metropolitana de Belo Horizonte (MG),310041210,3110111,06,10,5,⋯,697.8622,0.0000,706.2825,0,734.7967,0,700.5706,3100412100610,1.092827,1.092867


In [None]:
dados_2023_4 <- get_pnadc(year=2023, quarter=4, design=FALSE, labels=TRUE)

In [None]:
head(dados_2023_4)

Ano,Trimestre,UF,Capital,RM_RIDE,UPA,Estrato,V1008,V1014,V1016,⋯,V1028194,V1028195,V1028196,V1028197,V1028198,V1028199,V1028200,ID_DOMICILIO,Habitual,Efetivo
<chr>,<chr>,<fct>,<fct>,<fct>,<chr>,<chr>,<chr>,<chr>,<chr>,⋯,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,<dbl>,<dbl>
2023,4,Rondônia,Município de Porto Velho (RO),,110000016,1110011,1,10,5,⋯,0,0,0,674.4751,358.9703,292.6587,690.8893,1100000160110,1.066214,1.069236
2023,4,Rondônia,Município de Porto Velho (RO),,110000016,1110011,1,10,5,⋯,0,0,0,674.4751,358.9703,292.6587,690.8893,1100000160110,1.066214,1.069236
2023,4,Rondônia,Município de Porto Velho (RO),,110000016,1110011,2,10,5,⋯,0,0,0,378.2262,197.1772,158.5968,357.2602,1100000160210,1.066214,1.069236
2023,4,Rondônia,Município de Porto Velho (RO),,110000016,1110011,3,10,5,⋯,0,0,0,758.636,399.4156,310.5126,754.6056,1100000160310,1.066214,1.069236
2023,4,Rondônia,Município de Porto Velho (RO),,110000016,1110011,3,10,5,⋯,0,0,0,758.636,399.4156,310.5126,754.6056,1100000160310,1.066214,1.069236
2023,4,Rondônia,Município de Porto Velho (RO),,110000016,1110011,4,10,5,⋯,0,0,0,529.4532,277.0949,230.3452,541.0158,1100000160410,1.066214,1.069236
