# Análise Estatística com R

Este notebook demonstra várias medidas estatísticas e gráficos usando uma amostra de dados sobre distribuição de renda e qualidade de vida no Brasil. Além disso, abordaremos conceitos de variáveis, estruturas de controle, operadores lógicos e relacionais, classes, herança e polimorfismo.

In [None]:
# Carregar bibliotecas necessárias
library(ggplot2)
library(dplyr)
library(readr)
library(tidyr)
library(corrplot)

## Buscar e formatar dados

Vamos buscar dados da internet, formatá-los e criar uma tabela CSV.

In [None]:
# Buscar dados da internet
url <- 'https://raw.githubusercontent.com/datasets/income-distribution/master/data/income-distribution.csv'
dados <- read_csv(url)

# Filtrar dados para o Brasil
dados_brasil <- dados %>% filter(Country == 'Brazil')

# Selecionar colunas relevantes
dados_brasil <- dados_brasil %>% select(Year, Income, Population)

# Renomear colunas
colnames(dados_brasil) <- c('Ano', 'Renda', 'Populacao')

# Criar coluna de qualidade de vida (exemplo fictício)
set.seed(123)
dados_brasil$Qualidade_Vida <- runif(nrow(dados_brasil), min=0, max=100)

# Salvar dados em um arquivo CSV
write_csv(dados_brasil, 'dados_renda_qualidade_vida.csv')

# Visualizar os primeiros registros
head(dados_brasil)

## Carregar e visualizar os dados

Vamos carregar a tabela CSV criada e visualizar os dados.

In [None]:
# Carregar os dados
dados <- read_csv('dados_renda_qualidade_vida.csv')

# Visualizar os primeiros registros
head(dados)

## Variáveis

Em R, variáveis são usadas para armazenar dados. Vamos criar algumas variáveis de exemplo.

In [None]:
# Variáveis
inteiro <- 10
flutuante <- 5.5
caractere <- 'A'
texto <- 'Olá, mundo!'

# Exibir variáveis
inteiro
flutuante
caractere
texto

## Estruturas de Controle

### Decisão

Estruturas de controle de decisão permitem executar diferentes blocos de código com base em condições.

In [None]:
# Estruturas de Controle - Decisão
x <- 10

if (x > 5) {
  print('x é maior que 5')
} else {
  print('x é menor ou igual a 5')
}

### Repetição

Estruturas de controle de repetição permitem executar um bloco de código várias vezes.

In [None]:
# Estruturas de Controle - Repetição
for (i in 1:5) {
  print(i)
}

## Operadores Lógicos e Relacionais

Operadores lógicos e relacionais são usados para comparar valores e combinar condições.

In [None]:
# Operadores Lógicos e Relacionais
a <- 10
b <- 20

# Operadores relacionais
a < b
a > b
a == b
a != b

# Operadores lógicos
a < b & a == 10
a > b | a == 10

## Classes, Herança e Polimorfismo

Em R, podemos definir classes e métodos para criar objetos e aplicar conceitos de herança e polimorfismo.

In [None]:
# Definir uma classe Pessoa
Pessoa <- setRefClass('Pessoa',
  fields = list(nome = 'character', idade = 'numeric'),
  methods = list(
    saudacao = function() {
      cat('Olá, meu nome é', nome, 'e eu tenho', idade, 'anos.\n')
    }
  )
)

# Criar um objeto da classe Pessoa
pessoa <- Pessoa$new(nome = 'João', idade = 30)
pessoa$saudacao()

### Herança e Polimorfismo

In [None]:
# Definir uma classe Animal
Animal <- setRefClass('Animal',
  fields = list(nome = 'character'),
  methods = list(
    fazerSom = function() {
      cat(nome, 'faz um som.\n')
    }
  )
)

# Definir uma classe Cachorro que herda de Animal
Cachorro <- setRefClass('Cachorro',
  contains = 'Animal',
  methods = list(
    fazerSom = function() {
      cat(nome, 'late.\n')
    }
  )
)

# Definir uma classe Gato que herda de Animal
Gato <- setRefClass('Gato',
  contains = 'Animal',
  methods = list(
    fazerSom = function() {
      cat(nome, 'mia.\n')
    }
  )
)

# Criar objetos das classes Cachorro e Gato
cachorro <- Cachorro$new(nome = 'Rex')
gato <- Gato$new(nome = 'Mimi')

# Demonstrar polimorfismo
animais <- list(cachorro, gato)
for (animal in animais) {
  animal$fazerSom()
}

## Medidas Estatísticas

### Média

In [None]:
# Calcular a média da renda
media_renda <- mean(dados$Renda)
media_renda

### Mediana

In [None]:
# Calcular a mediana da renda
mediana_renda <- median(dados$Renda)
mediana_renda

### Moda

In [None]:
# Calcular a moda da renda
moda_renda <- as.numeric(names(sort(table(dados$Renda), decreasing=TRUE)[1]))
moda_renda

### Medidas de Dispersão

#### Variância

In [None]:
# Calcular a variância da renda
variancia_renda <- var(dados$Renda)
variancia_renda

#### Desvio Padrão

In [None]:
# Calcular o desvio padrão da renda
desvio_padrao_renda <- sd(dados$Renda)
desvio_padrao_renda

## Gráficos Estatísticos

### Histograma

In [None]:
# Histograma da renda
ggplot(dados, aes(x=Renda)) +
  geom_histogram(binwidth=500, fill='blue', color='black', alpha=0.7) +
  labs(title='Histograma da Renda', x='Renda', y='Frequência')

### Boxplot

In [None]:
# Boxplot da renda
ggplot(dados, aes(y=Renda)) +
  geom_boxplot(fill='orange', color='black', alpha=0.7) +
  labs(title='Boxplot da Renda', y='Renda')

### Gráfico de Dispersão

In [None]:
# Gráfico de dispersão entre renda e qualidade de vida
ggplot(dados, aes(x=Renda, y=Qualidade_Vida)) +
  geom_point(color='red', alpha=0.6) +
  labs(title='Dispersão entre Renda e Qualidade de Vida', x='Renda', y='Qualidade de Vida')

## Regressão Linear

In [None]:
# Regressão linear entre renda e qualidade de vida
modelo <- lm(Qualidade_Vida ~ Renda, data=dados)
summary(modelo)

### Gráfico de Regressão Linear

In [None]:
# Gráfico de regressão linear
ggplot(dados, aes(x=Renda, y=Qualidade_Vida)) +
  geom_point(color='blue', alpha=0.6) +
  geom_smooth(method='lm', color='red') +
  labs(title='Regressão Linear entre Renda e Qualidade de Vida', x='Renda', y='Qualidade de Vida')

## Correlação

In [None]:
# Matriz de correlação
correlacao <- cor(dados %>% select(Renda, Qualidade_Vida))
corrplot(correlacao, method='circle')