<a href="https://colab.research.google.com/github/momentoinesquecivel/Estatistica-Inferencial-Simulacao-Pesquisa-Eleitoral/blob/main/Simula%C3%A7%C3%A3o_de_Pesquisa_Eleitoral.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Metaverso Eleitoral

 A Estatística Inferêncial é a meneira de inferenciar, ou seja, dar a conclusão sobre uma determinada pesquisa populacional usando uma amostra dessa população.

[Exemplo](https://profes.com.br/aulasdeestatistica/blog/o-que-e-estatistica-inferencial): Se eu quero saber se a sopa está boa. Primeiro eu tiro uma concha da sopa(amostra), então eu provo, se a parte que eu peguei da sopa está boa, eu consigo dizer que toda a panela de sopa(população) está boa, e isso é inferência.

Neste projeto, iremos fazer uma estatística inferêncial usando dados "fakes"(Metaverso Eleitoral) para mostrar como é feito uma pesquisa eleitoral, já que a eleição está tão próxima. 

Então iremos analisar como podemos chegar em uma conclusão populacional confiante sobre determinadas pesquisas eleitorais, baseando-se em:
1. <strong>Amostras</strong>.
  Uma parte da população
2. <strong>Margem de erro</strong>. 
  É até onde nossa pesquisa pode "errar", ex: 50% com margem de erro de 2%, nossa pesquisa está entre 48% a 52%.
3. <strong>Intervalo de Confiança</strong>.
  É um intervalo de certeza onde há uma proporção(geralmente, 95%) da população que estára dentro da margem de erro. Ex: Se o intervalo de confiança for de 95% com a margem de erro de 2% para 50% da proporção de escolha da nossa amostra, então 95% da população estará entre 47% a 52% e as outras 5% estará fora da margem.

Quanto maior a margem de erro for, menos amostras iremos precisar para "concluir" a pesquisa. Pois estamos aceitando mais erros

Quanto menor a margem de erro, mais amostras é necessária para concluir a pesquisa.

Projeto by [canal FLAI](https://www.youtube.com/watch?v=kXNp71zhSlo&t=2s)

## Gerar nossa população

In [1]:
import numpy as np

In [2]:
n = 150000000
candidatos = ['A', 'B', 'C', 'D']
# para cada candidato, uma proporção das inteções de voto. Para ter controle do 
# experimento, e ver se nossa simulação está de acordo.
real_proporcao = [0.25, 0.20, 0.40, 0.15]

# para agilizar o processo de proporcao amostral, utilizarei o numpy.
real_proporcao = np.array(real_proporcao)

na, nb, nc, nd = (n*real_proporcao).astype(int)
print(na, nb, nc, nd)


37500000 30000000 60000000 22500000


 Criacao da população

In [3]:
populacao = ['A'] * na + ['B'] * nb + ['C'] * nc + ['D'] * nd

Importar random para tirar nossa amostra

In [7]:
import random
# 2% margem de erro
margem_erro = 0.02

tamanho_amostral = 2401
simulacoes = 100
resultados = []
for i in range(simulacoes):
  pesquisa = random.sample(populacao, k=tamanho_amostral)
  a = pesquisa.count('A')/tamanho_amostral
  b = pesquisa.count('B')/tamanho_amostral
  c = pesquisa.count('C')/tamanho_amostral
  d = pesquisa.count('D')/tamanho_amostral

  erros = np.array([a, b, c, d]) - real_proporcao
  todos = np.all(abs(erros[:2]) < margem_erro)
  resultados.append(todos)

# print("todos estão abaixo da margem de erro?", todos)
# print(pesquisa)
# print(real_proporcao)
# print("proporcao da pesquisa:", a, b, c, d)
# print("erro:", erros)

confianca = np.array(resultados).mean()

print("resultado:", resultados[:5], "...")
print("intervalo de confianca:", confianca)

resultado: [True, True, True, True, True] ...
intervalo de confianca: 0.97


# Conclusão

Esta foi uma simulação de Pesquisa Eleitoral, em que montamos uma real proporção sobre os candidatos ficticios, definimos uma margem de erro, que é até quanto a nossa pesquisa pode errar. Também pudemos ver como é tirado o intervalo de confiança. Que é baseado na contagem de quantas pesquisas deram certo dentro da margem de erro com somente dois candidatos.