In [17]:
import pandas as pd
import numpy as np
from io import BytesIO
import os
import zipfile
import requests

In [27]:
os.makedirs('./enem2019', exist_ok=True)

In [28]:
url = 'http://download.inep.gov.br/microdados/microdados_enem_2019.zip'
req = requests.get(url).content

In [29]:
filebytes = BytesIO(req)

myzip = zipfile.ZipFile(filebytes)
myzip.extractall('./enem2019')

In [6]:
data = pd.read_csv(
    './enem2019/DADOS/MICRODADOS_ENEM_2019.csv',
    sep = ';',
    decimal = '.',
    encoding='latin-1',
    chunksize=1000
)

In [None]:
enemMG = pd.concat([chunk[chunk['SG_UF_RESIDENCIA'] == "MG"] for chunk in data])

In [11]:
enemMG.SG_UF_RESIDENCIA.describe()

count     538896
unique         1
top           MG
freq      538896
Name: SG_UF_RESIDENCIA, dtype: object

In [12]:
enemMG.to_csv('./enemMG.csv', index = False, sep = ';', decimal = '.')

In [None]:
import psycopg2
from sqlalchemy import create_engine
engine = create_engine('postgresql://postgres:1234@127.0.0.1/enem')

enemMG.to_sql('enem', engine, if_exists='replace', index=False, method='multi')

In [14]:
data = pd.read_csv('./enemMG.csv', sep=';', decimal='.')

Qual é a média da nota em Linguagens e Códigos de todos os alunos mineiros? 

In [20]:
data['NU_NOTA_LC'].mean()

531.2155500475445

Qual é a média da nota em Ciências Humanas dos alunos do sexo FEMININO mineiros?

In [22]:
data[data['TP_SEXO'] == 'F']['NU_NOTA_CH'].mean()

515.1270983575309

Qual é a média da nota em Ciências Humanas dos alunos do sexo MASCULINO?

In [23]:
data[data['TP_SEXO'] == 'M']['NU_NOTA_CH'].mean()

529.6982704731435

Qual é a média da nota em Matemática dos alunos do sexo FEMININO que moram na cidade de Montes Claros? 

In [28]:
data[
    (data['TP_SEXO'] == 'F') &
    (data['NO_MUNICIPIO_RESIDENCIA'] == 'Montes Claros')
]['NU_NOTA_MT'].mean()

525.4776724249903

Qual é a média da nota em Matemática dos alunos do município de Sabará que possuem TV por assinatura na residência? 

In [29]:
data[
    (data['NO_MUNICIPIO_RESIDENCIA'] == 'Sabará') &
    (data['Q021'] == 'B')
]['NU_NOTA_MT'].mean()

543.2927556818181

Qual é a média da nota em Ciências Humanas dos alunos mineiros que possuem dois fornos micro-ondas em casa? 

In [30]:
data[data['Q016'] == 'C']['NU_NOTA_CH'].mean()

557.2765986394558

Qual é a nota média em Matemática dos alunos mineiros cuja mãe completou a pós-graduação? 

In [33]:
data.loc[
    (data['Q002'] == 'G'),
    'NU_NOTA_MT'
].mean()

620.0070620709871

Qual é a nota média em Matemática dos alunos de Belo Horizonte e de Conselheiro Lafaiete? 

In [38]:
data[data['NO_MUNICIPIO_RESIDENCIA'].isin(['Belo Horizonte', 'Conselheiro Lafaiete'])]['NU_NOTA_MT'].mean()

578.0392265100105

Qual é a nota média em Ciências Humanas dos alunos mineiros que moram sozinhos? 

In [39]:
data[data['Q005'] == 1]['NU_NOTA_CH'].mean()

534.4573388609219

Qual é a nota média em Ciências Humanas dos alunos mineiros cujo pai completou Pós graduação e possuem renda familiar entre R$ 8.982,01 e 9.980,00. 

In [40]:
data[
    (data['Q001'] == 'G') &
    (data['Q006'] == 'M')
]['NU_NOTA_CH'].mean()

586.7231663685152

Qual é a nota média em Matemática dos alunos do sexo Feminino que moram em Lavras e escolheram “Espanhol” como língua estrangeira? 

In [41]:
data[
    (data['TP_SEXO'] == 'F') &
    (data['NO_MUNICIPIO_RESIDENCIA'] == 'Lavras') &
    (data['TP_LINGUA'] == 1)
]['NU_NOTA_MT'].mean()

510.8095078299776

Qual é a nota média em Matemática dos alunos do sexo Masculino que moram em Ouro Preto? 

In [42]:
data[
    (data['TP_SEXO'] == 'M') &
    (data['NO_MUNICIPIO_RESIDENCIA'] == 'Ouro Preto')
]['NU_NOTA_MT'].mean()

555.0832520325204

Qual é a nota média em Ciências Humanas dos alunos surdos? 

In [43]:
data.loc[
    (data['IN_SURDEZ'] == 1),
    'NU_NOTA_CH'
].mean()

435.387962962963

Qual é a nota média em Matemática dos alunos do sexo FEMININO, que moram em Belo Horizonte, Sabará, Nova Lima e Betim e possuem dislexia? 

In [44]:
data.loc[
    (data['TP_SEXO'] == 'F') &
    (data['NO_MUNICIPIO_RESIDENCIA'].isin(['Belo Horizonte', 'Sabará', 'Nova Lima', 'Betim'])) &
    (data['IN_DISLEXIA'] == 1),
    'NU_NOTA_MT'
].mean()

582.1935483870968