### Microdados do ENEM 2017-2023
Os microdados do ENEM podem ser baixados das fontes oficiais a partir das seguintes URLs:

| Ano  | URL |
| ---- | --- |
| 2017 | https://download.inep.gov.br/microdados/microdados_enem_2017.zip |
| 2018 | https://download.inep.gov.br/microdados/microdados_enem_2018.zip |
| 2019 | https://download.inep.gov.br/microdados/microdados_enem_2019.zip |
| 2020 | https://download.inep.gov.br/microdados/microdados_enem_2020.zip |
| 2021 | https://download.inep.gov.br/microdados/microdados_enem_2021.zip |
| 2022 | https://download.inep.gov.br/microdados/microdados_enem_2022.zip |
| 2023 | https://download.inep.gov.br/microdados/microdados_enem_2023.zip |

In [1]:
%pip install pyarrow --quiet

Note: you may need to restart the kernel to use updated packages.


In [2]:
ENCODING = 'windows_1252'
PATH_ENEM = r'Y:\DATASOURCES\enem'
PATH_MD = r'{}\microdados_enem_[ANO]\DADOS'.format(PATH_ENEM)
PERIODO = range(2017, 2023+1)

In [3]:
import pandas as pd
import os
import gc
for p in PERIODO:
  PATH_MD_ANO = PATH_MD.replace('[ANO]', str(p))
  FILE_MD = f'{PATH_MD_ANO}\\MICRODADOS_ENEM_{p}.csv'
  PARQUET_MD = f'{PATH_MD_ANO}\\MICRODADOS_ENEM_{p}.parquet'
  parquet = True
  FEATHER_MD = f'{PATH_MD_ANO}\\MICRODADOS_ENEM_{p}.feather'
  feather = True 
  
  if os.path.exists(PARQUET_MD):
    print(f'MICRODADOS {p} já está convertido em {PARQUET_MD}')
    parquet = False

  if os.path.exists(FEATHER_MD):
    print(f'MICRODADOS {p} já está convertido em {FEATHER_MD}')
    feather = False
    
  if parquet or feather:
    if os.path.exists(FILE_MD):
      print(f'Carregando {FILE_MD}...', end = ' ')
      enem = pd.read_csv(FILE_MD, sep=';', header=0, index_col=False, encoding=ENCODING)
      print('OK')
      if parquet:
        print(f'Salvando {PARQUET_MD} no formato parquet brotli...', end = ' ')
        enem.to_parquet(path=PARQUET_MD, engine='auto', compression='brotli')
        print('OK')
      if feather:
        print(f'Salvando {FEATHER_MD} para o formato feather...', end = ' ')
        enem.to_feather(path=FEATHER_MD)
        print('OK')

      del enem
      gc.collect()
      
  

MICRODADOS 2017 já está convertido em Y:\DATASOURCES\enem\microdados_enem_2017\DADOS\MICRODADOS_ENEM_2017.parquet
MICRODADOS 2017 já está convertido em Y:\DATASOURCES\enem\microdados_enem_2017\DADOS\MICRODADOS_ENEM_2017.feather
MICRODADOS 2018 já está convertido em Y:\DATASOURCES\enem\microdados_enem_2018\DADOS\MICRODADOS_ENEM_2018.parquet
MICRODADOS 2018 já está convertido em Y:\DATASOURCES\enem\microdados_enem_2018\DADOS\MICRODADOS_ENEM_2018.feather
MICRODADOS 2019 já está convertido em Y:\DATASOURCES\enem\microdados_enem_2019\DADOS\MICRODADOS_ENEM_2019.parquet
MICRODADOS 2019 já está convertido em Y:\DATASOURCES\enem\microdados_enem_2019\DADOS\MICRODADOS_ENEM_2019.feather
MICRODADOS 2020 já está convertido em Y:\DATASOURCES\enem\microdados_enem_2020\DADOS\MICRODADOS_ENEM_2020.parquet
MICRODADOS 2020 já está convertido em Y:\DATASOURCES\enem\microdados_enem_2020\DADOS\MICRODADOS_ENEM_2020.feather
Carregando Y:\DATASOURCES\enem\microdados_enem_2021\DADOS\MICRODADOS_ENEM_2021.csv... OK