# GT Educação

O GT Educação enviou uma série de formulários com indicadores desejados para o painel. A maioria desses indicadores estão disponíveis no Portal de Dados Abertos da Prefeitura de São Paulo (http://dados.prefeitura.sp.gov.br/).

Portanto, vamos carregar o módulo de downloads do portal de dados abertos.

In [1]:
from core.downloads import dadosabertos as da

# Extração e transformação inicial

## Número de alunos da Rede Municipal de Ensino

O primeiro indicador é o número de alunos da rede municipal, segmentado por nível educacional (Creche, Pré Escola, Ensino Fundamental I, Ensino Fundamental II, EJA I, EJA II, Ensino Médio, Ed. Prof.).

O conjunto de dados que contém esse indicador está disponível em http://dados.prefeitura.sp.gov.br/dataset/demanda-e-matriculas. Sabendo que o último trecho da url representa a id do conjunto de dados, vamos utilizá-la para fazer a extração dos dados do portal.

Primeiro, precisamos visualizar todos os recursos relativos a esse conjunto de dados. Para padronizar o período de todos os conjuntos, vamos focar em dezembro de 2023.

In [2]:
pkg_name = 'demanda-e-matriculas'
resources = da.package_resources(pkg_name, '23')
resources

[{'name': 'Demanda e Matrículas - Dezembro/2023',
  'id': 'a63afccb-1a19-4438-96b1-7a13c4ccb586',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/45612acc-edd3-4134-ac7f-9a0026f60c97/resource/a63afccb-1a19-4438-96b1-7a13c4ccb586/download/publicacao-bimestral-dezembro-2023.xls'},
 {'name': 'Demanda e Matrículas - Outubro/2023',
  'id': 'f217087c-b2b8-4e76-a282-567075afe30c',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/45612acc-edd3-4134-ac7f-9a0026f60c97/resource/f217087c-b2b8-4e76-a282-567075afe30c/download/publicacao-bimestral-outubro-2023.xls'},
 {'name': 'Demanda e Matrículas - Agosto/2023',
  'id': 'ecb51533-e2dc-4298-8d66-878be3bab9d8',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/45612acc-edd3-4134-ac7f-9a0026f60c97/resource/ecb51533-e2dc-4298-8d66-878be3bab9d8/download/publicacao-bimestral-agosto-2023.xls'},
 {'name': 'Demanda e Matrículas - Junho/2023',
  'id': 'e67654b3-d1cd-455b-a97a-7df12627c9d0',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/45612ac

Sabendo o id do arquivo de dezembro de 2023, vamos carregar o recurso como um dataframe.

In [3]:
resource_id = 'a63afccb-1a19-4438-96b1-7a13c4ccb586'
mat_23 = da.load_resource(resource_id, pandas_kwargs=dict(header=[0,1]))
mat_23

Unnamed: 0_level_0,Distrito,Matrículas,Matrículas,Matrículas,Matrículas,Matrículas,Matrículas,Matrículas,Matrículas,Matrícula em Processo,...,Demanda,Demanda,Demanda,Demanda,Demanda,Demanda,Demanda,Demanda,Demanda,Demanda
Unnamed: 0_level_1,Unnamed: 0_level_1,Creche,Pré Escola,Ens. Fund.I,Ens. Fund.II,EJA I,EJA II,Ens. Médio,Ed. Prof.,Creche,...,Creche (3),Creche Total,Pré Escola (1),Pré Escola (2),Pré Escola (3),Pré Escola Total,Ens. Fund.I,Ens. Fund.II,EJA I,EJA II
0,AGUA RASA,1250.0,754.0,976.0,949.0,0.0,46.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
1,ALTO DE PINHEIROS,312.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
2,ANHANGUERA,2914.0,1730.0,3018.0,2363.0,51.0,226.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
3,ARICANDUVA,1560.0,732.0,1205.0,1113.0,13.0,59.0,0.0,0.0,1.0,...,4.0,4.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
4,ARTUR ALVIM,2733.0,2144.0,2316.0,2130.0,0.0,15.0,0.0,0.0,4.0,...,2.0,2.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
95,VILA SONIA,3807.0,1811.0,1991.0,1554.0,0.0,24.0,0.0,0.0,4.0,...,4.0,4.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
96,TOTAL,354093.0,224501.0,229976.0,186033.0,4347.0,16287.0,2031.0,1516.0,356.0,...,555.0,555.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
97,(1) - Demanda sem opção por unidade específica...,,,,,,,,,,...,,,,,,,,,,
98,(2) - Demanda sem opção por unidade específica...,,,,,,,,,,...,,,,,,,,,,


O dataframe contem dados de matrículas, matrículas em processo e demanda não atendida. Como desejamos apenas matrículas, vamos remover as outras colunas.

In [4]:
mat_23 = mat_23[['Distrito', 'Matrículas']]
mat_23

Unnamed: 0_level_0,Distrito,Matrículas,Matrículas,Matrículas,Matrículas,Matrículas,Matrículas,Matrículas,Matrículas
Unnamed: 0_level_1,Unnamed: 0_level_1,Creche,Pré Escola,Ens. Fund.I,Ens. Fund.II,EJA I,EJA II,Ens. Médio,Ed. Prof.
0,AGUA RASA,1250.0,754.0,976.0,949.0,0.0,46.0,0.0,0.0
1,ALTO DE PINHEIROS,312.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
2,ANHANGUERA,2914.0,1730.0,3018.0,2363.0,51.0,226.0,0.0,0.0
3,ARICANDUVA,1560.0,732.0,1205.0,1113.0,13.0,59.0,0.0,0.0
4,ARTUR ALVIM,2733.0,2144.0,2316.0,2130.0,0.0,15.0,0.0,0.0
...,...,...,...,...,...,...,...,...,...
95,VILA SONIA,3807.0,1811.0,1991.0,1554.0,0.0,24.0,0.0,0.0
96,TOTAL,354093.0,224501.0,229976.0,186033.0,4347.0,16287.0,2031.0,1516.0
97,(1) - Demanda sem opção por unidade específica...,,,,,,,,
98,(2) - Demanda sem opção por unidade específica...,,,,,,,,


Agora, sabendo que temos apenas dados sobre matrículas, vamos ajustar as colunas.

In [5]:
mat_23 = (mat_23
 .droplevel(0, axis='columns')
 .rename(columns={'Unnamed: 0_level_1': 'Distrito'}))

mat_23

Unnamed: 0,Distrito,Creche,Pré Escola,Ens. Fund.I,Ens. Fund.II,EJA I,EJA II,Ens. Médio,Ed. Prof.
0,AGUA RASA,1250.0,754.0,976.0,949.0,0.0,46.0,0.0,0.0
1,ALTO DE PINHEIROS,312.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
2,ANHANGUERA,2914.0,1730.0,3018.0,2363.0,51.0,226.0,0.0,0.0
3,ARICANDUVA,1560.0,732.0,1205.0,1113.0,13.0,59.0,0.0,0.0
4,ARTUR ALVIM,2733.0,2144.0,2316.0,2130.0,0.0,15.0,0.0,0.0
...,...,...,...,...,...,...,...,...,...
95,VILA SONIA,3807.0,1811.0,1991.0,1554.0,0.0,24.0,0.0,0.0
96,TOTAL,354093.0,224501.0,229976.0,186033.0,4347.0,16287.0,2031.0,1516.0
97,(1) - Demanda sem opção por unidade específica...,,,,,,,,
98,(2) - Demanda sem opção por unidade específica...,,,,,,,,


As últimas linhas do dataframe são apenas dados de totalização e notas, então vamos excluí-las também.

In [6]:
mat_23 = mat_23.loc[mat_23['Distrito'].str.lower()!='total']
mat_23 = mat_23.loc[~mat_23.iloc[:,1].isna()]
mat_23

Unnamed: 0,Distrito,Creche,Pré Escola,Ens. Fund.I,Ens. Fund.II,EJA I,EJA II,Ens. Médio,Ed. Prof.
0,AGUA RASA,1250.0,754.0,976.0,949.0,0.0,46.0,0.0,0.0
1,ALTO DE PINHEIROS,312.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
2,ANHANGUERA,2914.0,1730.0,3018.0,2363.0,51.0,226.0,0.0,0.0
3,ARICANDUVA,1560.0,732.0,1205.0,1113.0,13.0,59.0,0.0,0.0
4,ARTUR ALVIM,2733.0,2144.0,2316.0,2130.0,0.0,15.0,0.0,0.0
...,...,...,...,...,...,...,...,...,...
91,VILA MARIANA,714.0,548.0,250.0,229.0,0.0,0.0,0.0,0.0
92,VILA MATILDE,1795.0,846.0,2061.0,1857.0,21.0,121.0,0.0,0.0
93,VILA MEDEIROS,3922.0,2412.0,1700.0,1457.0,50.0,356.0,0.0,0.0
94,VILA PRUDENTE,2481.0,1207.0,989.0,871.0,27.0,74.0,0.0,0.0


Finalmente, vamos "despivotar" a tabela, transformando o nome das colunas em uma nova coluna chamada "Nível educacional" e unificando as colunas de valor sob uma coluna chamada matrículas.

In [7]:
mat_23 = mat_23.melt(
    id_vars='Distrito',
    var_name='Nível Educacional',
    value_name='Matrículas'
)
mat_23

Unnamed: 0,Distrito,Nível Educacional,Matrículas
0,AGUA RASA,Creche,1250.0
1,ALTO DE PINHEIROS,Creche,312.0
2,ANHANGUERA,Creche,2914.0
3,ARICANDUVA,Creche,1560.0
4,ARTUR ALVIM,Creche,2733.0
...,...,...,...
763,VILA MARIANA,Ed. Prof.,0.0
764,VILA MATILDE,Ed. Prof.,0.0
765,VILA MEDEIROS,Ed. Prof.,0.0
766,VILA PRUDENTE,Ed. Prof.,0.0


## Número de professores da Rede Municipal de Ensino

O segundo indicador solicitado é o número de professores da Rede Municipal de Ensino, com recortes por Raça, Sexo, Nível de Ensino (Educação Infantil, Ensino Fundamental etc.), Tipo de Unidade de atuação (EMEF, EMEI etc.).

O conjunto de dados que contém esse indicador está disponível em http://dados.prefeitura.sp.gov.br/dataset/microdados-servidores-perfil, porém os arquivos possuem informação sobre todos os servidores da SME, o que inclui os servidores administrativos, que precisarão ser excluídos.

Primeiro, precisamos visualizar todos os recursos relativos a esse conjunto de dados. Para padronizar o período de todos os conjuntos, vamos focar em dezembro de 2023.

In [8]:
pkg_name = 'microdados-servidores-perfil'
resources = da.package_resources(pkg_name, '23')
resources

[{'name': 'Microdados - Perfil dos Servidores 2023',
  'id': '9231789a-3a0d-4109-a8ba-25d31a099095',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/12a101f0-622b-43ad-946c-95c430ae6cab/resource/9231789a-3a0d-4109-a8ba-25d31a099095/download/perfilservidor23.csv'}]

Aparentemente, os dados de perfil dos servidores possuem periodicidade anual, já que temos apenas um arquivo disponível para 2023.

In [9]:
resource_id = resources[0]['id']
perf_23 = da.load_resource(resource_id,
                           pandas_kwargs={'encoding': 'utf-8'})
perf_23

Unnamed: 0,DATA_BASE_EOL,ANO_REFERENCIA,CD_CAR_SERV_SME,MES_NASC,ANO_NASC,IDADE,CD_SEXO,CD_MUNICIPIO_NASC,DC_MUNICIPIO_NASC,UF_MUNICIPIO_NASC,...,CD_UNIDADE_FUNCAO,CD_FUNCAO,DC_FUNCAO,DT_INICIO_FUNCAO,CD_UNIDADE_SOBREPOSTO,CD_SOBREPOSTO,DC_SOBREPOSTO,DT_INICIO_SOBREPOSTO,ACUMULO_AMBITO,ACUMULO_SITUACAO_SEGUNDO_VINCULO
0,Dez de 2023,2023,3.007270e+14,10,1990,33,F,,,,...,,,,,,,,,,
1,Dez de 2023,2023,3.717310e+14,1,1972,51,F,9.362740e+15,GUARULHOS,SP,...,,,,,,,,,,
2,Dez de 2023,2023,3.717310e+14,2,1975,48,F,9.354740e+15,SAO PAULO,SP,...,,,,,,,,,,
3,Dez de 2023,2023,3.717310e+14,5,1991,32,F,9.354740e+15,SAO PAULO,SP,...,,,,,,,,,,Efetivo
4,Dez de 2023,2023,3.717310e+14,3,1984,39,F,,,,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
86570,Dez de 2023,2023,9.371740e+15,2,1979,44,F,9.354740e+15,SAO PAULO,SP,...,,,,,,,,,,
86571,Dez de 2023,2023,8.371750e+15,7,1978,45,F,3.187370e+14,XIQUE-XIQUE,BA,...,,,,,,,,,,
86572,Dez de 2023,2023,9.371740e+15,2,1979,44,F,9.354740e+15,SAO PAULO,SP,...,,,,,,,,,,
86573,Dez de 2023,2023,3.717360e+14,10,1988,35,F,9.354740e+15,SAO PAULO,SP,...,,,,,,,,,,


Com os dados baixados, vamos selecionar as colunas para atender às segmentações propostas no formulário.

In [10]:
# Raça, Sexo, Nível de Ensino (Educação Infantil, Ensino Fundamental etc.), Tipo de Unidade de atuação (EMEF, EMEI etc.).

perf_cols = [
    'CD_SEXO',
    'CD_RACA_COR',
    'DC_RACA_COR',
    'CD_DEF',
    'CD_CARGO_BASE',
    'DC_CARGO_BASE',
    'CD_CARGO_ATUAL',
    'DC_CARGO_ATUAL',
    'CD_AREA_ATUACAO_ATUAL',
    'DC_AREA_ATUACAO_ATUAL',
    'CD_UNIDADE_ATUAL',
    'TP_UNIDADE_ATUAL',
    'DC_UNIDADE_ATUAL',
]

perf_23 = perf_23.loc[:, perf_cols]
perf_23

Unnamed: 0,CD_SEXO,CD_RACA_COR,DC_RACA_COR,CD_DEF,CD_CARGO_BASE,DC_CARGO_BASE,CD_CARGO_ATUAL,DC_CARGO_ATUAL,CD_AREA_ATUACAO_ATUAL,DC_AREA_ATUACAO_ATUAL,CD_UNIDADE_ATUAL,TP_UNIDADE_ATUAL,DC_UNIDADE_ATUAL
0,F,6361983595,NAO INFORMADA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,3.375150e+14,CEU EMEI,"JOSE GASPAR, D."
1,F,1311882504,BRANCA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,3.345130e+14,EMEFM,"DERVILLE ALLEGRETTI, PROF."
2,F,6361983595,NAO INFORMADA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,1.315840e+13,EMEI,PARQUE FIGUEIRA GRANDE I - ANDRE LUIZ JANUARIO
3,F,1311882504,BRANCA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,3.385170e+14,EMEI,"ENIO CORREA, PROF."
4,F,6361983595,NAO INFORMADA,12728032504,9.274100e+13,PROF.DE ED.INFANTIL,9.274100e+13,PROF.DE ED.INFANTIL,1311882504,EDUCACAO INFANTIL,8.246790e+14,CEI DIRET,"JOSE DE MOURA, VER."
...,...,...,...,...,...,...,...,...,...,...,...,...,...
86570,F,301583581,PRETA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,1.395100e+14,EMEBS,"MARIO PEREIRA BICUDO, PROF."
86571,F,93911283491,PARDA,12728032504,9.274100e+13,PROF.DE ED.INFANTIL,9.274100e+13,PROF.DE ED.INFANTIL,1311882504,EDUCACAO INFANTIL,8.266620e+14,CEI DIRET,"VICENTINA VELASCO, AS. SOCIAL"
86572,F,1311882504,BRANCA,12728032504,9.274100e+13,PROF.DE ED.INFANTIL,9.274100e+13,PROF.DE ED.INFANTIL,1311882504,EDUCACAO INFANTIL,8.218610e+15,CEI DIRET,JARDIM CLIMAX II
86573,F,5352082473,RECUSOU INFORMAR,12728032504,9.274100e+13,PROF.DE ED.INFANTIL,9.274100e+13,PROF.DE ED.INFANTIL,1311882504,EDUCACAO INFANTIL,1.226430e+14,DIR EDUC,DIRETORIA REGIONAL DE EDUCACAO PENHA


O formulário solicita também a exclusão de professores aposentados e servidores administrativos do conjunto de dados. Apesar de existir uma coluna com um valor "aposentado", a `ACUMULO_SITUACAO_SEGUNDO_VINCULO`, essa coluna parece se referir à situação do segundo vínculo, e não do vínculo com a PMSP. Além disso, a lista de servidores aposentados da Secretaria Municipal de Educação tem mais de 94 mil registros, então esses registros provavelmente não estão nos dados de perfil dos servidores.

Para excluir os servidores administrativos, vamos primeiro avaliar quais cargos estão presentes na base.

In [11]:
df_cargos = perf_23[['CD_CARGO_ATUAL', 'DC_CARGO_ATUAL']].copy()
df_cargos = df_cargos.drop_duplicates().reset_index(drop=True)

df_cargos

Unnamed: 0,CD_CARGO_ATUAL,DC_CARGO_ATUAL
0,9.234430e+12,PROF.ED.INF.E ENS.FUND.I
1,9.274100e+13,PROF.DE ED.INFANTIL
2,9.274940e+12,ASSISTENTE DE DIRETOR DE ESCOLA
3,9.234450e+12,COORDENADOR PEDAGOGICO
4,8.264710e+12,AUXILIAR TECNICO DE EDUCACAO
...,...,...
98,2.045660e+11,ASSISTENTE DE SAUDE - NIVEL I
99,9.224670e+12,PROF.ADJ.ENS.FUND.II-GEOGRAFIA
100,7.343900e+11,GESTOR DE CENTRO EDUCACIONAL UNIFICADO
101,9.274970e+12,PROF.ADJ.DE ENS.FUND. I


Dado a quantidade de cargos, vamos fitrar a lista com base em uma regra geral, mantendo apenas os cargos que possual a string "PROF" em sua descrição.

In [12]:
filtro_prof = df_cargos['DC_CARGO_ATUAL'].str.lower().str.contains('prof')
df_cargos_prof = df_cargos.loc[filtro_prof]

df_cargos_prof

Unnamed: 0,CD_CARGO_ATUAL,DC_CARGO_ATUAL
0,9234430000000.0,PROF.ED.INF.E ENS.FUND.I
1,92741000000000.0,PROF.DE ED.INFANTIL
6,9214970000000.0,PROF.ENS.FUND.II E MED.-MATEMATICA
7,9244720000000.0,PROF.ENS.FUND.II E MED.-PORTUGUES
8,9214970000000.0,PROF.ENS.FUND.II E MED.-GEOGRAFIA
9,9274960000000.0,PROF.ENS.FUND.II E MED.-CIENCIAS
10,9224650000000.0,PROF.ENS.FUND.II E MED.-HISTORIA
12,92941100000000.0,PROF.ENS.FUND.II E MED.-ED.FISICA
13,92841100000000.0,PROF.ENS.FUND.II E MED.-INGLES
14,264486000000.0,PROFISSIONAL DE ENG. ARQ. AGR. GEO. I


Por último, filtramos a base geral com base nessa lista de cargos.

In [13]:
perf_23 = (
    perf_23
    .loc[
        perf_23['CD_CARGO_ATUAL'].isin(df_cargos_prof['CD_CARGO_ATUAL'].tolist())
    ]
)

perf_23

Unnamed: 0,CD_SEXO,CD_RACA_COR,DC_RACA_COR,CD_DEF,CD_CARGO_BASE,DC_CARGO_BASE,CD_CARGO_ATUAL,DC_CARGO_ATUAL,CD_AREA_ATUACAO_ATUAL,DC_AREA_ATUACAO_ATUAL,CD_UNIDADE_ATUAL,TP_UNIDADE_ATUAL,DC_UNIDADE_ATUAL
0,F,6361983595,NAO INFORMADA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,3.375150e+14,CEU EMEI,"JOSE GASPAR, D."
1,F,1311882504,BRANCA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,3.345130e+14,EMEFM,"DERVILLE ALLEGRETTI, PROF."
2,F,6361983595,NAO INFORMADA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,1.315840e+13,EMEI,PARQUE FIGUEIRA GRANDE I - ANDRE LUIZ JANUARIO
3,F,1311882504,BRANCA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,3.385170e+14,EMEI,"ENIO CORREA, PROF."
4,F,6361983595,NAO INFORMADA,12728032504,9.274100e+13,PROF.DE ED.INFANTIL,9.274100e+13,PROF.DE ED.INFANTIL,1311882504,EDUCACAO INFANTIL,8.246790e+14,CEI DIRET,"JOSE DE MOURA, VER."
...,...,...,...,...,...,...,...,...,...,...,...,...,...
86570,F,301583581,PRETA,12728032504,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,9.234430e+12,PROF.ED.INF.E ENS.FUND.I,301583581,ENSINO FUNDAMENTAL I E INFANTIL,1.395100e+14,EMEBS,"MARIO PEREIRA BICUDO, PROF."
86571,F,93911283491,PARDA,12728032504,9.274100e+13,PROF.DE ED.INFANTIL,9.274100e+13,PROF.DE ED.INFANTIL,1311882504,EDUCACAO INFANTIL,8.266620e+14,CEI DIRET,"VICENTINA VELASCO, AS. SOCIAL"
86572,F,1311882504,BRANCA,12728032504,9.274100e+13,PROF.DE ED.INFANTIL,9.274100e+13,PROF.DE ED.INFANTIL,1311882504,EDUCACAO INFANTIL,8.218610e+15,CEI DIRET,JARDIM CLIMAX II
86573,F,5352082473,RECUSOU INFORMAR,12728032504,9.274100e+13,PROF.DE ED.INFANTIL,9.274100e+13,PROF.DE ED.INFANTIL,1311882504,EDUCACAO INFANTIL,1.226430e+14,DIR EDUC,DIRETORIA REGIONAL DE EDUCACAO PENHA


## Número de Unidades Escolares

O terceiro indicador solicitado é o número de Unidades Escolares da Rede Municipal de Ensino, com recortes por Tipo de Escola (EMEI, EMEF etc.) e Distrito.

O conjunto de dados que contém esse indicador está disponível em http://dados.prefeitura.sp.gov.br/dataset/cadastro-de-escolas-municipais-conveniadas-e-privadas.

Primeiro, precisamos visualizar todos os recursos relativos a esse conjunto de dados. Para padronizar o período de todos os conjuntos, vamos focar em dezembro de 2023.

In [14]:
pkg_name = 'cadastro-de-escolas-municipais-conveniadas-e-privadas'
resources = da.package_resources(pkg_name, '23')
resources

[{'name': 'Cadastro de escolas da cidade de São Paulo 2023',
  'id': 'accb16da-f2d7-44f5-8d91-bccdec78f3ce',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/8da55b0e-b385-4b54-9296-d0000014ddd5/resource/accb16da-f2d7-44f5-8d91-bccdec78f3ce/download/escolas122023.csv'}]

Aparentemente, os dados de unidades escolares possuem periodicidade anual, já que temos apenas um arquivo disponível para 2023.

In [15]:
resource_id = resources[0]['id']
escolas_23 = da.load_resource(resource_id)
escolas_23

Unnamed: 0,DRE,CODESC,TIPOESC,NOMES,DESLOC,CEU,DIRETORIA,SUBPREF,ENDERECO,NUMERO,...,DOM_CRIACAO,DT_INI_CONV,DT_AUTORIZA,DT_EXTINCAO,FX_ETARIA.1,NOME_ANT,REDE,LATITUDE,LONGITUDE,DATABASE
0,G,86,EMEI,PAULO CAMILHIER FLORENCANO,PAULO CAMILHIER FLORENCANO,,GUAIANASES,GUAIANASES,RUA FELICIANO DE MENDONCA,502,...,32307.0,,33313.0,,,,DIR,-23553905,-46398452,45285
1,FO,94,EMEI,VICENTE PAULO DA SILVA,VICENTE PAULO DA SILVA,,FREGUESIA/BRASILANDIA,CASA VERDE/CACHOEIRINHA,RUA DOUTOR FLEURY SILVEIRA,295,...,32328.0,,33313.0,,,,DIR,-23489728,-46670198,45285
2,MP,108,EMEF,"JOSE ERMIRIO DE MORAES, SEN.","JOSE ERMIRIO DE MORAES, SEN.",,SAO MIGUEL,SAO MIGUEL,RUA SAO BRAS DO SUACUI,159,...,32329.0,,36963.0,,,VILA NITRO OPERARIA,DIR,-23478312,-46427344,45285
3,BT,191,EMEF,"ALIPIO CORREA NETO, PROF.","ALIPIO CORREA NETO, PROF.",,BUTANTA,BUTANTA,AVENIDA JOAO CAIAFFA,140,...,32290.0,,33313.0,,,,DIR,-23612237,-46749888,45285
4,PJ,205,EMEBS,"VERA LUCIA APARECIDA RIBEIRO, PROFA.","VERA LUCIA APARECIDA RIBEIRO, PROFA.",,PIRITUBA,PIRITUBA,RUA BENEDITO PEREIRA,206,...,32316.0,,33313.0,,,,DIR,-23486142,-46733901,45285
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
4926,SM,700041,CEU AT COM,SAO RAFAEL,SAO RAFAEL,SAO RAFAEL,SAO MATEUS,SAO MATEUS,RUA CINIRA POLÔNIO,100,...,40681.0,,,,,,DIR,-23620144,-46456550,45285
4927,SM,700042,CEU AT COM,ROSA DA CHINA,ROSA DA CHINA,ROSA DA CHINA,SAO MATEUS,SAPOPEMBA,RUA CLARA PETRELA,113,...,40681.0,,,,,,DIR,-23621567,-46500775,45285
4928,SM,700043,CEU AT COM,SAPOPEMBA,SAPOPEMBA,SAPOPEMBA,SAO MATEUS,SAPOPEMBA,RUA MANUEL QUIRINO DE MATTOS,S/N,...,40681.0,,,,,,DIR,-23609804,-46494006,45285
4929,SM,700044,CEU AT COM,"ALTO ALEGRE - PAULO SUYOSH MINAMI, PROF.","ALTO ALEGRE - PAULO SUYOSH MINAMI, PROF.",ALTO ALEGRE,SAO MATEUS,SAO MATEUS,AVENIDA BENTO GUELFI,S/N,...,40681.0,,,,,ALTO ALEGRE,DIR,-23609738,-46426886,45285


Os dados das escolas também serão usados com outros conjuntos de dados para regionalizá-los, então vamos manter também algumas colunas de identificação das escolas para facilitar esse uso o posterior. Vamos também filtrar apenas as escolas ativas.

In [16]:
escolas_cols = ['CODESC',
                'TIPOESC',
                'NOMES',
                'SUBPREF',
                'DISTRITO',
                'CODINEP',
                'CD_CIE',
                'NOME_ANT',
                'REDE']

escolas_filtro = escolas_23['SITUACAO'].str.lower().str.contains('ativa')
escolas_23 = escolas_23.loc[escolas_filtro, escolas_cols]

escolas_23

Unnamed: 0,CODESC,TIPOESC,NOMES,SUBPREF,DISTRITO,CODINEP,CD_CIE,NOME_ANT,REDE
0,86,EMEI,PAULO CAMILHIER FLORENCANO,GUAIANASES,GUAIANASES,35098711.0,35098711.0,,DIR
1,94,EMEI,VICENTE PAULO DA SILVA,CASA VERDE/CACHOEIRINHA,LIMAO,35098361.0,35098361.0,,DIR
2,108,EMEF,"JOSE ERMIRIO DE MORAES, SEN.",SAO MIGUEL,JARDIM HELENA,35098760.0,35098760.0,VILA NITRO OPERARIA,DIR
3,191,EMEF,"ALIPIO CORREA NETO, PROF.",BUTANTA,VILA SONIA,35098462.0,35098462.0,,DIR
4,205,EMEBS,"VERA LUCIA APARECIDA RIBEIRO, PROFA.",PIRITUBA,PIRITUBA,35079029.0,35079029.0,,DIR
...,...,...,...,...,...,...,...,...,...
4926,700041,CEU AT COM,SAO RAFAEL,SAO MATEUS,SAO RAFAEL,35455702.0,35455702.0,,DIR
4927,700042,CEU AT COM,ROSA DA CHINA,SAPOPEMBA,SAPOPEMBA,35455672.0,35455672.0,,DIR
4928,700043,CEU AT COM,SAPOPEMBA,SAPOPEMBA,SAPOPEMBA,35455933.0,35455933.0,,DIR
4929,700044,CEU AT COM,"ALTO ALEGRE - PAULO SUYOSH MINAMI, PROF.",SAO MATEUS,IGUATEMI,35455611.0,35455611.0,ALTO ALEGRE,DIR


## Perfil dos alunos

O quinto indicador solicitado é o número de alunos da Rede Municipal de Ensino, com recortes por Raça, Sexo, existência de Necessidades Especiais, Distrito, Rede de Ensino (Administração Direta ou Rede Conveniada/Parceira).

O conjunto de dados que contém esse indicador está disponível em http://dados.prefeitura.sp.gov.br/dataset/perfil-dos-educandos-cor-raca-idade-sexo-necessidades-educacionais-especiais.

Primeiro, precisamos visualizar todos os recursos relativos a esse conjunto de dados. Para padronizar o período de todos os conjuntos, vamos focar em dezembro de 2023.

In [17]:
pkg_name = 'perfil-dos-educandos-cor-raca-idade-sexo-necessidades-educacionais-especiais'
resources = da.package_resources(pkg_name, '23')
resources

[{'name': 'Perfil dos educandos - Dez/2023',
  'id': '43d65892-caba-411e-aed3-3e0490822d3a',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/b9c5faef-1a61-4814-b89e-bd7a73154ebc/resource/43d65892-caba-411e-aed3-3e0490822d3a/download/idadeserieneeracadez23.csv'}]

Aparentemente, os dados de perfil dos educandos possuem periodicidade anual, já que temos apenas um arquivo disponível para 2023.

In [18]:
resource_id = resources[0]['id']
alunos_23 = da.load_resource(resource_id)
alunos_23

Unnamed: 0,DRE,CODESC,TIPOESC,NOMESC,DISTRITO,SETOR,ANO,REDE,MODAL,DESCSERIE,PERIODO,TURNO,DESCTURNO,SEXO,IDADE,NEE,RACA,Qtde,DATABASE
0,BT,191,EMEF,"ALIPIO CORREA NETO, PROF.",VILA SONIA,9404,2023,DIR,FUND,C.I 1.ANO F9,Diurno,3,Tarde,F,6,,BRANCA,6,25/12/2023
1,BT,191,EMEF,"ALIPIO CORREA NETO, PROF.",VILA SONIA,9404,2023,DIR,FUND,C.I 1.ANO F9,Diurno,3,Tarde,F,6,,PARDA,3,25/12/2023
2,BT,191,EMEF,"ALIPIO CORREA NETO, PROF.",VILA SONIA,9404,2023,DIR,FUND,C.I 1.ANO F9,Diurno,3,Tarde,F,6,AUTISMO,PARDA,1,25/12/2023
3,BT,191,EMEF,"ALIPIO CORREA NETO, PROF.",VILA SONIA,9404,2023,DIR,FUND,C.I 1.ANO F9,Diurno,3,Tarde,F,7,,BRANCA,8,25/12/2023
4,BT,191,EMEF,"ALIPIO CORREA NETO, PROF.",VILA SONIA,9404,2023,DIR,FUND,C.I 1.ANO F9,Diurno,3,Tarde,F,7,,PARDA,12,25/12/2023
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
356578,SM,700044,CEU AT COM,"ALTO ALEGRE - PAULO SUYOSH MINAMI, PROF.",IGUATEMI,3304,2023,DIR,ATCOMP,CELP,Diurno,4,Vespertino,F,9,,PARDA,1,25/12/2023
356579,SM,700044,CEU AT COM,"ALTO ALEGRE - PAULO SUYOSH MINAMI, PROF.",IGUATEMI,3304,2023,DIR,ATCOMP,CELP,Diurno,4,Vespertino,F,10,,BRANCA,2,25/12/2023
356580,SM,700044,CEU AT COM,"ALTO ALEGRE - PAULO SUYOSH MINAMI, PROF.",IGUATEMI,3304,2023,DIR,ATCOMP,CELP,Diurno,4,Vespertino,F,13,,PARDA,1,25/12/2023
356581,SM,700044,CEU AT COM,"ALTO ALEGRE - PAULO SUYOSH MINAMI, PROF.",IGUATEMI,3304,2023,DIR,ATCOMP,CELP,Diurno,4,Vespertino,F,13,,RECUSOU INFORMA,1,25/12/2023


In [19]:
alunos_cols = ['DISTRITO',
               'REDE',
               'SEXO',
               'NEE',
               'RACA',
               'Qtde']

alunos_23 = alunos_23[alunos_cols]

alunos_23

Unnamed: 0,DISTRITO,REDE,SEXO,NEE,RACA,Qtde
0,VILA SONIA,DIR,F,,BRANCA,6
1,VILA SONIA,DIR,F,,PARDA,3
2,VILA SONIA,DIR,F,AUTISMO,PARDA,1
3,VILA SONIA,DIR,F,,BRANCA,8
4,VILA SONIA,DIR,F,,PARDA,12
...,...,...,...,...,...,...
356578,IGUATEMI,DIR,F,,PARDA,1
356579,IGUATEMI,DIR,F,,BRANCA,2
356580,IGUATEMI,DIR,F,,PARDA,1
356581,IGUATEMI,DIR,F,,RECUSOU INFORMA,1


## Número de alunos estrangeiros

O sétimo indicador é o número de alunos estrangeiros da rede municipal, segmentado por País de Procedência, Distrito, Tipo de Rede (Direta ou Conveniada/Parceira), Etapa (Creche, fundamental, EJA etc.).

O conjunto de dados que contém esse indicador está disponível em http://dados.prefeitura.sp.gov.br/dataset/educandos-estrangeiros-por-nacionalidade. Sabendo que o último trecho da url representa a id do conjunto de dados, vamos utilizá-la para fazer a extração dos dados do portal.

Primeiro, precisamos visualizar todos os recursos relativos a esse conjunto de dados.

In [20]:
pkg_name = 'educandos-estrangeiros-por-nacionalidade'
resources = da.package_resources(pkg_name, '23')
resources

[{'name': 'Educandos estrangeiros por nacionalidade e DRE',
  'id': '002f8395-0faf-4ec8-ab63-a92e3ee8b232',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/f66a2317-0b67-4e14-b6c5-1a7340d6e30f/resource/002f8395-0faf-4ec8-ab63-a92e3ee8b232/download/estrangeirosjunho2023.xlsx'},
 {'name': 'Educandos estrangeiros por nacionalidade e DRE',
  'id': '855394c4-d95f-4387-880d-3a288bb31cff',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/f66a2317-0b67-4e14-b6c5-1a7340d6e30f/resource/855394c4-d95f-4387-880d-3a288bb31cff/download/estrangeirosjunho2023.ods'}]

Os dados de alunos estrangeiros parecem estar disponíveis anualmente, mas no mês de junho. Como não existe arquivo para dezembro de 2023, vamos utilizar o arquivo de junho de 2024.

In [21]:
pkg_name = 'educandos-estrangeiros-por-nacionalidade'
resources = da.package_resources(pkg_name, '24')
resources

[{'name': 'Educandos estrangeiros por nacionalidade e DRE',
  'id': '75357667-9bf6-463b-9ecc-609dfecafb25',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/f66a2317-0b67-4e14-b6c5-1a7340d6e30f/resource/75357667-9bf6-463b-9ecc-609dfecafb25/download/estudantes_estrangeiros_dez24.xlsx'},
 {'name': 'Educandos estrangeiros por nacionalidade e DRE',
  'id': '22f9daba-fb61-439b-984b-ab5d99733ad2',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/f66a2317-0b67-4e14-b6c5-1a7340d6e30f/resource/22f9daba-fb61-439b-984b-ab5d99733ad2/download/estudantes_estrangeiros_dez24.ods'},
 {'name': 'Educandos estrangeiros por nacionalidade e DRE',
  'id': '1920e20b-181f-43bf-b390-d45fbaa272d4',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/f66a2317-0b67-4e14-b6c5-1a7340d6e30f/resource/1920e20b-181f-43bf-b390-d45fbaa272d4/download/estudantes_estrangeiros_jun24.xlsx'},
 {'name': 'Educandos estrangeiros por nacionalidade e DRE',
  'id': '6f2adbce-af06-45c1-8946-b4659cabe228',
  'url': 'http://dados.

In [22]:
resource_id = resources[2]['id']
alunos_bf_2024 = da.load_resource(resource_id)
alunos_bf_2024

Unnamed: 0,DRE,DISTRITO,COD_PAIS,NOME_PAIS,ETAPA,SERIE,QTDE,REDE,DATABASE
0,FREGUESIA/BRASILANDIA,FREGUESIA DO O,92,VENEZUELA,FUND,C.II 4.ANO F9,1,DIR,2024-06-30
1,FREGUESIA/BRASILANDIA,FREGUESIA DO O,92,VENEZUELA,FUND,C.II 6.ANO F9,3,DIR,2024-06-30
2,FREGUESIA/BRASILANDIA,FREGUESIA DO O,92,VENEZUELA,PRE,INFANTIL UNIF,2,DIR,2024-06-30
3,FREGUESIA/BRASILANDIA,FREGUESIA DO O,175,ANGOLA,FUND,C.I 1.ANO F9,1,DIR,2024-06-30
4,FREGUESIA/BRASILANDIA,FREGUESIA DO O,175,ANGOLA,FUND,C.II 4.ANO F9,1,DIR,2024-06-30
...,...,...,...,...,...,...,...,...,...
3694,SAO MIGUEL,VILA JACUI,213,NIGÉRIA,FUND,C.I 2.ANO F9,1,DIR,2024-06-30
3695,SAO MIGUEL,VILA JACUI,213,NIGÉRIA,FUND,C.I 3.ANO F9,1,DIR,2024-06-30
3696,SAO MIGUEL,VILA JACUI,213,NIGÉRIA,FUND,C.III 7.ANO F9,1,DIR,2024-06-30
3697,SAO MIGUEL,VILA JACUI,213,NIGÉRIA,FUND,C.III 9.ANO F9,1,DIR,2024-06-30


In [23]:
# Recortes: País de Procedência, Distrito, Tipo de Rede (Direta ou Conveniada/Parceira), Etapa (Creche, fundamental, EJA etc.)
alunos_bf_cols = ['DISTRITO',
                   'COD_PAIS',
                   'NOME_PAIS',
                   'ETAPA',
                   'REDE',
                   'QTDE']

alunos_bf_2024 = alunos_bf_2024[alunos_bf_cols]

alunos_bf_2024

Unnamed: 0,DISTRITO,COD_PAIS,NOME_PAIS,ETAPA,REDE,QTDE
0,FREGUESIA DO O,92,VENEZUELA,FUND,DIR,1
1,FREGUESIA DO O,92,VENEZUELA,FUND,DIR,3
2,FREGUESIA DO O,92,VENEZUELA,PRE,DIR,2
3,FREGUESIA DO O,175,ANGOLA,FUND,DIR,1
4,FREGUESIA DO O,175,ANGOLA,FUND,DIR,1
...,...,...,...,...,...,...
3694,VILA JACUI,213,NIGÉRIA,FUND,DIR,1
3695,VILA JACUI,213,NIGÉRIA,FUND,DIR,1
3696,VILA JACUI,213,NIGÉRIA,FUND,DIR,1
3697,VILA JACUI,213,NIGÉRIA,FUND,DIR,1


## Número de alunos beneficiários do Bolsa Família

O oitavo indicador é o número de alunos beneficiários do Bolsa Família da rede municipal, segmentado por Distrito e nível de ensino.

O conjunto de dados que contém esse indicador está disponível em http://dados.prefeitura.sp.gov.br/dataset/beneficiarios-programa-bolsa-familia-creches-municipais-e-conveniadas. Sabendo que o último trecho da url representa a id do conjunto de dados, vamos utilizá-la para fazer a extração dos dados do portal.

As notas (que podem ser vistas na saída abaixo) desse conjunto de dados incluem a informação de que a estrutura do conjunto mudou a partir de 2024 e, por isso, foi criado um novo conjunto de dados com a estrutura mais recente, disponível em http://dados.prefeitura.sp.gov.br/dataset/beneficiarios-do-programa-bolsa-familia-por-etapa-de-ensino-da-rede-municipal-de-educacao. Vamos utilizar essa versão mais recente e os dados de julho de 2024, assim como o número de alunos estrangeiros.

In [24]:
pkg_name = 'beneficiarios-programa-bolsa-familia-creches-municipais-e-conveniadas'
pkg = da.package_show(pkg_name)
print(pkg['notes'])

Esta base de dados traz a série histórica de 10 anos com a quantidade de crianças beneficiárias pelo Programa Bolsa Família e matriculadas em creches municipais ou conveniadas entre os anos de 2013 e 2023.

As informações foram compiladas pela Secretaria Municipal de Educação, a partir de cruzamento do Sistema EOL com dados da Secretaria Municipal de Assistência Social utilizando a chave NIS do Aluno ou Nome do Aluno, mãe e nascimento, o que pode ocasionar variações de números por divergências cadastrais.

Nota técnica: A partir do mês de dezembro de 2021, o Programa Bolsa Família foi substituído pela Programa Auxílio Brasil, conforme Lei Federal nº 14.284/2021. Dessa forma, o conjunto de dados referente ao ano de 2022 encontra-se denominado como "Beneficiários do Programa Auxílio Brasil (Creche)". No entanto, em 19 junho de 2023 o Programa Auxílio Brasil volta a se chamar Programa Bolsa Família, conforme Lei Federal nº 14.601/2023 e por esse motivo a base retoma a sua nomenclatura ini

In [25]:
pkg_name = 'beneficiarios-do-programa-bolsa-familia-por-etapa-de-ensino-da-rede-municipal-de-educacao'
resources = da.package_resources(pkg_name, '24')
resources

[{'name': 'Dicionário de Variáveis Programa Bolsa Família por Etapa',
  'id': 'c36429c0-b9da-478d-b32e-c9ffd31adfce',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/2e1a7fe7-284f-445a-8566-031f689f1b54/resource/c36429c0-b9da-478d-b32e-c9ffd31adfce/download/dicionarariovariaveis_novabolsafamilia_jul2024.csv'},
 {'name': 'Dicionário de Variáveis Programa Bolsa Família por Etapa',
  'id': 'f1cf5dd5-c248-4c34-b1b0-dfb3d6f7ec1c',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/2e1a7fe7-284f-445a-8566-031f689f1b54/resource/f1cf5dd5-c248-4c34-b1b0-dfb3d6f7ec1c/download/dicionarariovariaveis_novabolsafamilia_jul2024.xlsx'},
 {'name': 'Programa Bolsa Família por Etapa - Jul24',
  'id': '8999e4a8-9cbc-4fd6-b7ce-cef505e55f34',
  'url': 'http://dados.prefeitura.sp.gov.br/dataset/2e1a7fe7-284f-445a-8566-031f689f1b54/resource/8999e4a8-9cbc-4fd6-b7ce-cef505e55f34/download/novabolsafamilia_julho2024.csv'},
 {'name': 'Programa Bolsa Família por Etapa - Jul24',
  'id': '29f089e7-2de2-4295-9d4c-

In [26]:
resource_id = resources[2]['id']
alunos_bf_2024 = da.load_resource(resource_id)
alunos_bf_2024

Unnamed: 0,CODEOL,TIPO,UNIDADE,DIRETORIA,DISTRITO,CRECHE,PRE ESCOLA,ENSINO FUNDAMENTAL,EDUCAÇÃO PROFISSIONAL,ENSINO MEDIO,EDUCAÇÃO ESPECIAL,TOTAL MATRICULAS,DATABASE
0,86,EMEI,PAULO CAMILHIER FLORENCANO,GUAIANASES,GUAIANASES,0,140,0,0,0,0,140,31/07/2024
1,94,EMEI,VICENTE PAULO DA SILVA,FREGUESIA/BRASILANDIA,LIMAO,0,145,0,0,0,0,145,31/07/2024
2,108,EMEF,"JOSE ERMIRIO DE MORAES, SEN.",SAO MIGUEL,JARDIM HELENA,0,0,324,0,0,0,324,31/07/2024
3,191,EMEF,"ALIPIO CORREA NETO, PROF.",BUTANTA,VILA SONIA,0,0,193,0,0,0,193,31/07/2024
4,205,EMEBS,"VERA LUCIA APARECIDA RIBEIRO, PROFA.",PIRITUBA,PIRITUBA,0,0,0,0,0,8,8,31/07/2024
...,...,...,...,...,...,...,...,...,...,...,...,...,...
3758,400902,CEI INDIR,ISMAEL IVO,IPIRANGA,SAO LUCAS,21,0,0,0,0,0,0,31/07/2024
3759,400903,CEI INDIR,JOSE DIAS SOBRINHO,JACANA/TREMEMBE,TREMEMBE,81,40,0,0,0,0,40,31/07/2024
3760,400904,CEI INDIR,RUBEM FONSECA,PENHA,PONTE RASA,19,16,0,0,0,0,16,31/07/2024
3761,400906,CEI INDIR,ZIRALDO ALVES PINTO,FREGUESIA/BRASILANDIA,BRASILANDIA,15,31,0,0,0,0,31,31/07/2024


In [27]:
# Recortes: Alunos Beneficiários do Bolsa-Família por distrito, por nível de Ensino
alunos_bf_cols = ['CODEOL',
                   'TIPO',
                   'UNIDADE',
                   'DIRETORIA',
                   'DISTRITO',
                   'CRECHE',
                   'PRE ESCOLA',
                   'ENSINO FUNDAMENTAL',
                   'EDUCAÇÃO PROFISSIONAL',
                   'ENSINO MEDIO',
                   'EDUCAÇÃO ESPECIAL']

alunos_bf_2024 = alunos_bf_2024[alunos_bf_cols]

alunos_bf_2024

Unnamed: 0,CODEOL,TIPO,UNIDADE,DIRETORIA,DISTRITO,CRECHE,PRE ESCOLA,ENSINO FUNDAMENTAL,EDUCAÇÃO PROFISSIONAL,ENSINO MEDIO,EDUCAÇÃO ESPECIAL
0,86,EMEI,PAULO CAMILHIER FLORENCANO,GUAIANASES,GUAIANASES,0,140,0,0,0,0
1,94,EMEI,VICENTE PAULO DA SILVA,FREGUESIA/BRASILANDIA,LIMAO,0,145,0,0,0,0
2,108,EMEF,"JOSE ERMIRIO DE MORAES, SEN.",SAO MIGUEL,JARDIM HELENA,0,0,324,0,0,0
3,191,EMEF,"ALIPIO CORREA NETO, PROF.",BUTANTA,VILA SONIA,0,0,193,0,0,0
4,205,EMEBS,"VERA LUCIA APARECIDA RIBEIRO, PROFA.",PIRITUBA,PIRITUBA,0,0,0,0,0,8
...,...,...,...,...,...,...,...,...,...,...,...
3758,400902,CEI INDIR,ISMAEL IVO,IPIRANGA,SAO LUCAS,21,0,0,0,0,0
3759,400903,CEI INDIR,JOSE DIAS SOBRINHO,JACANA/TREMEMBE,TREMEMBE,81,40,0,0,0,0
3760,400904,CEI INDIR,RUBEM FONSECA,PENHA,PONTE RASA,19,16,0,0,0,0
3761,400906,CEI INDIR,ZIRALDO ALVES PINTO,FREGUESIA/BRASILANDIA,BRASILANDIA,15,31,0,0,0,0


In [28]:
alunos_bf_id_vars = alunos_bf_cols[0:5]

alunos_bf_2024 = alunos_bf_2024.melt(id_vars=alunos_bf_id_vars,
                    var_name='NIVEL',
                    value_name='QTDE')

alunos_bf_2024

Unnamed: 0,CODEOL,TIPO,UNIDADE,DIRETORIA,DISTRITO,NIVEL,QTDE
0,86,EMEI,PAULO CAMILHIER FLORENCANO,GUAIANASES,GUAIANASES,CRECHE,0
1,94,EMEI,VICENTE PAULO DA SILVA,FREGUESIA/BRASILANDIA,LIMAO,CRECHE,0
2,108,EMEF,"JOSE ERMIRIO DE MORAES, SEN.",SAO MIGUEL,JARDIM HELENA,CRECHE,0
3,191,EMEF,"ALIPIO CORREA NETO, PROF.",BUTANTA,VILA SONIA,CRECHE,0
4,205,EMEBS,"VERA LUCIA APARECIDA RIBEIRO, PROFA.",PIRITUBA,PIRITUBA,CRECHE,0
...,...,...,...,...,...,...,...
22573,400902,CEI INDIR,ISMAEL IVO,IPIRANGA,SAO LUCAS,EDUCAÇÃO ESPECIAL,0
22574,400903,CEI INDIR,JOSE DIAS SOBRINHO,JACANA/TREMEMBE,TREMEMBE,EDUCAÇÃO ESPECIAL,0
22575,400904,CEI INDIR,RUBEM FONSECA,PENHA,PONTE RASA,EDUCAÇÃO ESPECIAL,0
22576,400906,CEI INDIR,ZIRALDO ALVES PINTO,FREGUESIA/BRASILANDIA,BRASILANDIA,EDUCAÇÃO ESPECIAL,0
