In [4]:
#!pip install openpyxl

In [5]:
import pandas as pd

#### DADOS DE POLUIÇÃO - CIDADE DE OSASCO
##### Fonte: https://aqicn.org/station/brazil/sao-paulo/osasco/pt/

Este conjunto de dados contém informações diárias sobre a qualidade do ar em Osasco,
monitoradas pela CETESB (Companhia Ambiental do Estado de São Paulo), desde 2014 até 2025.
As medições incluem os seguintes poluentes atmosféricos:
- Material particulado fino (PM2.5)
- Material particulado grosso (PM10)
- Ozônio (O3)
- Dióxido de nitrogênio (NO2)
- Dióxido de enxofre (SO2)
- Monóxido de carbono (CO)

Carregando os dados de poluição e transformando em Data Frame

In [6]:
dadosPoluicao = pd.read_csv(r'Arquivos\Dados_Poluicao_Osasco_fonte_air_quality.csv')
df_poluicao = pd.DataFrame(dadosPoluicao)

Fixa a consulta no ano de 2024

In [7]:
df_poluicao.copy()

df_poluicao['date'] = pd.to_datetime(df_poluicao['date'])

df_poluicao = df_poluicao[df_poluicao['date'].dt.year == 2024]

df_poluicao_cidade = df_poluicao.sort_values(by='date')

#### DADOS DE SINTOMAS - CIDADE DE OSASCO
##### Fonte: https://dados.gov.br/dados/conjuntos-dados/srag-2021-e-2022
##### Conjunto de dados: SRAG 2024 - Atualização em 24/03/2025

Este conjunto de dados refere-se à vigilância epidemiológica da Síndrome Respiratória Aguda Grave (SRAG)
em todo o território nacional. Contém mais de 190 colunas com informações detalhadas sobre cada caso.
Para esta análise, são utilizadas apenas as colunas referentes aos sintomas == 1,
relacionados à cidade de Osasco no ano de 2024.

Trata e carrega os dados de sintomas

In [8]:
dadosSintomas = pd.read_csv(
    r'Arquivos\Dados_Sintomas_fonte_MS.csv',
    sep=';',              
    encoding='latin1',    
    on_bad_lines='skip'   
)

df_sintomas = pd.DataFrame(dadosSintomas)
df_sintomas.head()


  dadosSintomas = pd.read_csv(


Unnamed: 0,DT_NOTIFIC,SEM_NOT,DT_SIN_PRI,SEM_PRI,SG_UF_NOT,ID_REGIONA,CO_REGIONA,ID_MUNICIP,CO_MUN_NOT,ID_UNIDADE,...,VG_REINF,REINF,FAB_ADIC,LOT_RE_BI,FAB_RE_BI,DOSE_ADIC,DOS_RE_BI,LOTE_ADIC,TABAG,CASO_SRAG
0,13/01/2024,2,10/01/2024,2,SP,GVE VII SANTO ANDRE,1332.0,MAUA,352940,HOSPITAL E MATERNIDADE BRASIL UNIDADE MAUA,...,,2,,,,,,,,0.0
1,26/01/2024,4,23/01/2024,4,DF,,,BRASILIA,530010,HOSPITAL SANTA LUZIA,...,,2,,,,,,,,1.0
2,12/02/2024,7,08/02/2024,6,RJ,,,RIO DE JANEIRO,330455,HOSPITAL QUINTA DOR,...,,2,,GJ2553,103 - COVID-19 PFIZER - COMIRNATY BIVALENTE,,27/02/2023,,,0.0
3,26/02/2024,9,21/02/2024,8,SP,GVE VIII MOGI DAS CRUZES,1333.0,GUARULHOS,351880,HOSPITAL MUNICIPAL DA CRIANCA E DO ADOLESCENTE...,...,,2,,,,,,,,1.0
4,22/02/2024,8,19/02/2024,8,MT,SINOP,1584.0,SORRISO,510792,UPA SARA AKEMI ICHICAVA SORRISO,...,,2,,,,,,,,1.0


Fixa a consulta na cidade de Osasco

In [9]:
cidade = 'OSASCO'
df_cidade = df_sintomas[df_sintomas['ID_MUNICIP'] == cidade]
df_cidade.head()

Unnamed: 0,DT_NOTIFIC,SEM_NOT,DT_SIN_PRI,SEM_PRI,SG_UF_NOT,ID_REGIONA,CO_REGIONA,ID_MUNICIP,CO_MUN_NOT,ID_UNIDADE,...,VG_REINF,REINF,FAB_ADIC,LOT_RE_BI,FAB_RE_BI,DOSE_ADIC,DOS_RE_BI,LOTE_ADIC,TABAG,CASO_SRAG
872,25/09/2024,39,24/09/2024,39,SP,GVE X OSASCO,1335.0,OSASCO,353440,HOSPITAL MUNICIPAL ANTONIO GIGLIO,...,,2,,GK0280,103 - COVID-19 PFIZER - COMIRNATY BIVALENTE,,22/12/2023,,,0.0
1231,11/07/2024,28,10/07/2024,28,SP,GVE X OSASCO,1335.0,OSASCO,353440,HOSPITAL SINO BRASILEIRO,...,,2,,,,,,,,1.0
1495,22/09/2024,39,22/09/2024,39,SP,GVE X OSASCO,1335.0,OSASCO,353440,HOSPITAL MUNICIPAL ANTONIO GIGLIO,...,,2,,,,,,,,0.0
1497,22/08/2024,34,18/08/2024,34,SP,GVE X OSASCO,1335.0,OSASCO,353440,HOSPITAL CRUZEIRO DO SUL,...,,2,,,,,,,,1.0
2191,23/05/2024,21,21/05/2024,21,SP,GVE X OSASCO,1335.0,OSASCO,353440,HOSPITAL MATERNIDADE AMADOR AGUIAR,...,,2,,,,,,,,1.0


Retorna apenas os dados de sintomas, ignorando as outras colunas

In [10]:
# Lista dos sintomas
colunas_sintomas = [
    'DT_NOTIFIC', 'FEBRE', 'TOSSE', 'GARGANTA', 'DISPNEIA', 'DESC_RESP', 'SATURACAO',
    'DIARREIA', 'VOMITO', 'DOR_ABD', 'FADIGA', 'PERD_OLFT', 'PERD_PALA', 'CLASSI_FIN'
]

# Filtrar as colunas e CLASSI_FIN == 4
df_cidade_sintomas = df_cidade[colunas_sintomas]
df_filtrado = df_cidade_sintomas[colunas_sintomas]

# Lista dos sintomas (sem DT_NOTIFIC e CLASSI_FIN)
sintomas = [col for col in colunas_sintomas if col not in ['DT_NOTIFIC', 'CLASSI_FIN']]

# Armazenar os resultados aqui
lista_resultados = []

# Iterar pelos sintomas e contar casos == 1 por dia
for sintoma in sintomas:
    df_sintoma = df_filtrado[df_filtrado[sintoma] == 1]
    contagem_por_dia = df_sintoma.groupby('DT_NOTIFIC').size().reset_index(name='qtd_casos')
    contagem_por_dia['sintoma'] = sintoma
    lista_resultados.append(contagem_por_dia)

# Concatenar tudo
df_cidade_sintomas = pd.concat(lista_resultados, ignore_index=True)

# Reordenar colunas
df_cidade_sintomas = df_cidade_sintomas[['DT_NOTIFIC', 'sintoma', 'qtd_casos']]

# Exibir exemplo
df_cidade_sintomas

Unnamed: 0,DT_NOTIFIC,sintoma,qtd_casos
0,01/02/2024,FEBRE,3
1,01/04/2024,FEBRE,2
2,01/05/2024,FEBRE,2
3,01/07/2024,FEBRE,1
4,01/08/2024,FEBRE,5
...,...,...,...
1957,25/05/2024,PERD_PALA,1
1958,26/03/2024,PERD_PALA,1
1959,26/08/2024,PERD_PALA,1
1960,29/12/2024,PERD_PALA,1


In [11]:
# Contagem total de casos por sintoma (soma dos casos agrupados por dia)
contagem_total_por_sintoma = df_cidade_sintomas.groupby('sintoma')['qtd_casos'].sum().sort_values(ascending=False)

# Exibir o resultado
print(contagem_total_por_sintoma)


sintoma
DESC_RESP    1034
DISPNEIA      945
SATURACAO     932
FEBRE         710
TOSSE         548
FADIGA        137
VOMITO        118
DIARREIA       62
DOR_ABD        53
GARGANTA       42
PERD_PALA      26
PERD_OLFT      25
Name: qtd_casos, dtype: int64


#### DADOS DE EMPRESAS - CIDADE DE OSASCO
##### Fonte: https://inteligencia-dados.fiesp.com.br/inteligencia-mercado/index.html

Este conjunto de dados apresenta informações sobre empresas atuantes no município de Osasco,
incluindo segmentos industriais e localizações. Os dados podem ser utilizados para correlacionar
a presença de atividades econômicas com a emissão de poluentes ou estratégias ESG locais.

In [12]:
dadosEmpresas = pd.read_excel(r'Arquivos\Dados_Empresas_Osasco_fonte_Fiesp.xlsx')
df_empresas = pd.DataFrame(dadosEmpresas)
df_empresas

Unnamed: 0,ID,CNPJ,emp_raz_so,emp_num_fu,Porte,Setor,cnae,denominacao,CNAE Secundaria,endereco,...,produto,email,email_contabil,Site,telefone2,email2,associada_entidade,NCM,Optante Simples,Optante MEI
0,5640690,48.510.937/0001-33,CERVIFLAN INDUSTRIAL E COMERCIAL LIMITADA,246,media/grande,INDUSTRIAS DE TRANSFORMACAO,2591800,Fabricação de embalagens metálicas,3319800,RUA INDUBEL 357,...,,cerviflan@cerviflan.com.br,,www.cerviflan.com.br,(11) 3787-7666,claudete@cerviflan.com.br,S,7310.10.10;7310.10.90;7310.21.10;7310.21.90;73...,Não,Não
1,3725954,48.754.139/0001-57,CONTINENTAL BRASIL INDUSTRIA AUTOMOTIVA LTDA,962,media/grande,INDUSTRIAS DE TRANSFORMACAO,2945000,Fabricação de material elétrico e eletrônico p...,29492996202300712010074901047490199,AVENIDA SENADOR ADOLF SCHINDLING 131,...,CONTINENTAL BRASIL,renata.bassi@continental.com,,www.continental-corporation.com,(11) 2035-4091,"""wesley filgueira de souza - wesley.souza@cont...",S,8409.91.40;8511.10.00;8511.20.10;8511.20.90;85...,Não,Não
2,5669425,57.794.844/0001-79,DANFLOW INDUSTRIA E COMERCIO LTDA,9,media/grande,,2599399,Fabricação de outros produtos de metal não esp...,2599301329220232990033319800,AVENIDA ATALAIA DO NORTE 22 BLOCO 3,...,DANFLOW S/A,danflow@danflow.ind.br,,,,gildariosilverio@uol.com.br,S,7212.10.00;7316.00.00;7326.90.10;8007.00.10;80...,Não,Não
3,5678059,54.947.908/0001-36,DEGANI VADUZ INDUSTRIA QUIMICA LTDA,23,media/grande,INDUSTRIAS DE TRANSFORMACAO,2099199,Fabricação de outros produtos químicos não esp...,"2013401,2013402,3600601,3900500,5211799,712010...",AVENIDA GUINLE 818,...,DEGANI QUIMICA,deganivaduz@deganivaduz.com.br,,www.deganivaduz.com.br,(11) 994711200;(11) 994333320;(11) 992519413,mauricio@mmugnol.com.br,S,1518.00.10;1518.00.90;2710.91.00;2710.99.00;28...,Não,Não
4,7593917,61.310.256/0001-90,ELETRICA DANUBIO INDUSTRIA E COMERCIO DE MATER...,311,media/grande,,2733300,"Fabricação de fios, cabos e condutores elétric...",4673700,RUA BARAO DE PENEDO 319,...,SIL FIOS E CABOS,sil@sil.com.br; filho@sil.com.br,,http://www.sil.com.br,(11) 33773249,KARINA.MARTINEZ@SIL.COM.BR,S,8544.11.00;8544.19.10;8544.19.90;8544.20.00;85...,Não,Não
5,7561478,45.988.045/0018-00,GARRETT MOTION INDUSTRIA AUTOMOTIVA BRASIL LTDA.,102,media/grande,INDUSTRIAS DE TRANSFORMACAO,3099700,Fabricação de equipamentos de transporte não e...,62040007020400711200074901047319004,AVENIDA JULIA GAIOLLI 282,...,,rosangela.goncalves@garrettmotion.com,,www.garrettmotion.com,(11) 976482134;(11) 989509014;(11) 991469025,smm@ceramicasumare.com.br;ceramica@desktop.com...,S,8716.80.00;,Não,Não
6,7592728,61.074.829/0001-23,HITACHI ENERGY BRASIL LTDA.,763,media/grande,,7112000,Serviços de engenharia,"2710402,4789099,7120100,4221903,4221902,711979...",AVENIDA AVENIDA MONTEIRO LOBATO 3411 3411 EDIF...,...,,fiscal@hitachienergy.com,,www.hitachienergy.com,,valdir.schneider@br.abb.com,S,,Não,Não
7,3661641,61.077.079/0001-43,MAGGION INDUSTRIAS DE PNEUS E MAQUINAS LTDA,1017,media/grande,INDUSTRIAS DE TRANSFORMACAO,2219600,Fabricação de artefatos de borracha não especi...,221110045307024661300521179970204008599604,RUA JOSE CAMPANELLA 501 467 CEP 07112-902,...,,apauletto@maggion.com.br,,www.maggion.com.br,(11) 2229-9200(11) 22299200,alexcpd@maggion.com.br ;maggi...,S,4003.00.00;4004.00.00;4005.10.10;4005.10.90;40...,Não,Não
8,1718574,70.940.994/0001-01,PANDURATA ALIMENTOS LTDA,569,media/grande,INDUSTRIAS DE TRANSFORMACAO,1092900,Fabricação de biscoitos e bolachas,"1032599,1093702,4635499,4637101,4637104,464949...",RUA FRITZ REIMANN 628,...,,controladoria@bauducco.com.br,,www.bauducco.com.br,1125739400,rodrigom@bauducco.com.br;malaquias@bauducco.co...,S,1905.31.00;1905.32.00;,Não,Não
9,3654963,59.884.502/0001-75,ROSSETTI EQUIPAMENTOS RODOVIARIOS LTDA,264,media/grande,INDUSTRIAS DE TRANSFORMACAO,2930101,"Fabricação de cabines, carrocerias e reboques ...",453070636006014530703452000728224026463800,ESTRADA AGUA CHATA 3715,...,,rossetti@rossetti.com.br,,www.rossetti.com.br,(11) 21910923(11) 21910900,edmilson.souza@rossetti.com.br;eduardo.slivar@...,S,8609.00.00;8707.10.00;8707.90.90;8716.10.00;87...,Não,Não
