# Projeto Final

Este projeto busca analisar a qualidade da água das praias de Mongaguá, litoral sul de São Paulo com base na densidade de Enterococcus presente em cada amostra. Altos valores dessa densidade indicam riscos á saúde dos banhistas e podem definir se a praia é "Própria" ou "Imprópria" para banho.

A tabela utilizada contém mais de 74 mil medições feitas semanalmente de 2012 a 2021, em 16 cidades e 168 praias. Neste projeto iremos apenas analisar as medições das praias da cidade de Mongaguá no período de Carnaval, comparando os anos de 2019 (quando não havia pandemia) e 2021 (quando a pandemia estava no seu auge), buscando saber o tamanho do impacto das restrições sanitárias nas águas de Mongaguá e se o turismo causa piora da situação do sistema de saneamento básico.

![Alt text](files/entero.png)

Enterococcus são bactérias gram-positivas, normalmente encontradas no intestino e no trato genital feminino. Existem 14 espécies descritas de Enterococcus spp., sendo o E. faecalis e o E. faecium as duas que normalmente promovem colonização e infecções em humanos, como endocardite, infecção do trato urinário, prostatite, infecção intra-abdominal, celulite e infecção em feridas, além de bacteremia concomitante.

De acordo com a CETESB, "densidades superiores a 100 UFC/100 mL , em duas ou mais amostras de um conjunto de cinco semanas, ou valores superiores a 400 UFC/100 mL na última amostragem, caracterizam a impropriedade da praia para recreação de contato primário."

In [1]:
import pandas as pd

In [12]:
df = pd.read_csv('../projeto-final/files/sp_beaches.csv')
df

Unnamed: 0,City,Beach,Date,Enterococcus
0,BERTIOGA,BORACÉIA - COL. MARISTA,2012-01-03,8.0
1,BERTIOGA,BORACÉIA - COL. MARISTA,2012-01-08,22.0
2,BERTIOGA,BORACÉIA - COL. MARISTA,2012-01-15,17.0
3,BERTIOGA,BORACÉIA - COL. MARISTA,2012-01-22,8.0
4,BERTIOGA,BORACÉIA - COL. MARISTA,2012-01-29,2.0
...,...,...,...,...
74051,UBATUBA,PULSO,2021-02-01,1.0
74052,UBATUBA,PULSO,2021-03-01,1.0
74053,UBATUBA,PULSO,2021-05-03,1.0
74054,UBATUBA,PULSO,2021-06-07,4.0


In [38]:
# Selecionando os dados de 01/02/19 a 14/03/19
#A CETESB não realizou medidas após 14/03/2021 por conta da pandemia, então vamos pegar 
# até 14/03/19 para aproximá-las

monga = df.loc[(df['City'] == 'MONGAGUÁ')]
monga_19 = monga.loc[(monga['Date'] >= '2019-02-01') & (monga['Date'] <= '2019-03-14')]
monga_19

Unnamed: 0,City,Beach,Date,Enterococcus
61855,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2019-02-03,108.0
61856,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2019-02-10,3.0
61857,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2019-02-17,124.0
61858,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2019-02-24,15.0
61859,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2019-03-03,59.0
61860,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2019-03-10,212.0
61907,MONGAGUÁ,CENTRAL,2019-02-03,124.0
61908,MONGAGUÁ,CENTRAL,2019-02-10,22.0
61909,MONGAGUÁ,CENTRAL,2019-02-17,80.0
61910,MONGAGUÁ,CENTRAL,2019-02-24,7.0


In [39]:
monga_19['Beach'].value_counts()

ITAPOÃ - VILA SÃO PAULO    6
CENTRAL                    6
VERA CRUZ                  6
SANTA EUGÊNIA              6
ITAÓCA                     6
AGENOR DE CAMPOS           6
FLÓRIDA MIRIM              6
Name: Beach, dtype: int64



![Alt text](files/mongagua.jpg)

In [40]:
monga_19[['Beach', 'Enterococcus']].groupby('Beach').agg(['mean', 'max', 'min'])

Unnamed: 0_level_0,Enterococcus,Enterococcus,Enterococcus
Unnamed: 0_level_1,mean,max,min
Beach,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2
AGENOR DE CAMPOS,110.666667,352.0,1.0
CENTRAL,84.166667,160.0,7.0
FLÓRIDA MIRIM,90.833333,296.0,1.0
ITAPOÃ - VILA SÃO PAULO,86.833333,212.0,3.0
ITAÓCA,115.833333,408.0,7.0
SANTA EUGÊNIA,123.333333,256.0,6.0
VERA CRUZ,94.0,292.0,4.0


In [41]:
#Selecionando os dados de 01/02/2021 a 14/03/2021

monga_21 = monga.loc[(monga['Date'] >= '2021-02-01') & (monga['Date'] <= '2021-03-14')]
monga_21

Unnamed: 0,City,Beach,Date,Enterococcus
71860,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2021-02-01,2.0
71861,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2021-02-08,8.0
71862,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2021-02-15,65.0
71863,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2021-02-22,1.0
71864,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2021-03-01,20.0
71865,MONGAGUÁ,ITAPOÃ - VILA SÃO PAULO,2021-03-08,16.0
71884,MONGAGUÁ,CENTRAL,2021-02-01,2.0
71885,MONGAGUÁ,CENTRAL,2021-02-08,5.0
71886,MONGAGUÁ,CENTRAL,2021-02-15,1.0
71887,MONGAGUÁ,CENTRAL,2021-02-22,1.0


In [42]:
monga_21['Beach'].value_counts()

ITAPOÃ - VILA SÃO PAULO    6
CENTRAL                    6
VERA CRUZ                  6
SANTA EUGÊNIA              6
ITAÓCA                     6
AGENOR DE CAMPOS           6
FLÓRIDA MIRIM              6
Name: Beach, dtype: int64

In [43]:
monga_21[['Beach', 'Enterococcus']].groupby('Beach').agg(['mean', 'max', 'min'])

Unnamed: 0_level_0,Enterococcus,Enterococcus,Enterococcus
Unnamed: 0_level_1,mean,max,min
Beach,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2
AGENOR DE CAMPOS,5.333333,17.0,1.0
CENTRAL,4.166667,12.0,1.0
FLÓRIDA MIRIM,6.166667,12.0,1.0
ITAPOÃ - VILA SÃO PAULO,18.666667,65.0,1.0
ITAÓCA,47.333333,256.0,2.0
SANTA EUGÊNIA,7.166667,16.0,2.0
VERA CRUZ,29.333333,152.0,1.0
