<a href="https://colab.research.google.com/github/yurivasconcelos/Javascript/blob/master/Avalia%C3%A7%C3%A3o_P2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Trabalhando com dados Fluviométricos do Córrego da Pedreira 

Os dados de vazão são essenciais para avaliação do balanço hidrológico em bacias hidrográficas. Entretanto, realizar medições fluviométricas diretas periodicamente é um desafio, devido aos custos operacionais. Sendo assim, uma forma indireta de obter dados de vazão é medindo a altura da lâmina d'água e a área da seção transversal do escoamento. A leitura do nível d'água pode ser obtida de maneira automática com  sensores eletrônicos. 

A figura abaixo à direita ilustra um sensor ultrassônico instalado em uma seção canalizada do córrego da Pedreira, um afluente do rio Belém. O sistema de medição registra a leitura da distância entre o sensor e a lâmina d'água (linha vermelha na figura da esquerda abaixo). Os dados são obtidos periodicamente e salvos em um cartão de memória.

<img src="https://drive.google.com/uc?export=view&id=18XqiiHUHq3MoV3koqn0Oq9ggqNTnW-5U" width="300"/> <img src="https://drive.google.com/uc?export=view&id=1NiGpdaX1CgtGZbSxDFo2gf-GNbjd-x8g" width="300"/> 




Com a utilização do sensor ultrassônico, foram realizadas leituras de nível em intervalos de 15 segundos, entre os dias 05/08 e 30/08.
Analisando os dados brutos observam-se alguns dados espúrios, necessitando que os mesmos sejam tratados e filtrados antes de serem utilizandos para os cálculos de vazão. 

**Exercício I:** Organizar os dados de medição de nível, seguindo os seguintes passos:

1. Leitura dos dados de distância (linha vermelha da figura acima à esquerda) do arquivo CSV. O arquivo CSV contém uma coluna para a data e hora (no formado ddmmaaaa HH:MM:SS) e outra coluna com os dados de distância em centímetros. Você pode acessá-lo no link:(https://www.dropbox.com/s/htfwy819slzcxkt/dados_ultrassonico.csv?dl=0). **Nessa seção o/a discente deverá fazer 3 coisas:**

**a) Criar um Dataframe e nomear o título das colunas de acordo com a lista: ['data_hora','dist_cm']**

**b) Definir a coluna 'data_hora' como o índice do dataframe.**

**c) A coluna 'data_hora' deverá ser configurada como o formato de data padrão: aaaa-mm-dd HH:MM:SS**

2. Filtragem dos dados espúrios (errôneos). Existem algumas medições onde a distância foi registrada como zero e outras medições em que a distância aparece maior do que 100 cm. O filtro deve ser construído para retirar os valores zero e os valores acima de 100 cm. **Nessa seção o/a discente deverá responder: Quantas linhas foram retiradas do Dataframe?**

3. Calcular os valores de nível com base nas medições de distância considerando a distância total entre o sensor e o fundo do canal de 83,80 centímetros (linha verde da figura acima à esquerda). **Nessa seção o/a discente deverá criar uma nova coluna no Dataframe intitulada 'dist_cm' com altura da lâmina d'água para cada medição. Além disso, deverá ser calculada a média do nível d'água.**


4. Calcular a Média horária dos dados de nível. Não é para calcular o perfil diário (média horária de todos os dias). É para calcular a média de cada intervalo de 60 minutos entre os dias 05/08 e 30/08. **Nessa seção o/a discente deverá criar um gráfico das médias horárias ao longo do tempo**

5. Calcular a Média diária dos dados de nível. **Nessa seção o/a discente deverá criar um gráfico das médias diárias ao longo do tempo**



In [98]:
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
%matplotlib inline

URL= 'https://www.dropbox.com/s/htfwy819slzcxkt/dados_ultrassonico.csv?dl=1'

df = pd.read_csv(URL, names=(['data_hora','dist_cm']), sep=';')
df['data_hora']=pd.to_datetime(df.data_hora, format = ' %d%m%Y %H:%M:%S')
df_index = df.set_index(df['data_hora'])
df_drop = df_index.drop('data_hora', inplace=True, axis=1)

df = pd.read_csv(URL, names=(['data_hora','dist_cm']), sep=';')
df['data_hora']=pd.to_datetime(df.data_hora, format = ' %d%m%Y %H:%M:%S')
df_index = df.set_index(df['data_hora'])
df_drop = df_index.drop('data_hora', inplace=True, axis=1)

filtro = (df_index['dist_cm'] > 0) & (df_index['dist_cm'] < 100)
df_filtrado = df_index[filtro]


# Totais dataframe:
''

totalRemovidos = len(df) - len(df_filtrado)
print('Total data frame origipnal', len(df))
print('Total data frame filtrado', len(df_filtrado))
print('Total removido', totalRemovidos)

print(df_filtrado)


# Adicionando novas colunas ao data frame


df['dist_cm_la'] = 83.8
df_filtrado['dist_cm_la'] = 83.8

df_filtrado['dist_cm_profundidade'] = df_filtrado['dist_cm_la'] -  df_filtrado['dist_cm']

print(df_filtrado)

# Calculando a media

media = df_filtrado['dist_cm_profundidade'].mean()

print('A media da profundidade é', media)




# 4 - Media Horaria
print('a media horaria')
media_hor = df.groupby(df['data_hora'].dt.hour);
print(media_hor)
# media_hor = df_filtrado['data_hora'].groupby(df_filtrado['data_hora'].)
# print(media_hor)



# hr = np.linspace(1,24,24,endpoint=True)
# # media_hor

# plt.style.use('ggplot')
# plt.figure(figsize=(12,6))
# plt.title('Concentração média horária de MP10 para o mês de junho', fontsize=19, fontweight='bold', fontfamily='monospace' )
# plt.xlabel('Hora do dia', fontsize=16, fontfamily='monospace')
# plt.ylabel('Concentração MP10 (μg/m3)', fontsize=16, fontfamily='monospace')
# plt.plot(hr,media_hor)



Total data frame origipnal 2123
Total data frame filtrado 2082
Total removido 41
                     dist_cm
data_hora                   
2020-08-05 17:10:03    65.10
2020-08-05 17:25:03    65.04
2020-08-05 17:40:02    65.20
2020-08-05 17:55:01    64.95
2020-08-05 18:10:01    65.03
...                      ...
2020-08-30 17:14:47    68.23
2020-08-30 17:29:46    68.51
2020-08-30 17:44:45    67.84
2020-08-30 17:59:45    68.10
2020-08-30 18:14:44    69.59

[2082 rows x 1 columns]
                     dist_cm  dist_cm_la  dist_cm_profundidade
data_hora                                                     
2020-08-05 17:10:03    65.10        83.8                 18.70
2020-08-05 17:25:03    65.04        83.8                 18.76
2020-08-05 17:40:02    65.20        83.8                 18.60
2020-08-05 17:55:01    64.95        83.8                 18.85
2020-08-05 18:10:01    65.03        83.8                 18.77
...                      ...         ...                   ...
2020-08-30 17

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy


**Exercício II:** Com os dados já tratados, agora pode-se utilizar de métodos empíricos para o cálculo da vazão. Considere que o córrego está canalizado em uma manilha de 1.50 metros de diâmetro, e a declividade é de 1,27% (0.73°).

Realizar o cálculo da vazão ($Q$) associada ao escoamento no canal circular utilizando os dados horários de nível. Uma aproximação da vazão $Q$ pode ser obtida aplicando a equação de Manning: 

$\displaystyle Q = \ \frac{A}{n}  R^{2/3} S^{1/2}$

Sendo que $V$ é a velocidade do escoamento, $R$ é o raio hidráulico, $S$ é a declividade do fundo do canal e $n$ é o coeficiente de rugosidade de Gauckler–Manning. Considere que o valor do coeficiente de Gauckler–Manning é $n = 0.2$ s/m$^{1/3}$.

Para obter a vazão o/a discente deverá realizar o produto da velocidade e da área. 

Observe a figura abaixo e identifique as variáveis: $D$ (diâmetro do tubo), $r$ (raio do tubo), $h$ (altura da lâmina d'água) e $\theta$ (ângulo em relação ao centro do tubo). 

<img src="https://www.dropbox.com/s/zx1xlfbqd16j5m2/wetted-circle_ok.png?dl=1" width="250"/> 

Para proceder com os cálculos sugere-se :

1. Calcular $\theta$ (em radianos) de acordo com as fórmulas abaixo, sendo que $h$ é a altura da lâmina d'água.
2. Cálculo da área molhada
3. Cálculo do perímetro molhado
4. Cálculo do raio hidráulico
5. Cálculo da velocidade média
6. Cálculo da vazão

A seguir são apresentadas algumas equações que podem ser úteis nos cálculos. 

O raio ($r$) é a metade do diâmetro ($D$):

$$r = \frac{D}{2}$$

O ângulo $\theta$ deverá ser calculado em radianos e pode ser obtido de acordo com a equação:

$$\theta = 2 \, \text{arc cos} \left(\frac{r-h}{r} \right)$$

A área da seção transversal do escoamento ($A$) é:

$$A = \frac{r^2 (\theta - \text{sen}\theta)}{2}$$

O perímetro molhado ($P$) é:

$$P = r \theta$$

O raio hidráulico ($R_h$) é:

$$R_h = \frac{A}{P}$$


Sugestão de leitura de [material com as equações](https://www.cedengineering.com/userfiles/Partially%20Full%20Pipe%20Flow%20Calculations.pdf).

**No final do exercício II o/a discente deverá fazer 3 coisas:**

**a) Mostrar um gráfico da vazão horária (m3/s) ao longo do tempo.** (não é o perfil diário de vazão).

**b) Mostrar um histograma da vazão horária (m3/s).**

**c) Calcular a mediana da vazão horária (m3/s)**


In [93]:
df_filtrado

raio = 0.75

df_filtrado['angulo_test'] = raio - df_filtrado['dist_cm_profundidade'] / raio
print(df_filtrado)

# test = 10
# raio = 0.75

# t2 = (raio - test) / raio
# print(t2)
print(2 * np.arccos(df_filtrado['angulo_test']))






                     dist_cm  dist_cm_la  ...  angulo angulo_test
data_hora                                 ...                    
2020-08-05 17:10:03    65.10        83.8  ...          -24.183333
2020-08-05 17:25:03    65.04        83.8  ...          -24.263333
2020-08-05 17:40:02    65.20        83.8  ...          -24.050000
2020-08-05 17:55:01    64.95        83.8  ...          -24.383333
2020-08-05 18:10:01    65.03        83.8  ...          -24.276667
...                      ...         ...  ...     ...         ...
2020-08-30 17:14:47    68.23        83.8  ...          -20.010000
2020-08-30 17:29:46    68.51        83.8  ...          -19.636667
2020-08-30 17:44:45    67.84        83.8  ...          -20.530000
2020-08-30 17:59:45    68.10        83.8  ...          -20.183333
2020-08-30 18:14:44    69.59        83.8  ...          -18.196667

[2082 rows x 5 columns]
data_hora
2020-08-05 17:10:03   NaN
2020-08-05 17:25:03   NaN
2020-08-05 17:40:02   NaN
2020-08-05 17:55:01   NaN
202

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  """
  result = getattr(ufunc, method)(*inputs, **kwargs)
