<a href="https://colab.research.google.com/github/monicasenna/movasc_scripts/blob/main/estatistica_descritiva.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Bibliotecas necessárias
import pandas as pd
import numpy as np

In [None]:
# Upload de arquivo CSV
from google.colab import drive
drive.mount('/content/drive')

# === 1. LER ARQUIVO CSV COM PRECIPITAÇÃO ===
file_path = '/content/drive/MyDrive/Movasc2_scripts/avaliacao_29mai25_monica.csv'  # Substitua pelo caminho do seu arquivo
df = pd.read_csv(file_path)

# Verifica as primeiras linhas
print("Amostra dos dados:")
print(df.head())


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Amostra dos dados:
   Unnamed: 0   ano  mes  latitude  longitude    prec_obs  prec_prev
0          65  2019    1    -23.55     -45.55  315.001373  241.30498
1          78  2019    1    -23.45     -46.05  199.662008  221.41922
2          79  2019    1    -23.45     -45.95  217.000336  211.06825
3          82  2019    1    -23.45     -45.65  263.535722  234.97282
4          86  2019    1    -23.45     -45.25  208.169805  281.90298


In [None]:
# === 2. Garantir que os dados estão corretos ===
# Ex: garantir nomes corretos das colunas (ajuste conforme seu CSV)
df.columns = [col.strip().lower() for col in df.columns]
df = df.rename(columns={
    'ano': 'ano',
    'mes': 'mes',
    'latitude': 'lat',
    'longitude': 'lon',
    'prec_obs': 'precip'
})

print (df)

       unnamed: 0   ano  mes    lat    lon      precip  prec_prev
0              65  2019    1 -23.55 -45.55  315.001373  241.30498
1              78  2019    1 -23.45 -46.05  199.662008  221.41922
2              79  2019    1 -23.45 -45.95  217.000336  211.06825
3              82  2019    1 -23.45 -45.65  263.535722  234.97282
4              86  2019    1 -23.45 -45.25  208.169805  281.90298
...           ...   ...  ...    ...    ...         ...        ...
12715      116750  2023   12 -20.85 -42.35  170.602283  149.04689
12716      116752  2023   12 -20.85 -42.15  189.231544  141.52084
12717      116877  2023   12 -20.65 -42.35  162.218085  157.52666
12718      116878  2023   12 -20.65 -42.25  165.493484  155.28203
12719      116879  2023   12 -20.65 -42.15  161.648152  141.37054

[12720 rows x 7 columns]


In [None]:
# === 3. Agrupar por coordenadas ===
agrupado = df.groupby(['lat', 'lon'])

# === 4. Calcular estatísticas descritivas ===
estatisticas = agrupado['precip'].agg([
    'count',           # número de observações
    'mean',            # média
    'std',             # desvio padrão
    'var',             # variância
    'min',             # valor mínimo
    'max',             # valor máximo
    'median'           # mediana
]).reset_index()

print(estatisticas)

       lat    lon  count        mean         std           var        min  \
0   -23.55 -45.55     60  164.534669  107.004556  11449.974955  13.692129   
1   -23.45 -46.05     60  121.456877   92.426591   8542.674704   3.838466   
2   -23.45 -45.95     60  116.268540   89.591493   8026.635604   5.033265   
3   -23.45 -45.65     60  135.873554   87.269543   7615.973093   7.100131   
4   -23.45 -45.25     60  166.089396  101.801389  10363.522854  24.088260   
..     ...    ...    ...         ...         ...           ...        ...   
207 -20.85 -42.35     60  127.960639  126.248612  15938.712158   0.000000   
208 -20.85 -42.15     60  125.189138  120.250417  14460.162786   0.075533   
209 -20.65 -42.35     60  115.002899  113.880996  12968.881292   0.000000   
210 -20.65 -42.25     60  122.429769  118.790152  14111.100175   0.089267   
211 -20.65 -42.15     60  127.107799  123.969415  15368.415885   0.206000   

            max      median  
0    470.716727  131.263161  
1    349.568163

In [None]:
# === 5. Salvar os resultados em CSV (opcional) ===
estatisticas.to_csv("/content/drive/MyDrive/Movasc2_scripts/estatisticas_precipitacao_por_ponto.csv", index=False)