In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
from meteostat import Point, Daily
from tqdm import tqdm
from sklearn.metrics import confusion_matrix

In [2]:
df = pd.read_csv('../pheno-data.csv')
df = df[(df['Phenophase_Description'] == 'Leaves (grasses)') & (df['Intensity_Value'] != '-9999')]
df['Abundance_Binary'] = df['Intensity_Value'].apply(lambda x: 1 if x == '75-94%' or x == '50-74%' or x == '95% or more' else 0)
df_filtered = df[['Observation_ID','Latitude', 'Longitude', 'Elevation_in_Meters', 'Phenophase_ID', 'Observation_Date', 'Abundance_Binary']]
df_filtered.head()

Unnamed: 0,Observation_ID,Latitude,Longitude,Elevation_in_Meters,Phenophase_ID,Observation_Date,Abundance_Binary
1754,1795824,32.25066,-110.946358,734,489,2013-01-28,1
1756,6838318,32.25066,-110.946358,734,489,2015-12-08,1
8332,2588139,32.212666,-111.001831,794,489,2013-07-23,1
8333,2588163,32.212666,-111.001831,794,489,2013-07-31,1
8334,2588187,32.212666,-111.001831,794,489,2013-08-06,1


In [3]:
scale = 4000 ## meters
label = df_filtered.Abundance_Binary.values ## labels
for days in range(24):
    
    pred = []
    
    for i in tqdm(range(len(df_filtered))):
            
        ## filter date
        start_date = df_filtered.Observation_Date.values[i]
        start_year = int(start_date[:4])
        start_month = int(start_date[5:7])
        start_day = int(start_date[8:10])
        start = datetime(start_year, start_month, start_day)
        
        end_date = (datetime.strptime(start_date, "%Y-%m-%d") + timedelta(days=days)).strftime("%Y-%m-%d")
        end_year = int(end_date[:4])
        end_month = int(end_date[5:7])
        end_day = int(end_date[8:10])
        end = datetime(end_year, end_month, end_day)
        
        ## point location
        lat = df_filtered.Latitude.values[i]
        long = df_filtered.Longitude.values[i]
        elevation = df_filtered.Elevation_in_Meters.values[i]
        point = Point(lat, long, elevation)
        data = Daily(point, start, end)
        data = data.fetch()
        
        ## get precipitation time series data
        try:
            ts_prec = data['prcp'].values*0.0393701 ## 1mm = 0.0393701 inches        
            pred.append(1*(sum(ts_prec)>1.7))
        except:
            pred.append(0)
    
    tn, fp, fn, tp = confusion_matrix(pred, label).ravel()            
    acc = 100*(tn+tp)/len(label)
    fp_rate = 100*(fp)/len(label)
    fn_rate = 100*(fn)/len(label)
    
    print(f'Accumulative Days {days}.')
    print(f'Accuracy: {acc}%')
    print(f'FP: {fp_rate}%')
    print(f'FN: {fn_rate}%')

100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:42<00:00, 39.61it/s]


Accumulative Days 0.
Accuracy: 64.25206124852768%
FP: 35.74793875147232%
FN: 0.0%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:44<00:00, 37.98it/s]


Accumulative Days 1.
Accuracy: 64.54652532391049%
FP: 35.39458186101296%
FN: 0.05889281507656066%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.78it/s]


Accumulative Days 2.
Accuracy: 64.3698468786808%
FP: 35.39458186101296%
FN: 0.23557126030624265%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:46<00:00, 36.60it/s]


Accumulative Days 3.
Accuracy: 64.3698468786808%
FP: 35.39458186101296%
FN: 0.23557126030624265%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:48<00:00, 35.07it/s]


Accumulative Days 4.
Accuracy: 64.01648998822144%
FP: 35.04122497055359%
FN: 0.9422850412249706%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:51<00:00, 33.27it/s]


Accumulative Days 5.
Accuracy: 63.78091872791519%
FP: 34.687868080094226%
FN: 1.5312131919905771%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:51<00:00, 33.20it/s]


Accumulative Days 6.
Accuracy: 63.60424028268551%
FP: 34.51118963486454%
FN: 1.8845700824499412%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:51<00:00, 33.08it/s]


Accumulative Days 7.
Accuracy: 64.01648998822144%
FP: 33.80447585394582%
FN: 2.1790341578327443%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:51<00:00, 33.20it/s]


Accumulative Days 8.
Accuracy: 64.01648998822144%
FP: 33.80447585394582%
FN: 2.1790341578327443%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:51<00:00, 32.98it/s]


Accumulative Days 9.
Accuracy: 64.01648998822144%
FP: 33.80447585394582%
FN: 2.1790341578327443%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:51<00:00, 32.91it/s]


Accumulative Days 10.
Accuracy: 64.60541813898705%
FP: 33.15665488810365%
FN: 2.237926972909305%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:50<00:00, 33.36it/s]


Accumulative Days 11.
Accuracy: 64.075382803298%
FP: 33.03886925795053%
FN: 2.8857479387514724%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.69it/s]


Accumulative Days 12.
Accuracy: 64.075382803298%
FP: 32.685512367491164%
FN: 3.239104829210836%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:48<00:00, 34.93it/s]


Accumulative Days 13.
Accuracy: 63.78091872791519%
FP: 32.09658421672556%
FN: 4.122497055359246%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:48<00:00, 35.10it/s]


Accumulative Days 14.
Accuracy: 63.30977620730271%
FP: 31.978798586572438%
FN: 4.7114252061248525%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 36.10it/s]


Accumulative Days 15.
Accuracy: 63.839811542991754%
FP: 31.15429917550059%
FN: 5.005889281507656%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.47it/s]


Accumulative Days 16.
Accuracy: 63.898704358068315%
FP: 31.036513545347468%
FN: 5.064782096584216%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.56it/s]


Accumulative Days 17.
Accuracy: 62.66195524146054%
FP: 30.859835100117785%
FN: 6.478209658421672%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.50it/s]


Accumulative Days 18.
Accuracy: 62.4263839811543%
FP: 30.800942285041224%
FN: 6.772673733804476%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.79it/s]


Accumulative Days 19.
Accuracy: 62.014134275618375%
FP: 30.742049469964666%
FN: 7.243816254416961%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.78it/s]


Accumulative Days 20.
Accuracy: 61.71967020023557%
FP: 30.3886925795053%
FN: 7.8916372202591285%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.50it/s]


Accumulative Days 21.
Accuracy: 62.073027090694936%
FP: 29.38751472320377%
FN: 8.539458186101296%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:47<00:00, 35.60it/s]


Accumulative Days 22.
Accuracy: 61.48409893992933%
FP: 28.50412249705536%
FN: 10.011778563015312%


100%|██████████████████████████████████████████████████████████████████████████████| 1698/1698 [00:48<00:00, 35.21it/s]

Accumulative Days 23.
Accuracy: 60.83627797408716%
FP: 28.386336866902237%
FN: 10.777385159010601%



