# Import Libraries

In [1]:
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)

In [2]:
import numpy as np
import pandas as pd
import tqdm
import yaml
import glob
import os
import gc

from datetime import datetime
from IPython.display import clear_output

In [3]:
from src.components.feature_extraction import feature_extraction
from src.utils import get_root_directory

In [4]:
# Get root directory of the project
root_dir = get_root_directory()

In [5]:
# Maximize Column Display 
pd.set_option('display.max_colwidth', None)     # Display all content within each cell without truncation
pd.set_option('display.max_columns', None)      # Display all columns
pd.set_option('display.width', None)            # Display entire width of DataFrame is displayed

pd.set_option('display.max_rows', None)         # Display all rows

# Extract Traffic Signal Profile

## FDOT D5

In [6]:
# Configurations
signal_ids = [
    "1285", "1290",
    "1300", "1315", "1325", "1330", 
    "1455", "1470", "1490",
    "1500", "1555",
    "1707", "1725", "1790", "1795", 
    "1960",
    "2055", 
    "2485", 
    "2665", 
    # "D5I-3000"
]

In [None]:
for signal_id in signal_ids:
    print(f"Processing Signal ID: {signal_id}")
    print("=" * 40)

    # Define the filepaths
    filepaths = f"../data/interim/atspm/fdot_d5/event_data/{signal_id}/*.pkl"
    filepaths = [p for p in glob.glob(filepaths)][1:]  # Exclude first file, if needed

    # Extract dates from filepaths
    dates = [os.path.basename(filepath).split(".")[0] for filepath in filepaths]

    for date in dates:
        print(f"  Processing Date: {date}")

        try:
            # Parse the date string into a datetime object
            date_object = datetime.strptime(date, '%Y-%m-%d')

            # Extract day, month, and year
            day = date_object.day
            month = date_object.month
            year = date_object.year

            if month != 6:
                continue

            # Extract Traffic Signal Profile
            traffic_signal_profile = feature_extraction.TrafficSignalProfile(day=day, 
                                                                             month=month, 
                                                                             year=year)
            
            df_vehicle_phase_profile_id = traffic_signal_profile.extract_vehicle_phase_profile(signal_id=signal_id)
            df_vehicle_cycle_profile_id = traffic_signal_profile.extract_vehicle_cycle_profile(signal_id=signal_id)

            df_pedestrian_phase_profile_id = traffic_signal_profile.extract_pedestrian_phase_profile(signal_id=signal_id)
            df_pedestrian_cycle_profile_id = traffic_signal_profile.extract_pedestrian_cycle_profile(signal_id=signal_id)

            # Extract signal features
            signal_feature_extract = feature_extraction.SignalFeatureExtract(day=day, 
                                                                             month=month, 
                                                                             year=year)

            print("   # Extracting SPaT")
            df_spat_id = signal_feature_extract.extract_spat(signal_id=signal_id)

            # Extract traffic features
            traffic_feature_extract = feature_extraction.TrafficFeatureExtract(day=day, 
                                                                               month=month,
                                                                               year=year)
            # Volume
            print("   # Extracting Volume")
            df_volume_id = traffic_feature_extract.extract_volume(signal_id=signal_id, 
                                                                  with_countbar=False)
            
            # Occupancy
            print("   # Extracting Occupancy")
            df_occupancy_id = traffic_feature_extract.extract_occupancy(signal_id=signal_id)

            # Split Failure
            print("   # Extracting Split Failure")
            df_split_failure_id = traffic_feature_extract.extract_split_failure(signal_id=signal_id)
            
            # Red Light Running
            print("   # Extracting Red Light Running")
            df_red_running_id = traffic_feature_extract.extract_red_running(signal_id=signal_id, 
                                                                            with_countbar=False)

            # Pedestrian Volume
            print("   # Extracting Pedestrian Volume")
            df_pedestrian_volume_id = traffic_feature_extract.extract_pedestrian_volume(signal_id=signal_id)

            # Pedestrian Delay
            print("   # Extracting Pedestrian Delay")
            df_pedestrian_delay_id = traffic_feature_extract.extract_pedestrian_delay(signal_id=signal_id)

        except Exception as e:
            print(f"Error Processing Date {date}: {e}")

    # Explicitly call garbage collector
    gc.collect()

    # Clear output after processing each Signal ID
    clear_output(wait=True)

Processing Signal ID: 1500
  Processing Date: 2024-05-31
  Processing Date: 2024-06-01
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 410/410 [00:01<00:00, 324.20it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 410/410 [00:07<00:00, 54.38it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 410/410 [15:36<00:00,  2.28s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 410/410 [02:25<00:00,  2.82it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 124/124 [00:00<00:00, 213.12it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 124/124 [00:01<00:00, 115.40it/s]


  Processing Date: 2024-06-02
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 458/458 [00:01<00:00, 348.53it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 458/458 [00:07<00:00, 58.05it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 458/458 [13:05<00:00,  1.71s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 458/458 [02:06<00:00,  3.62it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 118/118 [00:00<00:00, 221.08it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 118/118 [00:00<00:00, 132.17it/s]


  Processing Date: 2024-06-03
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 398/398 [00:01<00:00, 326.97it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 398/398 [00:07<00:00, 55.58it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 398/398 [15:18<00:00,  2.31s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 398/398 [02:21<00:00,  2.82it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:00<00:00, 230.08it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:00<00:00, 129.02it/s]


  Processing Date: 2024-06-04
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 384/384 [00:01<00:00, 338.35it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 384/384 [00:07<00:00, 53.83it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 384/384 [15:40<00:00,  2.45s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 384/384 [02:23<00:00,  2.68it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 129/129 [00:00<00:00, 221.38it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 129/129 [00:01<00:00, 122.70it/s]


  Processing Date: 2024-06-05
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 406/406 [00:01<00:00, 313.69it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 406/406 [00:07<00:00, 53.57it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 406/406 [15:53<00:00,  2.35s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 406/406 [02:26<00:00,  2.77it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 138/138 [00:00<00:00, 212.58it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 138/138 [00:01<00:00, 119.10it/s]


  Processing Date: 2024-06-06
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 407/407 [00:01<00:00, 334.95it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 407/407 [00:07<00:00, 53.82it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 407/407 [15:39<00:00,  2.31s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 407/407 [02:22<00:00,  2.86it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 118/118 [00:00<00:00, 215.56it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 118/118 [00:00<00:00, 122.91it/s]


  Processing Date: 2024-06-07
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 414/414 [00:01<00:00, 324.06it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 414/414 [00:07<00:00, 54.10it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 414/414 [16:08<00:00,  2.34s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 414/414 [02:27<00:00,  2.80it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 128/128 [00:00<00:00, 234.45it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 128/128 [00:01<00:00, 121.48it/s]


  Processing Date: 2024-06-08
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 430/430 [00:01<00:00, 335.64it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 430/430 [00:07<00:00, 54.60it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 430/430 [15:25<00:00,  2.15s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 430/430 [02:25<00:00,  2.96it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 111/111 [00:00<00:00, 207.76it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 111/111 [00:00<00:00, 134.71it/s]


  Processing Date: 2024-06-09
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 384/384 [00:01<00:00, 343.74it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 384/384 [00:06<00:00, 56.85it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 384/384 [12:15<00:00,  1.92s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 384/384 [01:57<00:00,  3.26it/s]


   # Extracting Pedestrian Volume


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 90/90 [00:00<00:00, 207.70it/s]


   # Extracting Pedestrian Delay


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 90/90 [00:00<00:00, 131.34it/s]


  Processing Date: 2024-06-11
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 104/104 [00:00<00:00, 349.91it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 104/104 [00:01<00:00, 60.07it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 104/104 [01:56<00:00,  1.12s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 104/104 [00:21<00:00,  4.94it/s]


   # Extracting Pedestrian Volume


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 26/26 [00:00<00:00, 217.44it/s]


   # Extracting Pedestrian Delay


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 26/26 [00:00<00:00, 132.78it/s]


  Processing Date: 2024-06-12
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 400/400 [00:01<00:00, 333.19it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 400/400 [00:07<00:00, 53.74it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 400/400 [15:59<00:00,  2.40s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 400/400 [02:25<00:00,  2.74it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 225.00it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 123.73it/s]


  Processing Date: 2024-06-13
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 497/497 [00:01<00:00, 345.14it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 497/497 [00:08<00:00, 57.96it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 497/497 [15:59<00:00,  1.93s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 497/497 [02:28<00:00,  3.35it/s]


   # Extracting Pedestrian Volume


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 116/116 [00:00<00:00, 215.43it/s]


   # Extracting Pedestrian Delay


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 116/116 [00:00<00:00, 118.69it/s]


  Processing Date: 2024-06-14
   # Extracting SPaT


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:01<00:00, 330.78it/s]


   # Extracting Volume


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:07<00:00, 53.34it/s]


   # Extracting Occupancy


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 395/395 [16:43<00:00,  2.54s/it]


   # Extracting Split Failure
   # Extracting Red Light Running


 81%|█████████████████████████████████████████████████████████████████████████████████████████████▏                     | 320/395 [02:16<00:32,  2.30it/s]

## FDOT D7

In [None]:
# # Configurations
# signal_ids = ["1067", "1068", "1301", "1392", "1435", "1439", "1445", "1501", "1506"]

In [None]:
# for signal_id in signal_ids:
#     print(f"Processing Signal ID: {signal_id}")
#     print("=" * 40)

#     # Define the filepaths
#     filepaths = f"../data/interim/atspm/fdot_d7/event_data/{signal_id}/*.pkl"
#     filepaths = [p for p in glob.glob(filepaths)][1:]  # Exclude first file, if needed

#     # Extract dates from filepaths
#     dates = [os.path.basename(filepath).split(".")[0] for filepath in filepaths]

#     for date in dates:
#         print(f"  Processing Date: {date}")

#         try:
#             # Parse the date string into a datetime object
#             date_object = datetime.strptime(date, '%Y-%m-%d')

#             # Extract day, month, and year
#             day = date_object.day
#             month = date_object.month
#             year = date_object.year

#             # Extract Traffic Signal Profile
#             traffic_signal_profile = feature_extraction.TrafficSignalProfile(day=day, 
#                                                                              month=month, 
#                                                                              year=year)
#             df_vehicle_phase_profile_id = traffic_signal_profile.extract_vehicle_phase_profile(signal_id=signal_id)
#             df_vehicle_cycle_profile_id = traffic_signal_profile.extract_vehicle_cycle_profile(signal_id=signal_id)

#             # Extract signal features
#             signal_feature_extract = feature_extraction.SignalFeatureExtract(day=day, 
#                                                                              month=month, 
#                                                                              year=year)

#             print("   # Extracting SPaT")
#             df_spat_id = signal_feature_extract.extract_spat(signal_id=signal_id)

#             # Extract traffic features
#             traffic_feature_extract = feature_extraction.TrafficFeatureExtract(day=day, 
#                                                                                month=month,
#                                                                                year=year)
#             # Volume
#             print("   # Extracting Volume")
#             df_volume_id = traffic_feature_extract.extract_volume(signal_id=signal_id, 
#                                                                   with_countbar=True)
            
#             # Occupancy
#             print("   # Extracting Occupancy")
#             df_occupancy_id = traffic_feature_extract.extract_occupancy(signal_id=signal_id)

#             # # Split Failure
#             # print("   # Extracting Split Failure")
#             # df_split_failure_id = traffic_feature_extract.extract_split_failure(signal_id=signal_id)
            
#             # Red Light Running
#             print("   # Extracting Red Light Running")
#             df_red_running_id = traffic_feature_extract.extract_red_running(signal_id=signal_id, 
#                                                                             with_countbar=True)

#         except Exception as e:
#             print(f"Error Processing Date {date}: {e}")

#     # Explicitly call garbage collector
#     gc.collect()

#     # Clear output after processing each Signal ID
#     clear_output(wait=True)