In [1]:
import pandas as pd
from tqdm import tqdm
import time
from openai import OpenAI
import os

In [2]:
# read the original data file
df = pd.read_csv("IDS.csv")

In [3]:
# index
INPUT_FILE = "IDS.csv"
PROGRESS_FILE = "Filtered_WPS_Progress.csv"
FINAL_FILE = "Filtered_WPS_Final.csv"
SAVE_EVERY = 100
DESC_COL = "Overall Submission Description (may describe multiple incidents)"

In [4]:
# keep human related + U.S incidents
df.columns = df.columns.str.strip()
df["Country"] = df["Country"].str.strip().str.upper()
df_human = df[df["Impact of Incident"].str.contains("H", na=False)]
df_human = df_human[df_human["Country"] == "US"]
df_human = df_human.reset_index(drop=True)

In [5]:
print("Filtered dataset size:", len(df_human))

Filtered dataset size: 13011


In [6]:
tqdm.pandas()

In [7]:
client = OpenAI(
    api_key="sk-df9f5cc150e746e7a2d93ac1db2cfeb2",
    base_url="https://api.deepseek.com"
)

In [8]:
# save the progress
results = []
start_index = 0
if os.path.exists(PROGRESS_FILE):
    existing = pd.read_csv(PROGRESS_FILE)
    results = existing.to_dict("records")
    start_index = len(existing)
    print(f"🔁 Resuming from row {start_index}")
else:
    print(f"🚀 Starting from scratch")

🚀 Starting from scratch


In [9]:
# check product type
def is_pesticide_product(product_name):
    prompt = f"""
You are a chemical safety and pesticide regulation expert.

Given the name of a chemical product or mixture, determine whether this chemical is likely used as a **pesticide or agricultural chemical** that could be subject to **Worker Protection Standard (WPS)** enforcement.

Consider the chemical "included" if it is used in agricultural fields, greenhouses, or orchards to control pests, diseases, or weeds.

Chemical:
{product_name}

Respond only with:
- "Yes"
- "No"
"""
    for attempt in range(3):
        try:
            response = client.chat.completions.create(
                model="deepseek-chat",
                messages=[{"role": "user", "content": prompt}],
                temperature=0,
            )
            return response.choices[0].message.content.strip()
        except Exception as e:
            print(f"⚠️ Product check error: {e} (attempt {attempt+1}/3)")
            time.sleep(5)
    return "ERROR"

In [10]:
# filter wps related
def is_wps_incident(description):
    prompt = f"""
You are a domain expert in agricultural labor safety and pesticide regulation.

Given a self-reported incident description, determine whether the case is relevant to the **Worker Protection Standard (WPS)**.

Consider it relevant if:
- A human (especially a worker, field laborer, pesticide handler) was affected
- The incident occurred in an agricultural context (e.g., farm, greenhouse, orchard, nursery)

If the report clearly involves most or all of the above, respond "Yes". If not, respond "No".

Incident Description:
{description}
"""
    for attempt in range(3):
        try:
            response = client.chat.completions.create(
                model="deepseek-chat",
                messages=[{"role": "user", "content": prompt}],
                temperature=0,
            )
            return response.choices[0].message.content.strip()
        except Exception as e:
            print(f"⚠️ WPS check error: {e} (attempt {attempt+1}/3)")
            time.sleep(5)
    return "ERROR"

In [11]:
# main loop: filter the is_pesticide_product then is_wps_incident
tqdm.pandas()
for i in tqdm(range(start_index, len(df_human))):
    row = df_human.iloc[i]
    product = str(row["Product Names"])
    description = str(row[DESC_COL])

    pesticide_check = is_pesticide_product(product)
    if pesticide_check.lower() == "yes":
        wps_check = is_wps_incident(description)
    else:
        wps_check = "No"

    # save result
    result_row = row.to_dict()
    result_row["is_pesticide_related"] = pesticide_check
    result_row["is_wps_related"] = wps_check
    results.append(result_row)

    # save the progress every 100 lines
    if (i + 1) % SAVE_EVERY == 0 or (i + 1) == len(df_human):
        temp_df = pd.DataFrame(results)
        temp_df.to_csv(PROGRESS_FILE, index=False)
        print(f"✅ Progress saved at row {i+1} to {PROGRESS_FILE}")

  1%|█                                                                                                                                        | 100/13011 [14:14<27:55:33,  7.79s/it]

✅ Progress saved at row 100 to Filtered_WPS_Progress.csv


  2%|██                                                                                                                                       | 200/13011 [28:12<25:06:42,  7.06s/it]

✅ Progress saved at row 200 to Filtered_WPS_Progress.csv


  2%|███▏                                                                                                                                     | 300/13011 [42:44<33:43:17,  9.55s/it]

✅ Progress saved at row 300 to Filtered_WPS_Progress.csv


  3%|████▏                                                                                                                                    | 400/13011 [57:51<30:13:16,  8.63s/it]

✅ Progress saved at row 400 to Filtered_WPS_Progress.csv


  4%|█████▏                                                                                                                                 | 500/13011 [1:12:41<21:02:10,  6.05s/it]

✅ Progress saved at row 500 to Filtered_WPS_Progress.csv


  5%|██████▏                                                                                                                                | 600/13011 [1:31:52<54:29:30, 15.81s/it]

✅ Progress saved at row 600 to Filtered_WPS_Progress.csv


  5%|███████▎                                                                                                                               | 700/13011 [1:47:29<27:45:05,  8.12s/it]

✅ Progress saved at row 700 to Filtered_WPS_Progress.csv


  6%|████████▎                                                                                                                              | 800/13011 [2:01:59<39:39:30, 11.69s/it]

✅ Progress saved at row 800 to Filtered_WPS_Progress.csv


  7%|█████████▎                                                                                                                             | 900/13011 [2:19:49<18:59:04,  5.64s/it]

✅ Progress saved at row 900 to Filtered_WPS_Progress.csv


  8%|██████████▎                                                                                                                           | 1000/13011 [2:34:13<51:13:35, 15.35s/it]

✅ Progress saved at row 1000 to Filtered_WPS_Progress.csv


  8%|███████████▎                                                                                                                          | 1100/13011 [2:52:04<45:42:25, 13.81s/it]

✅ Progress saved at row 1100 to Filtered_WPS_Progress.csv


  9%|████████████▎                                                                                                                         | 1200/13011 [3:07:51<18:21:30,  5.60s/it]

✅ Progress saved at row 1200 to Filtered_WPS_Progress.csv


 10%|█████████████▍                                                                                                                        | 1300/13011 [3:25:20<31:32:45,  9.70s/it]

✅ Progress saved at row 1300 to Filtered_WPS_Progress.csv


 11%|██████████████▍                                                                                                                       | 1400/13011 [3:39:25<34:27:55, 10.69s/it]

✅ Progress saved at row 1400 to Filtered_WPS_Progress.csv


 12%|███████████████▍                                                                                                                      | 1500/13011 [3:54:32<28:22:38,  8.87s/it]

✅ Progress saved at row 1500 to Filtered_WPS_Progress.csv


 12%|████████████████▍                                                                                                                     | 1600/13011 [4:08:16<41:15:25, 13.02s/it]

✅ Progress saved at row 1600 to Filtered_WPS_Progress.csv


 13%|█████████████████▌                                                                                                                    | 1700/13011 [4:21:06<22:51:54,  7.28s/it]

✅ Progress saved at row 1700 to Filtered_WPS_Progress.csv


 14%|██████████████████▌                                                                                                                   | 1800/13011 [4:40:13<17:05:26,  5.49s/it]

✅ Progress saved at row 1800 to Filtered_WPS_Progress.csv


 15%|███████████████████▌                                                                                                                  | 1900/13011 [4:57:42<18:22:43,  5.95s/it]

✅ Progress saved at row 1900 to Filtered_WPS_Progress.csv


 15%|████████████████████▌                                                                                                                 | 2000/13011 [5:14:08<34:32:07, 11.29s/it]

✅ Progress saved at row 2000 to Filtered_WPS_Progress.csv


 16%|█████████████████████▋                                                                                                                | 2100/13011 [5:30:56<19:00:28,  6.27s/it]

✅ Progress saved at row 2100 to Filtered_WPS_Progress.csv


 17%|██████████████████████▋                                                                                                               | 2200/13011 [5:49:41<34:28:35, 11.48s/it]

✅ Progress saved at row 2200 to Filtered_WPS_Progress.csv


 18%|███████████████████████▋                                                                                                              | 2300/13011 [6:07:34<22:50:38,  7.68s/it]

✅ Progress saved at row 2300 to Filtered_WPS_Progress.csv


 18%|████████████████████████▋                                                                                                             | 2400/13011 [6:24:25<35:03:39, 11.90s/it]

✅ Progress saved at row 2400 to Filtered_WPS_Progress.csv


 19%|█████████████████████████▋                                                                                                            | 2500/13011 [6:40:55<21:18:28,  7.30s/it]

✅ Progress saved at row 2500 to Filtered_WPS_Progress.csv


 20%|██████████████████████████▊                                                                                                           | 2600/13011 [6:58:31<23:40:49,  8.19s/it]

✅ Progress saved at row 2600 to Filtered_WPS_Progress.csv


 21%|███████████████████████████▊                                                                                                          | 2700/13011 [7:09:24<21:18:21,  7.44s/it]

✅ Progress saved at row 2700 to Filtered_WPS_Progress.csv


 22%|████████████████████████████▊                                                                                                         | 2800/13011 [7:25:22<31:41:46, 11.17s/it]

✅ Progress saved at row 2800 to Filtered_WPS_Progress.csv


 22%|█████████████████████████████▊                                                                                                        | 2900/13011 [7:39:18<21:08:22,  7.53s/it]

✅ Progress saved at row 2900 to Filtered_WPS_Progress.csv


 23%|██████████████████████████████▉                                                                                                       | 3000/13011 [7:55:39<25:38:02,  9.22s/it]

✅ Progress saved at row 3000 to Filtered_WPS_Progress.csv


 24%|███████████████████████████████▉                                                                                                      | 3100/13011 [8:07:07<23:39:38,  8.59s/it]

✅ Progress saved at row 3100 to Filtered_WPS_Progress.csv


 25%|████████████████████████████████▉                                                                                                     | 3200/13011 [8:22:21<20:00:07,  7.34s/it]

✅ Progress saved at row 3200 to Filtered_WPS_Progress.csv


 25%|█████████████████████████████████▉                                                                                                    | 3300/13011 [8:34:01<16:22:37,  6.07s/it]

✅ Progress saved at row 3300 to Filtered_WPS_Progress.csv


 26%|███████████████████████████████████                                                                                                   | 3400/13011 [8:47:39<33:46:23, 12.65s/it]

✅ Progress saved at row 3400 to Filtered_WPS_Progress.csv


 27%|████████████████████████████████████                                                                                                  | 3500/13011 [9:02:38<27:21:11, 10.35s/it]

✅ Progress saved at row 3500 to Filtered_WPS_Progress.csv


 28%|█████████████████████████████████████                                                                                                 | 3600/13011 [9:17:35<26:23:08, 10.09s/it]

✅ Progress saved at row 3600 to Filtered_WPS_Progress.csv


 28%|██████████████████████████████████████                                                                                                | 3700/13011 [9:33:29<23:12:14,  8.97s/it]

✅ Progress saved at row 3700 to Filtered_WPS_Progress.csv


 29%|███████████████████████████████████████▏                                                                                              | 3800/13011 [9:49:50<22:34:19,  8.82s/it]

✅ Progress saved at row 3800 to Filtered_WPS_Progress.csv


 30%|███████████████████████████████████████▊                                                                                             | 3900/13011 [10:05:22<21:10:56,  8.37s/it]

✅ Progress saved at row 3900 to Filtered_WPS_Progress.csv


 31%|████████████████████████████████████████▉                                                                                            | 4000/13011 [10:22:24<17:29:56,  6.99s/it]

✅ Progress saved at row 4000 to Filtered_WPS_Progress.csv


 32%|█████████████████████████████████████████▉                                                                                           | 4100/13011 [10:39:14<28:55:07, 11.68s/it]

✅ Progress saved at row 4100 to Filtered_WPS_Progress.csv


 32%|██████████████████████████████████████████▉                                                                                          | 4200/13011 [10:57:31<31:51:00, 13.01s/it]

✅ Progress saved at row 4200 to Filtered_WPS_Progress.csv


 33%|███████████████████████████████████████████▉                                                                                         | 4300/13011 [11:15:31<26:35:40, 10.99s/it]

✅ Progress saved at row 4300 to Filtered_WPS_Progress.csv


 34%|████████████████████████████████████████████▉                                                                                        | 4400/13011 [11:32:05<11:04:54,  4.63s/it]

✅ Progress saved at row 4400 to Filtered_WPS_Progress.csv


 35%|█████████████████████████████████████████████▉                                                                                       | 4500/13011 [11:47:18<22:20:09,  9.45s/it]

✅ Progress saved at row 4500 to Filtered_WPS_Progress.csv


 35%|███████████████████████████████████████████████                                                                                      | 4600/13011 [12:03:06<13:48:05,  5.91s/it]

✅ Progress saved at row 4600 to Filtered_WPS_Progress.csv


 36%|████████████████████████████████████████████████                                                                                     | 4700/13011 [12:20:47<28:09:24, 12.20s/it]

✅ Progress saved at row 4700 to Filtered_WPS_Progress.csv


 37%|█████████████████████████████████████████████████                                                                                    | 4800/13011 [12:35:44<24:00:10, 10.52s/it]

✅ Progress saved at row 4800 to Filtered_WPS_Progress.csv


 38%|██████████████████████████████████████████████████                                                                                   | 4900/13011 [12:52:57<24:16:13, 10.77s/it]

✅ Progress saved at row 4900 to Filtered_WPS_Progress.csv


 38%|███████████████████████████████████████████████████                                                                                  | 5000/13011 [13:08:10<28:53:45, 12.99s/it]

✅ Progress saved at row 5000 to Filtered_WPS_Progress.csv


 39%|████████████████████████████████████████████████████▏                                                                                | 5100/13011 [13:22:46<23:00:55, 10.47s/it]

✅ Progress saved at row 5100 to Filtered_WPS_Progress.csv


 40%|█████████████████████████████████████████████████████▏                                                                               | 5200/13011 [13:37:05<26:45:48, 12.33s/it]

✅ Progress saved at row 5200 to Filtered_WPS_Progress.csv


 41%|██████████████████████████████████████████████████████▏                                                                              | 5300/13011 [13:50:49<19:05:57,  8.92s/it]

✅ Progress saved at row 5300 to Filtered_WPS_Progress.csv


 42%|███████████████████████████████████████████████████████▏                                                                             | 5400/13011 [14:05:20<17:55:11,  8.48s/it]

✅ Progress saved at row 5400 to Filtered_WPS_Progress.csv


 42%|████████████████████████████████████████████████████████▏                                                                            | 5500/13011 [14:20:12<26:08:44, 12.53s/it]

✅ Progress saved at row 5500 to Filtered_WPS_Progress.csv


 43%|█████████████████████████████████████████████████████████▏                                                                           | 5600/13011 [14:37:46<35:58:40, 17.48s/it]

✅ Progress saved at row 5600 to Filtered_WPS_Progress.csv


 44%|██████████████████████████████████████████████████████████▎                                                                          | 5700/13011 [14:56:16<14:49:46,  7.30s/it]

✅ Progress saved at row 5700 to Filtered_WPS_Progress.csv


 45%|███████████████████████████████████████████████████████████▎                                                                         | 5800/13011 [15:12:15<14:11:28,  7.08s/it]

✅ Progress saved at row 5800 to Filtered_WPS_Progress.csv


 45%|████████████████████████████████████████████████████████████▎                                                                        | 5900/13011 [15:28:35<14:38:25,  7.41s/it]

✅ Progress saved at row 5900 to Filtered_WPS_Progress.csv


 46%|█████████████████████████████████████████████████████████████▎                                                                       | 6000/13011 [15:47:53<25:42:59, 13.20s/it]

✅ Progress saved at row 6000 to Filtered_WPS_Progress.csv


 47%|██████████████████████████████████████████████████████████████▎                                                                      | 6100/13011 [16:02:11<11:20:48,  5.91s/it]

✅ Progress saved at row 6100 to Filtered_WPS_Progress.csv


 48%|███████████████████████████████████████████████████████████████▍                                                                     | 6200/13011 [16:21:45<24:26:08, 12.92s/it]

✅ Progress saved at row 6200 to Filtered_WPS_Progress.csv


 48%|████████████████████████████████████████████████████████████████▉                                                                     | 6300/13011 [16:39:03<8:35:42,  4.61s/it]

✅ Progress saved at row 6300 to Filtered_WPS_Progress.csv


 49%|█████████████████████████████████████████████████████████████████▍                                                                   | 6400/13011 [16:57:39<22:12:30, 12.09s/it]

✅ Progress saved at row 6400 to Filtered_WPS_Progress.csv


 50%|██████████████████████████████████████████████████████████████████▍                                                                  | 6500/13011 [17:14:57<11:16:57,  6.24s/it]

✅ Progress saved at row 6500 to Filtered_WPS_Progress.csv


 51%|███████████████████████████████████████████████████████████████████▍                                                                 | 6600/13011 [17:30:15<14:05:03,  7.91s/it]

✅ Progress saved at row 6600 to Filtered_WPS_Progress.csv


 51%|████████████████████████████████████████████████████████████████████▍                                                                | 6700/13011 [17:44:07<21:18:06, 12.15s/it]

✅ Progress saved at row 6700 to Filtered_WPS_Progress.csv


 52%|█████████████████████████████████████████████████████████████████████▌                                                               | 6800/13011 [18:00:50<23:02:13, 13.35s/it]

✅ Progress saved at row 6800 to Filtered_WPS_Progress.csv


 53%|███████████████████████████████████████████████████████████████████████                                                               | 6900/13011 [18:15:08<9:11:00,  5.41s/it]

✅ Progress saved at row 6900 to Filtered_WPS_Progress.csv


 54%|███████████████████████████████████████████████████████████████████████▌                                                             | 7000/13011 [18:34:42<14:29:23,  8.68s/it]

✅ Progress saved at row 7000 to Filtered_WPS_Progress.csv


 55%|████████████████████████████████████████████████████████████████████████▌                                                            | 7100/13011 [18:53:41<18:12:13, 11.09s/it]

✅ Progress saved at row 7100 to Filtered_WPS_Progress.csv


 55%|█████████████████████████████████████████████████████████████████████████▌                                                           | 7200/13011 [19:11:22<25:26:31, 15.76s/it]

✅ Progress saved at row 7200 to Filtered_WPS_Progress.csv


 56%|██████████████████████████████████████████████████████████████████████████▌                                                          | 7300/13011 [19:41:43<28:01:29, 17.67s/it]

✅ Progress saved at row 7300 to Filtered_WPS_Progress.csv


 57%|███████████████████████████████████████████████████████████████████████████▋                                                         | 7400/13011 [20:19:15<20:58:57, 13.46s/it]

✅ Progress saved at row 7400 to Filtered_WPS_Progress.csv


 58%|█████████████████████████████████████████████████████████████████████████████▏                                                        | 7500/13011 [20:38:12<9:32:43,  6.24s/it]

✅ Progress saved at row 7500 to Filtered_WPS_Progress.csv


 58%|█████████████████████████████████████████████████████████████████████████████▋                                                       | 7600/13011 [20:59:57<21:01:32, 13.99s/it]

✅ Progress saved at row 7600 to Filtered_WPS_Progress.csv


 59%|██████████████████████████████████████████████████████████████████████████████▋                                                      | 7700/13011 [21:16:36<20:04:00, 13.60s/it]

✅ Progress saved at row 7700 to Filtered_WPS_Progress.csv


 60%|███████████████████████████████████████████████████████████████████████████████▋                                                     | 7800/13011 [21:35:17<23:02:06, 15.91s/it]

✅ Progress saved at row 7800 to Filtered_WPS_Progress.csv


 61%|████████████████████████████████████████████████████████████████████████████████▊                                                    | 7900/13011 [21:53:32<10:00:13,  7.05s/it]

✅ Progress saved at row 7900 to Filtered_WPS_Progress.csv


 61%|█████████████████████████████████████████████████████████████████████████████████▊                                                   | 8000/13011 [22:12:59<14:27:15, 10.38s/it]

✅ Progress saved at row 8000 to Filtered_WPS_Progress.csv


 62%|███████████████████████████████████████████████████████████████████████████████████▍                                                  | 8100/13011 [22:33:22<9:01:22,  6.61s/it]

✅ Progress saved at row 8100 to Filtered_WPS_Progress.csv


 63%|███████████████████████████████████████████████████████████████████████████████████▊                                                 | 8200/13011 [22:53:05<17:16:59, 12.93s/it]

✅ Progress saved at row 8200 to Filtered_WPS_Progress.csv


 64%|█████████████████████████████████████████████████████████████████████████████████████▍                                                | 8300/13011 [23:10:25<9:00:50,  6.89s/it]

✅ Progress saved at row 8300 to Filtered_WPS_Progress.csv


 65%|█████████████████████████████████████████████████████████████████████████████████████▊                                               | 8400/13011 [23:26:36<15:20:07, 11.97s/it]

✅ Progress saved at row 8400 to Filtered_WPS_Progress.csv


 65%|██████████████████████████████████████████████████████████████████████████████████████▉                                              | 8500/13011 [23:42:53<16:42:59, 13.34s/it]

✅ Progress saved at row 8500 to Filtered_WPS_Progress.csv


 66%|███████████████████████████████████████████████████████████████████████████████████████▉                                             | 8600/13011 [23:58:59<12:36:20, 10.29s/it]

✅ Progress saved at row 8600 to Filtered_WPS_Progress.csv


 67%|█████████████████████████████████████████████████████████████████████████████████████████▌                                            | 8700/13011 [24:16:52<6:13:24,  5.20s/it]

✅ Progress saved at row 8700 to Filtered_WPS_Progress.csv


 68%|██████████████████████████████████████████████████████████████████████████████████████████▋                                           | 8800/13011 [24:32:50<6:02:08,  5.16s/it]

✅ Progress saved at row 8800 to Filtered_WPS_Progress.csv


 68%|██████████████████████████████████████████████████████████████████████████████████████████▉                                          | 8900/13011 [24:48:25<16:52:22, 14.78s/it]

✅ Progress saved at row 8900 to Filtered_WPS_Progress.csv


 69%|███████████████████████████████████████████████████████████████████████████████████████████▉                                         | 9000/13011 [25:05:51<14:53:45, 13.37s/it]

✅ Progress saved at row 9000 to Filtered_WPS_Progress.csv


 70%|█████████████████████████████████████████████████████████████████████████████████████████████▋                                        | 9100/13011 [25:20:43<6:41:53,  6.17s/it]

✅ Progress saved at row 9100 to Filtered_WPS_Progress.csv


 71%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                       | 9200/13011 [25:38:01<8:11:16,  7.73s/it]

✅ Progress saved at row 9200 to Filtered_WPS_Progress.csv


 71%|███████████████████████████████████████████████████████████████████████████████████████████████                                      | 9300/13011 [25:54:15<12:38:44, 12.27s/it]

✅ Progress saved at row 9300 to Filtered_WPS_Progress.csv


 72%|████████████████████████████████████████████████████████████████████████████████████████████████                                     | 9400/13011 [26:09:42<10:36:51, 10.58s/it]

✅ Progress saved at row 9400 to Filtered_WPS_Progress.csv


 73%|█████████████████████████████████████████████████████████████████████████████████████████████████▊                                    | 9500/13011 [26:25:06<7:21:18,  7.54s/it]

✅ Progress saved at row 9500 to Filtered_WPS_Progress.csv


 74%|██████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 9600/13011 [26:38:08<12:54:03, 13.62s/it]

✅ Progress saved at row 9600 to Filtered_WPS_Progress.csv


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                                  | 9700/13011 [26:52:16<8:03:41,  8.77s/it]

✅ Progress saved at row 9700 to Filtered_WPS_Progress.csv


 75%|████████████████████████████████████████████████████████████████████████████████████████████████████▏                                | 9800/13011 [27:08:09<12:05:21, 13.55s/it]

✅ Progress saved at row 9800 to Filtered_WPS_Progress.csv


 76%|█████████████████████████████████████████████████████████████████████████████████████████████████████▉                                | 9900/13011 [27:24:46<9:13:17, 10.67s/it]

✅ Progress saved at row 9900 to Filtered_WPS_Progress.csv


 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████▏                              | 10000/13011 [27:39:49<3:28:17,  4.15s/it]

✅ Progress saved at row 10000 to Filtered_WPS_Progress.csv


 78%|███████████████████████████████████████████████████████████████████████████████████████████████████████▏                             | 10100/13011 [27:57:19<7:45:41,  9.60s/it]

✅ Progress saved at row 10100 to Filtered_WPS_Progress.csv


 78%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                            | 10200/13011 [28:13:11<13:16:53, 17.01s/it]

✅ Progress saved at row 10200 to Filtered_WPS_Progress.csv


 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 10300/13011 [28:31:09<11:38:59, 15.47s/it]

✅ Progress saved at row 10300 to Filtered_WPS_Progress.csv


 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▎                          | 10400/13011 [28:48:18<7:12:39,  9.94s/it]

✅ Progress saved at row 10400 to Filtered_WPS_Progress.csv


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▎                         | 10500/13011 [29:08:04<9:56:47, 14.26s/it]

✅ Progress saved at row 10500 to Filtered_WPS_Progress.csv


 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                        | 10600/13011 [29:25:31<5:24:04,  8.06s/it]

✅ Progress saved at row 10600 to Filtered_WPS_Progress.csv


 82%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                       | 10700/13011 [29:42:59<8:14:06, 12.83s/it]

✅ Progress saved at row 10700 to Filtered_WPS_Progress.csv


 83%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                      | 10800/13011 [29:59:58<4:05:53,  6.67s/it]

✅ Progress saved at row 10800 to Filtered_WPS_Progress.csv


 84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                     | 10900/13011 [30:15:59<6:57:33, 11.87s/it]

✅ Progress saved at row 10900 to Filtered_WPS_Progress.csv


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                    | 11000/13011 [30:32:38<7:09:18, 12.81s/it]

✅ Progress saved at row 11000 to Filtered_WPS_Progress.csv


 85%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                   | 11100/13011 [30:46:30<3:09:34,  5.95s/it]

✅ Progress saved at row 11100 to Filtered_WPS_Progress.csv


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 11200/13011 [31:01:34<5:41:48, 11.32s/it]

✅ Progress saved at row 11200 to Filtered_WPS_Progress.csv


 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 11300/13011 [31:17:00<2:30:57,  5.29s/it]

✅ Progress saved at row 11300 to Filtered_WPS_Progress.csv


 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                | 11400/13011 [31:31:43<2:42:01,  6.03s/it]

✅ Progress saved at row 11400 to Filtered_WPS_Progress.csv


 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌               | 11500/13011 [31:46:47<3:45:04,  8.94s/it]

✅ Progress saved at row 11500 to Filtered_WPS_Progress.csv


 89%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌              | 11600/13011 [32:02:35<2:13:21,  5.67s/it]

✅ Progress saved at row 11600 to Filtered_WPS_Progress.csv


 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌             | 11700/13011 [32:16:43<3:01:09,  8.29s/it]

✅ Progress saved at row 11700 to Filtered_WPS_Progress.csv


 91%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌            | 11800/13011 [32:32:06<2:00:25,  5.97s/it]

✅ Progress saved at row 11800 to Filtered_WPS_Progress.csv


 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋           | 11900/13011 [32:48:10<3:33:58, 11.56s/it]

✅ Progress saved at row 11900 to Filtered_WPS_Progress.csv


 92%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋          | 12000/13011 [33:06:16<4:09:04, 14.78s/it]

✅ Progress saved at row 12000 to Filtered_WPS_Progress.csv


 93%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋         | 12100/13011 [33:24:30<2:59:29, 11.82s/it]

✅ Progress saved at row 12100 to Filtered_WPS_Progress.csv


 94%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋        | 12200/13011 [33:39:49<1:27:39,  6.49s/it]

✅ Progress saved at row 12200 to Filtered_WPS_Progress.csv


 95%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 12300/13011 [33:56:50<2:27:42, 12.46s/it]

✅ Progress saved at row 12300 to Filtered_WPS_Progress.csv


 95%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊      | 12400/13011 [34:16:25<1:56:06, 11.40s/it]

✅ Progress saved at row 12400 to Filtered_WPS_Progress.csv


 96%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊     | 12500/13011 [34:30:43<1:05:17,  7.67s/it]

✅ Progress saved at row 12500 to Filtered_WPS_Progress.csv


 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊    | 12600/13011 [34:51:00<1:32:23, 13.49s/it]

✅ Progress saved at row 12600 to Filtered_WPS_Progress.csv


 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊   | 12700/13011 [35:08:32<45:55,  8.86s/it]

✅ Progress saved at row 12700 to Filtered_WPS_Progress.csv


 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊  | 12800/13011 [35:25:20<42:29, 12.08s/it]

✅ Progress saved at row 12800 to Filtered_WPS_Progress.csv


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊ | 12900/13011 [35:41:21<22:55, 12.39s/it]

✅ Progress saved at row 12900 to Filtered_WPS_Progress.csv


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉| 13000/13011 [35:58:57<02:38, 14.39s/it]

✅ Progress saved at row 13000 to Filtered_WPS_Progress.csv


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 13011/13011 [36:00:30<00:00,  9.96s/it]

✅ Progress saved at row 13011 to Filtered_WPS_Progress.csv





In [12]:
# result
final_df = df_pesticide[df_pesticide["is_wps_related"].str.lower() == "yes"]
final_df.to_csv("Filtered_WPS_Final.csv", index=False)
print("Done. Saved to Filtered_WPS_Final.csv")

NameError: name 'df_pesticide' is not defined