In [1]:
from transformers import Qwen2VLForConditionalGeneration, AutoTokenizer, AutoProcessor
from qwen_vl_utils import process_vision_info
import torch

import os
from tqdm import tqdm
import json
import signal
import argparse
import wandb
import pandas as pd

import sys
from collections import defaultdict
from sklearn.metrics import precision_score, recall_score, f1_score, accuracy_score,confusion_matrix
from pathlib import Path

  from .autonotebook import tqdm as notebook_tqdm
  warn(


In [2]:
from PIL import Image
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

In [3]:
sys.argv = [
    'notebook',  
    '--modelname' ,  'Qwen/Qwen2-VL-72B-Instruct' , 
    '--data', '/root/home/data',
    '--data_path_files','/mnt/Gbenga_Enemy/ramy/WACV-2025-Workshop-ViGIR',
    '--results_dir', '/mnt/Gbenga_Enemy/ramy/results',
]

In [4]:
parser = argparse.ArgumentParser(description="A script to run V-LLMs on different image classification datasets")

In [5]:
parser.add_argument("--modelname", type=str, required=True, help="The name of the V-LLM model")
parser.add_argument("--data", type=str, required=True, help="Path to the data")
parser.add_argument("--data_path_files", type=str, required=True, help="Path to the image data dir")
parser.add_argument("--results_dir", type=str, required=True, help="Folder name to save results")

args = parser.parse_args()

In [6]:
valid_file=os.path.join(args.data_path_files,'Validation_Set.json')
test_file=os.path.join(args.data_path_files,'Testing_Set.json')

with open(valid_file, 'r') as file:
    valid = json.load(file) 

with open(test_file, 'r') as file:
    test = json.load(file) 

In [7]:
def display_image(image_path):
    img = mpimg.imread(image_path)
    plt.figure(figsize=(20, 20))
    plt.imshow(img)
    plt.axis('off')
    plt.show()

In [8]:
directory_path=Path(args.data)

file_dict = {}


for file in directory_path.iterdir():
    if file.is_file() and 'collage' in file.name:
        parts = file.stem.split('_')  
        number = parts[-1]
        if number.isdigit():
            file_dict[int(number)] = str(file)

In [9]:
baseline_question = ["Given this collage of six images of the exact same area, collected over a period of 10 years. Are there any ephemeral gully appearances? Answer by Yes or No and nothing else."]

In [16]:
def prepare_inference_inputs(path, baseline_question):
    messages = [
        {
            "role": "user",
            "content": [
                {"type": "image", "image": path},
                {"type": "text", "text": baseline_question},
            ],
        }
    ]
    

    text = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    image_inputs, video_inputs = process_vision_info(messages)
    inputs = processor(     text=[text],      images=image_inputs,      padding=True,    return_tensors="pt",)
    
    return inputs


In [19]:
# inputs=prepare_inference_inputs("https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-VL/assets/demo.jpeg", "Describe this image.")
# inputs = inputs.to("cuda")

In [17]:
processor = AutoProcessor.from_pretrained("Qwen/Qwen2-VL-72B-Instruct")

model = Qwen2VLForConditionalGeneration.from_pretrained(
    args.modelname,
    torch_dtype=torch.bfloat16,
    attn_implementation="flash_attention_2",
    device_map="auto",
).eval()

Loading checkpoint shards:   3%|█▌                                                       | 1/38 [00:09<06:01,  9.78s/it]


KeyboardInterrupt: 

In [37]:
count=0
saving_response={}

for key,info in tqdm(test.items()):
    path=file_dict[int(key)]
    count+=1
    
    inputs=prepare_inference_inputs(path, baseline_question[0])
    inputs = inputs.to("cuda")
    
    generated_ids = model.generate(**inputs, max_new_tokens=128)
    generated_ids_trimmed = [out_ids[len(in_ids) :] for in_ids, out_ids in zip(inputs.input_ids, generated_ids)]
    output_text = processor.batch_decode(generated_ids_trimmed, skip_special_tokens=True, clean_up_tokenization_spaces=False)
    if output_text[0]=='Yes.':
        saving_response[key]=1
    else:
        saving_response[key]=0
        
    
    print(count,saving_response[key])
    
with open(os.path.join(args.results_dir,f'test_{args.modelname[-21:]}-Baseline.json'), "w") as file:
    json.dump(saving_response, file)
    
    

  0%|▎                                                                                  | 1/311 [00:00<02:37,  1.96it/s]

1 1


  1%|▌                                                                                  | 2/311 [00:00<02:31,  2.04it/s]

2 0


  1%|▊                                                                                  | 3/311 [00:01<02:28,  2.08it/s]

3 0


  1%|█                                                                                  | 4/311 [00:01<02:26,  2.10it/s]

4 1


  2%|█▎                                                                                 | 5/311 [00:02<02:25,  2.11it/s]

5 1


  2%|█▌                                                                                 | 6/311 [00:02<02:24,  2.11it/s]

6 1


  2%|█▊                                                                                 | 7/311 [00:03<02:23,  2.12it/s]

7 1


  3%|██▏                                                                                | 8/311 [00:03<02:22,  2.12it/s]

8 1


  3%|██▍                                                                                | 9/311 [00:04<02:22,  2.12it/s]

9 1


  3%|██▋                                                                               | 10/311 [00:04<02:21,  2.12it/s]

10 1


  4%|██▉                                                                               | 11/311 [00:05<02:21,  2.12it/s]

11 1


  4%|███▏                                                                              | 12/311 [00:05<02:20,  2.13it/s]

12 1


  4%|███▍                                                                              | 13/311 [00:06<02:20,  2.13it/s]

13 1


  5%|███▋                                                                              | 14/311 [00:06<02:20,  2.12it/s]

14 1


  5%|███▉                                                                              | 15/311 [00:07<02:19,  2.12it/s]

15 1


  5%|████▏                                                                             | 16/311 [00:07<02:19,  2.12it/s]

16 1


  5%|████▍                                                                             | 17/311 [00:08<02:18,  2.12it/s]

17 0


  6%|████▋                                                                             | 18/311 [00:08<02:18,  2.12it/s]

18 0


  6%|█████                                                                             | 19/311 [00:08<02:17,  2.12it/s]

19 0


  6%|█████▎                                                                            | 20/311 [00:09<02:17,  2.12it/s]

20 1


  7%|█████▌                                                                            | 21/311 [00:09<02:16,  2.12it/s]

21 0


  7%|█████▊                                                                            | 22/311 [00:10<02:16,  2.12it/s]

22 1


  7%|██████                                                                            | 23/311 [00:10<02:15,  2.12it/s]

23 1


  8%|██████▎                                                                           | 24/311 [00:11<02:15,  2.12it/s]

24 1


  8%|██████▌                                                                           | 25/311 [00:11<02:15,  2.12it/s]

25 1


  8%|██████▊                                                                           | 26/311 [00:12<02:14,  2.12it/s]

26 1


  9%|███████                                                                           | 27/311 [00:12<02:13,  2.12it/s]

27 1


  9%|███████▍                                                                          | 28/311 [00:13<02:13,  2.12it/s]

28 1


  9%|███████▋                                                                          | 29/311 [00:13<02:12,  2.12it/s]

29 1


 10%|███████▉                                                                          | 30/311 [00:14<02:12,  2.12it/s]

30 1


 10%|████████▏                                                                         | 31/311 [00:14<02:12,  2.12it/s]

31 1


 10%|████████▍                                                                         | 32/311 [00:15<02:11,  2.12it/s]

32 1


 11%|████████▋                                                                         | 33/311 [00:15<02:11,  2.12it/s]

33 1


 11%|████████▉                                                                         | 34/311 [00:16<02:10,  2.12it/s]

34 0


 11%|█████████▏                                                                        | 35/311 [00:16<02:09,  2.12it/s]

35 1


 12%|█████████▍                                                                        | 36/311 [00:17<02:09,  2.12it/s]

36 1


 12%|█████████▊                                                                        | 37/311 [00:17<02:09,  2.12it/s]

37 1


 12%|██████████                                                                        | 38/311 [00:17<02:08,  2.12it/s]

38 0


 13%|██████████▎                                                                       | 39/311 [00:18<02:07,  2.13it/s]

39 1


 13%|██████████▌                                                                       | 40/311 [00:18<02:07,  2.13it/s]

40 1


 13%|██████████▊                                                                       | 41/311 [00:19<02:07,  2.12it/s]

41 1


 14%|███████████                                                                       | 42/311 [00:19<02:06,  2.12it/s]

42 0


 14%|███████████▎                                                                      | 43/311 [00:20<02:06,  2.12it/s]

43 1


 14%|███████████▌                                                                      | 44/311 [00:20<02:06,  2.12it/s]

44 1


 14%|███████████▊                                                                      | 45/311 [00:21<02:05,  2.12it/s]

45 1


 15%|████████████▏                                                                     | 46/311 [00:21<02:05,  2.12it/s]

46 1


 15%|████████████▍                                                                     | 47/311 [00:22<02:04,  2.12it/s]

47 0


 15%|████████████▋                                                                     | 48/311 [00:22<02:03,  2.12it/s]

48 1


 16%|████████████▉                                                                     | 49/311 [00:23<02:03,  2.12it/s]

49 1


 16%|█████████████▏                                                                    | 50/311 [00:23<02:02,  2.12it/s]

50 1


 16%|█████████████▍                                                                    | 51/311 [00:24<02:02,  2.12it/s]

51 1


 17%|█████████████▋                                                                    | 52/311 [00:24<02:01,  2.12it/s]

52 1


 17%|█████████████▉                                                                    | 53/311 [00:25<02:01,  2.13it/s]

53 1


 17%|██████████████▏                                                                   | 54/311 [00:25<02:00,  2.13it/s]

54 1


 18%|██████████████▌                                                                   | 55/311 [00:25<02:00,  2.13it/s]

55 1


 18%|██████████████▊                                                                   | 56/311 [00:26<01:59,  2.13it/s]

56 0


 18%|███████████████                                                                   | 57/311 [00:26<01:59,  2.13it/s]

57 1


 19%|███████████████▎                                                                  | 58/311 [00:27<01:59,  2.12it/s]

58 1


 19%|███████████████▌                                                                  | 59/311 [00:27<01:58,  2.12it/s]

59 1


 19%|███████████████▊                                                                  | 60/311 [00:28<01:58,  2.12it/s]

60 0


 20%|████████████████                                                                  | 61/311 [00:28<01:57,  2.12it/s]

61 1


 20%|████████████████▎                                                                 | 62/311 [00:29<01:57,  2.12it/s]

62 1


 20%|████████████████▌                                                                 | 63/311 [00:29<01:56,  2.12it/s]

63 0


 21%|████████████████▊                                                                 | 64/311 [00:30<01:56,  2.12it/s]

64 1


 21%|█████████████████▏                                                                | 65/311 [00:30<01:56,  2.12it/s]

65 1


 21%|█████████████████▍                                                                | 66/311 [00:31<01:55,  2.12it/s]

66 1


 22%|█████████████████▋                                                                | 67/311 [00:31<01:54,  2.12it/s]

67 1


 22%|█████████████████▉                                                                | 68/311 [00:32<01:54,  2.12it/s]

68 1


 22%|██████████████████▏                                                               | 69/311 [00:32<01:53,  2.13it/s]

69 1


 23%|██████████████████▍                                                               | 70/311 [00:33<01:53,  2.12it/s]

70 1


 23%|██████████████████▋                                                               | 71/311 [00:33<01:52,  2.13it/s]

71 1


 23%|██████████████████▉                                                               | 72/311 [00:33<01:52,  2.12it/s]

72 1


 23%|███████████████████▏                                                              | 73/311 [00:34<01:52,  2.12it/s]

73 1


 24%|███████████████████▌                                                              | 74/311 [00:34<01:51,  2.12it/s]

74 1


 24%|███████████████████▊                                                              | 75/311 [00:35<01:51,  2.12it/s]

75 1


 24%|████████████████████                                                              | 76/311 [00:35<01:50,  2.12it/s]

76 1


 25%|████████████████████▎                                                             | 77/311 [00:36<01:50,  2.12it/s]

77 1


 25%|████████████████████▌                                                             | 78/311 [00:36<01:49,  2.12it/s]

78 1


 25%|████████████████████▊                                                             | 79/311 [00:37<01:49,  2.12it/s]

79 1


 26%|█████████████████████                                                             | 80/311 [00:37<01:48,  2.12it/s]

80 1


 26%|█████████████████████▎                                                            | 81/311 [00:38<01:48,  2.12it/s]

81 1


 26%|█████████████████████▌                                                            | 82/311 [00:38<01:47,  2.12it/s]

82 1


 27%|█████████████████████▉                                                            | 83/311 [00:39<01:47,  2.12it/s]

83 0


 27%|██████████████████████▏                                                           | 84/311 [00:39<01:46,  2.12it/s]

84 1


 27%|██████████████████████▍                                                           | 85/311 [00:40<01:46,  2.12it/s]

85 1


 28%|██████████████████████▋                                                           | 86/311 [00:40<01:46,  2.12it/s]

86 1


 28%|██████████████████████▉                                                           | 87/311 [00:41<01:45,  2.12it/s]

87 1


 28%|███████████████████████▏                                                          | 88/311 [00:41<01:45,  2.12it/s]

88 1


 29%|███████████████████████▍                                                          | 89/311 [00:41<01:44,  2.12it/s]

89 0


 29%|███████████████████████▋                                                          | 90/311 [00:42<01:44,  2.12it/s]

90 1


 29%|███████████████████████▉                                                          | 91/311 [00:42<01:43,  2.12it/s]

91 1


 30%|████████████████████████▎                                                         | 92/311 [00:43<01:43,  2.12it/s]

92 1


 30%|████████████████████████▌                                                         | 93/311 [00:43<01:42,  2.12it/s]

93 0


 30%|████████████████████████▊                                                         | 94/311 [00:44<01:42,  2.13it/s]

94 1


 31%|█████████████████████████                                                         | 95/311 [00:44<01:41,  2.13it/s]

95 1


 31%|█████████████████████████▎                                                        | 96/311 [00:45<01:41,  2.13it/s]

96 1


 31%|█████████████████████████▌                                                        | 97/311 [00:45<01:40,  2.13it/s]

97 0


 32%|█████████████████████████▊                                                        | 98/311 [00:46<01:40,  2.13it/s]

98 0


 32%|██████████████████████████                                                        | 99/311 [00:46<01:39,  2.13it/s]

99 1


 32%|██████████████████████████                                                       | 100/311 [00:47<01:39,  2.12it/s]

100 1


 32%|██████████████████████████▎                                                      | 101/311 [00:47<01:39,  2.12it/s]

101 0


 33%|██████████████████████████▌                                                      | 102/311 [00:48<01:38,  2.12it/s]

102 1


 33%|██████████████████████████▊                                                      | 103/311 [00:48<01:38,  2.12it/s]

103 1


 33%|███████████████████████████                                                      | 104/311 [00:49<01:37,  2.12it/s]

104 0


 34%|███████████████████████████▎                                                     | 105/311 [00:49<01:37,  2.12it/s]

105 0


 34%|███████████████████████████▌                                                     | 106/311 [00:49<01:36,  2.12it/s]

106 1


 34%|███████████████████████████▊                                                     | 107/311 [00:50<01:36,  2.12it/s]

107 1


 35%|████████████████████████████▏                                                    | 108/311 [00:50<01:35,  2.12it/s]

108 1


 35%|████████████████████████████▍                                                    | 109/311 [00:51<01:35,  2.12it/s]

109 1


 35%|████████████████████████████▋                                                    | 110/311 [00:51<01:34,  2.12it/s]

110 1


 36%|████████████████████████████▉                                                    | 111/311 [00:52<01:34,  2.12it/s]

111 1


 36%|█████████████████████████████▏                                                   | 112/311 [00:52<01:33,  2.12it/s]

112 1


 36%|█████████████████████████████▍                                                   | 113/311 [00:53<01:33,  2.13it/s]

113 1


 37%|█████████████████████████████▋                                                   | 114/311 [00:53<01:32,  2.13it/s]

114 1


 37%|█████████████████████████████▉                                                   | 115/311 [00:54<01:32,  2.12it/s]

115 0


 37%|██████████████████████████████▏                                                  | 116/311 [00:54<01:31,  2.13it/s]

116 0


 38%|██████████████████████████████▍                                                  | 117/311 [00:55<01:31,  2.13it/s]

117 1


 38%|██████████████████████████████▋                                                  | 118/311 [00:55<01:30,  2.13it/s]

118 1


 38%|██████████████████████████████▉                                                  | 119/311 [00:56<01:30,  2.12it/s]

119 1


 39%|███████████████████████████████▎                                                 | 120/311 [00:56<01:29,  2.12it/s]

120 1


 39%|███████████████████████████████▌                                                 | 121/311 [00:57<01:29,  2.12it/s]

121 1


 39%|███████████████████████████████▊                                                 | 122/311 [00:57<01:29,  2.12it/s]

122 1


 40%|████████████████████████████████                                                 | 123/311 [00:57<01:28,  2.12it/s]

123 1


 40%|████████████████████████████████▎                                                | 124/311 [00:58<01:28,  2.12it/s]

124 1


 40%|████████████████████████████████▌                                                | 125/311 [00:58<01:27,  2.12it/s]

125 1


 41%|████████████████████████████████▊                                                | 126/311 [00:59<01:27,  2.12it/s]

126 1


 41%|█████████████████████████████████                                                | 127/311 [00:59<01:26,  2.12it/s]

127 1


 41%|█████████████████████████████████▎                                               | 128/311 [01:00<01:26,  2.12it/s]

128 1


 41%|█████████████████████████████████▌                                               | 129/311 [01:00<01:25,  2.12it/s]

129 1


 42%|█████████████████████████████████▊                                               | 130/311 [01:01<01:25,  2.12it/s]

130 1


 42%|██████████████████████████████████                                               | 131/311 [01:01<01:24,  2.12it/s]

131 1


 42%|██████████████████████████████████▍                                              | 132/311 [01:02<01:24,  2.12it/s]

132 1


 43%|██████████████████████████████████▋                                              | 133/311 [01:02<01:23,  2.13it/s]

133 1


 43%|██████████████████████████████████▉                                              | 134/311 [01:03<01:23,  2.12it/s]

134 1


 43%|███████████████████████████████████▏                                             | 135/311 [01:03<01:22,  2.12it/s]

135 1


 44%|███████████████████████████████████▍                                             | 136/311 [01:04<01:22,  2.12it/s]

136 1


 44%|███████████████████████████████████▋                                             | 137/311 [01:04<01:21,  2.12it/s]

137 1


 44%|███████████████████████████████████▉                                             | 138/311 [01:05<01:21,  2.12it/s]

138 0


 45%|████████████████████████████████████▏                                            | 139/311 [01:05<01:20,  2.12it/s]

139 0


 45%|████████████████████████████████████▍                                            | 140/311 [01:05<01:20,  2.12it/s]

140 1


 45%|████████████████████████████████████▋                                            | 141/311 [01:06<01:20,  2.12it/s]

141 1


 46%|████████████████████████████████████▉                                            | 142/311 [01:06<01:19,  2.12it/s]

142 1


 46%|█████████████████████████████████████▏                                           | 143/311 [01:07<01:19,  2.12it/s]

143 1


 46%|█████████████████████████████████████▌                                           | 144/311 [01:07<01:18,  2.12it/s]

144 1


 47%|█████████████████████████████████████▊                                           | 145/311 [01:08<01:18,  2.12it/s]

145 0


 47%|██████████████████████████████████████                                           | 146/311 [01:08<01:17,  2.12it/s]

146 1


 47%|██████████████████████████████████████▎                                          | 147/311 [01:09<01:17,  2.12it/s]

147 1


 48%|██████████████████████████████████████▌                                          | 148/311 [01:09<01:16,  2.12it/s]

148 1


 48%|██████████████████████████████████████▊                                          | 149/311 [01:10<01:16,  2.12it/s]

149 1


 48%|███████████████████████████████████████                                          | 150/311 [01:10<01:15,  2.12it/s]

150 1


 49%|███████████████████████████████████████▎                                         | 151/311 [01:11<01:15,  2.12it/s]

151 1


 49%|███████████████████████████████████████▌                                         | 152/311 [01:11<01:14,  2.12it/s]

152 1


 49%|███████████████████████████████████████▊                                         | 153/311 [01:12<01:14,  2.12it/s]

153 0


 50%|████████████████████████████████████████                                         | 154/311 [01:12<01:13,  2.12it/s]

154 1


 50%|████████████████████████████████████████▎                                        | 155/311 [01:13<01:13,  2.12it/s]

155 1


 50%|████████████████████████████████████████▋                                        | 156/311 [01:13<01:13,  2.12it/s]

156 1


 50%|████████████████████████████████████████▉                                        | 157/311 [01:13<01:12,  2.12it/s]

157 0


 51%|█████████████████████████████████████████▏                                       | 158/311 [01:14<01:12,  2.12it/s]

158 0


 51%|█████████████████████████████████████████▍                                       | 159/311 [01:14<01:11,  2.12it/s]

159 1


 51%|█████████████████████████████████████████▋                                       | 160/311 [01:15<01:11,  2.12it/s]

160 1


 52%|█████████████████████████████████████████▉                                       | 161/311 [01:15<01:10,  2.12it/s]

161 0


 52%|██████████████████████████████████████████▏                                      | 162/311 [01:16<01:10,  2.12it/s]

162 0


 52%|██████████████████████████████████████████▍                                      | 163/311 [01:16<01:09,  2.12it/s]

163 1


 53%|██████████████████████████████████████████▋                                      | 164/311 [01:17<01:09,  2.12it/s]

164 0


 53%|██████████████████████████████████████████▉                                      | 165/311 [01:17<01:08,  2.12it/s]

165 1


 53%|███████████████████████████████████████████▏                                     | 166/311 [01:18<01:08,  2.12it/s]

166 1


 54%|███████████████████████████████████████████▍                                     | 167/311 [01:18<01:07,  2.12it/s]

167 1


 54%|███████████████████████████████████████████▊                                     | 168/311 [01:19<01:07,  2.12it/s]

168 0


 54%|████████████████████████████████████████████                                     | 169/311 [01:19<01:06,  2.12it/s]

169 1


 55%|████████████████████████████████████████████▎                                    | 170/311 [01:20<01:06,  2.12it/s]

170 1


 55%|████████████████████████████████████████████▌                                    | 171/311 [01:20<01:05,  2.12it/s]

171 1


 55%|████████████████████████████████████████████▊                                    | 172/311 [01:21<01:05,  2.12it/s]

172 1


 56%|█████████████████████████████████████████████                                    | 173/311 [01:21<01:04,  2.12it/s]

173 1


 56%|█████████████████████████████████████████████▎                                   | 174/311 [01:21<01:04,  2.12it/s]

174 1


 56%|█████████████████████████████████████████████▌                                   | 175/311 [01:22<01:04,  2.12it/s]

175 1


 57%|█████████████████████████████████████████████▊                                   | 176/311 [01:22<01:03,  2.12it/s]

176 1


 57%|██████████████████████████████████████████████                                   | 177/311 [01:23<01:03,  2.12it/s]

177 1


 57%|██████████████████████████████████████████████▎                                  | 178/311 [01:23<01:02,  2.12it/s]

178 0


 58%|██████████████████████████████████████████████▌                                  | 179/311 [01:24<01:02,  2.12it/s]

179 1


 58%|██████████████████████████████████████████████▉                                  | 180/311 [01:24<01:01,  2.12it/s]

180 0


 58%|███████████████████████████████████████████████▏                                 | 181/311 [01:25<01:01,  2.12it/s]

181 1


 59%|███████████████████████████████████████████████▍                                 | 182/311 [01:25<01:00,  2.12it/s]

182 0


 59%|███████████████████████████████████████████████▋                                 | 183/311 [01:26<01:00,  2.12it/s]

183 1


 59%|███████████████████████████████████████████████▉                                 | 184/311 [01:26<00:59,  2.12it/s]

184 1


 59%|████████████████████████████████████████████████▏                                | 185/311 [01:27<00:59,  2.12it/s]

185 1


 60%|████████████████████████████████████████████████▍                                | 186/311 [01:27<00:58,  2.12it/s]

186 0


 60%|████████████████████████████████████████████████▋                                | 187/311 [01:28<00:58,  2.12it/s]

187 1


 60%|████████████████████████████████████████████████▉                                | 188/311 [01:28<00:58,  2.12it/s]

188 1


 61%|█████████████████████████████████████████████████▏                               | 189/311 [01:29<00:57,  2.12it/s]

189 1


 61%|█████████████████████████████████████████████████▍                               | 190/311 [01:29<00:57,  2.12it/s]

190 1


 61%|█████████████████████████████████████████████████▋                               | 191/311 [01:30<00:56,  2.12it/s]

191 1


 62%|██████████████████████████████████████████████████                               | 192/311 [01:30<00:56,  2.12it/s]

192 1


 62%|██████████████████████████████████████████████████▎                              | 193/311 [01:30<00:55,  2.12it/s]

193 1


 62%|██████████████████████████████████████████████████▌                              | 194/311 [01:31<00:55,  2.12it/s]

194 1


 63%|██████████████████████████████████████████████████▊                              | 195/311 [01:31<00:54,  2.12it/s]

195 1


 63%|███████████████████████████████████████████████████                              | 196/311 [01:32<00:54,  2.12it/s]

196 1


 63%|███████████████████████████████████████████████████▎                             | 197/311 [01:32<00:53,  2.12it/s]

197 1


 64%|███████████████████████████████████████████████████▌                             | 198/311 [01:33<00:53,  2.12it/s]

198 1


 64%|███████████████████████████████████████████████████▊                             | 199/311 [01:33<00:52,  2.12it/s]

199 0


 64%|████████████████████████████████████████████████████                             | 200/311 [01:34<00:52,  2.12it/s]

200 1


 65%|████████████████████████████████████████████████████▎                            | 201/311 [01:34<00:51,  2.12it/s]

201 1


 65%|████████████████████████████████████████████████████▌                            | 202/311 [01:35<00:51,  2.12it/s]

202 1


 65%|████████████████████████████████████████████████████▊                            | 203/311 [01:35<00:50,  2.12it/s]

203 0


 66%|█████████████████████████████████████████████████████▏                           | 204/311 [01:36<00:50,  2.12it/s]

204 1


 66%|█████████████████████████████████████████████████████▍                           | 205/311 [01:36<00:50,  2.12it/s]

205 1


 66%|█████████████████████████████████████████████████████▋                           | 206/311 [01:37<00:49,  2.12it/s]

206 1


 67%|█████████████████████████████████████████████████████▉                           | 207/311 [01:37<00:49,  2.12it/s]

207 0


 67%|██████████████████████████████████████████████████████▏                          | 208/311 [01:38<00:48,  2.12it/s]

208 0


 67%|██████████████████████████████████████████████████████▍                          | 209/311 [01:38<00:48,  2.12it/s]

209 1


 68%|██████████████████████████████████████████████████████▋                          | 210/311 [01:38<00:47,  2.13it/s]

210 1


 68%|██████████████████████████████████████████████████████▉                          | 211/311 [01:39<00:47,  2.12it/s]

211 0


 68%|███████████████████████████████████████████████████████▏                         | 212/311 [01:39<00:46,  2.12it/s]

212 0


 68%|███████████████████████████████████████████████████████▍                         | 213/311 [01:40<00:46,  2.12it/s]

213 1


 69%|███████████████████████████████████████████████████████▋                         | 214/311 [01:40<00:45,  2.12it/s]

214 1


 69%|███████████████████████████████████████████████████████▉                         | 215/311 [01:41<00:45,  2.12it/s]

215 1


 69%|████████████████████████████████████████████████████████▎                        | 216/311 [01:41<00:44,  2.12it/s]

216 0


 70%|████████████████████████████████████████████████████████▌                        | 217/311 [01:42<00:44,  2.12it/s]

217 1


 70%|████████████████████████████████████████████████████████▊                        | 218/311 [01:42<00:43,  2.12it/s]

218 1


 70%|█████████████████████████████████████████████████████████                        | 219/311 [01:43<00:43,  2.12it/s]

219 0


 71%|█████████████████████████████████████████████████████████▎                       | 220/311 [01:43<00:42,  2.12it/s]

220 0


 71%|█████████████████████████████████████████████████████████▌                       | 221/311 [01:44<00:42,  2.12it/s]

221 1


 71%|█████████████████████████████████████████████████████████▊                       | 222/311 [01:44<00:41,  2.13it/s]

222 0


 72%|██████████████████████████████████████████████████████████                       | 223/311 [01:45<00:41,  2.12it/s]

223 1


 72%|██████████████████████████████████████████████████████████▎                      | 224/311 [01:45<00:40,  2.12it/s]

224 1


 72%|██████████████████████████████████████████████████████████▌                      | 225/311 [01:46<00:40,  2.12it/s]

225 1


 73%|██████████████████████████████████████████████████████████▊                      | 226/311 [01:46<00:40,  2.12it/s]

226 1


 73%|███████████████████████████████████████████████████████████                      | 227/311 [01:46<00:39,  2.12it/s]

227 1


 73%|███████████████████████████████████████████████████████████▍                     | 228/311 [01:47<00:39,  2.13it/s]

228 1


 74%|███████████████████████████████████████████████████████████▋                     | 229/311 [01:47<00:38,  2.13it/s]

229 1


 74%|███████████████████████████████████████████████████████████▉                     | 230/311 [01:48<00:38,  2.12it/s]

230 1


 74%|████████████████████████████████████████████████████████████▏                    | 231/311 [01:48<00:37,  2.12it/s]

231 1


 75%|████████████████████████████████████████████████████████████▍                    | 232/311 [01:49<00:37,  2.12it/s]

232 1


 75%|████████████████████████████████████████████████████████████▋                    | 233/311 [01:49<00:36,  2.12it/s]

233 1


 75%|████████████████████████████████████████████████████████████▉                    | 234/311 [01:50<00:36,  2.13it/s]

234 1


 76%|█████████████████████████████████████████████████████████████▏                   | 235/311 [01:50<00:35,  2.12it/s]

235 1


 76%|█████████████████████████████████████████████████████████████▍                   | 236/311 [01:51<00:35,  2.12it/s]

236 1


 76%|█████████████████████████████████████████████████████████████▋                   | 237/311 [01:51<00:34,  2.12it/s]

237 1


 77%|█████████████████████████████████████████████████████████████▉                   | 238/311 [01:52<00:34,  2.12it/s]

238 1


 77%|██████████████████████████████████████████████████████████████▏                  | 239/311 [01:52<00:33,  2.12it/s]

239 1


 77%|██████████████████████████████████████████████████████████████▌                  | 240/311 [01:53<00:33,  2.12it/s]

240 1


 77%|██████████████████████████████████████████████████████████████▊                  | 241/311 [01:53<00:32,  2.12it/s]

241 1


 78%|███████████████████████████████████████████████████████████████                  | 242/311 [01:54<00:32,  2.13it/s]

242 1


 78%|███████████████████████████████████████████████████████████████▎                 | 243/311 [01:54<00:31,  2.13it/s]

243 1


 78%|███████████████████████████████████████████████████████████████▌                 | 244/311 [01:54<00:31,  2.13it/s]

244 1


 79%|███████████████████████████████████████████████████████████████▊                 | 245/311 [01:55<00:31,  2.13it/s]

245 1


 79%|████████████████████████████████████████████████████████████████                 | 246/311 [01:55<00:30,  2.13it/s]

246 0


 79%|████████████████████████████████████████████████████████████████▎                | 247/311 [01:56<00:30,  2.12it/s]

247 1


 80%|████████████████████████████████████████████████████████████████▌                | 248/311 [01:56<00:29,  2.12it/s]

248 1


 80%|████████████████████████████████████████████████████████████████▊                | 249/311 [01:57<00:29,  2.12it/s]

249 1


 80%|█████████████████████████████████████████████████████████████████                | 250/311 [01:57<00:28,  2.12it/s]

250 1


 81%|█████████████████████████████████████████████████████████████████▎               | 251/311 [01:58<00:28,  2.12it/s]

251 1


 81%|█████████████████████████████████████████████████████████████████▋               | 252/311 [01:58<00:27,  2.13it/s]

252 1


 81%|█████████████████████████████████████████████████████████████████▉               | 253/311 [01:59<00:27,  2.12it/s]

253 1


 82%|██████████████████████████████████████████████████████████████████▏              | 254/311 [01:59<00:26,  2.12it/s]

254 0


 82%|██████████████████████████████████████████████████████████████████▍              | 255/311 [02:00<00:26,  2.12it/s]

255 1


 82%|██████████████████████████████████████████████████████████████████▋              | 256/311 [02:00<00:25,  2.12it/s]

256 1


 83%|██████████████████████████████████████████████████████████████████▉              | 257/311 [02:01<00:25,  2.13it/s]

257 1


 83%|███████████████████████████████████████████████████████████████████▏             | 258/311 [02:01<00:24,  2.12it/s]

258 0


 83%|███████████████████████████████████████████████████████████████████▍             | 259/311 [02:02<00:24,  2.12it/s]

259 1


 84%|███████████████████████████████████████████████████████████████████▋             | 260/311 [02:02<00:24,  2.12it/s]

260 1


 84%|███████████████████████████████████████████████████████████████████▉             | 261/311 [02:02<00:23,  2.13it/s]

261 0


 84%|████████████████████████████████████████████████████████████████████▏            | 262/311 [02:03<00:23,  2.12it/s]

262 0


 85%|████████████████████████████████████████████████████████████████████▍            | 263/311 [02:03<00:22,  2.12it/s]

263 1


 85%|████████████████████████████████████████████████████████████████████▊            | 264/311 [02:04<00:22,  2.12it/s]

264 1


 85%|█████████████████████████████████████████████████████████████████████            | 265/311 [02:04<00:21,  2.12it/s]

265 1


 86%|█████████████████████████████████████████████████████████████████████▎           | 266/311 [02:05<00:21,  2.12it/s]

266 1


 86%|█████████████████████████████████████████████████████████████████████▌           | 267/311 [02:05<00:20,  2.12it/s]

267 1


 86%|█████████████████████████████████████████████████████████████████████▊           | 268/311 [02:06<00:20,  2.12it/s]

268 1


 86%|██████████████████████████████████████████████████████████████████████           | 269/311 [02:06<00:19,  2.12it/s]

269 1


 87%|██████████████████████████████████████████████████████████████████████▎          | 270/311 [02:07<00:19,  2.13it/s]

270 0


 87%|██████████████████████████████████████████████████████████████████████▌          | 271/311 [02:07<00:18,  2.13it/s]

271 1


 87%|██████████████████████████████████████████████████████████████████████▊          | 272/311 [02:08<00:18,  2.13it/s]

272 0


 88%|███████████████████████████████████████████████████████████████████████          | 273/311 [02:08<00:17,  2.12it/s]

273 1


 88%|███████████████████████████████████████████████████████████████████████▎         | 274/311 [02:09<00:17,  2.12it/s]

274 1


 88%|███████████████████████████████████████████████████████████████████████▌         | 275/311 [02:09<00:16,  2.12it/s]

275 0


 89%|███████████████████████████████████████████████████████████████████████▉         | 276/311 [02:10<00:16,  2.12it/s]

276 1


 89%|████████████████████████████████████████████████████████████████████████▏        | 277/311 [02:10<00:16,  2.12it/s]

277 1


 89%|████████████████████████████████████████████████████████████████████████▍        | 278/311 [02:10<00:15,  2.12it/s]

278 0


 90%|████████████████████████████████████████████████████████████████████████▋        | 279/311 [02:11<00:15,  2.12it/s]

279 1


 90%|████████████████████████████████████████████████████████████████████████▉        | 280/311 [02:11<00:14,  2.13it/s]

280 1


 90%|█████████████████████████████████████████████████████████████████████████▏       | 281/311 [02:12<00:14,  2.13it/s]

281 1


 91%|█████████████████████████████████████████████████████████████████████████▍       | 282/311 [02:12<00:13,  2.12it/s]

282 1


 91%|█████████████████████████████████████████████████████████████████████████▋       | 283/311 [02:13<00:13,  2.12it/s]

283 1


 91%|█████████████████████████████████████████████████████████████████████████▉       | 284/311 [02:13<00:12,  2.12it/s]

284 1


 92%|██████████████████████████████████████████████████████████████████████████▏      | 285/311 [02:14<00:12,  2.12it/s]

285 1


 92%|██████████████████████████████████████████████████████████████████████████▍      | 286/311 [02:14<00:11,  2.12it/s]

286 1


 92%|██████████████████████████████████████████████████████████████████████████▋      | 287/311 [02:15<00:11,  2.12it/s]

287 1


 93%|███████████████████████████████████████████████████████████████████████████      | 288/311 [02:15<00:10,  2.12it/s]

288 1


 93%|███████████████████████████████████████████████████████████████████████████▎     | 289/311 [02:16<00:10,  2.12it/s]

289 0


 93%|███████████████████████████████████████████████████████████████████████████▌     | 290/311 [02:16<00:09,  2.12it/s]

290 1


 94%|███████████████████████████████████████████████████████████████████████████▊     | 291/311 [02:17<00:09,  2.12it/s]

291 1


 94%|████████████████████████████████████████████████████████████████████████████     | 292/311 [02:17<00:08,  2.13it/s]

292 0


 94%|████████████████████████████████████████████████████████████████████████████▎    | 293/311 [02:18<00:08,  2.13it/s]

293 1


 95%|████████████████████████████████████████████████████████████████████████████▌    | 294/311 [02:18<00:08,  2.12it/s]

294 1


 95%|████████████████████████████████████████████████████████████████████████████▊    | 295/311 [02:18<00:07,  2.12it/s]

295 0


 95%|█████████████████████████████████████████████████████████████████████████████    | 296/311 [02:19<00:07,  2.12it/s]

296 0


 95%|█████████████████████████████████████████████████████████████████████████████▎   | 297/311 [02:19<00:06,  2.12it/s]

297 1


 96%|█████████████████████████████████████████████████████████████████████████████▌   | 298/311 [02:20<00:06,  2.12it/s]

298 1


 96%|█████████████████████████████████████████████████████████████████████████████▊   | 299/311 [02:20<00:05,  2.12it/s]

299 0


 96%|██████████████████████████████████████████████████████████████████████████████▏  | 300/311 [02:21<00:05,  2.12it/s]

300 1


 97%|██████████████████████████████████████████████████████████████████████████████▍  | 301/311 [02:21<00:04,  2.12it/s]

301 0


 97%|██████████████████████████████████████████████████████████████████████████████▋  | 302/311 [02:22<00:04,  2.12it/s]

302 1


 97%|██████████████████████████████████████████████████████████████████████████████▉  | 303/311 [02:22<00:03,  2.12it/s]

303 1


 98%|███████████████████████████████████████████████████████████████████████████████▏ | 304/311 [02:23<00:03,  2.12it/s]

304 1


 98%|███████████████████████████████████████████████████████████████████████████████▍ | 305/311 [02:23<00:02,  2.12it/s]

305 1


 98%|███████████████████████████████████████████████████████████████████████████████▋ | 306/311 [02:24<00:02,  2.12it/s]

306 1


 99%|███████████████████████████████████████████████████████████████████████████████▉ | 307/311 [02:24<00:01,  2.13it/s]

307 0


 99%|████████████████████████████████████████████████████████████████████████████████▏| 308/311 [02:25<00:01,  2.12it/s]

308 1


 99%|████████████████████████████████████████████████████████████████████████████████▍| 309/311 [02:25<00:00,  2.13it/s]

309 1


100%|████████████████████████████████████████████████████████████████████████████████▋| 310/311 [02:26<00:00,  2.12it/s]

310 0


100%|█████████████████████████████████████████████████████████████████████████████████| 311/311 [02:26<00:00,  2.12it/s]

311 0





AttributeError: 'Namespace' object has no attribute 'model_name'

In [46]:
ground_truth=[]
model_response=[]

for key,info in test.items():
    if int(info['label']) ==4:
        ground_truth.append(1)
    else:
        ground_truth.append(0)
    
    if saving_response[key]==1:
        model_response.append(1)
    else:
        model_response.append(0)

In [50]:
y_true=ground_truth
y_pred=model_response

precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred, average='macro')
accuracy = accuracy_score(y_true, y_pred)
tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel()


print("Precision:", precision)
print("Recall:", recall)
print("F1 Score (Macro):", f1)
print("Accuracy:", accuracy)

print("True Negatives (TN):", tn)
print("False Positives (FP):", fp)
print("False Negatives (FN):", fn)
print("True Positives (TP):", tp)

Precision: 0.6788617886178862
Recall: 0.943502824858757
F1 Score (Macro): 0.6711809639212611
Accuracy: 0.7138263665594855
True Negatives (TN): 55
False Positives (FP): 79
False Negatives (FN): 10
True Positives (TP): 167


In [54]:
f1_per_class = f1_score(y_true, y_pred, average=None)

In [55]:
f1_per_class

array([0.55276382, 0.78959811])

In [56]:
precision*recall*2/(precision+recall)

0.7895981087470448