In [1]:
import os
import pandas as pd
from PIL import Image
import torch
from torchvision import transforms
from transformers import CLIPProcessor, CLIPModel

# ファイルパス設定
input_csv_path = './csv/sd-turbo.csv'
image_folder_path = './generate_image/sd-turbo/'
output_csv_path = './csv/sd-turbo_clip.csv'

# CLIPモデルのロード
model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")
processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

# 前処理の定義
image_preprocess = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize((0.48145466, 0.4578275, 0.40821073), (0.26862954, 0.26130258, 0.27577711))
])

# CSVファイルの読み込み
data = pd.read_csv(input_csv_path)

# CLIPスコア計算用の関数
def calculate_clip_similarity(image_path, prompt):
    try:
        image = Image.open(image_path).convert("RGB")
        inputs = processor(text=[prompt], images=image, return_tensors="pt", padding=True)
        outputs = model(**inputs)
        logits_per_image = outputs.logits_per_image  # 画像とテキストの類似度スコア
        similarity = logits_per_image.item()  # スカラー値に変換
        return similarity
    except Exception as e:
        print(f"Error processing {image_path}: {e}")
        return None

# 新しい列を追加して計算
clip_scores = []
for index, row in data.iterrows():
    image_path = os.path.join(image_folder_path, row['Filename'])
    prompt = row['Prompt']
    if os.path.exists(image_path):
        score = calculate_clip_similarity(image_path, prompt)
        clip_scores.append(score)
    else:
        print(f"Image not found: {image_path}")
        clip_scores.append(None)

data['clip'] = clip_scores

# 結果を新しいCSVに保存
data.to_csv(output_csv_path, index=False)
print(f"CLIPスコアを計算し、結果を{output_csv_path}に保存しました。")


  from .autonotebook import tqdm as notebook_tqdm


CLIPスコアを計算し、結果を./csv/sd-turbo_clip.csvに保存しました。


In [2]:
import os
import pandas as pd
from PIL import Image
import torch
from torchvision import transforms
from transformers import CLIPProcessor, CLIPModel

# ファイルパス設定
input_csv_path = './csv/sdxl-turbo.csv'
image_folder_path = './generate_image/sdxl-turbo/'
output_csv_path = './csv/sdxl-turbo_clip.csv'

# CLIPモデルのロード
model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")
processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

# 前処理の定義
image_preprocess = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize((0.48145466, 0.4578275, 0.40821073), (0.26862954, 0.26130258, 0.27577711))
])

# CSVファイルの読み込み
data = pd.read_csv(input_csv_path)

# CLIPスコア計算用の関数
def calculate_clip_similarity(image_path, prompt):
    try:
        image = Image.open(image_path).convert("RGB")
        inputs = processor(text=[prompt], images=image, return_tensors="pt", padding=True)
        outputs = model(**inputs)
        logits_per_image = outputs.logits_per_image  # 画像とテキストの類似度スコア
        similarity = logits_per_image.item()  # スカラー値に変換
        return similarity
    except Exception as e:
        print(f"Error processing {image_path}: {e}")
        return None

# 新しい列を追加して計算
clip_scores = []
for index, row in data.iterrows():
    image_path = os.path.join(image_folder_path, row['Filename'])
    prompt = row['Prompt']
    if os.path.exists(image_path):
        score = calculate_clip_similarity(image_path, prompt)
        clip_scores.append(score)
    else:
        print(f"Image not found: {image_path}")
        clip_scores.append(None)

data['clip'] = clip_scores

# 結果を新しいCSVに保存
data.to_csv(output_csv_path, index=False)
print(f"CLIPスコアを計算し、結果を{output_csv_path}に保存しました。")




CLIPスコアを計算し、結果を./csv/sdxl-turbo_clip.csvに保存しました。


In [3]:
import os
import pandas as pd
from PIL import Image
import torch
from torchvision import transforms
from transformers import CLIPProcessor, CLIPModel

# ファイルパス設定
input_csv_path = './csv/stable-diffusion-2-base.csv'
image_folder_path = './generate_image/stable-diffusion-2-base/'
output_csv_path = './csv/stable-diffusion-2-base_clip.csv'

# CLIPモデルのロード
model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")
processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

# 前処理の定義
image_preprocess = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize((0.48145466, 0.4578275, 0.40821073), (0.26862954, 0.26130258, 0.27577711))
])

# CSVファイルの読み込み
data = pd.read_csv(input_csv_path)

# CLIPスコア計算用の関数
def calculate_clip_similarity(image_path, prompt):
    try:
        image = Image.open(image_path).convert("RGB")
        inputs = processor(text=[prompt], images=image, return_tensors="pt", padding=True)
        outputs = model(**inputs)
        logits_per_image = outputs.logits_per_image  # 画像とテキストの類似度スコア
        similarity = logits_per_image.item()  # スカラー値に変換
        return similarity
    except Exception as e:
        print(f"Error processing {image_path}: {e}")
        return None

# 新しい列を追加して計算
clip_scores = []
for index, row in data.iterrows():
    image_path = os.path.join(image_folder_path, row['Filename'])
    prompt = row['Prompt']
    if os.path.exists(image_path):
        score = calculate_clip_similarity(image_path, prompt)
        clip_scores.append(score)
    else:
        print(f"Image not found: {image_path}")
        clip_scores.append(None)

data['clip'] = clip_scores

# 結果を新しいCSVに保存
data.to_csv(output_csv_path, index=False)
print(f"CLIPスコアを計算し、結果を{output_csv_path}に保存しました。")




CLIPスコアを計算し、結果を./csv/stable-diffusion-2-base_clip.csvに保存しました。


In [4]:
import os
import pandas as pd
from PIL import Image
import torch
from torchvision import transforms
from transformers import CLIPProcessor, CLIPModel

# ファイルパス設定
input_csv_path = './csv/stable-diffusion-v1-4.csv'
image_folder_path = './generate_image/stable-diffusion-v1-4/'
output_csv_path = './csv/stable-diffusion-v1-4_clip.csv'

# CLIPモデルのロード
model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")
processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

# 前処理の定義
image_preprocess = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize((0.48145466, 0.4578275, 0.40821073), (0.26862954, 0.26130258, 0.27577711))
])

# CSVファイルの読み込み
data = pd.read_csv(input_csv_path)

# CLIPスコア計算用の関数
def calculate_clip_similarity(image_path, prompt):
    try:
        image = Image.open(image_path).convert("RGB")
        inputs = processor(text=[prompt], images=image, return_tensors="pt", padding=True)
        outputs = model(**inputs)
        logits_per_image = outputs.logits_per_image  # 画像とテキストの類似度スコア
        similarity = logits_per_image.item()  # スカラー値に変換
        return similarity
    except Exception as e:
        print(f"Error processing {image_path}: {e}")
        return None

# 新しい列を追加して計算
clip_scores = []
for index, row in data.iterrows():
    image_path = os.path.join(image_folder_path, row['Filename'])
    prompt = row['Prompt']
    if os.path.exists(image_path):
        score = calculate_clip_similarity(image_path, prompt)
        clip_scores.append(score)
    else:
        print(f"Image not found: {image_path}")
        clip_scores.append(None)

data['clip'] = clip_scores

# 結果を新しいCSVに保存
data.to_csv(output_csv_path, index=False)
print(f"CLIPスコアを計算し、結果を{output_csv_path}に保存しました。")




CLIPスコアを計算し、結果を./csv/stable-diffusion-v1-4_clip.csvに保存しました。


In [5]:
import os
import pandas as pd
from PIL import Image
import torch
from torchvision import transforms
from transformers import CLIPProcessor, CLIPModel

# ファイルパス設定
input_csv_path = './csv/stable-diffusion-xl-base-1.0.csv'
image_folder_path = './generate_image/stable-diffusion-xl-base-1.0/'
output_csv_path = './csv/stable-diffusion-xl-base-1.0_clip.csv'

# CLIPモデルのロード
model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")
processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

# 前処理の定義
image_preprocess = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize((0.48145466, 0.4578275, 0.40821073), (0.26862954, 0.26130258, 0.27577711))
])

# CSVファイルの読み込み
data = pd.read_csv(input_csv_path)

# CLIPスコア計算用の関数
def calculate_clip_similarity(image_path, prompt):
    try:
        image = Image.open(image_path).convert("RGB")
        inputs = processor(text=[prompt], images=image, return_tensors="pt", padding=True)
        outputs = model(**inputs)
        logits_per_image = outputs.logits_per_image  # 画像とテキストの類似度スコア
        similarity = logits_per_image.item()  # スカラー値に変換
        return similarity
    except Exception as e:
        print(f"Error processing {image_path}: {e}")
        return None

# 新しい列を追加して計算
clip_scores = []
for index, row in data.iterrows():
    image_path = os.path.join(image_folder_path, row['Filename'])
    prompt = row['Prompt']
    if os.path.exists(image_path):
        score = calculate_clip_similarity(image_path, prompt)
        clip_scores.append(score)
    else:
        print(f"Image not found: {image_path}")
        clip_scores.append(None)

data['clip'] = clip_scores

# 結果を新しいCSVに保存
data.to_csv(output_csv_path, index=False)
print(f"CLIPスコアを計算し、結果を{output_csv_path}に保存しました。")




CLIPスコアを計算し、結果を./csv/stable-diffusion-xl-base-1.0_clip.csvに保存しました。
