### labelimgを使用してdata/imagesの画像データのannotation情報を作成してdata/labelsに保存した。
* labelsの中に不要なclasses.txtがあったので削除した。

In [1]:
import ultralytics
from ultralytics import YOLO
from IPython.display import Image
import shutil
import numpy as np
import os

In [2]:
# dataセットへのpath
data_dir = "data/"

In [19]:
# 画像ファイルのパスとラベルファイルのパスを取得
image_files = [os.path.join(data_dir, 'images', filename) for filename in os.listdir(os.path.join(data_dir, 'images')) if filename.endswith(".jpg")]
label_files = [os.path.join(data_dir, 'labels', filename) for filename in os.listdir(os.path.join(data_dir, 'labels')) if filename.endswith(".txt")]

In [20]:
len(label_files)

203

In [21]:
len(image_files)

203

In [22]:
# 画像ファイルとラベルファイルをペアにする
data_pairs = list(zip(image_files, label_files))

In [23]:
# モデルに偏りがないようにshuffleする
np.random.shuffle(data_pairs)

In [25]:
# 訓練データと検証データの分割率を指定
# 全体の70%を訓練データとする
train_ratio = 0.7

# 訓練データと検証データの個数
train_num = int(len(data_pairs) * train_ratio)
print(train_num)
val_num = len(data_pairs) - train_num
print(val_num)

# 訓練データと検証データのリストを作成
train_data_pairs_list = data_pairs[:train_num]
val_data_pairs = data_pairs[train_num:]

142
61


In [26]:
# 検証データの20％をテストデータとする
test_ratio = 0.2

# 検証データとテストデータの個数
test_num = int(len(val_data_pairs) * test_ratio)
print(test_num)
val_num = len(val_data_pairs) - test_num
print(val_num)

# 検証データとテストデータのリストを作成
val_data_pairs_list = val_data_pairs[:val_num]
test_data_pairs_list = val_data_pairs[val_num:]

12
49


In [29]:
len(train_data_pairs_list)

142

In [30]:
len(val_data_pairs_list)

49

In [31]:
len(test_data_pairs_list)

12

In [38]:
# 訓練データのリストを保存
with open("train_image_paths.txt", "w") as f:
    for image_path, _ in train_data_pairs_list:
        f.write(image_path + "\n")

with open("train_label_paths.txt", "w") as f:
    for _, label_path in train_data_pairs_list:
        f.write(label_path + "\n")

# 検証データのリストを保存
with open("val_image_paths.txt", "w") as f:
    for image_path, _ in val_data_pairs_list:
        f.write(image_path + "\n")

with open("val_label_paths.txt", "w") as f:
    for _, label_path in val_data_pairs_list:
        f.write(label_path + "\n")

# テストデータのリストを保存
with open("test_image_paths.txt", "w") as f:
    for image_path, _ in test_data_pairs_list:
        f.write(image_path + "\n")

with open("test_label_paths.txt", "w") as f:
    for _, label_path in test_data_pairs_list:
        f.write(label_path + "\n")

In [33]:
# 訓練データの画像パスリストを読み込み
with open("train_image_paths.txt", "r") as f:
    train_image_paths = [line.strip() for line in f]

# 訓練データのラベルパスリストを読み込み
with open("train_label_paths.txt", "r") as f:
    train_label_paths = [line.strip() for line in f]

# 検証データの画像パスリストを読み込み
with open("val_image_paths.txt", "r") as f:
    val_image_paths = [line.strip() for line in f]

# 検証データのラベルパスリストを読み込み
with open("val_label_paths.txt", "r") as f:
    val_label_paths = [line.strip() for line in f]

# テストデータの画像パスリストを読み込み
with open("test_image_paths.txt", "r") as f:
    test_image_paths = [line.strip() for line in f]

# 検証データのラベルパスリストを読み込み
with open("test_label_paths.txt", "r") as f:
    test_label_paths = [line.strip() for line in f]

In [39]:
# 訓練データディレクトリを作成
os.makedirs("after_split/train/images", exist_ok=True)
os.makedirs("after_split/train/labels", exist_ok=True)

# 検証データディレクトリを作成
os.makedirs("after_split/val/images", exist_ok=True)
os.makedirs("after_split/val/labels", exist_ok=True)

# テストデータディレクトリを作成
os.makedirs("after_split/test/images", exist_ok=True)
os.makedirs("after_split/test/labels", exist_ok=True)

In [40]:
# 訓練データの配置
for image_path, label_path in zip(train_image_paths, train_label_paths):
    # 画像ファイルの移動
    shutil.move(image_path, os.path.join("after_split/train/images", os.path.basename(image_path)))

    # ラベルファイルの移動
    shutil.move(label_path, os.path.join("after_split/train/labels", os.path.basename(label_path)))

# 検証データの配置
for image_path, label_path in zip(val_image_paths, val_label_paths):
    # 画像ファイルの移動
    shutil.move(image_path, os.path.join("after_split/val/images", os.path.basename(image_path)))

    # ラベルファイルの移動
    shutil.move(label_path, os.path.join("after_split/val/labels", os.path.basename(label_path)))

# テストデータの配置
for image_path, label_path in zip(test_image_paths, test_label_paths):
    # 画像ファイルの移動
    shutil.move(image_path, os.path.join("after_split/test/images", os.path.basename(image_path)))

    # ラベルファイルの移動
    shutil.move(label_path, os.path.join("after_split/test/labels", os.path.basename(label_path)))