## ファインチューニングで利用する独自データセットを確認する

In [2]:
%load_ext autoreload
%autoreload 2
%matplotlib inline

import os
import cv2
import random
import kwcoco, kwplot
import matplotlib.pyplot as plt
from pathlib import Path
from mpl_toolkits.axes_grid1 import ImageGrid

# 1枚の画像を表示する関数
def show_img(img, dpi=150, title=None):
    fig, ax = plt.subplots(nrows=1, ncols=1, dpi=dpi)
    ax.set_title( title, fontsize=16, color='black')
    ax.axis('off')
    ax.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    return fig, ax

# 複数枚の画像を表示する関数
def show_imgs(imgs_dict:dict, ncol=0, dpi=200, font_scale=0.7):
    font_size = int(plt.rcParams["font.size"]*font_scale)

    if ncol > 0:
        nrow = ((len(imgs_dict)-1)//ncol)+1
    else:
        nrow = 1
        ncol = len(imgs_dict)

    img_num = len(imgs_dict)
    fig = plt.figure(figsize=(float(img_num), float(img_num)), dpi=dpi)
    grid = ImageGrid(fig, 111, nrows_ncols=(nrow, ncol), axes_pad=0.2,)

    for i in range(nrow*ncol):
        grid[i].axis('off')
        if i < len(imgs_dict):
            img_key = list(imgs_dict.keys())[i]
            grid[i].imshow(cv2.cvtColor(imgs_dict[img_key], cv2.COLOR_BGR2RGB))
            grid[i].set_title(img_key, fontsize=font_size, color='black', pad=int(font_size/2))
    
    plt.show(); plt.close()
    return None

  from .autonotebook import tqdm as notebook_tqdm


In [7]:
coco_path = Path("./__datasets__/sentan_dataset/sentan_dataset/sentan_dataset.json")
coco_img_root = Path("./__datasets__/sentan_dataset/sentan_dataset/")

coco = kwcoco.CocoDataset(data=coco_path, img_root=coco_img_root)

print(f"画像の枚数： {coco.n_images}")
print(f"カテゴリー数： {coco.n_cats}")
print(f"アノテーション数： {coco.n_annots}")

# 画像のIDを複数取得
sample_imgIds = random.sample(list(coco.imgs.keys()), coco.n_images)

imgs = {}
for imgId in sample_imgIds:
    imgs[imgId] = cv2.cvtColor(coco.draw_image(imgId), cv2.COLOR_BGR2RGB)

# 画像を表示
show_imgs(imgs, ncol=4, dpi=100)

画像の枚数： 9
カテゴリー数： 1
アノテーション数： 70
4387
4312
4235




4338


KeyError: ''