# 8章　画像の取り扱い 
## レシピ8.1　画像のロード 

In [None]:

# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# 画像をグレースケール（モノクロ）として読み込み
image = cv2.imread("images/plane.jpg", cv2.IMREAD_GRAYSCALE)

# 画像を表示
plt.imshow(image, cmap="gray"), plt.axis("off")
plt.show()

In [None]:
# データ型を表示
type(image)

In [None]:
# 画像データを表示
image

In [None]:
# データの形状を表示
image.shape

In [None]:
# 最初のピクセルを表示
image[0,0]

In [None]:
# カラーで画像を読み込み
image_bgr = cv2.imread("images/plane.jpg", cv2.IMREAD_COLOR)

# ピクセルを表示
image_bgr[0,0]

In [None]:
# RGBに変換
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)

# 画像を表示
plt.imshow(image_rgb), plt.axis("off")
plt.show()

## レシピ8.2　画像の保存 


In [None]:
# ライブラリをロード
import cv2
import numpy as np

# モノクロで画像を読み込み
image = cv2.imread("images/plane.jpg", cv2.IMREAD_GRAYSCALE)

# 画像を保存
cv2.imwrite("images/plane_new.jpg", image)

## レシピ8.3　画像サイズの変更 


In [None]:
# ライブラリのロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像を読み込み
image = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# 画像を50×50ピクセルにサイズ変更
image_50x50 = cv2.resize(image, (50, 50))

# 画像を表示
plt.imshow(image_50x50, cmap="gray"), plt.axis("off")
plt.show()

## レシピ8.4　画像のクロップ 


In [None]:
# ライブラリのロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像を読み込み
image = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# 列の最初の半分を選択。行はすべての行を使う
image_cropped = image[:,:128]

# 画像を表示
plt.imshow(image_cropped, cmap="gray"), plt.axis("off")
plt.show()

## レシピ8.5　画像のぼかし 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像を読み込み
image = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# 画像をぼかす
image_blurry = cv2.blur(image, (5,5))

# 画像を表示
plt.imshow(image_blurry, cmap="gray"), plt.axis("off")
plt.show()

In [None]:
# 画像をぼかす
image_very_blurry = cv2.blur(image, (100,100))

# 画像を表示
plt.imshow(image_very_blurry, cmap="gray"), plt.xticks([]), plt.yticks([])
plt.show()

In [None]:
# カーネルを作成
kernel = np.ones((5,5)) / 25.0

# カーネルを表示
kernel

In [None]:
# カーネルを適用
image_kernel = cv2.filter2D(image, -1, kernel)

# 画像を表示
plt.imshow(image_kernel, cmap="gray"), plt.xticks([]), plt.yticks([])
plt.show()

## レシピ8.6　画像をくっきりさせる 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像を読み込み
image = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# カーネルの作成
kernel = np.array([[0, -1, 0],
[-1, 5,-1],
[0, -1, 0]])

# 画像をくっきりさせる
image_sharp = cv2.filter2D(image, -1, kernel)

# 画像を表示
plt.imshow(image_sharp, cmap="gray"), plt.axis("off")
plt.show()

## レシピ8.7　コントラストの強調 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像を読み込み
image = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# 画像を強調
image_enhanced = cv2.equalizeHist(image)

# 画像を表示
plt.imshow(image_enhanced, cmap="gray"), plt.axis("off")
plt.show()

In [None]:
# 画像をロード
image_bgr = cv2.imread("images/plane.jpg")

# YUVに変換
image_yuv = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2YUV)

# ヒストグラム均等化を適用
image_yuv[:, :, 0] = cv2.equalizeHist(image_yuv[:, :, 0])

# RGBに変換
image_rgb = cv2.cvtColor(image_yuv, cv2.COLOR_YUV2RGB)

# 画像を表示
plt.imshow(image_rgb), plt.axis("off")
plt.show()

## レシピ8.8　色の分離 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# 画像をロード
image_bgr = cv2.imread('images/plane_256x256.jpg')

# BGR色空間からHSV色空間に変換
image_hsv = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2HSV)

# HSV空間で「青」の範囲を定義
lower_blue = np.array([50,100,50])
upper_blue = np.array([130,255,255])

# マスクを作成
mask = cv2.inRange(image_hsv, lower_blue, upper_blue)

# 画像にマスクを適用
image_bgr_masked = cv2.bitwise_and(image_bgr, image_bgr, mask=mask)

# BGR色空間からRGB色空間に変換
image_rgb = cv2.cvtColor(image_bgr_masked, cv2.COLOR_BGR2RGB)

# 画像を表示
plt.imshow(image_rgb), plt.axis("off")
plt.show()

In [None]:
# マスク画像を表示
plt.imshow(mask, cmap='gray'), plt.axis("off")
plt.show()

## レシピ8.9　画像の2値化 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像を読み込み
image_grey = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# 適応的閾値処理を実行
max_output_value = 255
neighborhood_size = 99
subtract_from_mean = 10
image_binarized = cv2.adaptiveThreshold(image_grey,
                                        max_output_value,
                                        cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
                                        cv2.THRESH_BINARY,
                                        neighborhood_size,
                                        subtract_from_mean)

# 画像を表示
plt.imshow(image_binarized, cmap="gray"), plt.axis("off")
plt.show()

In [None]:
# cv2.ADAPTIVE_THRESH_MEAN_Cを使用
image_mean_threshold = cv2.adaptiveThreshold(image_grey,
                                             max_output_value,
                                             cv2.ADAPTIVE_THRESH_MEAN_C,
                                             cv2.THRESH_BINARY,
                                             neighborhood_size,
                                             subtract_from_mean)

# 画像を表示
plt.imshow(image_mean_threshold, cmap="gray"), plt.axis("off")
plt.show()

## レシピ8.10　背景除去 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# 画像をロードしてRGBに変換
image_bgr = cv2.imread('images/plane_256x256.jpg')
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)

# 矩形：始点x、始点y、幅、高さ
rectangle = (0, 56, 256, 150)

# マスクの初期値を作成
mask = np.zeros(image_rgb.shape[:2], np.uint8)

# grabCutで用いる一時配列を作成
bgdModel = np.zeros((1, 65), np.float64)
fgdModel = np.zeros((1, 65), np.float64)

# grabCutを実行
cv2.grabCut(image_rgb, # 入力画像
            mask,      # マスク
            rectangle, # 範囲指定の矩形
            bgdModel,  # 背景のための一時配列
            fgdModel,  # 前景のための一時配列
            5,         # 繰り返し回数
            cv2.GC_INIT_WITH_RECT) # 矩形を用いて初期化

# マスクを作成。背景であることが確実もしくは高確率な場所を0に、それ以外を1に
mask_2 = np.where((mask==2) | (mask==0), 0, 1).astype('uint8')

# 画像とマスクを掛け合わせて背景を除去
image_rgb_nobg = image_rgb * mask_2[:, :, np.newaxis]

# 画像を表示
plt.imshow(image_rgb_nobg), plt.axis("off")
plt.show()

In [None]:
# マスクを表示
plt.imshow(mask, cmap='gray'), plt.axis("off")
plt.show()

In [None]:
# マスクを表示
plt.imshow(mask_2, cmap='gray'), plt.axis("off")
plt.show()

## レシピ8.11　エッジの検出 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像を読み込み
image_gray = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# 輝度の中央値を計算
median_intensity = np.median(image_gray)

# 中央値0.67倍と1.33倍を閾値として設定
lower_threshold = int(max(0, (1.0 - 0.33) * median_intensity))
upper_threshold = int(min(255, (1.0 + 0.33) * median_intensity))

# Cannyエッジ検出を適用
image_canny = cv2.Canny(image_gray, lower_threshold, upper_threshold)

# 画像を表示
plt.imshow(image_canny, cmap="gray"), plt.axis("off")
plt.show()


## レシピ8.12　コーナーの検出 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像を読み込み
image_bgr = cv2.imread("images/plane_256x256.jpg")
image_gray = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2GRAY)
image_gray = np.float32(image_gray)

# コーナー検出のパラメータを設定
block_size = 2
aperture = 29
free_parameter = 0.04

# コーナー検出
detector_responses = cv2.cornerHarris(image_gray,
                                      block_size,
                                      aperture,
                                      free_parameter)

# コーナー部分を強調
detector_responses = cv2.dilate(detector_responses, None)

# 検出器の反応が閾値以上に大きい場所だけを保持して、白くする
threshold = 0.02
image_bgr[detector_responses >
          threshold *
          detector_responses.max()] = [255,255,255]

# モノクロに変換
image_gray = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2GRAY)

# 画像を表示
plt.imshow(image_gray, cmap="gray"), plt.axis("off")
plt.show()


In [None]:
# コーナーの候補を表示
plt.imshow(detector_responses, cmap='gray'), plt.axis("off")
plt.show()

In [None]:
# 画像をロード
image_bgr = cv2.imread('images/plane_256x256.jpg')
image_gray = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2GRAY)

# 検出したいコーナーの数
corners_to_detect = 10
minimum_quality_score = 0.05
minimum_distance = 25

# コーナーを検出
corners = cv2.goodFeaturesToTrack(image_gray,
                                  corners_to_detect,
                                  minimum_quality_score,
                                  minimum_distance)
corners = np.int16(corners)

# 各コーナーに白い円を描画
for corner in corners:
    x, y = corner[0]
    cv2.circle(image_bgr, (x,y), 10, (255,255,255), -1)

# モノクロで画像を読み込み
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2GRAY)

# 画像を表示
plt.imshow(image_rgb, cmap='gray'), plt.axis("off")
plt.show()

## レシピ8.13　機械学習用の特徴量を作成 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

# モノクロで画像読み込み
image = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# 10×10ピクセルにサイズ変換
image_10x10 = cv2.resize(image, (10, 10))

# 1次元ベクトルに変換
image_10x10.flatten()

In [None]:
plt.imshow(image_10x10, cmap="gray"), plt.axis("off")
plt.show()

In [None]:
image_10x10.shape

In [None]:
image_10x10.flatten().shape

In [None]:
# カラーで画像をロード
image_color = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_COLOR)

# 10×10ピクセルにサイズ変換
image_color_10x10 = cv2.resize(image_color, (10, 10))

# 1次元のベクトルに変換して、形を表示
image_color_10x10.flatten().shape

In [None]:
# モノクロで画像を読み込み
image_256x256_gray = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_GRAYSCALE)

# 1次元のベクトルに変換して、形を表示
image_256x256_gray.flatten().shape

In [None]:
# カラーで画像をロード
image_256x256_color = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_COLOR)

# 1次元のベクトルに変換して、形を表示
image_256x256_color.flatten().shape

## レシピ8.14　色ヒストグラムをエンコードした特徴量 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
from matplotlib import pyplot as plt

np.random.seed(0)

# 画像をロード
image_bgr = cv2.imread("images/plane_256x256.jpg", cv2.IMREAD_COLOR)

# RGBに変換
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)

# 特徴量値を格納するリストを作成
features = []

# それぞれの色チャネルに対してヒストグラムを計算
colors = ("r","g","b")

# それぞれの色チャネルに対してヒストグラムを計算して特徴量値のリストに追加
for i, channel in enumerate(colors):
    histogram = cv2.calcHist([image_rgb], # 画像
                             [i],         # チャネルのインデックス
                             None,        # マスクは用いない
                             [256],       # ヒストグラムの大きさ
                             [0,256])     # 範囲
    features.extend(histogram)

# 観測値の特徴量値となるベクトルを作成
observation = np.array(features).flatten()

# 観測値の最初の5つの特徴量を表示
observation[0:5]

In [None]:
# RGBチャネル値を表示
image_rgb[0,0]

In [None]:
# pandasをインポート
import pandas as pd

# データを作成
data = pd.Series([1, 1, 2, 2, 3, 3, 3, 4, 5])

# ヒストグラムを表示
data.hist(grid=False)
plt.show()

In [None]:
# それぞれの色チャネルに対してヒストグラムを計算
colors = ("r","g","b")

# それぞれの色チャネルに対して：ヒストグラムを計算してプロット
for i, channel in enumerate(colors):
    histogram = cv2.calcHist([image_rgb], # 画像
                             [i],         # チャネルのインデックス
                             None,        # マスクは用いない
                             [256],       # ヒストグラムの大きさ
                             [0,256])     # 範囲
    plt.plot(histogram, color = channel)
    plt.xlim([0,256])

# プロットしたものを表示
plt.show()

## レシピ8.15　訓練済みのエンベディングを特徴量として用いる 


In [None]:
# ライブラリをロード
import cv2
import numpy as np
import torch
from torchvision import transforms
import torchvision.models as models

# 画像をロード
image_bgr = cv2.imread("images/plane.jpg", cv2.IMREAD_COLOR)

# PyTorchのデータ型に変換
convert_tensor = transforms.ToTensor()
pytorch_image = convert_tensor(np.array(image_rgb))

# 訓練済みモデルをロード
model = models.resnet18(pretrained=True)

# 出力として使いたいモデルの層を選択
layer = model._modules.get('avgpool')

# モデルを評価モードに
model.eval()

# no_gradオプションを付けてエンベディングを計算
with torch.no_grad():
    embedding = model(pytorch_image.unsqueeze(0))
    
print(embedding.shape)

In [None]:
# ライブラリをロード
import cv2
import tensorflow as tf
import tensorflow_hub as hub

# 画像をロード
image_bgr = cv2.imread("images/plane.jpg", cv2.IMREAD_COLOR)
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)

# TensorFlowのデータ型に変換
tf_image = tf.image.convert_image_dtype([image_rgb], tf.float32)

# Inception V1を用いてモデルを作り、エンベディングを取得
embedding_model = hub.KerasLayer(
    "https://tfhub.dev/google/imagenet/inception_v1/feature_vector/5"
)
embeddings = embedding_model(tf_image)

# エンベディングの形状を表示
print(embeddings.shape)

## レシピ8.16　OpenCVを用いたオブジェクトの検出

In [None]:
# ライブラリをロード
import cv2
from matplotlib import pyplot as plt

# 先に下記を実行
# mkdir models && cd models
# wget -O haarcascade_frontalface_default.xml https://tinyurl.com/mrc6jwhp
face_cascade = cv2.CascadeClassifier()
face_cascade.load(
    cv2.samples.findFile(
        "models/haarcascade_frontalface_default.xml"
    )
)

# 画像をロード
image_bgr = cv2.imread("images/kyle_pic.jpg", cv2.IMREAD_COLOR)
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)

# 顔画像を検出して矩形を描画
faces = face_cascade.detectMultiScale(image_rgb)
for (x,y,w,h) in faces:
    cv2.rectangle(image_rgb, (x, y),
                  (x + h, y + w),
                  (0, 255, 0), 5)

# 画像を表示
plt.subplot(1, 1, 1)
plt.imshow(image_rgb)
plt.show()

 
## レシピ8.17　PyTorchを用いた画像のクラス分類 


In [None]:
# ライブラリをロード
import cv2
import json
import numpy as np
import torch
from torchvision import transforms
from torchvision.models import resnet18
import urllib.request

# Imagenetのクラスを取得
with urllib.request.urlopen(
    "https://raw.githubusercontent.com/raghakot/keras-vis/master/resources/imagenet_class_index.json"
    ) as url:
    imagenet_class_index = json.load(url)

# 訓練済みモデルを作成
model = resnet18(pretrained=True)

# 画像をロード
image_bgr = cv2.imread("images/plane.jpg", cv2.IMREAD_COLOR)
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)

# PyTorchのデータ型に変換
convert_tensor = transforms.ToTensor()
pytorch_image = convert_tensor(np.array(image_rgb))

# モデルを評価モードに設定
model.eval()

# 予測を実行
prediction = model(pytorch_image.unsqueeze(0))

# 最も予測確率の高いインデックスを取得
_, index = torch.max(prediction, 1)

# 確率をパーセンテージに変換
percentage = torch.nn.functional.softmax(prediction, dim=1)[0] * 100

# インデックスに該当するアイテム名と確信度を表示
print(imagenet_class_index[str(index.tolist()[0])][1],
      percentage[index.tolist()[0]].item())