<a href="https://colab.research.google.com/github/machine-perception-robotics-group/ImageProcessingGoogleColabNotebooks/blob/master/01_image_intensity_histogram.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 01. 画像の濃淡ヒストグラム
講義で説明する画像処理の方法について，google colaboratoryを利用して演習する．
google colaboratoryは，クラウドで実行する Jupyter ノートブック環境である.
google coraboratoryについては，[ここ](https://www.tdi.co.jp/miso/google-colaboratory-gpu)や[ここ](https://www.codexa.net/how-to-use-google-colaboratory/)を参考にすること．

下記のプログラムを実行すると，グレースケール画像を読み込み，濃淡ヒストグラムを表示する.

## 準備
プログラムの動作に必要なデータをダウンロードし，zipファイルを解凍する．
`!`で始まるコマンドはPythonではなく，Linux（Ubuntu）のコマンドを実行している．

In [0]:
!wget -q http://www.mprg.cs.chubu.ac.jp/Tutorial/ML_Lecture/tutorial_ip_2020/image1.zip
!unzip -q image1.zip
!ls
!ls ./image1/

## 画像の読み込みと表示
画像の読み込みには，OpenCVという画像処理・画像認識のライブラリを利用する．
OpenCVをpythonで利用する場合は，`cv2`というパッケージをインポートする．

`imread`関数で画像の読み込み，`cvtColor`でカラー画像のチャネルの順番をBGRからRGBに変換している．この処理の詳細は割愛する．

そして，`matplotlib`という描画するパッケージの`imshow`関数を利用して画像を表示する．


In [0]:
import cv2
import numpy as np
from matplotlib import pyplot as plt

# 画像の読み込み
img_color_origin = cv2.imread('./image1/woman-color.jpg')

# BGRからRGBに変換
img_color_origin = im_rgb = cv2.cvtColor(img_color_origin, cv2.COLOR_BGR2RGB)

# 画像を表示
plt.imshow(img_color_origin)

グレースケール画像画像を読み込む．そして，`matplotlib`の`imshow`関数で画像を表示する．
この時，`imshow`関数の引数として`cmap="gray"`を指定することで，グレースケール画像として表示をすることができる．

In [0]:
# グレースケール画像を読み込む
img_gray_g = cv2.imread('./image1/woman-g.jpg', 2)
# 表示
plt.imshow(img_gray_g, cmap="gray")

コントラストを低くしたグレースケール画像を読み込む．
そして，`matplotlib`の`imshow`関数で画像を表示する．

In [0]:
# コントラストを低くした画像を読み込む
img_gray_g2 = cv2.imread('./image1/woman-g2.jpg', 2)
# 表示
plt.imshow(img_gray_g2, cmap="gray")

## 画像の仕組み

### グレースケール画像
画像は，コンピュータ内では，2次元配列で表現されている．
配列の各要素は画像の画素に対応する．
各画素は8ビットで表現する場合は0から255の値となる．

4*4の画像を作成する．
まず，Pythonのリストを使用して，`img_44`に2次元の配列を作成する．
作成した`img_44`を`imshow`関数を用いて表示することで，
作成したグレースケール画像を表示することができる．

In [0]:
# 2次元配列で各画素の値を決定
img_44 =  [[ 64,   0, 128,  64],
           [128, 255, 255,   0],
           [  0, 255, 255, 128],
           [ 64, 128,   0,  64]]
# 中身を表示する
print(img_44)
# グレースケール画像として表示
plt.imshow(img_44, cmap="gray")

### カラー画像
 カラー画像の場合は，3次元配列となっている．
 すなわち，2次元の配列が複数ある．
 カラー画像は赤色 (R)，緑色 (G)，青色 (B) の3つのチャネルから構成されている．
 よって，3次元配列が3つある．

以下では，Pythonのモジュール（ライブラリ）の1つであるNumpyを使用し，4x4のカラー画像を作成する．Numpyの基本的な使い方については，[ここ](https://qiita.com/sqrtxx/items/f37d99991e40a35ee4e0)や[ここ](https://deepage.net/features/numpy/)を参考にすること．

Numpyの`zeros`関数を用いて，4x4x3の3次元配列（`image_array`）を作成する．
`zeros`関数は，配列の要素が全て0の配列を作成する関数である．
この時，第1引数として配列のサイズを指定する．
ここでは，`(4, 4, 3)`と指定することで，4x4x3の3次元配列のサイズを指定する．
また，2つ目の引数として，配列のデータの型を指定する．
`dtype=np.uint8`と指定することで，配列の要素のデータ型を8bitの符号なし整数（8-bit unsigned integer）と指定している．

次に，`image_array`の各要素に画素値を代入する．
ここでは，for文を用いて，配列のインデックス（`h`, `w`）を指定し，指定した要素にRGB値を代入する．
この時，`image_array[h, w]`と指定することで，1次元目は`h`，2次元目は`w`の要素を指定している．
3次元目を指定していしないことで，`h`，`w`の箇所の3つの要素に一度に値を代入している．

最後に`imshow`関数を用いて画像を表示する．

In [0]:
# 画像の縦・横幅を指定
height = 4
width = 4

# 要素が全て0の3次元配列を作成
image_array = np.zeros((height, width, 3), dtype=np.uint8)

# 配列の各要素に値（画素値）を代入
for h in range(0, height):
    for w in range(0, width):
      image_array[h, w] = [w*64, h*64, w*h*64]

print(image_array)
# カラー画像の表示
plt.imshow(image_array)

### 画像サイズを確認する方法
ファイルから読み込む画像の高さと幅のサイズがわからない場合，以下のように確認することができる．
Pythonでは，OpenCVなどで画像ファイルを読み込むと，画素値がNumpyの配列に格納される．
Numpy配列の`shape`を確認することで，高さと幅のサイズがわかる．

In [0]:
# 上で作成したカラー画像のデータをコピー
img = image_array.copy()

 # 高さ・幅・チャンネル数の取得
height, width, channel = img.shape

# 表示
print("height=", height)
print("width=", width)
print(img)
plt.imshow(img, cmap = "gray")

### 指定した画素の値を確認する
上で示したように，コンピュータ上では，画像は2次元配列（グレースケール画像）または3次元配列（カラー画像）であり，各要素を取得することで画素値を確認できる．
配列の各要素にアクセスするには，以下のように要素番号を指定する．
カラー画像の場合は，R, G, Bに対応する3つの値がある．

In [0]:
# 上で読み込んだカラー画像をコピー
img = img_color_origin.copy()

 # 高さ・幅・チャンネル数の取得
height, width, channel = img.shape

# 確認したい画素の場所を指定
x = 100
y = 120

# x, yが画像のサイズ内であれば，x, yの場所の画素値を表示
if x < width and y < height:
    print(img[y, x])

グレースケール画像の場合も同様に以下のように要素番号を指定する．
カラー画像と異なり，画素の値は輝度値であり，1つだけである．

In [0]:
# 上で読み込んだグレースケール画像をコピー
img = img_gray_g.copy()

# 高さ・幅の取得
height, width = img.shape

# 確認したい画素の場所を指定
x = 100
y = 120

# x, yが画像のサイズ内であれば，x, yの場所の画素値を表示
if x < width and y < height:
    print(img[y,x])

別の方法として，以下のようにfor文とif文を利用して確認する方法もある．

In [0]:
# 上で読み込んだグレースケール画像をコピー
img = img_gray_g.copy()

# 高さ・幅の取得
height, width = img.shape
x = 100
y = 120

for i in range(height):
    for j in range(width):
        if i == y and j == x:
          print(img[i,j])

## 濃淡ヒストグラムの作成
画像の各画素は，0から255の画素値を持つ．
1枚の画像内にどのような画素値が含まれているか分布を濃淡ヒストグラムとして作成する．
濃淡ヒストグラムを見ると，画素値が0に近いところに多くの画素があると暗い画像，画素値が255に近いところに多くの画素があると明るい画像と判断できる．

濃淡ヒストグラムの作成には，`matplotlib`の`hist`関数を利用する．

`hist`関数の第1引数に画像の画素値を入力する．
ここで使用されている`ravel`関数は，配列を1次元に変換するものである．

第2引数にヒストグラムを作成する際のbinの数を指定する．ここでは0から255の256種類の画素値のヒストグラムを作成するため，`256`と指定する．

第3引数では，ヒストグラムを計算する際の各要素の取りうる値の範囲を指定する．
画素の値は0から255のため，`[0, 256]`と指定する．
 

In [0]:
# 上で読み込んだグレースケール画像をコピー
img = img_gray_g.copy()

# hist関数を使用して濃淡ヒストグラムを作成
plt.hist(img.ravel(), 256, [0, 256])

# 作成したヒストグラムを表示
plt.show()

コントラストが低いグレースケール画像の場合の濃淡ヒストグラムは以下のようになる．

In [0]:
#上で読み込んだ低コントラストグレースケール画像をコピー
img = img_gray_g2.copy()

# 濃淡ヒストグラムの作成と表示
plt.hist(img.ravel(), 256, [0, 256])
plt.show()

## 濃淡ヒストグラムを利用した統計量の獲得
濃淡ヒストグラムは各画素値の画素数をカウントしている．
この情報を利用して，画質を評価するための統計量を獲得できる．

以下では，最大画素値，最小画素値，平均画素値，画素の中央値，コントラストを計算する．

In [0]:
#上で読み込んだ低コントラストグレースケール画像をコピー
img = img_gray_g2.copy()

# 高さ・幅の取得
height, width = img.shape

# 画像の画素数を計算
imgsize = height * width

min_v = img[0][0]
max_v = img[0][0]
imgsum = 0
imglist = []

# for文で1つずつ画素値にアクセスする
for h in range(height):
    for w in range(width):

        # 最小画素値
        if img[h][w] < min_v: 
            min_v = img[h][w]
        # 最大画素値
        if img[h][w] > max_v:
            max_v = img[h][w]
        # 画素値の合計
        imgsum += img[h][w]
        
        # 画素値をリストに追加
        imglist.append(img[h][w])

# 平均画素値の計算
avg = imgsum / (imgsize)

# 画素値の中央値の計算
img_sort = sorted(imglist)
img_len = len(imglist)
img_len_half = int(img_len / 2)
if img_len % 2 == 0:
    img_median = (int(img_sort[img_len_half - 1]) + int(img_sort[img_len_half])) / 2
else:
    img_median = img_sort[int((img_len - 1) / 2)]

print("min =", min_v)
print("max =", max_v)
print("avg =", avg)
print("median", img_median)

# コントラストの計算
contrast = (int(max_v) - int(min_v)) / (int(max_v) + int(min_v))
print("contrast =", contrast)

## 2値化
画素ごとに閾値処理を行うことで2値化できる．
閾値を変えると白 (255) と黒 (0) に2値化するための分岐点が変わる．
2値化は，各画素に対して閾値処理するので，以下のようにfor文とif文を組み合わせて，全画素に対して処理を行う．


In [0]:
img = img_gray_g.copy()
height, width = img.shape

# 閾値の設定
thresh = 128

for i in range(height):
    for j in range(width):
        if img[i][j] < thresh:  # 画素値が閾値未満の場合
            img[i][j] = 0
        else:                   # それ以外
            img[i][j] = 255

# 2値化した画像の表示
img_b2 = img
plt.imshow(img_b2, cmap="gray")

2値化した場合のヒストグラムを表示する．
0 (白), 255 (黒) の2種類の値のみとなっていることがわかる．

In [0]:
plt.hist(img.ravel(), 256, [0, 256])
plt.show()

## 画質の調整
画像全体の明るさを調整する方法である線形変換は，以下のように行う．

In [0]:
output_img = img_gray_g2.copy()

# 変換後の画素値の最大・最小を指定
D_max = 255
D_min = 0

for i in range(height):
    for j in range(width):
        output_img[i][j] = int(((D_max - D_min) / (max_v - min_v)) * (output_img[i][j] - min_v) + D_min)

# 変換前の画像の描画
plt.imshow(img_gray_g2, cmap="gray")
plt.title('Before')
plt.show()
# 変換後の画像の描画
plt.imshow(output_img, cmap="gray")
plt.title('After')
plt.show()

目視では変換前後の違いを確認することが難しいため，濃淡ヒストグラムで比較する．

In [0]:
#処理前
plt.hist(img_gray_g2.ravel(), 256, [0, 256])
plt.show()

#処理後
plt.hist(output_img.ravel(), 256, [0, 256])
plt.show()

## ガンマ補正
ガンマ変換では，画像の各画素の値を非線形に変換する．

以下では，ガンマ変換により画素値を変換する．
まず，ガンマ値を指定する．
その後，for文を用いて1画素ごとにガンマ変換を適用する．

In [0]:
# 変換前の画像データを準備
img_org = img_gray_g.copy()

# ガンマ値の指定
gamma = 5.0
 
# ガンマ変換用の画像データを準備
img_gamma = img_gray_g.copy()

# for文で各画素にアクセスし，1画素ごとにガンマ変換を行う
for h in range(img_gamma.shape[0]):
    for w in range(img_gamma.shape[1]):
        img_gamma[h, w] = int(255 * (img_gamma[h, w] / 255) ** (1.0 / gamma))

# 変換前後の画像の描画
plt.imshow(img_org,cmap = "gray")
plt.title('Before')
plt.show()
plt.imshow(img_gamma,cmap = "gray")
plt.title('After')
plt.show()

線形変換と同様に濃淡ヒストグラムで違いを確認する．

In [0]:
#処理前
plt.hist(img_org.ravel(), 256, [0, 256])
plt.show()

#処理後
plt.hist(img_gamma.ravel(), 256, [0, 256])
plt.show()

## 課題
### 画像の変換
*   画質の調整について，プログラムの`D_max`, `D_min`の値を変更すると画像はどのようになるか確認すること
*   ガンマ補正について，ガンマ値を変更すると画像はどのようになるか確認すること．

