# コンピュータ画像の基礎

## 色とRGBA値 

コンピュータは色をRGBA値で表現する  
RGBAは、R(赤)G(緑)B(青)A(不透明度)を表し、0から255までの値を取る  
RGBA値はピクセル(画素)の一つずつに割り当てられている  
RGBは数字が大きいほどその色が強く、Aは数が多いほど不透明で255だと背景が透き通らなくなり0だと不可視(透明)になる

標準色名とRGBA値  

|色名|RGBA値|色名|RGBA値|
|:-|:-|:-|:-|
|White|(255,255,255,255)|Red|(255,0,0,255)|
|Green|(0,128,0,255)|Blue|(0,0,255,255)|
|Gray|(128,128,128,255)|Yellow|(255,255,0,255)|
|Black|(0,0,0,255)|Purple|(128,0,128,255)|

In [1]:
from PIL import ImageColor

In [2]:
ImageColor.getcolor("red", "RGBA")

(255, 0, 0, 255)

In [3]:
ImageColor.getcolor("RED", "RGBA")

(255, 0, 0, 255)

In [4]:
ImageColor.getcolor("black", "RGBA")

(0, 0, 0, 255)

In [5]:
ImageColor.getcolor("chocolate", "RGBA")

(210, 105, 30, 255)

In [6]:
ImageColor.getcolor("CornflowerBlue", "RGBA")

(100, 149, 237, 255)

PIL から ImageColor モジュールをインポートして、ImageColorの getcolor 関数を使うことで色のRGBA値をタプルで返してくれる

getcolorに渡す引数は、大文字と小文字を区別しない標準色名と文字列のRGBAを渡すことで返してくれる

100個以上の標準色名に対応している

## 座標と矩形タプル

画像のピクセルはx,y座標であらわせる  
ピクセルの原点(origin)は画像の一番左上の画像で、(0,0)と表すことができる  
左の数字がx座標を表し、右に行くほど大きくなる  
右の座標がy座標を表し、下に行くほど大きくなる

多くのPillowの関数やメソッドは矩形タプルの引数をとり、(左,上,右,下)に4つの整数値を渡すことになる  
例えば、(3,1,9,6)なら、左上のx座標が3でy座標が1のピクセルから、右下のx座標が8でy座標が5のピクセルまでのピクセルの矩形領域を指す  
右下の座標は指定された数字は含まれず、1つ小さい数字までが含まれることに注意

# Pillowで画像を操作する

In [7]:
from PIL import Image

In [8]:
cat_im = Image.open(r"C:\Users\kumak\pydata\zophie.png")

画像を読み込むにはPillow(PIL)から Image モジュールをインポートして、  
Imageの open 関数にファイル名を入れることで Imageオブジェクトを取得できる

## Imageオブジェクトを操作する

In [9]:
cat_im = Image.open(r".\pydata\zophie.png")

In [10]:
cat_im.size

(816, 1088)

In [11]:
width, height = cat_im.size

In [12]:
width

816

In [13]:
height

1088

In [14]:
cat_im.filename

'.\\pydata\\zophie.png'

In [15]:
cat_im.format

'PNG'

In [16]:
cat_im.format_description

'Portable network graphics'

In [17]:
cat_im.save(r".\pydata\zophie.jpg")

Imageオブジェクトの size アトリビュートは、画像の幅と高さをピクセル単位で返し、それぞれ代入することで変数を使ってアクセスすることもできる

Imageオブジェクトの format と format_description アトリビュートは、画像のフォーマットを文字列で返してくれる

Imageオブジェクトの save メソッドを使ってファイルを保存できる(上ではPNGからJPEGに形式を変更して保存している)

In [18]:
im = Image.new("RGBA", (100,200), "purple")
im.save(r".\pydata\purpleImage.png")

In [19]:
im2 = Image.new("RGBA", (20,20))
im2.save(r".\pydata\transparentImage.png")

Imageモジュールには new 関数という新しくImageオブジェクトを作る関数がある  
引数には、カラーモードである"RGBA"の文字列、画像の幅と高さを表す2つの整数のタプル、初期値として画像を塗りつぶす背景色の文字列もしくはRGBA値を表す4つの整数のタプルを渡すことができる

なお、背景色を省略すると(0,0,0,0)がよばれ、不可視の黒になる

## 画像を切り抜く

In [20]:
from PIL import Image
cat_im = Image.open(r".\pydata\zophie.png")

In [21]:
cropped_im = cat_im.crop((335, 345, 565, 560))

In [22]:
cropped_im.save(r".\pydata\cropped.png")

Imageオブジェクトの crop メソッドに矩形タプルを渡すことで切り抜いた画像のImageオブジェクトを返す(上では(335,345)から(565,560)までを切り抜いている)

## 画像のコピー＆ペースト

In [23]:
from PIL import Image
cat_im = Image.open(r".\pydata\zophie.png")

In [24]:
cat_copy_im = cat_im.copy()

Imageオブジェクトの copy メソッドを使うと、元の画像データを複製した別のImageオブジェクトを生成することができる  
元の画像データを維持したまま変更した画像を作るときに便利

In [25]:
face_im = cat_im.crop((335, 345, 565, 560))
face_im.size

(230, 215)

In [26]:
cat_copy_im.paste(face_im, (0, 0))
cat_copy_im.paste(face_im, (400, 500))
cat_copy_im.save(r".\pydata\paste.png")

Imageオブジェクトの paste メソッドに貼り付けたいImageオブジェクトと、画像を貼り付ける左上のxy座標を表すタプルを渡すことでペーストできる

pasteメソッドはインプレースなメソッドで、Imageオブジェクトを返さず、使ったオブジェクトを直接変更するのでコピーして使うといい

In [27]:
cat_im_width, cat_im_height = cat_im.size
face_im_width, face_im_height = face_im.size
cat_copy_two = cat_im.copy()
for left in range(0, cat_im_width, face_im_width):
    for top in range(0, cat_im_height, face_im_height):
        print(left, top)
        cat_copy_two.paste(face_im, (left, top))

0 0
0 215
0 430
0 645
0 860
0 1075
230 0
230 215
230 430
230 645
230 860
230 1075
460 0
460 215
460 430
460 645
460 860
460 1075
690 0
690 215
690 430
690 645
690 860
690 1075


In [28]:
cat_copy_two.save(r".\pydata\tiled.png")

forループのrange関数に貼り付けたい画像の幅と高さをステップとして渡して敷き詰めたい画像の幅と高さを範囲として渡すことで、画像全体に敷き詰めて画像を貼り付けてくれる

## 画像のサイズを変更する

In [29]:
from PIL import Image
cat_im = Image.open(r".\pydata\zophie.png")

In [30]:
width, height = cat_im.size
quartersized_im = cat_im.resize((int(width / 2), int(height / 2)))
quartersized_im.save(r".\pydata\quartersized.png")

In [31]:
svelte_im = cat_im.resize((width, height + 300))
svelte_im.save(r".\pydata\svelte.png")

Imageオブジェクトの resize メソッドに幅と高さを表す2つの整数をタプルにまとめて渡すことでできる  
幅と高さの比率と同じ数字ではなくても大丈夫で、比率が違う場合は引き延ばされたような画像になる

In [32]:
thumb_im = cat_im.copy()
thumb_im.size

(816, 1088)

In [33]:
thumb_im.thumbnail((100, 100))
thumb_im.size

(75, 100)

In [34]:
thumb_im.save(r".\pydata\thumbnail.png")

Imageオブジェクトの thumbnail メソッドに2つの整数のタプルを渡すと、幅と高さの比率を維持したまま指定したサイズに収まるように変更してくれる

thumbnailメソッドはインプレースなメソッドで、直接Imageオブジェクトを変更してしまうので上書きしてしまわないように注意

## 画像を回転・反転する

In [35]:
from PIL import Image
cat_im = Image.open(r".\pydata\zophie.png")

In [36]:
cat_im.rotate(90).save(r".\pydata\rotated90.png")

In [37]:
cat_im.rotate(180).save(r".\pydata\rotated180.png")

In [38]:
cat_im.rotate(270).save(r".\pydata\rotated270.png")

Imageオブジェクトの rotate メソッドを使って整数を渡すとその角度分反時計回りに回転した画像のImageオブジェクトを返してくれる

幅と高さは元の画像のままで回転し、はみ出た部分はカットされ、余った隙間部分には黒いピクセルで埋められる

In [39]:
cat_im.rotate(6).save(r".\pydata\rotated6.png")

In [40]:
cat_im.rotate(6).size

(816, 1088)

In [41]:
cat_im.rotate(6, expand=True).save(r".\pydata\rotated6_expanded.png")

In [42]:
cat_im.rotate(6,expand=True).size

(926, 1168)

rotateメソッドのキーワード引数 expand をTrueにすると、はみ出た部分をカットせずに、はみ出た部分が収まるよう画像サイズを変更したImageオブジェクトを返してくれる

In [43]:
cat_im.transpose(Image.FLIP_LEFT_RIGHT).save(r".\pydata\horizontal_flip.png")

In [44]:
Image.FLIP_LEFT_RIGHT

0

In [45]:
cat_im.transpose(Image.FLIP_TOP_BOTTOM).save(r".\pydata\vertical_flip.png")

In [46]:
Image.FLIP_TOP_BOTTOM

1

Imageオブジェクトの transpose メソッドを使うと画像を反転することができる  
渡す引数は、Imgageモジュールの FLIP_LEFT_RIGHT か FLIP_TOP_BOTTOM アトリビュートで、  
FLIP_LEFT_RIGHTは左右を反転したImageオブジェクトを返し、FLIP_TOP_BOTTOMは上下を反転したImageオブジェクトを返す

FLIP_LEFT_RIGHTには0が入っているのでtransposeに0を与えても左右を入れ替え、  
FLIP_TOP_BOTTOMには1が入っているのでtransposeに1を与えても上下を入れ替えてくれる

## ピクセルを変更する

In [47]:
from PIL import Image
im = Image.new("RGBA", (100, 100))

In [48]:
im.getpixel((0, 0))

(0, 0, 0, 0)

In [49]:
for y in range(50):
    for x in range(100):
        im.putpixel((x, y), (210, 210, 210))

In [50]:
from PIL import ImageColor
darkgray = ImageColor.getcolor("darkgray", "RGBA")

In [51]:
for y in range(50, 100):
    for x in range(100):
        im.putpixel((x, y), darkgray)

In [52]:
im.getpixel((0, 0))

(210, 210, 210, 255)

In [53]:
im.getpixel((0, 51))

(169, 169, 169, 255)

In [54]:
im.save(r".\pydata\putpixel.png")

Imageオブジェクトの getpixel メソッドに一つのピクセルの座標を表すタプルを渡すことで、そのピクセルのRGBA値を返してくれる

Imageオブジェクトの putpixel メソッドに一つのピクセルの座標を表すタプルと、色を指定するのRGBA値のタプルを渡すことで、指定したピクセルの色を指定したRGBA値の色に変更することができる(A(アルファ値)を省略して渡した場合は255が入る)

# 画像に描画する

In [55]:
from PIL import Image, ImageDraw

In [56]:
im = Image.new("RGBA", (200, 200), "white")

In [57]:
draw = ImageDraw.Draw(im)

画像に線や矩形や円などの簡単な図形を描きたいときはPillowの ImageDraw モジュールを使う

ImageDrawモジュールの Draw 関数に図形を描きたいImageオブジェクトを渡すことで ImageDraw オブジェクトを生成できる

上では200x200で背景が白の画像を作成して渡している

ImgaeDrawオブジェクトのメソッドを使って図形を描画するときに、キーワード引数の fill(塗りつぶし色) と outline(輪郭色) を指定できるものがあり、色名の文字列かRGBA値のタプルを渡すことで色を指定できる  
指定しなければ白が使われる

## 点

In [58]:
draw.point([(50, 150), (100, 150), (150, 150)], fill="purple")
draw.point([50, 175, 100, 175, 150, 175], fill="yellow")

ImgaeDrawオブジェクトの point メソッドに座標のタプルをまとめたリストか、x座標と対応するy座標を順番に並べたリストと、  
キーワード引数のfillと色名を渡すことで点を描画することができる(1ピクセル)

## 線分

In [59]:
draw.line([(0, 0), (199, 0), (199, 199), (0, 199), (0, 0)], fill="black")
for i in range(100, 200, 10):
    draw.line([i, 0, 200, i - 100], fill="green", width=5)

ImageDrawオブジェクトの line メソッドに座標のタプルをまとめたリストか、x座標と対応するy座標を順番に並べたリストを渡すことで、  
指定した座標から次の座標まで線を引いていくれる  
fillで色を指定して、キーワードの引数の width で線の太さを変えることができる

## 矩形

In [60]:
draw.rectangle((20, 30, 60, 60), fill="blue", outline="orange")

ImageDrawオブジェクトの rectangle メソッドに矩形を表すタプル(左上のx座標,左上のy座標,右下のx座標,右下のy座標)を渡すことで矩形を描写できる  
fillで内部の色、outloneで輪郭の色を指定できる

## 楕円形

In [61]:
draw.ellipse((120, 30, 160, 60), fill="red", outline="yellowgreen")
draw.ellipse((150, 80, 180, 110), fill="gray")

ImageDrawオブジェクトの ellipse メソッドに楕円形に外接する長方形を表す矩形タプルを渡すことで楕円形を描写できる  
矩形を正方形にすることで正円を描写できる  
fillで内部の色、outlineで輪郭の色を指定できる

## 多角形

In [62]:
draw.polygon([(57, 87), (79, 62), (94, 85), (120, 90), (103, 113)], fill="brown", outline="skyblue")
draw.polygon([10, 110, 40, 95, 25, 125], fill="darkred")

ImageDrawオブジェクトの polygon メソッドに座標のタプルをまとめたリストか、x座標と対応するy座標を順番に並べたリストを渡すことで、  
座標を線でつなげて(最初と最後の座標を自動でつなげてくれる)中の色を塗りつぶした多角形を描画できる  
fillで内部の色、outlineで輪郭の色を指定できる

In [63]:
im.save(r".\pydata\drawing.png")

ImageDrawオブジェクトには他にも描画メソッドがあり、調べると出てくる

# テキストを描画する

In [64]:
from PIL import Image, ImageDraw, ImageFont

In [65]:
im = Image.new("RGBA", (200, 200), "white")
draw = ImageDraw.Draw(im)
draw.text((20, 150), "Hello", fill="purple")

In [66]:
arial_font = ImageFont.truetype("arial.ttf", 32)
draw.text((100, 150), "World!", fill="gray", font=arial_font)

In [67]:
im.save(r".\pydata\text.png")

ImageDrawオブジェクトの text メソッドを使うことでテキストを描画することができる  
引数は、テキストを表示する矩形の左上の座標タプル、描画するテキストの文字列、テキストの色(fill)、後述するImageFontオブジェクト(font)の4つを渡すことができる

ImageFont モジュールの truetype 関数の第一引数にパソコン内のフォントファイル(truetypeファイルで拡張子は.ttf、C:\Windows\Fontsにある)、  
第二引数にポイント数を表す整数を渡すことで ImageFont オブジェクトが生成できる

上ではImageDrawオブジェクトのtextメソッドに、x座標100y座標150の位置に、World!という文字列を、灰色で、フォントをImageFontオブジェクトで設定したarial.ttfファイルのフォントで32ポイントにしている

In [68]:
im = Image.new("RGBA", (200, 200), "white")
draw = ImageDraw.Draw(im)
jfont = ImageFont.truetype("msmincho.ttc", 24, index=1) # MS P明朝
draw.text((20, 20), "こんにちは", fill="black", font=jfont)
jfont = ImageFont.truetype("msgothic.ttc", 24, index=2) # MS Pゴシック
draw.text((20, 50), "こんにちは", fill="black", font=jfont)
jfont = ImageFont.truetype("meiryo.ttc", 24, index=0) # メイリオ
draw.text((20, 80), "こんにちは", fill="black", font=jfont)

In [69]:
im.save(r".\pydata\jtext.png")

日本語のフォントを使用するには以下のフォントファイル名とキーワード引数のindexを指定して渡す必要がある  
ファイルの拡張子が.ttcになっていることに注意

日本語フォントとファイル名

|フォント名|ファイル名|index|
|:-|:-|:-|
|MS明朝|msmincho.ttc|0|
|MS P明朝|mnmincho.ttc|1|
|MSゴシック|msgothic.ttc|0|
|MS Pゴシック|msgothic.ttc|2|
|MS UI Gothic|msgothic.ttc|1|
|メイリオ|meiryo.ttc|0|
|Meiryo UI|meiryo.ttc|2|