# ハッシュ関数とは

ハッシュ関数は入力データをルールに基づいて他のデータに変換する関数で下のような特徴を持っている。

    1. 不可逆性：一方向にしか計算できず、逆算ができない。
        →第三者に知られたくない情報を隠すために利用される。
    2. 機密性：入力データが少しでも変わると、出力データが大きく変わる。
        →元のデータが改ざんされていないかを検出するために利用される。
    3. 固定長：入力データの長さを問わず、出力データは同じ長さにになる。
        →多くのデータを要約してサイズを圧縮することに利用される。
    4. 処理速度：入力データから出力データを簡単に計算できる。

## ハッシュ関数を使ってみる。

In [2]:
#標準ライブラリの hashlib をインポート
import hashlib

def hashWord(word):
    # b'hello' のように文字列の前に b をつけるとバイト型にできる。もしくは、str.encode()でもバイト型に変換できる。
    # sha256()でハッシュ化し、hexdigest()で16進数の文字列にしている。
    return hashlib.sha256(word.encode()).hexdigest()

In [15]:
print('「hello」のハッシュ: '+hashWord('hello'))
print('「hallo」のハッシュ: '+hashWord('hallo'))
print('「hello world!」のハッシュ: '+hashWord('hello world!'))

print(len(hashWord('hello')), len(hashWord('hallo')), len(hashWord('hello world!')))

「hello」のハッシュ: 2cf24dba5fb0a30e26e83b2ac5b9e29e1b161e5c1fa7425e73043362938b9824
「hallo」のハッシュ: d3751d33f9cd5049c4af2b462735457e4d3baf130bcbb87f389e349fbaeb20b9
「hello world!」のハッシュ: 7509e5bda0c762d2bac7f90d758b5b2263fa01ccbc542ab5e3df163be08e6ca9
64 64 64


「hello」と「hallo」の1文字だけを変えただけで大きく出力が変わるという特徴がわかる。

また、「hello world!」のように出力が大きくなっても、出力のサイズは同じだという特徴も確認できた。

### 章末問題
「Bonjour」を　SHA-256　に掛けてハッシュ値を計算

In [3]:
hashWord('Bonjour')

'9172e8eec99f144f72eca9a568759580edadb2cfd154857f07e657569493bc44'