# 206 문자코드
## ASCII
- 주로 영어권에서 사용되는 기초적인 문자 코드
- 하나의 문자를 1 바이트로 표현

In [22]:
a = 'a'

print(ord(a))
print(hex(ord(a)))
print(bin(0x61)) 

97
0x61
0b1100001


## EUC-KR
- ASCII 코드에 한국어를 추가한 문자 코드

In [15]:
'박'.encode('euc-kr')

b'\xb9\xda'

In [17]:
bin(0xB9DA)

'0b1011100111011010'

## Unicode 부호화 문자 규격
- 세계중의 문자를 단일 문자 집합으로 다루는 부호화 문자 집합 규격

https://jrgraphix.net/r/Unicode/AC00-D7AF

In [24]:
a = '박'

print(ord(a))
print(hex(ord(a)))
print(bin(0x61)) 

48149
0xbc15
0b1100001


## UTF-8

- ASCII 코드에 여러가지 언어의 문자를 추가
- ASCII 코드 만으로 표현할 수 없는 언어도 지원
- 세계 표준 문자 코드

In [25]:
import sys

sys.stdin.encoding

'utf-8'

In [27]:
print('a'.encode())
print('박'.encode('utf-8'))
print(bin(0xebb095))

b'a'
b'\xeb\xb0\x95'
0b111010111011000010010101


# 바이트열, 바이너리열
- 바이트의 데이터의 묶음. 파일 입출력이나 데이터의 송수신, 암호화, 데이터의 압축 등 취급하는 데이터의 형태나 형식에 상관없이 모든 데이터를 단순한 비트 패턴의 나열로 범용적으로 처리하는 경우에 사용되는 데이터 형
- 0과 1의 한개씩 '몇 비트'라는 단위로 생각할 때는 바이너리 열
- 8개씩 '몇 바이트'로 생가가하는 바이트 열

In [28]:
print('박'.encode('utf-8'))
print(bytes('박', 'utf-8'))
print(bin(0xebb095))
''.join(map(bin,bytearray('박','utf8')))

b'\xeb\xb0\x95'
b'\xeb\xb0\x95'
0b111010111011000010010101


'0b111010110b101100000b10010101'

# Base64
  - 데이터를 64 종류의 인쇄 가능한 알파벳과 숫자만을 사용하여, 그 외의 문자를 처리 할 수 없는 통신 환경에서 멀티 바이트 문자나 바이너리 데이터를 처리하기 위한 인코딩 방식
  - 7비트 ACII문자 만의 사용을 전제로 하고 있는 이메일에서, 바이너리 데이터를 전송하기 위한 규약
  - 데이터 변환 방식의 하나
  - 첨부파일 -> 변환 -> 문자정보
  - 문자정보 -> 반대로 변환 -> 첨부 파일

In [9]:
import os, base64
base64.b64encode(os.urandom(32))

b'XnLDfU/8oZh/PtfYiEzmsmisUHmjsmmJ5LcjvVA9TxI='

# 207 pycrypto 암호화와 해독

In [36]:
# pip install pycrypto

import string
import random

from Crypto.Cipher import AES

print(AES.block_size)
print(string.ascii_letters)

key = ''.join(
    random.choice(string.ascii_letters) for _ in range(AES.block_size))

iv = ''.join(
    random.choice(string.ascii_letters) for _ in range(AES.block_size))

plaintext = 'This is python crypto test'
cipher = AES.new(key, AES.MODE_CBC, iv)

# 마지막에 필요한 길이
padding_length = AES.block_size - len(plaintext) % AES.block_size
plaintext += chr(padding_length) * padding_length # AES.block_size 길이를 맞추기 위해 넣어주는 더미 문자
cipher_text = cipher.encrypt(plaintext)
print(cipher_text)

cipher2 = AES.new(key, AES.MODE_CBC, iv)
decrypted_text = cipher2.decrypt(cipher_text)
print(decrypted_text[-1])
print(decrypted_text[:-decrypted_text[-1]])

16
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
b'I\x16\x04:\xc0\x8f\x8cA\x12\xc0\xefE\x9a\x81\xa6\x9f\x83\xb0\xbf\xc7,\x0b\x1e\xa5\x15\x10w3\x18\xc9g0'
6
b'This is python crypto test'


In [38]:
# pip install pycrypto

import string
import random

from Crypto.Cipher import AES

print(AES.block_size)
print(string.ascii_letters)

key = ''.join(
    random.choice(string.ascii_letters) for _ in range(AES.block_size))

iv = ''.join(
    random.choice(string.ascii_letters) for _ in range(AES.block_size))

with open('config.ini', 'r') as f, open('enc.dat', 'wb') as e:
    plaintext = f.read()
    cipher = AES.new(key, AES.MODE_CBC, iv)
    # 마지막에 필요한 길이
    padding_length = AES.block_size - len(plaintext) % AES.block_size
    plaintext += chr(padding_length) * padding_length # AES.block_size 길이를 맞추기 위해 넣어주는 더미 문자
    cipher_text = cipher.encrypt(plaintext)
    e.write(cipher_text)

with open('enc.dat', 'rb') as f: 
    cipher2 = AES.new(key, AES.MODE_CBC, iv)
    decrypted_text = cipher2.decrypt(f.read())
    print(decrypted_text[:-decrypted_text[-1]].decode('utf-8'))

16
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
[DEFAULT]
debug = True

[web_server]
host = 127.0.0.1
port = 80

[db_server]
host = 127.0.0.1
port = 3306




# 208 hashlib의 해시

In [51]:
import base64
import os
import hashlib

print(hashlib.sha256(b'password').digest())
print(hashlib.sha256(b'test').hexdigest())

user_name = 'user1'
user_pass = 'password'

db = {}

salt = base64.b64encode(os.urandom(32))
print(salt)

def get_digest(password):
    password = bytes(password, 'utf-8')
    digest = hashlib.sha256(salt + password).hexdigest()
    for _ in range(10000):
        digest = hashlib.sha256(bytes(digest, 'utf-8')).hexdigest()
    print(digest)
    return digest

digest = hashlib.pbkdf2_hmac(
    'sha256', bytes(user_pass, 'utf-8'), salt, 10000)

db[user_name] = digest
# db[user_name] = get_digest(user_pass)

def is_login(user_name, password):
    digest = hashlib.pbkdf2_hmac(
        'sha256', bytes(password, 'utf-8'), salt, 10000)
    return digest == db[user_name]
#     return get_digest(password) == db[user_name]


print(is_login(user_name, user_pass))

b"^\x88H\x98\xda(\x04qQ\xd0\xe5o\x8d\xc6)'s`=\rj\xab\xbd\xd6*\x11\xefr\x1d\x15B\xd8"
9f86d081884c7d659a2feaa0c55ad015a3bf4f1b2b0b822cd15d6c15b0f00a08
b'Wp3UvNBvqvDWZ41Dqbj/PEWMCd0xbrYBHJGFJMcMrbU='
True
