# EXIF 리더 프로그램

지금까지 우리는 JPEG 파일을 열어서 IFD0, Exif IFD, GPS IFD, IFD1 의 메타정보를 읽어보았습니다. 그러나 기존의 코드는 불필요한 코드 중복이 많기 때문에 이 부분을 조금 정리해서 코드를 조금 깔끔하게 작성해보도록 하겠습니다. 코드를 작성하는 방법은 정해진 규칙은 없으니 여러 사람이 만든 코드를 분석해보고 자신만의 코드를 더욱 더 효율적으로 업그레이드 해보는것을 추천합니다.

### 파일 분리

우리는 기존에 ```.py``` 파일 하나에 모든 선언과 코드를 작성했습니다만 이를 조금 분리해보도록 하겠습니다.

In [1]:
'''defines.py'''

TAGS = {
    0x010E: ("Image Description", "이미지 설명", {}),
    0x010F: ("Make", "카메라 제조사", {}),
    0x0110: ("Model", "카메라 모델", {}),
    0x0112: ("Orientation", "사진 촬영시 카메라의 방향", {1:"upper-left", 3:"lower-right", 6:"upper-right", 8:"lower-left", 9:"undefined"}),
    0x011A: ("XResolution", "X축 디스플레이/인쇄 해상도", {}),
    0x011B: ("YResolution", "Y축 디스플레이/인쇄 해상도", {}),
    0x0128: ("ResolutionUnit", "위의 디스플레이/인쇄 해상도의 단위", {1:"단위없음", 2:"인치", 3:"센티미터"}),
    0x0131: ("Software", "펌웨어 버전 번호", {}),
    0x0132: ("DateTime", "YYYY:MM:DD HH:MM:SS", {}),
    0x013E: ("WhitePoint", "이미지의 흰색점의 색도 정의.", {}),
    0x013F: ("PrimaryChromaticities", "이미지 원색의 색도 정의", {}),
    0x0211: ("YCbCrCoefficients", "이미지 형식이 YCbCr 인 경우 RGB 형으로 변환하는 상수 표시.", {}),
    0x0213: ("YCbCrPositioning", "이미지 형식이 YCbCr 이고 서브샘플링을 사용하는 경우", {1:"픽셀어레이 중심", 2:"데이텀 포인트 를 의미"}),
    0x0214: ("ReferenceBlackWhite", "흑점/백점의 기준값을 표시", {}),
    0x8298: ("Copyright", "저작권 정보 표시", {}),
    0x8769: ("ExifOffset", "Exif Sub IFD의 오프셋", {}),
    0x8825: ("GPSInfo", "GPS 정보 IFD 오프셋", {}),

    0x0100: ("ImageWidth", "썸네일 이미지 가로 크기", {}), 
    0x0101: ("ImageHeight", "썸네일 이미지 세로 크기", {}), 
    0x0103: ("Compression", "압축", {1:"압축안함", 6:"JPEG압축"}), 
    0x0112: ("Orientation", "방향", {1:"Horizontal", 2:"Mirror Horizontal", 3:"Rotate 180", 4:"Mirror vertical", 5:"Mirror horizontal and rotate 270 CW", 6:"Rotate 90 CW", 7:"Mirror horizontal and rotate 90 CW", 8:"Rotate 270 CW"}), 
    0x0201: ("JpegIFOffset", "JPEG 오프셋", {}), 
    0x0202: ("JpegIFByteCount", "JPEG 바이트 수", {}), 

    0x829A: ("ExposureTime", "노출 시간", {}),
    0x829D: ("FNumber", "촬영시 조리개 값", {}),
    0x8822: ("ExposureProgram", "촬영시 카메라의 노출 모드", {1:"메뉴얼", 2:"프로그램", 3:"조리개우선", 4:"셔터우선", 5:"크리에이티브모드", 6:"프로그램액션", 7:"인물모드", 8:"풍경모드"}),
    0x8827: ("ISOSpeedRatings", "ISO 감도", {}),
    0x9000: ("ExifVersion", "4바이트 문자의 Exif 버전", {}),
    0x9003: ("DateTimeOriginal", "이미지 원본 촬영 시간", {}),
    0x9004: ("DateTimeDigitized", "이미지가 디지털로 기록된 시간. 일반적으로 DateTimeOriginal 과 동일", {}),
    0x9101: ("ComponentConfiguration", "ComponentConfiguration", {}),
    0x9102: ("CompressedBitsPerPixel", "JPEG 평균 압축률", {}),
    0x9201: ("ShutterSpeedValue",  "셔터속도", {}),
    0x9202: ("ApertureValue", "이미지 촬영시 실제 렌즈 조리개값", {}),
    0x9203: ("BrightnessValue", "촬영한 피사체의 밝기", {}),
    0x9204: ("ExposureBiasValue", "촬영시 노출값", {}),
    0x9205: ("MaxApertureValue", "촬영시 사용된 렌즈의 최대 조리개 값", {}),
    0x9206: ("SubjectDistance", "초점 거리", {}),
    0x9207: ("MeteringMode", "노출 측광방식", {1:"평균측광", 2:"중앙평균측광", 3:"스팟측광", 4:"멀티스팟", 5:"다중측광"}),
    0x9208: ("LightSource", "화이트밸런스 광원설정", {0:"자동", 1:"일광", 2:"형광등", 3:"텅스텐", 10:"플래시"}),
    0x9209: ("Flash", "플래시 사용여부", {1:"플래시사용", 0:"플래시사용안함"}),
    0x920A: ("FocalLength", "촬영시 렌즈의 초점거리", {}),
    0x927C: ("MakerNote", "제조사 내부 데이터영역", {}),
    0x9286: ("UserComment", "사용자 코멘트", {}),
    0xA000: ("FlashPixVersion", "플래시픽스 버전", {}),
    0xA001: ("ColorSpace", "ColorSpace", {}),
    0xA002: ("ExifImageWidth", "이미지 넓이", {}),
    0xa003: ("ExifImageHeight", "이미지 높이", {}),
    0xA004: ("RelatedSoundFile", "촬영시 오디오 데이터를 녹음한 경우 오디오 데이터의 이름 표시", {}),
    0xA005: ("ExifInteroperabilityOffset", "ExifInteroperabilityOffset", {}),
    0xA20E: ("FocalPlaneXResolution", "CCD의 가로 픽셀 밀도", {}),
    0xA20F: ("FocalPlaneYResolution", "CCD의 세로 픽셀 밀도", {}),
    0xA210: ("FocalPlaneResolutionUnit", "CCD의 픽셀 밀도의 단위", {1:"단위없음", 2:"인치", 3:"센티미터"}),
    0xA217: ("SensingMethod", "이미지 센서 유닛종류", {}),
    0xA300: ("FileSource", "'3' 고정됩니다.", {}),
    0xA301: ("SceneType", "'1' 고정됩니다.", {}),

    0x9290: ("SubSecTime", "날짜 수정에 대한 분수 초", {}),
    0x9291: ("SubSecTimeOriginal", "DateTimeOriginal에 대한 분수 초", {}),
    0x9292: ("SubSecTimeDigitized", "CreateDate에 대한 분수 초", {}),
    0xA401: ("CustomRendered", "사용자 지정 렌더링", {0:"노말", 1:"커스텀"}),
    0xA402: ("ExposureMode", "노출모드", {0:"오토", 1:"메뉴얼", 2:"자동 브래킷"}),
    0xA403: ("WhiteBalance", "화이트밸런스", {0:"오토", 1:"메뉴얼"}),
    0xA404: ("DigitalZoomRatio", "디지털줌 비율", {}),
    0xA405: ("FocalLengthIn35mmFormat", "35mm필름 형식", {}),
    0xA406: ("SceneCaptureType", "촬영모드", {0:"스탠다드", 1:"풍경", 2:"인물", 3:"나이트", 4:"기타"}),
    0xA407: ("GainControl", "게인 컨트롤", {0:"None", 1:"Low gain up", 2:"High gain up", 3:"Low gain down", 4:"High gain down"}),
    0xA408: ("Contrast", "대비", {0:"Normal", 1:"Low", 2:"High"}),
    0xA409: ("Saturation", "채도", {0:"Normal", 1:"Low", 2:"High"}),
    0xA40A: ("Sharpness", "선명도", {0:"Normal", 1:"Soft", 2:"Hard"}),
    0xA420: ("ImageUniqueID", "이미지 고유넘버", {}),

    0x0000: ("GPSVersionID", "GPS 태그 버전", {}),
    0x0001: ("GPSLatitudeRef", "북위 또는 남위", {}),
    0x0002: ("GPSLatitude", "위도", {}),
    0x0003: ("GPSLongitudeRef", "동쪽 또는 서쪽 경도", {}),
    0x0004: ("GPSLongitude", "경도", {}),
    0x0005: ("GPSAltitudeRef", "고도 참조", {}),
    0x0006: ("GPSAltitude", "고도", {}),
    0x001D: ("GPSDateStamp", "GPS 날짜", {}),
    0x0007: ("GPSTimeStamp", "GPS 시간(원자시계)", {}),
    0x001B: ("GPSProcessingMethod", "GPS 처리 방식 이름", {}),
}

FORMAT_TYPES = (
    (0, ""),
    (1, "B", "unsigned byte"),
    (1, "c", "ascii"),
    (2, "H", "unsigned short"),
    (4, "L", "unsigned long"),
    (8, "Q", "unsigned rational"),
    (1, "b", "signed byte"),
    (1, "", "undefined"),
    (2, "h", "signed short"),
    (4, "l", "signed long"),
    (8, "q", "signed rational"),
    (4, "f", "single float"),
    (8, "d", "double float")
)


```defines.py``` 파일명으로 파일을 하나 생성한 후 태그 정보, 포맷타입의 변수를 한곳에 모두 작성했습니다. 또한 기존에 IFD0_TAGS, EXIF_TAGS 등으로 구분되어있던 태그들도 그냥 ```TAGS``` 라는 변수 하나에 모두 저장했습니다. 물론 이를 더 세분화 해서 ```0x010E: ("Image Description", "이미지 설명", {}, "IFD0")``` 처럼 그룹명을 기록해주는 방법도 좋을것 같습니다만 여기선 하지 않습니다.

### 함수 작성

기존의 코드는 그냥 위에서 부터 순차적으로 내려오는 방식으로 코드를 작성했기 때문에 불필요한 중복된 코드가 많았습니다. 이를 조금 수정하여 반복되는 내용을 함수로 작성하여 함수를 호출해서 결과를 얻는 방식으로 변경하도록 합니다.

In [6]:
import struct
from defines import FORMAT_TYPES, TAGS

def get_ifd_data(pointer, TIFF_DATA):
    ifd_dict = {}
    BYTE_ORDER = TIFF_DATA[0 : 1]
    ENDIAN_MARK = "<" if BYTE_ORDER == b"I" else ">"
    _tag_count = struct.unpack(ENDIAN_MARK + "H", TIFF_DATA[pointer : pointer + 2])[0]
    _start_offset = pointer + 2

    for i in range(_tag_count):
        pointer = _start_offset + 12 * i
        tag = struct.unpack(ENDIAN_MARK + "H", TIFF_DATA[pointer : pointer + 2])[0]
        value_format = struct.unpack(ENDIAN_MARK + "H", TIFF_DATA[pointer + 2 : pointer + 4])[0]
        value_num = struct.unpack(ENDIAN_MARK + "L", TIFF_DATA[pointer + 4 : pointer + 8])[0]
        value_size = FORMAT_TYPES[value_format][0] * value_num
        value_offset = pointer + 8
        value_offset = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[value_offset : value_offset + 4])[0] if value_size > 4 else value_offset

        if value_format == 2:
            value = TIFF_DATA[value_offset : value_offset + value_size].decode()
        elif value_format in (5, 10):
            value = ""
            for i in range(int(value_size / 8)):
                v_offset = value_offset + (i * 8)
                value1 = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[v_offset : v_offset + 4])[0]
                value2 = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[v_offset + 4 : v_offset + 8])[0]
                value += ", {}/{}".format(value1, value2) if value != "" else "{}/{}".format(value1, value2)
        elif value_format == 7:
            if tag in (0x9000, 0xA000, 0x9286, 0x001B):
                value = TIFF_DATA[value_offset : value_offset + value_size].decode()
            elif tag == 0x9101:
                buffer = TIFF_DATA[value_offset : value_offset + value_size]
                value = "YCbCr" if buffer == b"\x01\x02\x03\x00" else "RGB"
            elif tag == 0xA301:
                value = 1
            else:
                print("Unknown tag {:04x}".format(tag))
        elif value_format == 1 and value_size == 4:
            value = TIFF_DATA[value_offset : value_offset + value_size]
        else:
            value = struct.unpack(ENDIAN_MARK + FORMAT_TYPES[value_format][1], TIFF_DATA[value_offset : value_offset + value_size])[0]

        ifd_dict[tag] = value
        value = TAGS[tag][2].get(value) if TAGS[tag][2].get(value) is not None else value
        print("태그:{:04x} {} {} {} {} {}".format(tag, TAGS[tag][1], value_format, value_num, value_size, value))
    
    next_ifd_offset = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[pointer + 12 : pointer + 12 + 4])[0]
    return ifd_dict, next_ifd_offset

위에서 작성한 ```get_fid_data()``` 함수에는 우리가 기존에 작성한 코드의 모든 내용이 담겨 있습니다. 

<pre style="background-color:#eeeeee;margin:0px;padding:10px;margin-top:15px;">
def get_ifd_data(pointer, TIFF_DATA):
</pre>

이 함수는 ```pointer, TIFF_DATA``` 2개의 인자를 받아서 처리 하는데 pointer 는 IFD 의 오프셋 주소 값 입니다. 

<pre style="background-color:#eeeeee;margin:0px;padding:10px;margin-top:15px;">
BYTE_ORDER = TIFF_DATA[0 : 1]
ENDIAN_MARK = "<" if BYTE_ORDER == b"I" else ">"
_tag_count = struct.unpack(ENDIAN_MARK + "H", TIFF_DATA[pointer : pointer + 2])[0]
_start_offset = pointer + 2
</pre>

그런데 여기서 주의해야할 부분이 함수 내에서 바이트 오더를 구하고 IFD 의 엔트리 갯수를 구하게 됩니다. 그렇기 때문에 이전 코드에서 처럼 오프셋 시작 주소값에 갯수를 먼저 구해서 갯수 바이트 수 만큼 2를 더하지 않아야 합니다.

<pre style="background-color:#eeeeee;margin:0px;padding:10px;margin-top:15px;">
ifd_dict[tag] = value
</pre>

이렇게 구해진 모든 태그와 해당 태그의 값은 위의 부분코드에서 처럼 ```ifd_dict``` 라는 딕셔너리 형태의 변수에 저장합니다.

<pre style="background-color:#eeeeee;margin:0px;padding:10px;margin-top:15px;">
next_ifd_offset = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[pointer + 12 : pointer + 12 + 4])[0]
return ifd_dict, next_ifd_offset
</pre>
각 IFD 는 마지막 엔트리 이후 4바이트가 다음 IFD 주소값인걸 알고 있기 때문에 그 값 역시 함수에서 구해서 리턴해줍니다.

<pre style="background-color:#eeeeee;margin:0px;padding:10px;margin-top:15px;">
HEAD = exif[:10]
TIFF_DATA = exif[10:]

DATA_IFD0, ifd1_offset = get_ifd_data(8, TIFF_DATA)
exif_offset = DATA_IFD0[0x8769]
DATA_EXIF, _ = get_ifd_data(exif_offset, TIFF_DATA)
gps_ifd_offset = DATA_IFD0[0x8825]
DATA_GPS, _ = get_ifd_data(gps_ifd_offset, TIFF_DATA)
get_ifd_data(ifd1_offset, TIFF_DATA)
</pre>

이렇게 핵심 기능을 함수화 시켜놓고 위의 코드에서처럼 우리는 간편하게 모든 IFD 에 해당하는 엔트리 값을 구할 수 있게 됩니다. 기존의 코드와 다르게 엔트리 갯수를 함수 내부에서 구하기 때문에 ```DATA_IFD0, ifd1_offset = get_ifd_data(8, TIFF_DATA)``` 처럼 최초 IFD0 의 오프셋 시작값은 8 입니다. 해당 함수가 정상적으로 수행되면 ```get_ifd_data()``` 함수는 IFD 엔트리 정보와 다음 IFD 의 오프셋 주소를 리턴합니다.

In [9]:
import struct
from defines import FORMAT_TYPES, TAGS
from PIL import Image
import io

def get_ifd_data(pointer, TIFF_DATA):
    ifd_dict = {}
    BYTE_ORDER = TIFF_DATA[0 : 1]
    ENDIAN_MARK = "<" if BYTE_ORDER == b"I" else ">"
    _tag_count = struct.unpack(ENDIAN_MARK + "H", TIFF_DATA[pointer : pointer + 2])[0]
    _start_offset = pointer + 2

    for i in range(_tag_count):
        pointer = _start_offset + 12 * i
        tag = struct.unpack(ENDIAN_MARK + "H", TIFF_DATA[pointer : pointer + 2])[0]
        value_format = struct.unpack(ENDIAN_MARK + "H", TIFF_DATA[pointer + 2 : pointer + 4])[0]
        value_num = struct.unpack(ENDIAN_MARK + "L", TIFF_DATA[pointer + 4 : pointer + 8])[0]
        value_size = FORMAT_TYPES[value_format][0] * value_num
        value_offset = pointer + 8
        value_offset = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[value_offset : value_offset + 4])[0] if value_size > 4 else value_offset

        if value_format == 2:
            value = TIFF_DATA[value_offset : value_offset + value_size].decode()
        elif value_format in (5, 10):
            value = ""
            for i in range(int(value_size / 8)):
                v_offset = value_offset + (i * 8)
                value1 = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[v_offset : v_offset + 4])[0]
                value2 = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[v_offset + 4 : v_offset + 8])[0]
                value += ", {}/{}".format(value1, value2) if value != "" else "{}/{}".format(value1, value2)
        elif value_format == 7:
            if tag in (0x9000, 0xA000, 0x9286, 0x001B):
                value = TIFF_DATA[value_offset : value_offset + value_size].decode()
            elif tag == 0x9101:
                buffer = TIFF_DATA[value_offset : value_offset + value_size]
                value = "YCbCr" if buffer == b"\x01\x02\x03\x00" else "RGB"
            elif tag == 0xA301:
                value = 1
                # value = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[value_offset : value_offset + value_size])[0]
            else:
                print("Unknown tag {:04x}".format(tag))
        elif value_format == 1 and value_size == 4:
            value = TIFF_DATA[value_offset : value_offset + value_size]
        else:
            value = struct.unpack(ENDIAN_MARK + FORMAT_TYPES[value_format][1], TIFF_DATA[value_offset : value_offset + value_size])[0]

        ifd_dict[tag] = value
        value = TAGS[tag][2].get(value) if TAGS[tag][2].get(value) is not None else value
        print("태그:{:04x} {} {} {} {} {}".format(tag, TAGS[tag][1], value_format, value_num, value_size, value))
    
    next_ifd_offset = struct.unpack(ENDIAN_MARK + "I", TIFF_DATA[pointer + 12 : pointer + 12 + 4])[0]
    return ifd_dict, next_ifd_offset


filename = "note9.jpg"
f = open(filename, "rb")
data = f.read(2)
if data[0:2] != b"\xFF\xD8":
    print("Not JPEG file!!")
    exit(0)

while True:
    H = f.read(2)
    if H == b"\xFF\xE1":
        data = f.read(16)
        length = struct.unpack(">H", data[0:2])[0]
        if data[2:6] != b"Exif":
            print("Not EXIF!")
            exit(0)
        segment_data = f.read(length - 2)
        exif = H + data + segment_data
        break
    elif H == b"":
        break
f.close()

if not exif:
    print("No Exif data")
    exit(0)

HEAD = exif[:10]
TIFF_DATA = exif[10:]
DATA_IFD0, ifd1_offset = get_ifd_data(8, TIFF_DATA)
exif_offset = DATA_IFD0[0x8769]
DATA_EXIF, _ = get_ifd_data(exif_offset, TIFF_DATA)
gps_ifd_offset = DATA_IFD0[0x8825]
DATA_GPS, _ = get_ifd_data(gps_ifd_offset, TIFF_DATA)
DATA_IFD1, next_offset = get_ifd_data(ifd1_offset, TIFF_DATA)

# 썸네일 출력
jpeg_offset = DATA_IFD1[0x0201]
jpeg_count = DATA_IFD1[0x0202]
thumbnail_buffer = TIFF_DATA[jpeg_offset : jpeg_offset + jpeg_count]
print(thumbnail_buffer[:10])
image = Image.open(io.BytesIO(thumbnail_buffer))
image.show()

태그:0112 방향 3 1 2 Horizontal
태그:0213 이미지 형식이 YCbCr 이고 서브샘플링을 사용하는 경우 3 1 2 픽셀어레이 중심
태그:011a X축 디스플레이/인쇄 해상도 5 1 8 72/1
태그:011b Y축 디스플레이/인쇄 해상도 5 1 8 72/1
태그:0128 위의 디스플레이/인쇄 해상도의 단위 3 1 2 인치
태그:010f 카메라 제조사 2 8 8 samsung 
태그:0110 카메라 모델 2 9 9 SM-N960N 
태그:0131 펌웨어 버전 번호 2 14 14 N960NKSU3CSG3 
태그:0132 YYYY:MM:DD HH:MM:SS 2 20 20 2019:08:16 20:55:05 
태그:8769 Exif Sub IFD의 오프셋 4 1 4 213
태그:8825 GPS 정보 IFD 오프셋 4 1 4 833
태그:829a 노출 시간 5 1 8 1/4
태그:829d 촬영시 조리개 값 5 1 8 150/100
태그:8822 촬영시 카메라의 노출 모드 3 1 2 프로그램
태그:8827 ISO 감도 3 1 2 1250
태그:9000 4바이트 문자의 Exif 버전 7 4 4 0220
태그:9003 이미지 원본 촬영 시간 2 20 20 2019:08:16 20:55:05 
태그:9004 이미지가 디지털로 기록된 시간. 일반적으로 DateTimeOriginal 과 동일 2 20 20 2019:08:16 20:55:05 
태그:9201 셔터속도 10 1 8 429496729932
태그:9202 이미지 촬영시 실제 렌즈 조리개값 5 1 8 116/100
태그:9203 촬영한 피사체의 밝기 10 1 8 433791696314
태그:9204 촬영시 노출값 10 1 8 42949672960
태그:9205 촬영시 사용된 렌즈의 최대 조리개 값 5 1 8 116/100
태그:9207 노출 측광방식 3 1 2 중앙평균측광
태그:9209 플래시 사용여부 3 1 2 플래시사용안함
태그:a000 플래시픽스 버전 7 4 4 0100
태그:9101 Componen