# 시퀀스 해킹, 해시, 슬라이드
* 시퀀스형 기능
    * 기본 시퀀스 프로토콜: ```__len__()```과 ```__getitem__()``` 메서드
    * 여러 항목을 가진 객체를 안전하게 표현
    * 슬라이싱을 지원해서 새로운 벡터 객체 생성
    * 포함된 요소 값을 모두 고려한 집합 해싱
    * 커스터마이즈된 포맷 언어 확장
* 이외의 기능
    * ```__getattr__()```메서드로 동적 속성 접근 구현
    * 프로토콜을 비공식 인터페이스로 이용
        * 프로토콜은 덕 타이핑 관련
- - -
* 덕 타이핑 (Duck Typing)
    * 동적 타이핑의 한 종류
    * 객체의 변수 및 메소드의 집합이 객체의 타입을 결정
    > *"만약 어떤 새가 오리처럼 걷고, 헤엄치고, 꽥꽥거리는 소리를 낸다면 나는 그 새를 오리라고 부를 것이다."*
    * [출처](https://ko.wikipedia.org/wiki/%EB%8D%95_%ED%83%80%EC%9D%B4%ED%95%91)
* 정적 타이핑 v.s. 동적 타이핑
    * 자료형 체계
        * 계산될 값을 분류하여 특정한 종류의 프로그램 오류가 일어나지 않음을 증명하는 계산 가능한 방법
    * 자료형 검사
        * 프로그램이 자료형의 제약 조건을 지키는지 검증
        * 분류
            * 컴파일 타임 vs 런타임
                * 컴파일 타임
                    * 컴파일러에 의해 수행되는 동작
                    * 구문 분석, 다양한 종류의 의미 분석(타입 검사 등), 코드 생성
                * 런타임
                    *  컴퓨터 과학에서 컴퓨터 프로그램이 실행되고 있는 동안의 동작
                * [컴파일 타임 관련 출처](https://ko.wikipedia.org/wiki/%EC%BB%B4%ED%8C%8C%EC%9D%BC_%ED%83%80%EC%9E%84)
                * [런타임 관련 출처](https://ko.wikipedia.org/wiki/%EB%9F%B0%ED%83%80%EC%9E%84)
            * 정적 타이핑
                * 컴파일 타임 동안 자료형 검사 수행
                * e.g. C, C++, Java, Scala
                ```
                // Java
                String hello = "Hello World!";
                
                // Scala
                val hello = "Hello World!"
                ```
            * 동적 타이핑
                * 런타임 동안 자료형 검사 수행
                * e.g. Python, Javascript, PHP
                ```
                // Javascript
                var hello = 'Hello World!'
                
                # Python
                hello = 'Hello World!'
                ```
    * [출처](https://ko.wikipedia.org/wiki/%EC%9E%90%EB%A3%8C%ED%98%95_%EC%B2%B4%EA%B3%84)
- - -
## 10.1 Vector: 사용자 정의 시퀀스형
* 상속이 아닌 구성을 이용해 벡터 구현
    * 요소들을 실수형 배열에 저장
    * 불변 시퀀스처럼 작동하게 필요한 메서드 구현
- - - 
* 상속
    * 사전에(Built-in) 정의되어 있는 클래스의 속성이나 메서드를 새로 정의하고자 하는 클래스에서 그대로 내려 받아 속성이나 메서드를 재사용하는 객체지향의 대표적 기술
    * 사전에 정의된 클래스(부모클래스라 함)에는 없는 새로운 속성이나 메소드를 추가(확장)할 수 있음
    * 필요에 따라 속성이나 메서드를 재정의(수정) 할 수 있음
    * 출처: 김기정 강사님 강의자료 

In [8]:
class  Sqlite:
    
    sql = 'SELECT * FROM {table} WHERE {column} = ?'
    
    def select(self, params):
        exec_sql = self.sql.format(**params)
        print(exec_sql)
        
class SqliteEx(Sqlite):
    
    sql = 'SELECT * FROM {table} WHERE {conditions}'
    
    def override_select(self, params):
        exec_sql = self.sql.format(**params)
        print(exec_sql)

In [9]:
s = SqliteEx()
s.override_select({'table': 'presentations', 'conditions': "name = 'luna'"})

SELECT * FROM presentations WHERE name = 'luna'


## 10.2. Vector 버전 \#1: Vector2d 호환
* ```repr()``` 디버깅에 사용되어 길어질 경우 생략 기호로 축약할 것을 권장
    * 제한된 길이로 표현하기 위해서는 ```reprlib``` 모듈 사용
* 생성자가 호환되지 않는 경우 상속 받는 것은 좋지 않음


## 10.3 프로토콜과 덕 타이핑
* 프로토콜 (in oop)
    * interfaec or trait
    * 인터페이스
        * 인스턴스 생성이 아닌 표준 규약을 목적으로 함
        * 상수와 추상 메서드로 이루어짐
            * 추상 메서드는 선언부만 있는 메서드
            * 상속 받는 클래스는 추상 메서드를 구현해야 함
        * 다중 상속이 안 되는 프로그래밍 언어에서 유용 (e.g. Java)
            * 여러 인터페이스 구현은 가능하기 때문
        * c.f. 추상 클래스
            * 규약의 역할을 한다는 점에서는 인터페이스와 비슷
            * 추상 메서드를 포함
        * 출처: 김기정 강사님 강의자료
        * [출처](https://en.wikipedia.org/wiki/Interface_(computing)#In_object-oriented_languages)
    * [출처](https://en.wikipedia.org/wiki/Protocol_(object-oriented_programming))
* 파이썬 시퀀스 프로토콜
    * ```__len__()```과 ```__getitem__()``` 동반
    * 필요한 메서드를 제공함으로써 해당 자료형처럼 동작해 그 자료형으로 볼 수 있음
        * 덕 타이핑
        * e.g. 시퀀스처럼 동작해 시퀀스
                
## 10.4 Vector 버전 \#2: 슬라이스 가능한 시퀀스

In [16]:
class MySeq:
    def __getitem__(self, index):
        return index

In [17]:
s = MySeq()
s[1]

1

In [18]:
s[1:4:2]

slice(1, 4, 2)

In [19]:
s[1:4:2, 7:9]

(slice(1, 4, 2), slice(7, 9, None))

In [20]:
dir(slice)

['__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__le__',
 '__lt__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'indices',
 'start',
 'step',
 'stop']

In [21]:
help(slice.indices)

Help on method_descriptor:

indices(...)
    S.indices(len) -> (start, stop, stride)
    
    Assuming a sequence of length len, calculate the start and stop
    indices, and the stride length of the extended slice described by
    S. Out of bounds indices are clipped in a manner consistent with the
    handling of normal slices.



> 길이가 len인 시퀀스 S가 나타내는 확장된 슬라이스의 start와 stop 인덱스 및 stride 길이를 계산한다. 경계를 벗어난 인덱스는 일반적인 슬라이스를 처리하는 방법과 동일하게 잘라낸다.


* ```slice.indices```
    * start, stop, stride로 구성된 튜플 생성
    * start, stop, stride는 0 또는 양수를 가짐
    * ```slice```인수 받을 때 메서드 구현해야 할 수 있음
* ```isinstance()``` 
    * 이를 사용하면 객체지향설계가 잘못되었다는 것을 나타낼 수 있음
    * 단 ```__getitem__()```에서 슬라이스 처리하는 경우에는 정당화 가능
    * ```ABC``` 사용하는 경우 확장성 있음 (추후 상술) 
    
## 10.5 Vector 버전 \#3: 동적 속성 접근
* ```__getattr__()```
    * ```obj.x```표현식 주어질 경우 ```obj```의 ```x``` 검색 후 ```obj.__class__```에서 검색
    * 이후에는 상속 그래프 따라 계속 올라감
    * 그래도 못 찾을 경우 ```__getattr__()``` 호출
    * 위와 같은 동작 때문에 원하는 결과와 실제 결과가 다를 수 있음
        * ```__setattr__()```구현이 필요
        * 벡터 요소 변경을 허용하고 싶을 경우 ```__setitem__()```구현 필요
* ```super()```
    * 슈퍼 클래스의 메서드에 동적으로 접근할 수 있는 방법 제공
    * 참고로 파이썬은 다중 상속 지원 (Java는 다중 상속 지원 안 함)
    
## 10.6 Vector 버전 \#4: 해싱 및 더 빠른 ==
* 연속적으로 ^(XOR) 연산자를 적용해 요소의 해시 계산하기 위해서 ```reduce()```사용
    * XOR 연산: 두 명제 중 하나만 참일 때 참
    * ```reduce(<함수>, <반복형>, <초깃값>)```
        * 초기값은 시퀀스가 비어 있을 때 사용
        * ```functools```에 위치
        * ```operator``` 모듈 사용 시 람다 사용하지 않아도 됨
    * ```Vector.__hash__()```는 맵 리듀스의 예
        * 맵 리듀스   
        ![map reduce](../images/chap10_map_reduce.png)   
* ```map()```
    * python2에서는 결과 리스트를 새로 생성해 효율 떨어짐
    * python3에서는 lazy한 (필요할 때) 연산을 하는 제너레이터 생성
* ```all()```
    * 리듀스 함수의 하나
    * 요소 간 비교가 모두 ```True```일 때만 ```True``` 반환
* ```zip()```
    * 반복형에서 나온 항목들을 튜플로 묶어 두 개 이상의 반복형을 병렬로 반복하기 쉽게 해줌
    * 가장 짧은 피연산자에서 멈춰 길이 검사가 필요함
* ```enumerate()```
    * 인덱스 변수 조작할 필요 없음
    
## 10.7 Vector 버전 \#5: 포매팅
* 포맷 명시 간이 언어 확장 시 내장 자료형에서 지원하는 포맷 코드 다른 용도로 사용하는 것 **지양**


In [24]:
import math
import reprlib
import numbers
import operator
import functools
from array import array


class Vector:
    typecode = 'd'
    shortcut_names = 'xyzt'
    
    def __init__(slef, components):
        self._components = array(self, typecode, components)
        
    def __iter__(self):
        return iter(slef._components)
    
    def __repr__(self):
        components = reprlib.repr(self._components)
        components = components[components.find('['):-1]
        return 'Vector({})'.format(components)
    
    def __str__(self):
        return str(tuple(self))
    
    def __bytes__(self):
        return (bytes([ord(self.typecode)]) + bytes(self._components))
    
    def __eq__(self, other):
        return len(self) == len(other) and all(a == b for a, b in zip(self, other))
    
    def __hash__(self):
        hashes = map(hash, self._components)
        return functools.reduce(operator.xor, hashes)
    
    def __abs__(self):
        return math.sqrt(sum(x * x for x in self))
    
    def __bool__(self):
        return bool(abs(self))
    
    def __len__(self):
        return len(self._components)
    
    def __getitem__(self, index):
        cls = type(self)
        if isinstance(index, slice):
            return cls(self._components[index])
        elif isinstance(index, numbers.Integral):
            return self._components[index]
        else:
            msg = '{cls.__name__} indices must be integers'
            raise TypeError(msg.format(cls=cls))
    
    def __getattr__(self, name):
        cls = type(self)
        if len(name) == 1:
            pos = cls.shortcut_names.find(name)
            if 0 <= pos < len(self._components):
                return self._components[pos]
        msg = '{.__name__!r} object has no attribute {!r}'
        raise AttributeError(msg.format(cls, name))
        
    def __setattr__(self, name, value):
        cls = type(self)
        if len(name) == 1:
            if name in cls.shortcut_names:
                error = 'readonly attributes {attr_name!r}'
            elif name.islower():
                error = "can't set attribute 'a' to 'z' in {cls_name!r}"
            else:
                error = ''
            if error:
                msg = error.format(cls_name=cls.__name__, attr_name = name)
                raise AttributeError(msg)
        super().__setattr__(name, value)
        
    def angle(self, n):
        r = math.sqrt(sum(x * x for x in self[n:]))
        a = math.atan2(r, self[n - 1])
        if (n == len(self) - 1) and (self[-1] < 0):
            return math.pi * 2 - a
        else:
            return a
    
    def angles(slef):
        return (self.angle(n) for n in range(1, len(slef)))
    
    def __format__(slef, fmt_spec=''):
        if fmt_spec.endswith('h'):
            fmt_spec = fmt_spec[:-1]
            coords = itertools.chain([abs(self)], self.angles())
            outer_fmt = '<{}>'
        else:
            coords = self
            outer_fmt = '({})'
        components = (format(c, fmt_spec) for c in coords)
        return outer_fmt.format(', '.join(coponents))
    
    @classmethod
    def frombytes(cls, octets):
        typecode = chr(octets[0])
        memv = memoryview(octets[1:], cast(typecode))
        return cls(memv)

## 읽을 거리
* 다른 언어에서 ```reduce()```는 ```fold(), accumulate(), aggregate(), compress(), inject()``` 등의 함수로 제공
* 프로토콜
    * 비공식 인터페이스
        * 공식 인터페이스는 컴파일러가 강제
        * 일부만 구현 가능
    * 동적 자료형 사용 언어는 프로토콜이 발전
        * 런타임 시 자료형 검사
* 덕 타이핑의 기원은 [사이트](http://bit.ly/1QOuTPx) 참고
* ```__format__()``` 추가
    * 클래스 전체를 보고자 하는 경우 사용되어 전체 출력
    * 생략이 필요할 경우 포맷 명시 간이 언어 더 확장하여 사용
* 2차원 배열의 요소인 배열의 특정 인덱스의 합을 구하는 가장 좋은 방법

In [28]:
import operator
import functools


my_list = [[1, 2, 3], [40, 50, 60], [9, 8, 7]]

In [29]:
# python2.3 이전
functools.reduce(operator.add, [sub[1] for sub in my_list], 0)

60

In [30]:
# python2.3 이후
sum(sub[1] for sub in my_list)

60