# [How To Flatten a Dictionary With Nested Lists and Dictionaries in Python](https://medium.com/better-programming/how-to-flatten-a-dictionary-with-nested-lists-and-dictionaries-in-python-524fd236365)

멀티 레이어 데이터 구조를 테이블 형식으로 만드는 함수 만들기. 

튜플 등 다른 데이터 유형은 JSON 데이터를 조작할 때 주고 사용되므로 포함되지 않음.  
이 함수는 사용자 정의의 구분 기호를 사용하고, 순서를 유지한다.

제대로 동작하기 위해 재귀가 필요.  

순서를 유지하기 위해 `collections`를 사용하여 OrderedDict를 만들어야 한다.

```python
def flatten(d, sep="_"):
    '''
    custom 기호가 없을 경우 _를 기본값으로 한다.
    '''
    import collections
    obj = collections.OrderedDict()
    
    def recurse(t, parent_key=""):
        '''
        parent_key 변수는 현재 키를 전달하는데 사용되어
        이전 키와 새키를 연결한다.
        '''
        pass
    
    recure(d)
    return obj
```

JSON와 호환하기 위한 세 가지 타입의 데이터

- list/array
- dict/obj
- 기본 값

위 세 가지 타입으로 `recurse()`를 구현한다면.

```python
def recurse(t, parent_key=""):
    
    if isinstance(t, list): # list를 반복하고 recurse() call
        pass
    elif isinstance(t, dict): # dict를 반복하고 recurse() call
        pass
    else:
        obj[parent_key] = t  # parent_key를 사용하고 obj에 저장
```

In [2]:
def flatten(d, sep="_"):
    import collections
    
    obj = collections.OrderedDict()
    
    def recurse(t, parent_key=""):
        if isinstance(t, list):
            for i in range(len(t)):
                recurse(t[i], parent_key + sep + str(i) if parent_key else str(i))
        elif isinstance(t, dict):
            for k, v in t.items():
                recurse(v, parent_key + sep + k if parent_key else k)
        else:
            obj[parent_key] = t
            
    recurse(d)
    
    return obj

In [3]:
data = {
    "id": 1,
    "first_name": "Jonathan",
    "last_name": "Hsu",
    "employment_history": [
        {
            "company": "Black Belt Academy",
            "title": "Instructor",
            "something": {
                "hello": [1,2,3,{
                    "something":"goes"
                }]
            }
        },
        {
            "company": "Zerion Software",
            "title": "Solutions Engineer"
        }
    ],
    "education": {
        "bachelors": "Information Technology",
        "masters": "Applied Information Technology",
        "phd": "Higher Education"
    }
}

In [4]:
flatten(data)

OrderedDict([('id', 1),
             ('first_name', 'Jonathan'),
             ('last_name', 'Hsu'),
             ('employment_history_0_company', 'Black Belt Academy'),
             ('employment_history_0_title', 'Instructor'),
             ('employment_history_0_something_hello_0', 1),
             ('employment_history_0_something_hello_1', 2),
             ('employment_history_0_something_hello_2', 3),
             ('employment_history_0_something_hello_3_something', 'goes'),
             ('employment_history_1_company', 'Zerion Software'),
             ('employment_history_1_title', 'Solutions Engineer'),
             ('education_bachelors', 'Information Technology'),
             ('education_masters', 'Applied Information Technology'),
             ('education_phd', 'Higher Education')])

In [5]:
flatten(data, '=')

OrderedDict([('id', 1),
             ('first_name', 'Jonathan'),
             ('last_name', 'Hsu'),
             ('employment_history=0=company', 'Black Belt Academy'),
             ('employment_history=0=title', 'Instructor'),
             ('employment_history=0=something=hello=0', 1),
             ('employment_history=0=something=hello=1', 2),
             ('employment_history=0=something=hello=2', 3),
             ('employment_history=0=something=hello=3=something', 'goes'),
             ('employment_history=1=company', 'Zerion Software'),
             ('employment_history=1=title', 'Solutions Engineer'),
             ('education=bachelors', 'Information Technology'),
             ('education=masters', 'Applied Information Technology'),
             ('education=phd', 'Higher Education')])

중첩된 데이터는 원래 키로 식별되고, 키는 사용자 지정 구분 기호로 연결된다. 중첩 목록의 경우 인덱스도 포함한다.

> 이걸 어디에 써먹을지 모르겠다. 나중에 필요하겠지 뭐.