# 리스트 표현식
* 리스트 안에 for 반복문과 if else 조건문을 한 번에 적어서 리스트를 만드는 방법
* 여러 줄의 코드를 1줄로 줄일 수 있다.
* for문과 if else문을 사용해서 처리할 때 보다 속도가 빠르다.
* [실행할 명령 for 변수 in 시쿼스자료]

In [9]:
# 1-10까지 수 중에서 홀수와 짝수를 구분해서 리스트에 담기
result = []
for i in range(1,11):
    if i % 2 == 0:
        result.append(f"{i}는 짝수")
    else:
        result.append(f"{i}는 홀수")  
result

['1는 홀수',
 '2는 짝수',
 '3는 홀수',
 '4는 짝수',
 '5는 홀수',
 '6는 짝수',
 '7는 홀수',
 '8는 짝수',
 '9는 홀수',
 '10는 짝수']

In [11]:
# for 반복문으로 1-10까지 수가 담긴 리스트 만들기
list_10 = []
for i in range(1,11):
    list_10.append(i)
list_10

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [14]:
# list 표현식으로 1-10까지 수가 담긴 리스트 만들기
list_10 = [i for i in range(1,11)]
list_10

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [15]:
# list 표현식으로 1-10까지 수 중에서 홀수와 짝수를 구분해서 리스트에 담기
result = [f"{i}는 짝수" if i % 2 == 0 else f"{i}는 홀수" for i in range(1,11)] 
result

['1는 홀수',
 '2는 짝수',
 '3는 홀수',
 '4는 짝수',
 '5는 홀수',
 '6는 짝수',
 '7는 홀수',
 '8는 짝수',
 '9는 홀수',
 '10는 짝수']

# 리스트 표현식과 일반 반복문의 속도 차이

In [16]:
%%time
a = []
for i in range(1, 200000000):
    a.append(i + 5)
print(a[:10])

[6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
CPU times: total: 1min 16s
Wall time: 1min 17s


In [17]:
%%time
b = [i + 5 for i in range(1, 200000000)]
print(b[:10])

[6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
CPU times: total: 41.2 s
Wall time: 42.6 s


In [18]:
!pip install numpy

Collecting numpy
  Downloading numpy-2.0.2-cp39-cp39-win_amd64.whl.metadata (59 kB)
Downloading numpy-2.0.2-cp39-cp39-win_amd64.whl (15.9 MB)
   ---------------------------------------- 0.0/15.9 MB ? eta -:--:--
   --- ------------------------------------ 1.3/15.9 MB 7.4 MB/s eta 0:00:02
   ------- -------------------------------- 3.1/15.9 MB 8.0 MB/s eta 0:00:02
   -------- ------------------------------- 3.4/15.9 MB 6.7 MB/s eta 0:00:02
   ------------ --------------------------- 5.0/15.9 MB 5.6 MB/s eta 0:00:02
   -------------------- ------------------- 8.1/15.9 MB 8.1 MB/s eta 0:00:01
   ------------------------------ --------- 12.3/15.9 MB 9.5 MB/s eta 0:00:01
   ---------------------------------------- 15.9/15.9 MB 11.0 MB/s  0:00:01
Installing collected packages: numpy
Successfully installed numpy-2.0.2


In [19]:
import numpy as np

In [20]:
%%time
c = np.arange(1, 200000000)
c = c + 5
print(c[:10])

[ 6  7  8  9 10 11 12 13 14 15]
CPU times: total: 1.33 s
Wall time: 1.32 s


# 다중 반복문을 사용한 리스트 표현식
* [실행할 코드 반복문1 반복문2]: 반복문이 2개 일 때
* [실행할 코드 반복문1 반복문2 반복문3]: 반복문이 3개 일 때
* 반복문이 3개 이상 중첩되거나 if else문의 조건이 복잡하게 붙을 경우 일반 문법을 사용
  * 코드 해석이 너무 어려워짐

* 2중 반복문으로 구구단 출력하기

In [24]:
gugu = []
for i in range(1,10):
    for j in range(1,10):
        gugu.append(f"{i}X{j}={i+j}")

In [74]:
gugu = [f"{i}X{j}={i*j}" for i in range(2,10) for j in range(1,10)]
gugu

['2X1=2',
 '2X2=4',
 '2X3=6',
 '2X4=8',
 '2X5=10',
 '2X6=12',
 '2X7=14',
 '2X8=16',
 '2X9=18',
 '3X1=3',
 '3X2=6',
 '3X3=9',
 '3X4=12',
 '3X5=15',
 '3X6=18',
 '3X7=21',
 '3X8=24',
 '3X9=27',
 '4X1=4',
 '4X2=8',
 '4X3=12',
 '4X4=16',
 '4X5=20',
 '4X6=24',
 '4X7=28',
 '4X8=32',
 '4X9=36',
 '5X1=5',
 '5X2=10',
 '5X3=15',
 '5X4=20',
 '5X5=25',
 '5X6=30',
 '5X7=35',
 '5X8=40',
 '5X9=45',
 '6X1=6',
 '6X2=12',
 '6X3=18',
 '6X4=24',
 '6X5=30',
 '6X6=36',
 '6X7=42',
 '6X8=48',
 '6X9=54',
 '7X1=7',
 '7X2=14',
 '7X3=21',
 '7X4=28',
 '7X5=35',
 '7X6=42',
 '7X7=49',
 '7X8=56',
 '7X9=63',
 '8X1=8',
 '8X2=16',
 '8X3=24',
 '8X4=32',
 '8X5=40',
 '8X6=48',
 '8X7=56',
 '8X8=64',
 '8X9=72',
 '9X1=9',
 '9X2=18',
 '9X3=27',
 '9X4=36',
 '9X5=45',
 '9X6=54',
 '9X7=63',
 '9X8=72',
 '9X9=81']

# 리스트표현식으로 시계 만들기

In [7]:
clock = [f"{hour:02d}:{min:02d}:{sec:02d}"
         for hour in range(24) for min in range(60) for sec in range(60)]
clock

['00:00:00',
 '00:00:01',
 '00:00:02',
 '00:00:03',
 '00:00:04',
 '00:00:05',
 '00:00:06',
 '00:00:07',
 '00:00:08',
 '00:00:09',
 '00:00:10',
 '00:00:11',
 '00:00:12',
 '00:00:13',
 '00:00:14',
 '00:00:15',
 '00:00:16',
 '00:00:17',
 '00:00:18',
 '00:00:19',
 '00:00:20',
 '00:00:21',
 '00:00:22',
 '00:00:23',
 '00:00:24',
 '00:00:25',
 '00:00:26',
 '00:00:27',
 '00:00:28',
 '00:00:29',
 '00:00:30',
 '00:00:31',
 '00:00:32',
 '00:00:33',
 '00:00:34',
 '00:00:35',
 '00:00:36',
 '00:00:37',
 '00:00:38',
 '00:00:39',
 '00:00:40',
 '00:00:41',
 '00:00:42',
 '00:00:43',
 '00:00:44',
 '00:00:45',
 '00:00:46',
 '00:00:47',
 '00:00:48',
 '00:00:49',
 '00:00:50',
 '00:00:51',
 '00:00:52',
 '00:00:53',
 '00:00:54',
 '00:00:55',
 '00:00:56',
 '00:00:57',
 '00:00:58',
 '00:00:59',
 '00:01:00',
 '00:01:01',
 '00:01:02',
 '00:01:03',
 '00:01:04',
 '00:01:05',
 '00:01:06',
 '00:01:07',
 '00:01:08',
 '00:01:09',
 '00:01:10',
 '00:01:11',
 '00:01:12',
 '00:01:13',
 '00:01:14',
 '00:01:15',
 '00:01:16',

# 반복문 + if 문의 조건표현식
* 필터링: for문 뒤에 if 조건(if문이 뒤에 붙음)
* 값 변환: for문 앞에 if else 조건(if문이 for문 앞에 붙음)

## 1) 조건을 이용해 필터링하기(if만 쓸 때)
* if가 for문 뒤로 붙음

* 1-10까지 숫자중에서 짝수만 모으기

In [36]:
# 일반 for if 문
evens = []
for i in range(1,11):
    if i % 2 == 0:
        evens.append(i)
evens

[2, 4, 6, 8, 10]

In [39]:
# 리스트 표현식 if만 있을때
evens = [i for i in range(1,11) if i % 2 == 0]
evens

[2, 4, 6, 8, 10]

## 2) 조건에 따라 값 바꾸기(if ~ else)
* for문 앞에 옴

In [41]:
# 일반 for if else문
lables = []
for i in range(1,11):
    if i % 2 == 0:
        lables.append("짝수")
    else:
        lables.append("홀수")
lables

['홀수', '짝수', '홀수', '짝수', '홀수', '짝수', '홀수', '짝수', '홀수', '짝수']

In [43]:
# 리스트표현식 if else가 포함된 코드만들기
lables = ["짝수" if i % 2 == 0 else "홀수" for i in range(1,11)]
lables

['홀수', '짝수', '홀수', '짝수', '홀수', '짝수', '홀수', '짝수', '홀수', '짝수']

# 제네레이터 표현식
* 리스트 표현식과 문법이 거의 같지만 대괄호 대신 소괄호()를 사용
* 값을 필요할 때마다 하나식 만들언내는 표현식
* 메모리 효율적, 큰 자료도 처리 가능
* 한 번만 소비 가능(다 쓰면 재사용 불가)
* 인덱싱, 슬라이싱 불가 -> 오직 순차적 접근만 가능
* 크거나 한번만 쓸 데이터/스티리밍 처리

In [33]:
evens_g = (x for x in range(1,11) if x % 2 == 0)

In [34]:
print(evens_g)
evens_g

<generator object <genexpr> at 0x000001FFAFF83040>


<generator object <genexpr> at 0x000001FFAFF83040>

In [35]:
for i in evens_g:
    print(i,end=" ")

2 4 6 8 10 

In [31]:
for i in evens_g:
    print(i,end=" ")

In [37]:
evens_g = (x for x in range(1,11) if x % 2 == 0)

In [38]:
next(evens_g)

2

# 리스트와 제네레이터 크기 비교

In [52]:
!pip install pympler

Collecting pympler
  Downloading Pympler-1.1-py3-none-any.whl.metadata (3.6 kB)
Downloading Pympler-1.1-py3-none-any.whl (165 kB)
Installing collected packages: pympler
Successfully installed pympler-1.1


In [55]:
import sys
from pympler import asizeof
import psutil, os

#메모리 사용량 확인 함수
def show_memory(msg):
    process = psutil.Process(os.getpid())
    print(f"{msg}: {process.memory_info().rss / 1024**2:.2f} MB")

#비교 대상 생성
list_var = [x for x in range(1, 1_000_000)]   # 리스트 내포
gen_var  = (x for x in range(1, 1_000_000))   # 제너레이터 표현식

print("==== sys.getsizeof() 결과 ====")
print("리스트:", sys.getsizeof(list_var))
print("제너레이터:", sys.getsizeof(gen_var))

print("\n==== asizeof.asizeof() 결과 (내부 요소 포함) ====")
print("리스트:", asizeof.asizeof(list_var))
print("제너레이터:", asizeof.asizeof(gen_var))

print("\n==== 프로세스 전체 메모리 사용량 비교 ====")
show_memory("리스트 생성 후")
show_memory("제너레이터 생성 후")

==== sys.getsizeof() 결과 ====
리스트: 8448728
제너레이터: 112

==== asizeof.asizeof() 결과 (내부 요소 포함) ====
리스트: 40448696
제너레이터: 432

==== 프로세스 전체 메모리 사용량 비교 ====
리스트 생성 후: 2318.30 MB
제너레이터 생성 후: 2318.32 MB


# 파일 읽기 쓰기 open(), with open()

## 1) 파일에 문자열을 쓰거나 읽을 때 오픈() 함수 사용
파일저장 변수명 = open("파일이름", 모드(w:쓰기, r: 읽기, a:추가)) <br>
변수명.write("저장할 내용)<br>
변수명.close()<br>
**close()**를 안하면 파일이 계속 열려있음 => 반드시 닫아주어야 함

In [57]:
file = open("./data/test.txt", "w")
file.write("파일 만들기 연습 1")
file.close()

변수1 = open("파일이름", 모드('r') <br>
변수2 = 변수1.read() <br>
변수1.close()

In [39]:
file1 = open("./data/test.txt", "r")
file1_data = file1.read()
file1.close()
print(file1_data)

파일 만들기 연습 1


## with open
* with open은 close()를 하지 않아도 자동으로 close() 처리를 해줌

In [61]:
with open("./data/test2.txt", 'w') as file3:
    file3.write("with open으로 만든 파일입니다.")

In [63]:
with open("./data/test2.txt", 'r') as file4:
    file4_data = file4.read()
print(file4_data)

with open으로 만든 파일입니다.


# encoding에 따른 읽기 오류
* 운영체제나(windows, linux, macos), 한글/영어 윈도우냐에 따라서 인코딩 포멧이 달라짐
* 인코딩에 따른 오류가 발생
* web 표준은 utf-8이므로 인코딩은 utf-8로 하는 것이 좋다.
* windows의 경우 인코딩이 cp949이므로 주의

In [65]:
with open("./data/test3_utf-8.txt", 'w', encoding="utf-8") as file5:
    file5.write("이것은 with open으로 만든 utf-8 인코딩 파일입니다.")

In [40]:
with open("./data/test3_utf-8.txt", 'r') as file6:
    file6_data=file6.read()
print(file6_data)

UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 0: illegal multibyte sequence

In [41]:
with open("./data/test3_utf-8.txt", 'r', encoding="utf-8") as file6:
    file6_data=file6.read()
print(file6_data)

이것은 with open으로 만든 utf-8 인코딩 파일입니다.


# json 파일 읽어와서 내용 정리하기
* 공공데이터 포털 - 서울특별시 관광지 입장 정보

In [43]:
with open("./data/서울특별시_관광지입장정보_2011_2016.json", 'r', encoding="utf-8") as file7:
    trip_info=file7.read()
    print(trip_info)

[
    {
        "ForNum": 44722,
        "NatNum": 75991,
        "addrCd": 1111,
        "gungu": "종로구",
        "resNm": "창덕궁",
        "rnum": 1,
        "sido": "서울특별시",
        "yyyymm": "201112"
    },
    {
        "ForNum": 0,
        "NatNum": 11017,
        "addrCd": 1111,
        "gungu": "종로구",
        "resNm": "운현궁",
        "rnum": 2,
        "sido": "서울특별시",
        "yyyymm": "201112"
    },
    {
        "ForNum": 132399,
        "NatNum": 237330,
        "addrCd": 1111,
        "gungu": "종로구",
        "resNm": "경복궁",
        "rnum": 3,
        "sido": "서울특별시",
        "yyyymm": "201112"
    },
    {
        "ForNum": 3133,
        "NatNum": 21267,
        "addrCd": 1111,
        "gungu": "종로구",
        "resNm": "창경궁",
        "rnum": 4,
        "sido": "서울특별시",
        "yyyymm": "201112"
    },
    {
        "ForNum": 18226,
        "NatNum": 24223,
        "addrCd": 1111,
        "gungu": "종로구",
        "resNm": "종묘",
        "rnum": 5,
        "sido": "서울특별시",
      

# open/with open으로 연 데이터는 모두 str

In [44]:
print(type(trip_info))

<class 'str'>


# 문자열을 json/dict 형식으로 변환하려면 json 모듈 사용
import json <br>
data = json.loads(변수명)

In [5]:
import json

In [6]:
data = json.loads(trip_info)

NameError: name 'trip_info' is not defined

In [49]:
print(type(data))

<class 'list'>


In [50]:
data[0]

{'ForNum': 44722,
 'NatNum': 75991,
 'addrCd': 1111,
 'gungu': '종로구',
 'resNm': '창덕궁',
 'rnum': 1,
 'sido': '서울특별시',
 'yyyymm': '201112'}

In [51]:
print(type(data[0]))

<class 'dict'>


In [53]:
len(data)

67

data변수 안에 있는 리스트에서 딕셔너리 1개씩 꺼내고 key별로 나머지 66개 데이터의 자료를 리스트로 정리하기

## 한땀한땀 수작업 정리

In [54]:
data[0].keys()

dict_keys(['ForNum', 'NatNum', 'addrCd', 'gungu', 'resNm', 'rnum', 'sido', 'yyyymm'])

In [2]:
ForNum = []
NatNum = []
addrCd = []
gungu = []
resNm = []
rnum = []
sido = []
yyyymm = []

In [3]:
ForNum.append(data[2]['ForNum'])
NatNum.append(data[2]['NatNum'])
addrCd.append(data[2]['addrCd'])
gungu.append(data[2]['gungu'])
resNm.append(data[2]['resNm'])
rnum.append(data[2]['rnum'])
sido.append(data[2]['sido'])
yyyymm.append(data[2]['yyyymm'])
print(ForNum)
print(NatNum)
print(addrCd)
print(gungu)
print(resNm)
print(rnum)
print(sido)
print(yyyymm)

NameError: name 'data' is not defined

In [57]:
result = dict(ForNum=ForNum, NatNum=NatNum, addrCd=addrCd, gungu=gungu, resNm=resNm,
    rnum=rnum, sido=sido, yyyymm=yyyymm)
result

{'ForNum': [132399],
 'NatNum': [237330],
 'addrCd': [1111],
 'gungu': ['종로구'],
 'resNm': ['경복궁'],
 'rnum': [3],
 'sido': ['서울특별시'],
 'yyyymm': ['201112']}

# 반복문으로 자동화

In [58]:
for i in range(len(data)):
    print(i, end=" ")

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 

In [59]:
for i in range(len(data)):
    ForNum.append(data[i]['ForNum'])
    NatNum.append(data[i]['NatNum'])
    addrCd.append(data[i]['addrCd'])
    gungu.append(data[i]['gungu'])
    resNm.append(data[i]['resNm'])
    rnum.append(data[i]['rnum'])
    sido.append(data[i]['sido'])
    yyyymm.append(data[i]['yyyymm'])
print(ForNum)
print(NatNum)
print(addrCd)
print(gungu)
print(resNm)
print(rnum)
print(sido)
print(yyyymm)

[132399, 44722, 0, 132399, 3133, 18226, 0, 0, 13935, 0, 10, 0, 0, 5214, 333, 4704, 52484, 27814, 546, 105370, 1451, 8817, 13033, 1138, 11151, 0, 15, 6625, 0, 24492, 62, 66868, 25550, 101942, 1986, 6048, 9083, 13282, 6, 6732, 0, 43129, 16, 1445, 29928, 129946, 1693, 3891, 7195, 14723, 12, 6263, 0, 42443, 5, 823, 33342, 170379, 1783, 3406, 13127, 15197, 16, 5588, 0, 29520, 3, 492]
[237330, 75991, 11017, 237330, 21267, 24223, 233828, 93554, 52140, 61115, 1885, 32412, 19308, 6956, 1823, 16634, 642290, 28061, 5978, 133012, 15722, 8068, 227077, 78179, 44855, 213467, 1252, 14090, 18881, 9167, 860, 670056, 38553, 145544, 20035, 13896, 286992, 99301, 706, 14607, 23245, 11886, 1248, 11890, 41561, 190501, 19473, 5951, 258781, 44272, 486, 27205, 24527, 7478, 1036, 8869, 59738, 148961, 27172, 14936, 281457, 68749, 2221, 44232, 22587, 8822, 1647, 14454]
[1111, 1111, 1111, 1111, 1111, 1111, 1117, 1111, 1114, 1114, 1135, 1141, 1141, 1144, 1165, 1168, 1171, 1111, 1111, 1111, 1111, 1111, 1117, 1111, 111

In [61]:
result = dict(ForNum=ForNum, NatNum=NatNum, addrCd=addrCd, gungu=gungu, 
              resNm=resNm, rnum=rnum, sido=sido, yyyymm=yyyymm)
result

{'ForNum': [132399,
  44722,
  0,
  132399,
  3133,
  18226,
  0,
  0,
  13935,
  0,
  10,
  0,
  0,
  5214,
  333,
  4704,
  52484,
  27814,
  546,
  105370,
  1451,
  8817,
  13033,
  1138,
  11151,
  0,
  15,
  6625,
  0,
  24492,
  62,
  66868,
  25550,
  101942,
  1986,
  6048,
  9083,
  13282,
  6,
  6732,
  0,
  43129,
  16,
  1445,
  29928,
  129946,
  1693,
  3891,
  7195,
  14723,
  12,
  6263,
  0,
  42443,
  5,
  823,
  33342,
  170379,
  1783,
  3406,
  13127,
  15197,
  16,
  5588,
  0,
  29520,
  3,
  492],
 'NatNum': [237330,
  75991,
  11017,
  237330,
  21267,
  24223,
  233828,
  93554,
  52140,
  61115,
  1885,
  32412,
  19308,
  6956,
  1823,
  16634,
  642290,
  28061,
  5978,
  133012,
  15722,
  8068,
  227077,
  78179,
  44855,
  213467,
  1252,
  14090,
  18881,
  9167,
  860,
  670056,
  38553,
  145544,
  20035,
  13896,
  286992,
  99301,
  706,
  14607,
  23245,
  11886,
  1248,
  11890,
  41561,
  190501,
  19473,
  5951,
  258781,
  44272,
  486,
  2720

In [62]:
len(result['ForNum'])

68

In [7]:
!pip install pandas

Collecting pandas
  Downloading pandas-2.3.2-cp39-cp39-win_amd64.whl.metadata (19 kB)
Collecting pytz>=2020.1 (from pandas)
  Using cached pytz-2025.2-py2.py3-none-any.whl.metadata (22 kB)
Collecting tzdata>=2022.7 (from pandas)
  Using cached tzdata-2025.2-py2.py3-none-any.whl.metadata (1.4 kB)
Downloading pandas-2.3.2-cp39-cp39-win_amd64.whl (11.3 MB)
   ---------------------------------------- 0.0/11.3 MB ? eta -:--:--
   --- ------------------------------------ 1.0/11.3 MB 5.6 MB/s eta 0:00:02
   ------- -------------------------------- 2.1/11.3 MB 4.7 MB/s eta 0:00:02
   ------------------- -------------------- 5.5/11.3 MB 8.6 MB/s eta 0:00:01
   --------------------------- ------------ 7.9/11.3 MB 9.2 MB/s eta 0:00:01
   ----------------------------------- ---- 10.0/11.3 MB 9.3 MB/s eta 0:00:01
   ---------------------------------------- 11.3/11.3 MB 9.5 MB/s  0:00:01
Using cached pytz-2025.2-py2.py3-none-any.whl (509 kB)
Using cached tzdata-2025.2-py2.py3-none-any.whl (347 kB)
I

In [63]:
import pandas as pd

In [64]:
df = pd.DataFrame(result)
df

Unnamed: 0,ForNum,NatNum,addrCd,gungu,resNm,rnum,sido,yyyymm
0,132399,237330,1111,종로구,경복궁,3,서울특별시,201112
1,44722,75991,1111,종로구,창덕궁,1,서울특별시,201112
2,0,11017,1111,종로구,운현궁,2,서울특별시,201112
3,132399,237330,1111,종로구,경복궁,3,서울특별시,201112
4,3133,21267,1111,종로구,창경궁,4,서울특별시,201112
...,...,...,...,...,...,...,...,...
63,5588,44232,1141,서대문구,서대문형무소역사관,8,서울특별시,201512
64,0,22587,1141,서대문구,서대문자연사박물관,9,서울특별시,201512
65,29520,8822,1144,마포구,트릭아이미술관,10,서울특별시,201512
66,3,1647,1165,서초구,헌릉ㆍ인릉,11,서울특별시,201512


# 딕셔너리의 key도 자동으로 넣을 수 있을까?
* 딕셔너리를 반복문에 넣으면 key가 나온다.

In [65]:
a = {}

In [66]:
a["fornum"] = [1,2,3]
a

{'fornum': [1, 2, 3]}

In [67]:
for i in list(data[0].keys())[:1]:
    print(i)

ForNum


In [68]:
# data - list를 반복문에 넣으면 dict 따라서 item - dict
# dict를 반복문에 넣으면 dict의 key가 나온다.
result2 = {}
for key in data[0]:
    temp = []
    for dicts in data[:]:
        temp.append(dicts[key])
    result2[key] = temp
print(result2)

{'ForNum': [44722, 0, 132399, 3133, 18226, 0, 0, 13935, 0, 10, 0, 0, 5214, 333, 4704, 52484, 27814, 546, 105370, 1451, 8817, 13033, 1138, 11151, 0, 15, 6625, 0, 24492, 62, 66868, 25550, 101942, 1986, 6048, 9083, 13282, 6, 6732, 0, 43129, 16, 1445, 29928, 129946, 1693, 3891, 7195, 14723, 12, 6263, 0, 42443, 5, 823, 33342, 170379, 1783, 3406, 13127, 15197, 16, 5588, 0, 29520, 3, 492], 'NatNum': [75991, 11017, 237330, 21267, 24223, 233828, 93554, 52140, 61115, 1885, 32412, 19308, 6956, 1823, 16634, 642290, 28061, 5978, 133012, 15722, 8068, 227077, 78179, 44855, 213467, 1252, 14090, 18881, 9167, 860, 670056, 38553, 145544, 20035, 13896, 286992, 99301, 706, 14607, 23245, 11886, 1248, 11890, 41561, 190501, 19473, 5951, 258781, 44272, 486, 27205, 24527, 7478, 1036, 8869, 59738, 148961, 27172, 14936, 281457, 68749, 2221, 44232, 22587, 8822, 1647, 14454], 'addrCd': [1111, 1111, 1111, 1111, 1111, 1117, 1111, 1114, 1114, 1135, 1141, 1141, 1144, 1165, 1168, 1171, 1111, 1111, 1111, 1111, 1111, 1117

# 좀 더 쉽게 딕셔너리 함수를 이용해서 만들자
* items(), setdefult()
* setdefault(key, []).append()

In [72]:
result3 = {}
for dicts in data:
    for key, value in dicts.items():
        result3.setdefault(key, []).append(value)
print(result3)

{'ForNum': [44722, 0, 132399, 3133, 18226, 0, 0, 13935, 0, 10, 0, 0, 5214, 333, 4704, 52484, 27814, 546, 105370, 1451, 8817, 13033, 1138, 11151, 0, 15, 6625, 0, 24492, 62, 66868, 25550, 101942, 1986, 6048, 9083, 13282, 6, 6732, 0, 43129, 16, 1445, 29928, 129946, 1693, 3891, 7195, 14723, 12, 6263, 0, 42443, 5, 823, 33342, 170379, 1783, 3406, 13127, 15197, 16, 5588, 0, 29520, 3, 492], 'NatNum': [75991, 11017, 237330, 21267, 24223, 233828, 93554, 52140, 61115, 1885, 32412, 19308, 6956, 1823, 16634, 642290, 28061, 5978, 133012, 15722, 8068, 227077, 78179, 44855, 213467, 1252, 14090, 18881, 9167, 860, 670056, 38553, 145544, 20035, 13896, 286992, 99301, 706, 14607, 23245, 11886, 1248, 11890, 41561, 190501, 19473, 5951, 258781, 44272, 486, 27205, 24527, 7478, 1036, 8869, 59738, 148961, 27172, 14936, 281457, 68749, 2221, 44232, 22587, 8822, 1647, 14454], 'addrCd': [1111, 1111, 1111, 1111, 1111, 1117, 1111, 1114, 1114, 1135, 1141, 1141, 1144, 1165, 1168, 1171, 1111, 1111, 1111, 1111, 1111, 1117

In [73]:
df3 = pd.DataFrame(result3)
df3

Unnamed: 0,ForNum,NatNum,addrCd,gungu,resNm,rnum,sido,yyyymm
0,44722,75991,1111,종로구,창덕궁,1,서울특별시,201112
1,0,11017,1111,종로구,운현궁,2,서울특별시,201112
2,132399,237330,1111,종로구,경복궁,3,서울특별시,201112
3,3133,21267,1111,종로구,창경궁,4,서울특별시,201112
4,18226,24223,1111,종로구,종묘,5,서울특별시,201112
...,...,...,...,...,...,...,...,...
62,5588,44232,1141,서대문구,서대문형무소역사관,8,서울특별시,201512
63,0,22587,1141,서대문구,서대문자연사박물관,9,서울특별시,201512
64,29520,8822,1144,마포구,트릭아이미술관,10,서울특별시,201512
65,3,1647,1165,서초구,헌릉ㆍ인릉,11,서울특별시,201512
