# AIVLE스쿨 1차 미니프로젝트: 서울시 생활정보 기반 대중교통 수요 분석

<img src = "https://github.com/Jangrae/img/blob/master/moving.png?raw=true" width=800, align="left"/>

- 본 과정에서는 실제 사례와 데이터를 기반으로 문제를 해결하는 전체 과정을 자기 주도형 실습으로 진행해볼 예정입니다.
- 앞선 교육과정을 정리하는 마음과 지금까지 배운 내용을 바탕으로 문제 해결을 해볼게요!
- 미니 프로젝트를 통한 문제 해결 과정 'A에서 Z까지', 지금부터 시작합니다!

---

# [미션 2] 구별 유동인구 분석

### 로컬 수행(Anaconda)
- project 폴더에 필요한 파일들을 넣고, 본 파일을 열었다면, 별도 경로 지정이 필요하지 않습니다.

In [1]:
# 기본 경로
path = ''

### 구글 콜랩 수행

- 구글 콜랩을 사용중이면 구글 드라이브를 연결합니다.

In [4]:
# # 구글 드라이브 연결, 패스 지정
# import sys
# if 'google.colab' in sys.modules:
#     from google.colab import drive
#     drive.mount('/content/drive')
#     path = '/content/drive/MyDrive/project/'

### 한글 폰트 표시를 위해 설치합니다.

In [7]:
# 한글 표시를 위한 라이브러리 설치
!pip install koreanize_matplotlib -q

### 필요한 라이브러리를 불러옵니다.

In [9]:
# 라이브러리 불러오기
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import koreanize_matplotlib
import warnings

warnings.filterwarnings(action='ignore')
%config InlineBackend.figure_format='retina'

### 기본 데이터: 1.2 seoul_moving_month_202408.csv

- 서울 시 구별 이동 2024년 8월 데이터
- 출처: https://data.seoul.go.kr/dataVisual/seoul/seoulLivingMigration.do

---

# 1. 데이터 불러오기

- 분석 대상 데이터를 불러와 데이터프레임으로 선언합니다.

### [참고] 데이터 프레임을 불러오고 변수로 저장(CSV 기준으로 진행)

- csv: pd.read_csv('파일이름.csv')
- txt: pd.read_csv('파일이름.csv', sep='구분자')
- xlsx: pd.read_excel('파일이름.xlsx')
- pickle: pd.read_pickle('파일이름.pkl')

## [실습1] 데이터 불러오기

- 대상 파일: 1.2 seoul_moving_month_202408.csv
- 불러온 데이터는 seoul_moving 데이터프레임으로 선언하세요.
- 데이터 불러올 때 참고할 사항 
    - 구분자(sep)는 ',' 입니다
    - UTF-8 인코더를 사용해 주세요(생략 가능)

In [15]:
# 데이터 불러오기
seoul_moving = pd.read_csv(path + '1.2 seoul_moving_month_202408.csv', sep=',', encoding='UTF-8')

# 확인
seoul_moving.head()

Unnamed: 0,대상연월,요일,도착시간,출발 시군구 코드,도착 시군구 코드,성별,나이,이동유형,평균 이동 시간(분),이동인구(합)
0,202408,일,0,11010,11010,F,0,EE,136,28.01
1,202408,일,0,11010,11010,F,0,WH,7,28.02
2,202408,일,0,11010,11010,F,10,EE,55,23.96
3,202408,일,0,11010,11010,F,10,HH,84,11.83
4,202408,일,0,11010,11010,F,10,WH,166,5.94


**[데이터 소개]**
- 도착시간: 0 -> 00:00~00:59를 의미 
- 시구군 코드: 자치구 코드
- 성별: F(여성), M(남성)
- 나이: 0 ~ 9세, 10 ~ 79세 (5세 단위), 80세 이상으로 구분
- 이동유형: H(야간상주지), W(주간상주지), E(기타)
- 평균 이동 시간(분): 동일 열 내 이동인구의 월 단위 평균 이동 시간
- 이동인구(합): 추정 합산값으로 소수점 표출, 개인정보 비식별화를 위해 3명 미만의 경우 * 처리

In [17]:
# 데이터프레임 크기(행, 열) 확인
seoul_moving.shape

(30817445, 10)

---

# 2. 기본 정보 확인 및 전처리

- 분석 대상 테이터를 탐색하고 적절한 전처리를 수행합니다.

## [실습2] 기본 정보 확인

- seoul_moving 데이터프레임 정보를 확인하세요.- head(), tail(), info(), describe() 메서드 등을 활용해 보세요.

In [22]:
# head() 메서드로 상위 데이터 확인
seoul_moving.head()

Unnamed: 0,대상연월,요일,도착시간,출발 시군구 코드,도착 시군구 코드,성별,나이,이동유형,평균 이동 시간(분),이동인구(합)
0,202408,일,0,11010,11010,F,0,EE,136,28.01
1,202408,일,0,11010,11010,F,0,WH,7,28.02
2,202408,일,0,11010,11010,F,10,EE,55,23.96
3,202408,일,0,11010,11010,F,10,HH,84,11.83
4,202408,일,0,11010,11010,F,10,WH,166,5.94


**[0번 열의 의미]**

~~~
"2024년 8월 일요일에 11010(종로구)에서 11010(종로구)으로 이동하여 0시 ~ 0시 59분 사이에 도착했고,
 E(기타)에서 E(기타)로 이동한 0 ~ 9세 여성은 총 28.01명이며 이들의 평균 이동시간은 136분이다"
~~~

In [25]:
# tail() 메서드로 하위 데이터 확인
seoul_moving.tail()

Unnamed: 0,대상연월,요일,도착시간,출발 시군구 코드,도착 시군구 코드,성별,나이,이동유형,평균 이동 시간(분),이동인구(합)
30817440,202408,토,23,39000,11250,M,45,EH,184,3.16
30817441,202408,토,23,39000,11250,M,50,EH,173,6.61
30817442,202408,토,23,39000,11250,M,55,EH,164,6.55
30817443,202408,토,23,39000,11250,M,60,EW,207,3.52
30817444,202408,토,23,39000,11250,M,65,EE,155,4.08


In [26]:
# info() 메서드로 열 이름, 데이터 개수, 데이터 형식 등 확인
seoul_moving.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 30817445 entries, 0 to 30817444
Data columns (total 10 columns):
 #   Column       Dtype 
---  ------       ----- 
 0   대상연월         int64 
 1   요일           object
 2   도착시간         int64 
 3   출발 시군구 코드    int64 
 4   도착 시군구 코드    int64 
 5   성별           object
 6   나이           int64 
 7   이동유형         object
 8   평균 이동 시간(분)  int64 
 9   이동인구(합)      object
dtypes: int64(6), object(4)
memory usage: 2.3+ GB


In [27]:
# 표시 형식 변경
pd.set_option('display.float_format', '{:.4f}'.format)

In [28]:
# describe() 메서드로 기술통계정보 확인
seoul_moving.describe()

Unnamed: 0,대상연월,도착시간,출발 시군구 코드,도착 시군구 코드,나이,평균 이동 시간(분)
count,30817445.0,30817445.0,30817445.0,30817445.0,30817445.0,30817445.0
mean,202408.0,13.6159,17199.454,17269.141,43.0756,94.4543
std,0.0,5.8779,9073.1107,9084.3081,18.1757,79.1972
min,202408.0,0.0,11010.0,11010.0,0.0,1.0
25%,202408.0,10.0,11110.0,11110.0,30.0,49.0
50%,202408.0,14.0,11200.0,11200.0,45.0,75.0
75%,202408.0,18.0,31021.0,31021.0,55.0,113.0
max,202408.0,23.0,39000.0,39000.0,80.0,3644.0


In [29]:
# 표시 형식 초기화
pd.reset_option('display.float_format')

## [실습3] 결측치 처리

- NaN이 아닌 결측치를 처리해 보세요.
- '이동인구(합)' 열 데이터 형식은 현재 object, 즉 str 형입니다.
- 3명 미만 이동인구 합은 개인정보 비식별화를 위해 * 처리 되어 있기 때문입니다.

In [31]:
# '이동인구(합)' 값별 갯수 확인
# 참고: value_counts() 메서드 사용
seoul_moving['이동인구(합)'].value_counts()

이동인구(합)
*          3946178
6.05        469786
3.30        412951
3.29        290769
3.31        239926
            ...   
603.05           1
977.58           1
885.38           1
1105.71          1
765.75           1
Name: count, Length: 143893, dtype: int64

- 그러므로 * 로 저장된 값을 나름의 기준으로 변경하세요.(예: '1,5')

In [33]:
# '이동인구(합)' 열 * 값을 '1.5'로 변경
# 참고: replace() 메서드 사용
seoul_moving['이동인구(합)'].replace('*', '1.5', inplace=True)

# 확인
seoul_moving['이동인구(합)'].value_counts()

이동인구(합)
1.5        3946178
6.05        469786
3.30        412951
3.29        290769
3.31        239926
            ...   
603.05           1
977.58           1
885.38           1
1105.71          1
765.75           1
Name: count, Length: 143893, dtype: int64

- '이동인구(합)' 열의 데이터 형식을 float 형으로 변경하세요 

In [35]:
# '이동인구(합)' 열 데이터 형식을 float으로 변경
# 참고: astype() 메서드 사용
seoul_moving['이동인구(합)'] =  seoul_moving['이동인구(합)'].astype(float)

# 확인
seoul_moving['이동인구(합)'].describe()

count    3.081744e+07
mean     2.495402e+01
std      1.039514e+02
min      1.500000e+00
25%      3.320000e+00
50%      6.560000e+00
75%      1.623000e+01
max      1.491182e+04
Name: 이동인구(합), dtype: float64

## [실습4] 범주형 데이터 확인

- '이동유형', '요일', '성별' 열의 범줏값 개수를 확인하세요.


In [37]:
# '이동유형' 범줏값 개수
# 참고: value_counts() 메서드 사용
seoul_moving['이동유형'].value_counts()

이동유형
EH    6184889
HE    5979641
EE    5601729
WH    3118329
WE    2953729
HW    2737553
EW    2466619
WW    1109238
HH     665718
Name: count, dtype: int64

In [38]:
# '요일' 범줏값 개수
# 참고: value_counts() 메서드 사용
seoul_moving['요일'].value_counts()

요일
금    4869700
토    4862970
목    4719375
수    4191807
화    4121848
월    4090609
일    3961136
Name: count, dtype: int64

- 아래 달력을 보고 2024년 8월 요일 개수를 확인하세요.

<img src = "https://github.com/Jangrae/img/blob/master/202408.png?raw=true" width=200, align="left"/>

In [41]:
# '성별' 범줏값 개수
# 참고: value_counts() 메서드 사용
seoul_moving['성별'].value_counts()

성별
M    17206256
F    13611189
Name: count, dtype: int64

## [실습5] 서울 지역 데이터 준비

- 우리는 서울시의 데이터만 필요합니다.
    - 시군구 코드:광역시도(2자리)+시군구(3자리) / 서울:11, 부산:26, 대구:27, 인천:28, 광주:29, 대전:30, 울산:31)
- 출발과 도착이 모두 서울인 데이터 ('출발 시군구 코드' < 20000 & '도착 시군구 코드' < 20000)만 추출하세요.
- 추출된 결과를 기존 seoul_moving 데이터프레임으로 다시 선언하세요.

In [42]:
# 서울지역 데이터 추출
# 참고: df = df.loc[(조건1) & (조건)] 형태 구문 사용
seoul_moving = seoul_moving.loc[(seoul_moving['출발 시군구 코드'].astype(str).str.startswith('11')) & (seoul_moving['도착 시군구 코드'].astype(str).str.startswith('11'))]

# 결과 확인
seoul_moving['출발 시군구 코드'].value_counts()

출발 시군구 코드
11230    594530
11220    528964
11020    526590
11190    520347
11010    517947
11140    509772
11240    482633
11040    479299
11030    476461
11060    473106
11080    462079
11130    446451
11050    442137
11200    438745
11210    434772
11160    423102
11110    412472
11170    408171
11070    386979
11250    376498
11120    369592
11090    358972
11150    357635
11100    327592
11180    305089
Name: count, dtype: int64

- 인덱스를 초기화하세요(단, 기존 인덱스를 버리세요).

In [44]:
# 인덱스 초기화
seoul_moving.reset_index(inplace=True)

# 결과 확인
seoul_moving.tail()

Unnamed: 0,index,대상연월,요일,도착시간,출발 시군구 코드,도착 시군구 코드,성별,나이,이동유형,평균 이동 시간(분),이동인구(합)
11059930,30765110,202408,토,23,11250,11250,M,80,HE,55,37.86
11059931,30765111,202408,토,23,11250,11250,M,80,HH,92,18.87
11059932,30765112,202408,토,23,11250,11250,M,80,HW,21,28.4
11059933,30765113,202408,토,23,11250,11250,M,80,WH,44,113.71
11059934,30765114,202408,토,23,11250,11250,M,80,WW,177,28.5


**[서울 구별 코드]**

~~~
11010: 종로구    11020: 중구    11030: 용산구   11040: 성동구    11050: 광진구
11060: 동대문구  11070: 중랑구  11080: 성북구   11090: 강북구    11100: 도봉구
11110: 노원구    11120:	은평구  11130: 서대문구 11140: 마포구    11150: 양천구
11160: 강서구    11170: 구로구  11180: 금천구   11190: 영등포구  11200:	동작구
11210: 관악구    11220: 서초구  11230: 강남구   11240: 송파구    11250: 강동구
~~~

- 다음 코드를 필히 실행하여 출발/도착 시구군 코드를 출발/도착 자치구 이름으로 변경하세요.

In [47]:
# 구 코드를 구 이름으로 변경
seoul_moving['출발 자치구'] = seoul_moving['출발 시군구 코드'].map({
      11010: '종로구',   11020: '중구',   11030: '용산구',   11040: '성동구',   11050: '광진구',
      11060: '동대문구', 11070: '중랑구', 11080: '성북구',   11090: '강북구',   11100: '도봉구',
      11110: '노원구',   11120:	'은평구', 11130: '서대문구', 11140: '마포구',   11150: '양천구',
      11160: '강서구',   11170: '구로구', 11180: '금천구',   11190: '영등포구', 11200: '동작구',
      11210: '관악구',   11220: '서초구', 11230: '강남구',   11240: '송파구',   11250: '강동구'})

seoul_moving['도착 자치구'] = seoul_moving['도착 시군구 코드'].map({
      11010: '종로구',   11020: '중구',   11030: '용산구',   11040: '성동구',   11050: '광진구',
      11060: '동대문구', 11070: '중랑구', 11080: '성북구',   11090: '강북구',   11100: '도봉구',
      11110: '노원구',   11120:	'은평구', 11130: '서대문구', 11140: '마포구',   11150: '양천구',
      11160: '강서구',   11170: '구로구', 11180: '금천구',   11190: '영등포구', 11200: '동작구',
      11210: '관악구',   11220: '서초구', 11230: '강남구',   11240: '송파구',   11250: '강동구'})

# '출발/도착 시구군 코드' 열 제거
seoul_moving.drop(['출발 시군구 코드', '도착 시군구 코드'], axis=1, inplace=True)

# 확인
seoul_moving.head()

Unnamed: 0,index,대상연월,요일,도착시간,성별,나이,이동유형,평균 이동 시간(분),이동인구(합),출발 자치구,도착 자치구
0,0,202408,일,0,F,0,EE,136,28.01,종로구,종로구
1,1,202408,일,0,F,0,WH,7,28.02,종로구,종로구
2,2,202408,일,0,F,10,EE,55,23.96,종로구,종로구
3,3,202408,일,0,F,10,HH,84,11.83,종로구,종로구
4,4,202408,일,0,F,10,WH,166,5.94,종로구,종로구


## [실습6] 구별 유입/유출 인구 분석

- 구별로 집계하여 다음 내용을 확인하세요.
    - 유출 인구가 제일 많은 구는?
    - 유출 인구가 제일 적은 구는?
    - 유입 인구가 제일 많은 구는?
    - 유입 인구가 제일 적은 구는?

In [57]:
# 유출이 제일 많은 구와 적은 구는? 강남구, 금천구
# 참고: groupby() 메서드 사용
seoul_moving.loc[seoul_moving['출발 자치구'] != seoul_moving['도착 자치구']].groupby(by='출발 자치구').size().sort_values(ascending=False)


출발 자치구
강남구     547485
중구      484386
서초구     483026
종로구     475564
영등포구    474878
마포구     464562
송파구     435641
성동구     434925
용산구     432889
동대문구    427900
성북구     416641
서대문구    402133
광진구     397007
동작구     393312
관악구     390235
강서구     376653
노원구     366508
구로구     363582
중랑구     341601
강동구     329539
은평구     323651
강북구     314379
양천구     312801
도봉구     283847
금천구     262453
dtype: int64

In [58]:
# 유입이 제일 많은 구와 적은 구는? 강남구, 금천구 
# 참고: groupby() 메서드 사용
seoul_moving.loc[seoul_moving['출발 자치구'] != seoul_moving['도착 자치구']].groupby(by='도착 자치구').size().sort_values(ascending=False)


도착 자치구
강남구     528903
서초구     474105
영등포구    468237
중구      460875
마포구     455183
종로구     451775
송파구     433762
성동구     431315
동대문구    430553
성북구     425214
용산구     422355
서대문구    398827
광진구     398035
동작구     396336
관악구     393572
강서구     392488
노원구     379340
구로구     365255
중랑구     352877
은평구     335772
강동구     335590
강북구     326267
양천구     322316
도봉구     296848
금천구     259798
dtype: int64

## [실습7] 구별 이동 시간, 이동 인구 분석

- '도착 자치구' 열을 기준으로 각 구별로 '평균 이동 시간(분)', '이동인구(합)' 평균을 집계하세요.
- 평균 집계 결과를 df_mean 데이터프레임으로 선언하세요.

In [70]:
seoul_moving.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 11059935 entries, 0 to 11059934
Data columns (total 11 columns):
 #   Column       Dtype  
---  ------       -----  
 0   index        int64  
 1   대상연월         int64  
 2   요일           object 
 3   도착시간         int64  
 4   성별           object 
 5   나이           int64  
 6   이동유형         object 
 7   평균 이동 시간(분)  int64  
 8   이동인구(합)      float64
 9   출발 자치구       object 
 10  도착 자치구       object 
dtypes: float64(1), int64(5), object(5)
memory usage: 928.2+ MB


In [76]:
a = seoul_moving.loc[seoul_moving['나이']>=70]

In [80]:
a.groupby(by='도착 자치구', as_index=False)[['평균 이동 시간(분)', '이동인구(합)']].mean().head()

Unnamed: 0,도착 자치구,평균 이동 시간(분),이동인구(합)
0,강남구,69.427451,75.450907
1,강동구,75.268675,87.634931
2,강북구,66.042841,61.211339
3,강서구,74.084405,71.410602
4,관악구,65.624521,60.115551


In [82]:
a.groupby(by='도착 자치구', as_index=False)[['평균 이동 시간(분)', '이동인구(합)']].sum().head()

Unnamed: 0,도착 자치구,평균 이동 시간(분),이동인구(합)
0,강남구,5108333,5551526.81
1,강동구,3640520,4238638.72
2,강북구,3112467,2884767.99
3,강서구,3811939,3674361.09
4,관악구,3493587,3200311.49


# 나이 70대 이상 추출

In [85]:
# 70대 이상 추출 코드 > 미션 1.2 실습 7번부터
seoul_moving_over70 = seoul_moving.loc[seoul_moving['나이']>=70]
df_mean = seoul_moving_over70.groupby(by='도착 자치구', as_index=False)[['평균 이동 시간(분)', '이동인구(합)']].mean()
df_mean.rename(columns={'평균 이동 시간(분)':'노령층 평균 이동 시간', '이동인구(합)':'노령층 평균 이동인구'}, inplace=True)
df_sum = seoul_moving_over70.groupby(by='도착 자치구', as_index=False)[['평균 이동 시간(분)', '이동인구(합)']].sum()
df_sum.rename(columns={'평균 이동 시간(분)':'노령층 총 이동 시간', '이동인구(합)':'노령층 총 이동인구'}, inplace=True)
df_seoul_moving.to_csv(path + 'df_seoul_moving_over70.csv', index=False)

In [106]:
# 평균 집계 --> df_mean 데이터프레임으로 선언
# 참고: groupby() 메서드 사용, as_index=False 지정
df_mean = seoul_moving_over70.groupby(by='도착 자치구', as_index=False)[['평균 이동 시간(분)', '이동인구(합)']].mean()

# 확인
df_mean.head()

Unnamed: 0,도착 자치구,평균 이동 시간(분),이동인구(합)
0,강남구,69.427451,75.450907
1,강동구,75.268675,87.634931
2,강북구,66.042841,61.211339
3,강서구,74.084405,71.410602
4,관악구,65.624521,60.115551


- '도착 자치구' 열을 기준으로 각 구별로 '평균 이동 시간(분)', '이동인구(합)' 합을 집계하세요.
- 합 집계 결과를 df_sum 데이터프레임으로 선언하세요.

In [109]:
# 합 집계 --> df_sum 데이터프레임으로 선언
# 참고: groupby() 메서드 사용, as_index=False 지정
df_sum = seoul_moving_over70.groupby(by='도착 자치구', as_index=False)[['평균 이동 시간(분)', '이동인구(합)']].sum()

# 확인
df_sum

Unnamed: 0,도착 자치구,평균 이동 시간(분),이동인구(합)
0,강남구,5108333,5551526.81
1,강동구,3640520,4238638.72
2,강북구,3112467,2884767.99
3,강서구,3811939,3674361.09
4,관악구,3493587,3200311.49
5,광진구,3139290,2654772.02
6,구로구,3287595,2541425.68
7,금천구,2066113,1128034.82
8,노원구,3732403,3800335.16
9,도봉구,3177062,2629040.25


- 다음과 같이 df_sum 데이터프레임의 열 이름을 변경하세요.
    - '평균 이동 시간(분)' --> '총 이동 시간', '이동인구(합)' --> '총 이동인구'

In [112]:
# 열 이름 변경: '평균 이동 시간(분)' --> '총 이동 시간','이동인구(합)' --> '총 이동인구'
# 참고: rename() 메서드 사용
df_sum.rename(columns={'평균 이동 시간(분)':'노령층 총 이동 시간', '이동인구(합)':'노령층 총 이동인구'}, inplace=True)

# 확인
df_sum.head()

Unnamed: 0,도착 자치구,노령층 총 이동 시간,노령층 총 이동인구
0,강남구,5108333,5551526.81
1,강동구,3640520,4238638.72
2,강북구,3112467,2884767.99
3,강서구,3811939,3674361.09
4,관악구,3493587,3200311.49


In [114]:
df_mean.rename(columns={'평균 이동 시간(분)':'노령층 평균 이동 시간', '이동인구(합)':'노령층 평균 이동인구'}, inplace=True)

- df_mean, df_sum 두 데이터프레임을 조인(merge) 하여 df_seoul_moving 데이터프레임을 선언하세요.

In [117]:
# df_mean, df_sum 데이터프레임 조인(merge)
# 참고: '도착 자치구' 열이 조인 기준, how='inner' 지정
df_seoul_moving = pd.merge(df_mean, df_sum, how='inner', on='도착 자치구')

# 확인
df_seoul_moving

Unnamed: 0,도착 자치구,노령층 평균 이동 시간,노령층 평균 이동인구,노령층 총 이동 시간,노령층 총 이동인구
0,강남구,69.427451,75.450907,5108333,5551526.81
1,강동구,75.268675,87.634931,3640520,4238638.72
2,강북구,66.042841,61.211339,3112467,2884767.99
3,강서구,74.084405,71.410602,3811939,3674361.09
4,관악구,65.624521,60.115551,3493587,3200311.49
5,광진구,61.62116,52.110551,3139290,2654772.02
6,구로구,66.476494,51.38865,3287595,2541425.68
7,금천구,66.128313,36.104046,2066113,1128034.82
8,노원구,70.179058,71.456362,3732403,3800335.16
9,도봉구,69.104122,57.184127,3177062,2629040.25


- df_seoul_moving 데이터프레임의 '도착 자치구' 열 이름을 '자치구'로 변경하세요.

In [120]:
# 열 이름 변경
df_seoul_moving.rename(columns={'도착 자치구':'자치구'}, inplace=True)

# 확인
df_seoul_moving.head()

Unnamed: 0,자치구,노령층 평균 이동 시간,노령층 평균 이동인구,노령층 총 이동 시간,노령층 총 이동인구
0,강남구,69.427451,75.450907,5108333,5551526.81
1,강동구,75.268675,87.634931,3640520,4238638.72
2,강북구,66.042841,61.211339,3112467,2884767.99
3,강서구,74.084405,71.410602,3811939,3674361.09
4,관악구,65.624521,60.115551,3493587,3200311.49


- df_seoul_moving 데이터프레임을 df_seoul_moving.csv 파일로 저장하세요.

In [123]:
# csv 파일로 저장 (파일명: df_seoul_moving.csv)
# 참고: to_csv() 메서드를 사용, index=False 지정 
df_seoul_moving.to_csv(path + 'df_seoul_moving_over70.csv', index=False)

---