#### 0. oauth
- https://oauth.net/2/
- 2006년에 IETF(Internet Engineering Task Force) OAuth Working Group에서 개발되고 유지보수 되는 인증을 위한 표준 프로토콜
- secret key, request token, access token, refresh token
- https://confluence.atlassian.com/bitbucket/oauth-endpoint-300220600.html

#### 1. Install Package
- mac
    - `$ pip install pygsheets oauth2client`
- windows
    - `$ conda install -c marta-sd pygsheets`

windows에서 아래의 에러가 발생하면 pip로 설치합니다.
- TypeError: parse() got an unexpected keyword argument 'transport_encoding'
    - `$ conda install pip`
    - `$ pip install pygsheets`

In [1]:
import pygsheets

- authorizing : access token 받기
- connecting : google spreadsheet에 연결 (자신의 계정)
- spreadsheet 파일 열기
- sheet 생성
- sheet 복사
- sheet 삭제
- sheet 선택 : 데이터 가져오기
- 업데이트, insert
- sheet -> pandas df 변환
- cell 컨트롤
- spreadsheet 파일 공유
- pandas df -> sheet 변환

#### 2. authorizing - secret token 받기
- reference
    - http://pygsheets.readthedocs.io/en/latest/authorizing.html

1. 콘솔 페이지로 이동 - https://console.developers.google.com
2. 왼쪽 상단의 프로젝트 만들기로 DSS8 프로젝트를 만듦
3. 좌측의 라이브러리 탭에서 Google Sheets API, Google Drive API를 추가(사용설정 클릭)
4. 사용자 인정 정보 탭으로 이동
5. Oauth 동의 화면으로 이동
6. 저장 클릭
7. 사용자 인증정보 클릭
8. Oauth 클라이언트 ID 클릭
9. 기타 선택후 dss8로 이름 설정후 확인 클릭
10. 우측의 다운로드 버튼 클릭 (json 확장자의 키 파일이 다운로드 된다.)
11. 다운로드 받은 파일을 노트북과 같은 디렉토리에 위치하도록 파일을 이동 및 파일이름을 "client_secret.json"으로 변경

windows에서 아래의 에러가 발생하면 `no_cache = True` 옵션을 설정해 줍니다.
- FileNotFoundError: [Errno 2] No such file or directory:
    - gc = pygsheets.authorize(outh_file='client_secret.json', no_cache = True)

In [4]:
# 아래 코드를 실행하면 auth 인증창이 실행되고 로그인후에 허용을 하면 access_token을 받아온다.
gc = pygsheets.authorize(outh_file=\
                        'client_secret_1079143501749-i1btbeeb48dds4clsu70duv6rvsjkun8.apps.googleusercontent.com.json')
gc

<pygsheets.client.Client at 0x117539c18>

#### 3. open sheet
- 구글 드라이브로 가서 새로운 시트를 만듭니다.
- 시트 파일 이름으로 시트를 오픈합니다.
- open 함수에 시트의 이름을 파라미터로 넣어 구글 드라이버에 있는 시트 파일을 아래와 같이 열수 있습니다.
- sh로 오픈한 시트 파일의 시트는 sh.sheet1으로 첫번째 시트를 가져올수 있습니다.
- 처음에는 항상 첫번째 시트를 가져오고 selecting기능으로 다른 시트에 접근할수 있습니다.

In [8]:
sh = gc.open('fc-email') # 파일 열기 (sh : 전체 시트에 대한 객체)

In [9]:
sheet1 = sh.sheet1 # 시트 접근 (sheet1 : 첫번째 시트에 대한 객체)
sheet1

<Worksheet '이메일 시트' index:0>

#### 4. create sheet
- 시트 생성
- add_worksheet 함수를 이용하여 생성할 시트이름, 행과 열의 크기를 파라미터로 넘겨 새로운 시트를 생성할수 있습니다.

In [10]:
# 5칸, 20줄을 가지는 new_sheet라는 이름의 새로운 시트를 생성하여 sheet2라는 변수에 넣어줌
sheet2 = sh.add_worksheet("new_sheet", rows=20, cols=5)
sheet2

<Worksheet 'new_sheet' index:1>

#### 5. copy sheet
- 시트 복사
- add_worksheet를 이용하여 src_worksheet 파라미터에 복사할 시트를 파라미터로 넘기면 새로운 시트를 생성할때 src_worksheet에 설정한 시트가 복사 됩니다.

In [11]:
# sheet1을 복사하여 email_copied라는 title의 새로운 시트를 생성하여 sheet3이라는 변수에 넣어줌
sheet3 = sh.add_worksheet("email_copied", src_worksheet = sheet1)
sheet3

<Worksheet 'email_copied' index:2>

#### 6. delete sheet
- 시트 삭제
- del_worksheet에 삭제한 시트 객체를 파라미터로 넘기면 해당 시트가 삭제됩니다.

In [12]:
# sheet3 변수가 가지는 sheet를 삭제
sh.del_worksheet(sheet3)

#### 7. selecting  sheet
- 시트가 모여있는 객체인 sh 객체에서 원하는 시트하나에 대한객체를 선택해서 가져오는 방법입니다.
- 제목과 순서에 대한 값으로 시트를 가져올수 있습니다.

In [14]:
# 모든 시트 리스트로 가져오기
sheet_list = sh.worksheets()
sheet_list

[<Worksheet '이메일 시트' index:0>, <Worksheet 'new_sheet' index:1>]

In [15]:
# 시트 제목으로 가져오기
new_sheet = sh.worksheet_by_title("new_sheet")
print(new_sheet)

<Worksheet 'new_sheet' index:1>


In [16]:
# index로 시트 가져오기
sheet0 = sh.worksheet("index", 0)
print(sheet0)

<Worksheet '이메일 시트' index:0>


In [24]:
# 위에 저장한 첫번째 시트인 sheet1과 같은지 확인하기
sheet0 == sheet1 # object 사이의 주소값을 비교

True

In [18]:
# offset으로 가져오기
sheet0 = sh[0]
print(sheet0)

<Worksheet '이메일 시트' index:0>


In [19]:
# 위에 저장한 첫번째 시트인 sheet1과 같은지 확인하기
sheet0 == sheet1

True

#### 8. get values

In [25]:
# 전체 데이터 리스트로 가져오기 (딕셔너리타입)
sheet1.get_all_records()

[{'순번': 1, '이름': '박두진', '이메일': 'pdj1224@gmail.com'},
 {'순번': 2, '이름': '손원철', '이메일': 'dnjscjf92@ajou.ac.kr'},
 {'순번': 3, '이름': '곽규리', '이메일': 'uiopl4@ajou.ac.kr'}]

In [41]:
# rows와 columns 설정
sh[0].rows = 10
sh[0].cols = 3

In [27]:
# 모든 데이터 행렬로 가져오기 (리스트타입)
all_data_sheet1 = sheet1.get_all_values(returnas='matrix')
all_data_sheet1

[['순번', '이름', '이메일'],
 ['1', '박두진', 'pdj1224@gmail.com'],
 ['2', '손원철', 'dnjscjf92@ajou.ac.kr'],
 ['3', '곽규리', 'uiopl4@ajou.ac.kr']]

In [29]:
# 위치를 지정하여 행렬 형태로 데이터 가져오기
some_data_sheet1 = sheet1.get_values(start=(3,2), end=(4,3), returnas='matrix')
some_data_sheet1

[['손원철', 'dnjscjf92@ajou.ac.kr'], ['곽규리', 'uiopl4@ajou.ac.kr']]

In [33]:
# "시트[행][열]"과 같은 방법으로 특정 셀의 데이터를 가져올수 있습니다.
value = sheet1[2]
value

['2', '손원철', 'dnjscjf92@ajou.ac.kr']

In [34]:
value = sheet1[2][1]
value

'손원철'

In [37]:
# 문자열 찾기 (C2 - 3번째 열, 2번째 줄)
cell_list = sh[0].find("곽규리")
print(cell_list)

[<Cell B4 '곽규리'>]


In [38]:
# 특정 문자열이 있는 셀을 찾아서 다른 문자열로 바꾸기
cell_list = sh[0].find("pdj1224@gmail.com", replace="radajin1224@gmail.com")
cell_list

[<Cell C2 'radajin1224@gmail.com'>]

In [43]:
# csv 파일로 export하기
pygsheets.ExportType.CSV

<ExportType.CSV: 'text/csv:.csv'>

In [44]:
sheet1.export(pygsheets.ExportType.CSV, filename="sheet1.csv")

sheet1.csv


#### 9. Update & Insert

In [45]:
# A1에서 C4까지의 위치에 some_data_sheet1 데이터로 업데이트함
# some_data_sheet1에는 [['박두진', 'pdj1224@gmail.com'], ['손원철', 'dnjscjf92@ajou.ac.kr']] 데이터가 들어있음으로 4개의 value가 들어감
sh[1].update_cells(crange='A1:C4', values=some_data_sheet1)

In [46]:
# sh[1] 위치에 있는 두번째 시트에 대한 모든 데이터를 가져옴
all_data_sheet2 = sh[1].get_all_values()
all_data_sheet2

[['손원철', 'dnjscjf92@ajou.ac.kr', '', '', ''],
 ['곽규리', 'uiopl4@ajou.ac.kr', '', '', '']]

In [47]:
# 4번째줄 아래로 2줄 삽입 (5,6번째줄에 데이터 삽입)
sh[1].insert_rows(row=4, number=2, values=all_data_sheet2)

In [48]:
# 시트의 열과 행을 재설정해줌
sh[1].rows = 7
sh[1].cols = 2

In [49]:
# 반복문을 통해 한줄씩 읽어 올수 있음
for row in sh[1]:
    print(row)

['손원철', 'dnjscjf92@ajou.ac.kr']
['곽규리', 'uiopl4@ajou.ac.kr']
['', '']
['', '']
['손원철', 'dnjscjf92@ajou.ac.kr']
['곽규리', 'uiopl4@ajou.ac.kr']


In [50]:
# 시트의 제목을 업데이트
sh[1].title = "NewSheet"

In [60]:
# 시트의 마지막 데이터를 찾아 마지막 데이터의 아래에 데이터를 추가
sh[1].append_table(values=["박두진","pdj1224@gmail.com"])

In [61]:
sh[1].rows

7

In [30]:
# 시트 내용 모두 삭제하기
sh[1].clear()

#### 10. change to pandas
- google sheet를 데이터 분석을 위한 파이썬 패키지인 pandas의 DataFrame으로 변환할수 있다.

In [62]:
sheet1

<Worksheet '이메일 시트' index:0>

In [75]:
df = sheet1.get_as_df()
df

Unnamed: 0,순번,이름,이메일
0,1,박두진,radajin1224@gmail.com
1,2,손원철,dnjscjf92@ajou.ac.kr
2,3,곽규리,uiopl4@ajou.ac.kr


In [76]:
# csv 파일로 저장
df.to_csv("email.csv", index=False)

In [77]:
# csv 파일 읽어오기
df = pd.read_csv("email.csv")
df

Unnamed: 0,순번,이름,이메일
0,1,박두진,radajin1224@gmail.com
1,2,손원철,dnjscjf92@ajou.ac.kr
2,3,곽규리,uiopl4@ajou.ac.kr


#### 11. Cell

In [78]:
# sheet1을 cell_test 시트를 만들어 복사한다.
test_sheet = sh.add_worksheet("cell_test", src_worksheet=sheet1)
test_sheet

<Worksheet 'cell_test' index:2>

In [82]:
# 특정 셀의 객체 가져오기
b3 = test_sheet.cell('B3')

# 셀 값 확인
print(b3.value)

손원철


In [83]:
# b2 객체의 3번째 칸의 데이터를 b2에 할당
b3.col = 3

# 셀 값 확인
print(b3.value)

dnjscjf92@ajou.ac.kr


In [84]:
# b2에 해당하는 위치의 데이터를 "radajin1224@gmail.com"로 바꿈
b3.value = "pdj1224@gmail.com"
b3.value

'pdj1224@gmail.com'

In [85]:
# C3 위치의 데이터를 'radajin1224@gmail.com'로 업데이트함
test_sheet.update_cell('C3', 'dnjscjf92@ajou.ac.kr')

In [86]:
# A1에서 C4의 셀 리스트 가져옴
cell_list = test_sheet.range('A1:C4')
print(cell_list)

[[<Cell A1 '순번'>, <Cell B1 '이름'>, <Cell C1 '이메일'>], [<Cell A2 '1'>, <Cell B2 '박두진'>, <Cell C2 'radajin1224@gmail.com'>], [<Cell A3 '2'>, <Cell B3 '손원철'>, <Cell C3 'dnjscjf92@ajou.ac.kr'>], [<Cell A4 '3'>, <Cell B4 '곽규리'>, <Cell C4 'uiopl4@ajou.ac.kr'>]]


In [88]:
cell_list[3][2].value = '규리 이메일'

In [89]:
# A1에서 C4의 셀 리스트 가져옴
cell_list = test_sheet.get_values('A1','C4', returnas='cells')
print(cell_list)

[[<Cell A1 '순번'>, <Cell B1 '이름'>, <Cell C1 '이메일'>], [<Cell A2 '1'>, <Cell B2 '박두진'>, <Cell C2 'radajin1224@gmail.com'>], [<Cell A3 '2'>, <Cell B3 '손원철'>, <Cell C3 'dnjscjf92@ajou.ac.kr'>], [<Cell A4 '3'>, <Cell B4 '곽규리'>, <Cell C4 '규리 이메일'>]]


In [91]:
# 두번째 줄의 셀 리스트 가져옴
cell_list = test_sheet.get_row(3, returnas='cells')
print(cell_list)

[<Cell A3 '2'>, <Cell B3 '손원철'>, <Cell C3 'dnjscjf92@ajou.ac.kr'>]


In [94]:
%%time
cell = test_sheet.cell('C2')

# 노트 추가
cell.note = "this is email data."

# 셀 배경 색상 변경 (Red, Green, Blue, Alpha
cell.color = (1.0,0.7,0.0,1.0) 

# 텍스트 포멧 변경
cell.text_format['fontSize'] = 12
cell.text_format['bold'] = True

# sync the changes
cell.update()

CPU times: user 147 ms, sys: 9.24 ms, total: 156 ms
Wall time: 1.72 s


#### 12. Share

In [95]:
# add
# 'owner','writer','commenter','reader'
sh.share("radajin1224@gmail.com", role='reader')

In [96]:
# remove
sh.remove_permissions("radajin1224@gmail.com")

''

In [97]:
# add
# 'owner','writer','commenter','reader'
sh.share("radajin1224@gmail.com", role='writer')

In [98]:
# remove
sh.remove_permissions("radajin1224@gmail.com")

''

#### 13. delete sheet

In [99]:
sh.del_worksheet(sh[1])

In [100]:
sh.del_worksheet(sh[0])

#### 14. seaborn에서 iris 데이터를 가져와서 구글 데이터 시트에 넣기

In [101]:
import seaborn as sns
iris = sns.load_dataset("iris")
iris.tail()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
145,6.7,3.0,5.2,2.3,virginica
146,6.3,2.5,5.0,1.9,virginica
147,6.5,3.0,5.2,2.0,virginica
148,6.2,3.4,5.4,2.3,virginica
149,5.9,3.0,5.1,1.8,virginica


In [102]:
# 새로운 시트 만들기
iris_sheet = sh.add_worksheet("iris")

In [103]:
iris_sheet.set_dataframe(iris, 'A1', copy_index=True) # (df, cell_start)

---

In [13]:
bigcon_sh = gc.open('2018 빅콘 - 포화란') # 파일 열기 (sh : 전체 시트에 대한 객체)

In [23]:
bigcon_sh.worksheet('index',3)

<Worksheet '손원철 - 모델링' index:3>