# HOME ASSIGNMENT #3: SLACK API - TO GSHEET
**Mục đích của bài Assignment**
- Lấy thông tin các Users từ Slack của DataCracy (BTC, Mentors và Learners)
- `**[Optional 1]**` Đưa danh sách Users lên Google Spreadsheet, để theo dõi 
- `**[Optional 2]**` Lấy thông tin Assignment Submission và số Reviews trên `#atom-assignmentnt2` và cập nhật lên Spreadsheet, để theo dõi các học viên đã nộp bài và được review

**Các kiến thức sẽ áp dụng**
- Ôn lại và luyện tập thêm về concept API (cụ thể sử dụng API Slack)
- Trích xuất thông tin từ JSON
- Dùng module gspread để đưa thông tin lên Google Spreadsheet

## 0. Load Modules

In [143]:
import requests #-> Để gọi API
import re #-> Để xử lý data dạng string
from datetime import datetime as dt #-> Để xử lý data dạng datetime
import gspread #-> Để update data lên Google Spreadsheet
from gspread_dataframe import set_with_dataframe #-> Để update data lên Google Spreadsheet
import pandas as pd #-> Để update data dạng bản
import json 
from oauth2client.service_account import ServiceAccountCredentials #-> Để nhập Google Spreadsheet Credentials
import os

## 1. Slack API: User List
* Bạn có thể đọc lại về concept API [HERE](https://anhdang.gitbook.io/datacracy/atom/3-data-tools-2/3.2-spotify-api-and-postman)
* Assignment này sẽ dùng Slack API để lấy thông tin về Learners và theo dõi các bài tập đã nộp và được review (sau đó cập nhật lên Google Spreadsheet)
* ===> **NOTICE**: Slack API authorize bằng Bearer Token `xoxb-...-...-...` (Sẽ được cung cấp riêng)
* Update file `env_variable.json` như trong [Assignment#2](../assignment_2/home_assignment_2.ipynb)
* ==> Nếu bạn dùng Google Colab, upload file vào Colab ([Hướng dẫn](https://colab.research.google.com/notebooks/io.ipynb))

In [144]:
!ls

env_variables.json  home_assignment_3.ipynb  README.md	slack-bot-key.json


In [145]:
with open('env_variables.json', 'r') as j:
    json_data = json.load(j)
    print(json_data)

{'SENDER_EMAIL': 'cnhhoang850@gmail.com', 'PWD_EMAIL': 'eetwbhkppxphpvfs', 'WEATHER_API_KEY': '8ddaf824d7e377a591bb83034fbbec1a', 'SLACK_BEARER_TOKEN': 'xoxb-1381900565698-2074738241732-2FEKCWh9z1rxh11YyIC1WOjN'}


In [146]:
## Load SLACK_BEARER_TOKEN
os.environ['SLACK_BEARER_TOKEN'] = json_data['SLACK_BEARER_TOKEN'] 

In [147]:
## Gọi API từ Endpoints (Input - Token được đưa vào Headers)
## Challenge: Thử gọi API này bằng Postman
endpoint = "https://slack.com/api/users.list"
headers = {"Authorization": "Bearer {}".format(os.environ['SLACK_BEARER_TOKEN'])}
response_json = requests.post(endpoint, headers=headers).json() 
print(response_json)
user_dat = response_json['members']

{'ok': True, 'members': [{'id': 'USLACKBOT', 'team_id': 'T01B7SGGMLJ', 'name': 'slackbot', 'deleted': False, 'color': '757575', 'real_name': 'Slackbot', 'tz': 'America/Los_Angeles', 'tz_label': 'Pacific Daylight Time', 'tz_offset': -25200, 'profile': {'title': '', 'phone': '', 'skype': '', 'real_name': 'Slackbot', 'real_name_normalized': 'Slackbot', 'display_name': 'Slackbot', 'display_name_normalized': 'Slackbot', 'fields': None, 'status_text': '', 'status_emoji': '', 'status_expiration': 0, 'avatar_hash': 'sv41d8cd98f0', 'always_active': True, 'first_name': 'slackbot', 'last_name': '', 'image_24': 'https://a.slack-edge.com/80588/img/slackbot_24.png', 'image_32': 'https://a.slack-edge.com/80588/img/slackbot_32.png', 'image_48': 'https://a.slack-edge.com/80588/img/slackbot_48.png', 'image_72': 'https://a.slack-edge.com/80588/img/slackbot_72.png', 'image_192': 'https://a.slack-edge.com/80588/marketing/img/avatars/slackbot/avatar-slackbot.png', 'image_512': 'https://a.slack-edge.com/8058

### TODO #1
Hoàn tất đoạn code sau

In [148]:
## Loop qua JSON file và extract các thông tin quan trọng (id, name, display_name, real_name_normalized, title, phone, is_bot)
## Hint: Bạn có thể dùng Postman hoặc in user_dat JSON để xem cấu trúc (schema), dùng Ctrl+F để tìm các keys (id, name, display_name, real_name_normalized, title, phone, is_bot)
user_dict = {'user_id':[], 'name':[], 'display_name':[],'real_name':[],'title':[],'phone':[],'is_bot':[]}
for i in range(len(user_dat)):
  user_dict['user_id'].append(user_dat[i]['id'])
  user_dict['name'].append(user_dat[i]['name'])
  user_dict['display_name'].append(user_dat[i]['profile']['display_name'])
  user_dict['real_name'].append(user_dat[i]['profile']['real_name_normalized'])
  user_dict['title'].append(user_dat[i]['profile']['title'])
  user_dict['phone'].append(user_dat[i]['profile']['phone'])
  user_dict['is_bot'].append(user_dat[i]['is_bot'])

In [168]:
user_df = pd.DataFrame(user_dict) ## Dùng pandas để convert dictionaries thành bảng
user_df.head(10)
print(user_df) ## Chỉ in 5 dòng đầu (chủ yếu để xem cấu trúc)

        user_id               name       display_name            real_name  \
0     USLACKBOT           slackbot           Slackbot             Slackbot   
1   U01AT4T75JB     loclexuan26392        Loc Le Xuan          Loc Le Xuan   
2   U01AVDY7JET           locle.ds        Loc Le Xuan          Loc Le Xuan   
3   U01BE2PR6LU     maianhdang.ftu                MAD   Dặng Huỳnh Mai Anh   
4   U01C48T7S1J  huyenhoang.design  Thanh Huyen Hoang    Thanh Huyen Hoang   
..          ...                ...                ...                  ...   
64  U021NF9FMPH           ngochant                                ngochant   
65  U021TFMH1RU      mquang.151999       Quang Nguyen         Quang Nguyen   
66  U021Y57RMN1           lamlv723             Lâm Lê               Lam Le   
67  U02246KN5D1  conversationslist                     /conversations.list   
68  U0226MQ73MJ                mad                                     MAD   

                 title phone  is_bot  
0                       

In [150]:
user_df[user_df.display_name == 'MAD'] ## Lọc thông tin của MAD, trên DataFrame (bạn có thể Google thêm)

Unnamed: 0,user_id,name,display_name,real_name,title,phone,is_bot
3,U01BE2PR6LU,maianhdang.ftu,MAD,Dặng Huỳnh Mai Anh,Technical Contents,,False


-------------- HẾT PHẦN BẮT BUỘC ---------------------

## Option 1: Update data => Google SpreadSheet

### TODO#2
Tạo service account (output là file json), file này để cho phép ta access vào Google Spreadsheet:

1. Làm theo hướng dẫn: [Google Create a Service Account](https://support.google.com/a/answer/7378726?hl=en)
![google_service_account](../img/google_service_account.png)
2. Lưu file JSON (chứa credential về máy)
![gservice_acc_json](../img/gservice_acc_json.png)
3. Nhớ Enable [Google Drive API](https://console.cloud.google.com/marketplace/product/google/drive.googleapis.com?q=search&referrer=search&project=quickstart-313303) (Nếu bạn chạy code báo lỗi chưa enable API thì vào link trong phần lỗi để Enable, sau khi kích hoạt có thể cần vài phút để chạy được)
![enable_api](../img/enable_api.png)
* ==> Upload file Gsheet Credential JSON nếu bạn dùng Colab 
* ==> Nếu bạn để key trong repo git, **NHỚ** để file json vào `.gitignore` để không bị leaked key)


In [151]:
!ls

env_variables.json  home_assignment_3.ipynb  README.md	slack-bot-key.json


In [152]:
## Authorize bằng JSON
scope = ['https://spreadsheets.google.com/feeds',
         'https://www.googleapis.com/auth/drive']
credentials = ServiceAccountCredentials.from_json_keyfile_name(
    'slack-bot-key.json', scope)
gc = gspread.authorize(credentials)
print("DONE!")

DONE!


**Tạo Spreadsheet**

1. Tạo Spreadsheet trên google
2. Invite account trong `client_email` (file JSON Gsheet Credential bên trên) vào Spreadsheet (quyền Editor)
![enable_api](../img/enable_api.png)
3. Lấy `SPREADSHEET_KEY` (nằm trong chính URL của Spreadhstee): `https://docs.google.com/spreadsheets/d/<SPREADSHEET_KEY>/edit#gid=0`

![add_gsheet](../img/add_gsheet.png)

In [153]:
# ACCES GOOGLE SHEET
sheet_index_no = 0
spreadsheet_key = '1mrHOuXzCOtgsIPQcm-pg8VK6uE3DM91u-RGXO_Vfexs' # input SPREADSHEET_KEY HERE
sh = gc.open_by_key(spreadsheet_key)
worksheet = sh.get_worksheet(sheet_index_no) #-> 0 - first sheet, 1 - second sheet etc. 

# APPEND DATA TO SHEET
set_with_dataframe(worksheet, user_df) #-> Upload user_df vào Sheet đầu tiên trong Spreadsheet

# DONE: Bây giờ bạn có thể mở spreadsheet và kiểm tra nội dung đã update chứ

![slack_user_gsheet](../img/slack_user_gsheet.png)

-------------- HẾT PHẦN OPTION 1 ---------------------

## Option 2: Ai đã nộp bài?


### Slack API: Channel List

In [154]:
## Gọi SLACK API để list tất cả các channel
endpoint = "https://slack.com/api/conversations.list"
headers = {"Authorization": "Bearer {}".format(os.environ['SLACK_BEARER_TOKEN'])}
response = requests.post(endpoint, headers=headers).json() 
channel_ls = response['channels']

In [155]:
channel_ls[0] ## Thử extract record đầu tiên để xem schema  => name: general, id: C01B4PVGLVB

{'id': 'C01B4PVGLVB',
 'name': 'general',
 'is_channel': True,
 'is_group': False,
 'is_im': False,
 'created': 1600856703,
 'is_archived': False,
 'is_general': True,
 'unlinked': 0,
 'name_normalized': 'general',
 'is_shared': False,
 'parent_conversation': None,
 'creator': 'U01BE2PR6LU',
 'is_ext_shared': False,
 'is_org_shared': False,
 'shared_team_ids': ['T01B7SGGMLJ'],
 'pending_shared': [],
 'pending_connected_team_ids': [],
 'is_pending_ext_shared': False,
 'is_member': False,
 'is_private': False,
 'is_mpim': False,
 'topic': {'value': '', 'creator': '', 'last_set': 0},
 'purpose': {'value': 'This is the one channel that will always include everyone. It’s a great spot for announcements and team-wide conversations.',
  'creator': 'U01BE2PR6LU',
  'last_set': 1600856703},
 'previous_names': [],
 'num_members': 63}

In [156]:
#TODO 3
for i in channel_ls:
    if i['name'] == 'atom-assignment2':
        print(i)

{'id': 'C021FSDN7LJ', 'name': 'atom-assignment2', 'is_channel': True, 'is_group': False, 'is_im': False, 'created': 1620677142, 'is_archived': False, 'is_general': False, 'unlinked': 0, 'name_normalized': 'atom-assignment2', 'is_shared': False, 'parent_conversation': None, 'creator': 'U01BE2PR6LU', 'is_ext_shared': False, 'is_org_shared': False, 'shared_team_ids': ['T01B7SGGMLJ'], 'pending_shared': [], 'pending_connected_team_ids': [], 'is_pending_ext_shared': False, 'is_member': True, 'is_private': False, 'is_mpim': False, 'topic': {'value': 'Assigment#2 - Mailbot, API, Web Scrapping', 'creator': 'U01BE2PR6LU', 'last_set': 1621074502}, 'purpose': {'value': 'Where learners submit assignments and give review for others', 'creator': 'U01BE2PR6LU', 'last_set': 1621074519}, 'previous_names': [], 'num_members': 39}


### TODO#3 
* Tìm id của channel #atom-assignment2

### Slack API: List messages trong 1 channel

In [157]:
endpoint = "https://slack.com/api/conversations.history"
data = {"channel": "C01U6P7LZ8F"} ## This is ID of assignment#1 channel
headers = {"Authorization": "Bearer {}".format(os.environ['SLACK_BEARER_TOKEN'])}

In [158]:
response_json = requests.post(endpoint, data=data, headers=headers).json()
msg_ls = response_json['messages']

In [159]:
msg_ls[21]

{'client_msg_id': '16a573fd-377c-4713-9045-818f1fe64ae4',
 'type': 'message',
 'text': 'Chào mọi người, mình gửi assignment 1: Task 1:\xa0<https://docs.google.com/spreadsheets/d/1O3sH0lT7hPcR2AWq9MYkGmbdnK1oNPgBgNdcHcaoQrU/edit#gid=1677392585>\xa0\nTask 2:\xa0<https://colab.research.google.com/drive/1wmEYMAaGCw0OzSzOVLD9rwxvkk8gr4z5#scrollTo=2BGRX19L6fgb>\xa0\nTask 3:\xa0<https://github.com/vietqh/datacracy-atom-HoangQuocViet>',
 'user': 'U01U6JM6LEB',
 'ts': '1619226537.041400',
 'team': 'T01B7SGGMLJ',
 'attachments': [{'fallback': 'vietqh/datacracy-atom-HoangQuocViet',
   'title': 'vietqh/datacracy-atom-HoangQuocViet',
   'id': 1,
   'color': '24292f',
   'fields': [{'title': 'Language',
     'value': 'Jupyter Notebook',
     'short': True},
    {'title': 'Last updated', 'value': '28 minutes ago', 'short': True}],
   'bot_id': 'B01UQU8E2A3',
   'app_unfurl_url': 'https://github.com/vietqh/datacracy-atom-HoangQuocViet',
   'is_app_unfurl': True}],
 'blocks': [{'type': 'rich_text',
   

In [160]:
not_learners_id = ['U01BE2PR6LU']

In [161]:
## Summarize all submitted assignments + reviews cnt
not_learners_id = ['U01BE2PR6LU'] # -> Remove MA from the user_id
msg_lk = []
msg_dict = {'github': [], 'reply_count': [], 'reply_users_count': [], 'reply_users': [], 'latest_reply':[] } 
for i in range(len(msg_ls)):
  ts = dt.fromtimestamp(float(msg_ls[i]['ts'])) # -> Convert timestamp Epoch thành dàng dễ đọc
  user = msg_ls[i]['user'] # -> Lấy thông tin người post messages
  if msg_ls[i]['user'] not in not_learners_id:
    if 'attachments' in msg_ls[i].keys():
      text = msg_ls[i]['text']
      github_link = re.findall('(?:https?://)?(?:www[.])?github[.]com/[\w-]+/?', text) #-> Submission là các message có link github
      print(msg_ls[i])
      if len(github_link) > 0: msg_dict['github'].append(github_link[0])
      if 'reply_count' in msg_ls[i].keys(): msg_dict['reply_count'].append(msg_ls[i]['reply_count']) #-> Extract số review
      if 'reply_users_count' in msg_ls[i].keys(): msg_dict['reply_users_count'].append(msg_ls[i]['reply_users_count'])
      if 'reply_users' in msg_ls[i].keys(): msg_dict['reply_users'].append(msg_ls[i]['reply_users'])
      if 'latest_reply' in msg_ls[i].keys(): msg_dict['latest_reply'].append(dt.fromtimestamp(float(msg_ls[i]['latest_reply'])))


msg_df = pd.DataFrame(msg_dict)

print(msg_df)

{'client_msg_id': 'D86A48D2-D953-4504-92BF-D9240B2549A8', 'type': 'message', 'text': 'Hi all,\nMình gửi lại assignment phần 1 nhé\nTask 1: <https://docs.google.com/spreadsheets/d/1YUHbEJehnRlGHfsaqvgz3Mf0fYFMjCHgF4kz-WO2vQY/edit#gid=218077707|https://docs.google.com/spreadsheets/d/1YUHbEJehnRlGHfsaqvgz3Mf0fYFMjCHgF4kz-WO2vQY/edit#gid=218077707>\nTask 2: <https://colab.research.google.com/drive/13mN-OGyMoIeEbkdFdwl-LqWohjG5sqiN#scrollTo=exHP3hO_khL1|https://colab.research.google.com/drive/13mN-OGyMoIeEbkdFdwl-LqWohjG5sqiN#scrollTo=exHP3hO_khL1>\nTask 3: <https://github.com/danhpcv/datacracy-atom-danhpcv|https://github.com/danhpcv/datacracy-atom-danhpcv>', 'user': 'U01UJ9LG5U5', 'ts': '1620622306.004700', 'team': 'T01B7SGGMLJ', 'attachments': [{'fallback': 'danhpcv/datacracy-atom-danhpcv', 'title': 'danhpcv/datacracy-atom-danhpcv', 'id': 1, 'color': '24292f', 'fields': [{'title': 'Language', 'value': 'Jupyter Notebook', 'short': True}, {'title': 'Last updated', 'value': '17 days ago', 's

### TODO#4

* Tạo thành 1 bảng chứa các thông tin trên và update lên Spreadsheet (Sheet: Assignment#2 Submission)

In [173]:
## Summarize all submitted assignments + reviews cnt
not_learners_id = ['U01BE2PR6LU'] # -> Remove MA from the user_id
msg_lk = []
msg_dict = {'github': [], 'reply_count': [], 'reply_users_count': [], 'reply_users': [], 'latest_reply':[] } 
for i in range(len(msg_ls)):
  ts = dt.fromtimestamp(float(msg_ls[i]['ts'])) # -> Convert timestamp Epoch thành dàng dễ đọc
  user = msg_ls[i]['user'] # -> Lấy thông tin người post messages
  if msg_ls[i]['user'] not in not_learners_id:
    if 'attachments' in msg_ls[i].keys():
      text = msg_ls[i]['text']
      github_link = re.findall('(?:https?://)?(?:www[.])?github[.]com/[\w-]+/?', text) #-> Submission là các message có link github
      if len(github_link) > 0: msg_dict['github'].append(github_link[0])
      if 'reply_count' in msg_ls[i].keys(): msg_dict['reply_count'].append(msg_ls[i]['reply_count']) #-> Extract số review
      if 'reply_users_count' in msg_ls[i].keys(): msg_dict['reply_users_count'].append(msg_ls[i]['reply_users_count'])
      if 'reply_users' in msg_ls[i].keys(): msg_dict['reply_users'].append(msg_ls[i]['reply_users'])
      if 'latest_reply' in msg_ls[i].keys(): msg_dict['latest_reply'].append(dt.fromtimestamp(float(msg_ls[i]['latest_reply'])))


msg_df = pd.DataFrame(msg_dict)

print(msg_df.head(20))

# ACCES GOOGLE SHEET
sheet_index_no = 2
spreadsheet_key = '1mrHOuXzCOtgsIPQcm-pg8VK6uE3DM91u-RGXO_Vfexs' # input SPREADSHEET_KEY HERE
sh = gc.open_by_key(spreadsheet_key)
worksheet2 = sh.get_worksheet(sheet_index_no) #-> 0 - first sheet, 1 - second sheet etc. 
set_with_dataframe(worksheet2, msg_df)


                                   github  reply_count  reply_users_count  \
0             https://github.com/danhpcv/            2                  2   
1        https://github.com/auslynnguyen/            2                  2   
2             https://github.com/hoaintp/            1                  1   
3         https://github.com/Tenderriver/            2                  2   
4          https://github.com/saturn1101/            1                  1   
5   https://github.com/AnhThuNguyenHuynh/            2                  2   
6              https://github.com/vietqh/            1                  1   
7         https://github.com/vuthanhdatt/            1                  1   
8         https://github.com/TranPham-96/            2                  2   
9           https://github.com/annaho124/            1                  1   
10     https://github.com/minhnguyentk95/            1                  1   
11         https://github.com/lienanh264/            1                  1   

AttributeError: 'NoneType' object has no attribute 'row_count'

-------------- HẾT PHẦN OPTION 2 ---------------------