# Python для анализа данных

## API


## API YouTube

+ [Инструкция](https://sphenoid-aluminum-1ba.notion.site/API-YouTube-a1e2552472c246d295b6f1d1dbce5dcb) по получению ключа API YouTube
+ Официальная [документация](https://developers.google.com/youtube/v3/docs) к API YouTube
+ Статья на Хабр. [Что такое API?](https://habr.com/ru/post/464261/)
+ Статья на Хабр. [Что такое JSON](https://habr.com/ru/post/554274/)

API (Application programming interface) — это контракт, который предоставляет программа. Иными словами, это функции от разработчика, которые предоставлены в наше использование и распоряжение.

Сегодня попробуем потыкаться в API YouTube и вытащить какую-нибудь информацию. Но для этого нам нужен собственно доступ к API (ключ). Как его получить, можно узнать в [инструкции](https://sphenoid-aluminum-1ba.notion.site/API-YouTube-a1e2552472c246d295b6f1d1dbce5dcb).

In [1]:
# !pip install google-api-python-client
import googleapiclient.discovery as api

In [2]:
# Поскольку API-ключи привязаны к личным аккаунтам и хранят эту связь, не стоит выкладывать в открытый доступ ваш ключ.
# Я создала отдельный файл youtube_key.py, где задала константу YT_API_KEY и положила свой токен в виде строки.
# Получить свой токен: https://sphenoid-aluminum-1ba.notion.site/API-YouTube-a1e2552472c246d295b6f1d1dbce5dcb

from youtube_key import *
key = YT_API_KEY

In [3]:
# key = 'ВАШ КЛЮЧ'
youtube = api.build('youtube', 'v3', developerKey = key)

Далее используем запрос, который предлагается нам в самой документации. Этот тот момент, где вам не нужно задумываться о том, почему метод называется так и почему он хочет определенные параметры — просто так придумал разработчик.

### Видео по опеределенному запросу

Например, в самой [документации](https://developers.google.com/youtube/v3/docs/search/list?hl=en) про параметр `part` сказано Set the parameter value to snippet.

`maxResults` — сколько видео (максимально можно 50, но, спойлер, это ограничение можно обойти) \
`q` — запрос, который мы ищем \
`type` — пока мы ищем видео, но можно и каналы \
`order` — по релевантности (его можно убрать) \
Это все наш запрос с помощью метода .`search()`. Выгружаем его командой `.execute()`.

In [11]:
request_search = youtube.search().list(
    part = "snippet",
    maxResults = 10,
    q = "API with Python",
    type = 'video',
    order = 'relevance')

response_search = request_search.execute()
response_search

{'kind': 'youtube#searchListResponse',
 'etag': 'WeCP6FUeuMQITZ03z741czsmYog',
 'nextPageToken': 'CAoQAA',
 'regionCode': 'RU',
 'pageInfo': {'totalResults': 1000000, 'resultsPerPage': 10},
 'items': [{'kind': 'youtube#searchResult',
   'etag': '2Jp-NA9qeDhCQXj-KXnbUm9dgp0',
   'id': {'kind': 'youtube#video', 'videoId': 'zsYIw6RXjfM'},
   'snippet': {'publishedAt': '2023-05-23T13:00:53Z',
    'channelId': 'UC4JX40jDee_tINbkjycV4Sg',
    'title': 'Create A Python API in 12 Minutes',
    'description': 'Rapidly build and deploy APIs in seconds with DreamFactory ! https://bit.ly/3M1TAP7 Are you learning programming and ...',
    'thumbnails': {'default': {'url': 'https://i.ytimg.com/vi/zsYIw6RXjfM/default.jpg',
      'width': 120,
      'height': 90},
     'medium': {'url': 'https://i.ytimg.com/vi/zsYIw6RXjfM/mqdefault.jpg',
      'width': 320,
      'height': 180},
     'high': {'url': 'https://i.ytimg.com/vi/zsYIw6RXjfM/hqdefault.jpg',
      'width': 480,
      'height': 360}},
    'cha

Это просто словарь! А с ними вы работать уже умеете.

К слову, использование этого API **бесплатно**, но не бесконечно. Есть определенный лимит для одного ключа —10.000 у.е в день (например, запрос видео выше стоил нам 100 у.е). Подробнее об этом можно почитать в самой документации. Такое придумано в API YouTube (для других API может быть что-то свое или вообще не быть лимита).

Посмотрим, какие тут есть ключи:

In [12]:
response_search.keys()

dict_keys(['kind', 'etag', 'nextPageToken', 'regionCode', 'pageInfo', 'items'])

Из них нас интересуют только `nextPageToken`, `pageInfo`, `items`.

`nextPageToken` — адрес следующей страницы нашего поиска; до тех пор пока он есть в выдаче, мы можем собирать данные. \
`pageInfo` — сколько всего результатов и сколько всего результатов по нашему запросу. Если всего результатов очень много, то все вы не получите (так уж устроен API YouTube); можно исхитриться и в цикле делать запрос от и до определенной даты. \
`items` — все видео, которые мы нашли (у нас их десять).

In [13]:
print(type(response_search['items'])) # это список! 
print(len(response_search['items']))  # наши десять видео

<class 'list'>
10


Вытащим самое первое видео и посмотрим, что там.

In [14]:
response_search['items'][0]

{'kind': 'youtube#searchResult',
 'etag': '2Jp-NA9qeDhCQXj-KXnbUm9dgp0',
 'id': {'kind': 'youtube#video', 'videoId': 'zsYIw6RXjfM'},
 'snippet': {'publishedAt': '2023-05-23T13:00:53Z',
  'channelId': 'UC4JX40jDee_tINbkjycV4Sg',
  'title': 'Create A Python API in 12 Minutes',
  'description': 'Rapidly build and deploy APIs in seconds with DreamFactory ! https://bit.ly/3M1TAP7 Are you learning programming and ...',
  'thumbnails': {'default': {'url': 'https://i.ytimg.com/vi/zsYIw6RXjfM/default.jpg',
    'width': 120,
    'height': 90},
   'medium': {'url': 'https://i.ytimg.com/vi/zsYIw6RXjfM/mqdefault.jpg',
    'width': 320,
    'height': 180},
   'high': {'url': 'https://i.ytimg.com/vi/zsYIw6RXjfM/hqdefault.jpg',
    'width': 480,
    'height': 360}},
  'channelTitle': 'Tech With Tim',
  'liveBroadcastContent': 'none',
  'publishTime': '2023-05-23T13:00:53Z'}}

In [15]:
response_search['items'][0].keys()

dict_keys(['kind', 'etag', 'id', 'snippet'])

Тут нас интересуют ключи `id` и `snippet`.

* в `id` записано `'videoId'` (оно нам нужно, чтобы вытащить информацию о конкретном видео, например, статистику по лайкам или комментарии)
* `snippet` содержит основную информацию о видео (id канала, заголовок, описание).

In [16]:
response_search['items'][0]['id']['videoId']

'zsYIw6RXjfM'

К слову, само видео можно посмотреть так: https://www.youtube.com/watch?v=zsYIw6RXjfM. Обратите внимание, куда именно подставлятся наше id.

## Комментарии к определенному видео

Например, можно забрать комментарии определенного видео (а в перспективе — посмотреть их тональность). Поможет нам в этом метод `.commentThreads()`.

In [19]:
comment_request = youtube.commentThreads().list(
    part = 'snippet',
    videoId = "zsYIw6RXjfM"
)

comment_response = comment_request.execute()
comment_response

{'kind': 'youtube#commentThreadListResponse',
 'etag': '8P2k5uCmOoSwQicYKaVqV1-Dd80',
 'nextPageToken': 'QURTSl9pM05RTUZUQUJHbjhqYWYydUNsZnp1TF8tVlFNdXlhQXJBeVJ6bm5vSXkzb1VKc3lpMDZBNlFCM2ZTdndmenh1YXR2ZWRfXzJJNUcxMHcwUmFoWk14cWlKUm11',
 'pageInfo': {'totalResults': 20, 'resultsPerPage': 20},
 'items': [{'kind': 'youtube#commentThread',
   'etag': 'nDodmFc5JqjkcNlIhgU5cbboQsU',
   'id': 'Ugwv2of8WoJe24fHanB4AaABAg',
   'snippet': {'videoId': 'zsYIw6RXjfM',
    'topLevelComment': {'kind': 'youtube#comment',
     'etag': 'y2Z87uU69Ux9yL3CBeSPkp_pYLw',
     'id': 'Ugwv2of8WoJe24fHanB4AaABAg',
     'snippet': {'videoId': 'zsYIw6RXjfM',
      'textDisplay': 'Rapidly build and deploy APIs in seconds with DreamFactory ! <a href="https://bit.ly/3M1TAP7">https://bit.ly/3M1TAP7</a>',
      'textOriginal': 'Rapidly build and deploy APIs in seconds with DreamFactory ! https://bit.ly/3M1TAP7',
      'authorDisplayName': 'Tech With Tim',
      'authorProfileImageUrl': 'https://yt3.ggpht.com/ytc/AGIKg

In [21]:
for comment in comment_response['items']:
    print(comment['snippet']['topLevelComment']['snippet']['textOriginal'], '\n')

Rapidly build and deploy APIs in seconds with DreamFactory ! https://bit.ly/3M1TAP7 

not able to install flask tried changing the virtual environment as well
someone if faced the same issue please help 

An API is just an interface of callable functions. It can be a code library that simplifies some complex tasks, a web API (which is what this video talks about) or a bunch of functions that a running process on your computer exposes for other programs to interact with 

Thanks so much 

Great video like always Tim 👍🏽🍷 

instead of saying "underscore underscore" you can say "dunder" which is double underscore 

vary good video... Thanks 

api is not only for database, can be instructing other devices to do something, might not even need a reply. 

Great vid thanks. I think you might have missed some info if you can confirm. When you demo the GET request you're using the id:123, however we don't set that up so we can't repeat the steps as you have as you have presumably already created 

## Статистика по определенному видео
Последний метод в этом погружении в API YouTube — `.videos()`

In [22]:
video_request = youtube.videos().list(
    part = ['snippet', 'contentDetails', 'id', 'statistics'],
    id = 'zsYIw6RXjfM'
)

video_response = video_request.execute()
video_response

{'kind': 'youtube#videoListResponse',
 'etag': 'dCKbW2gCpji-jfFNfKEQnzLubdw',
 'items': [{'kind': 'youtube#video',
   'etag': 'ZvVJz_gLWQiInqcH0Ui-bFhxAVg',
   'id': 'zsYIw6RXjfM',
   'snippet': {'publishedAt': '2023-05-23T13:00:53Z',
    'channelId': 'UC4JX40jDee_tINbkjycV4Sg',
    'title': 'Create A Python API in 12 Minutes',
    'description': 'Rapidly build and deploy APIs in seconds with DreamFactory ! https://bit.ly/3M1TAP7\n\nAre you learning programming and wondering what an API is? An API is an Application Programming Interface that allows different software or systems to communicate with one another. I\'ll show you how to whip up your very own API in just 10 minutes using Python and Flask. \n\nPost Man API Platform: \nhttps://www.postman.com/\n\nFix Pip (Windows): \nhttps://www.youtube.com/watch?v=AdUZArA-kZw&t=204s\n\nFix Pip (Mac): \nhttps://www.youtube.com/watch?v=E-WhAS6qzsU\n\n💻 Master Blockchain and Web 3.0 development today by using BlockchainExpert: 🔗 https://algoexpe

Теперь попробуем собрать информацию о всех наших десяти видео!

In [23]:
video_ids = []

for video in response_search['items']:
    video_ids.append(video['id']['videoId'])
    
print(video_ids)

['zsYIw6RXjfM', '0sOvCWFmrtA', '0x0hOdvhCXU', 'hpc5jyVpUpw', 'qbLc5a9jdXo', '5ZMpbdK0uqU', 'fXa_2rllZTI', '-ykeT6kk4bk', '_k22Bs3zYyA', '-oPuGc05Lxs']


In [24]:
video_10_request = youtube.videos().list(
    part = ['snippet', 'contentDetails', 'id', 'statistics'],
    id = video_ids
)

video_10_response = video_10_request.execute()

In [25]:
video_10_response

{'kind': 'youtube#videoListResponse',
 'etag': 'x9kf98Y2xR_q_b8PHafrG4By970',
 'items': [{'kind': 'youtube#video',
   'etag': 'ZvVJz_gLWQiInqcH0Ui-bFhxAVg',
   'id': 'zsYIw6RXjfM',
   'snippet': {'publishedAt': '2023-05-23T13:00:53Z',
    'channelId': 'UC4JX40jDee_tINbkjycV4Sg',
    'title': 'Create A Python API in 12 Minutes',
    'description': 'Rapidly build and deploy APIs in seconds with DreamFactory ! https://bit.ly/3M1TAP7\n\nAre you learning programming and wondering what an API is? An API is an Application Programming Interface that allows different software or systems to communicate with one another. I\'ll show you how to whip up your very own API in just 10 minutes using Python and Flask. \n\nPost Man API Platform: \nhttps://www.postman.com/\n\nFix Pip (Windows): \nhttps://www.youtube.com/watch?v=AdUZArA-kZw&t=204s\n\nFix Pip (Mac): \nhttps://www.youtube.com/watch?v=E-WhAS6qzsU\n\n💻 Master Blockchain and Web 3.0 development today by using BlockchainExpert: 🔗 https://algoexpe

## Базовая обработка выгрузки из API

Чтобы привести это все в относительно приличный вид, сделаем таблицу. Поможет нам в этом модуль pandas, нам понадобится только один метод — `json_normalize()`.

In [26]:
import pandas as pd
table = pd.json_normalize(video_10_response['items'])
table

Unnamed: 0,kind,etag,id,snippet.publishedAt,snippet.channelId,snippet.title,snippet.description,snippet.thumbnails.default.url,snippet.thumbnails.default.width,snippet.thumbnails.default.height,...,contentDetails.duration,contentDetails.dimension,contentDetails.definition,contentDetails.caption,contentDetails.licensedContent,contentDetails.projection,statistics.viewCount,statistics.likeCount,statistics.favoriteCount,statistics.commentCount
0,youtube#video,ZvVJz_gLWQiInqcH0Ui-bFhxAVg,zsYIw6RXjfM,2023-05-23T13:00:53Z,UC4JX40jDee_tINbkjycV4Sg,Create A Python API in 12 Minutes,Rapidly build and deploy APIs in seconds with ...,https://i.ytimg.com/vi/zsYIw6RXjfM/default.jpg,120,90,...,PT12M5S,2d,hd,True,True,rectangular,125510,3565,0,60
1,youtube#video,3U5P15_vIhdYNxyl7Qg__3vyB3I,0sOvCWFmrtA,2021-11-01T13:11:23Z,UC8butISFwT-Wl7EV0hUK0BQ,Python API Development - Comprehensive Course ...,Learn Python API development in one of the mos...,https://i.ytimg.com/vi/0sOvCWFmrtA/default.jpg,120,90,...,PT19H27S,2d,hd,False,True,rectangular,1611342,43622,0,1718
2,youtube#video,211aeSNJ8nl_7sSOhOUMzaegh6M,0x0hOdvhCXU,2019-10-10T07:52:52Z,UCGuhp4lpQvK94ZC5kuOZbjA,Урок 4. Python. Быстрый старт. Изучаем API сер...,"Подробнее о курсе ""Python. Полное руководство""...",https://i.ytimg.com/vi/0x0hOdvhCXU/default.jpg,120,90,...,PT12M15S,2d,hd,False,False,rectangular,58359,959,0,28
3,youtube#video,jPnN2TJWV12bJCBCSOJxP6O4sr0,hpc5jyVpUpw,2019-11-02T14:00:09Z,UCF1dnm4HfA9LYQo9fVU5RKQ,Working with APIs in Python - Code in 10 Minutes,"In this video, I teach you the basics of APIs ...",https://i.ytimg.com/vi/hpc5jyVpUpw/default.jpg,120,90,...,PT8M41S,2d,hd,False,True,rectangular,264052,4530,0,108
4,youtube#video,JZzOmrfxt-HvqCKkCSVF1E4YRiw,qbLc5a9jdXo,2020-11-19T20:27:58Z,UCZUyPT9DkJWmS_DzdOi7RIA,REST API Crash Course - Introduction + Full Py...,💯 FREE Courses (100+ hours) - https://calcur.t...,https://i.ytimg.com/vi/qbLc5a9jdXo/default.jpg,120,90,...,PT52M50S,2d,hd,False,True,rectangular,683336,16737,0,591
5,youtube#video,FqzsvRFVkorq930v65OjgshknCs,5ZMpbdK0uqU,2021-01-27T08:30:00Z,UCuudpdbKmQWq2PPzYgVCWlA,Create your own Public API in Python Tutorial,Hey guys! In this video I'll be showing you ho...,https://i.ytimg.com/vi/5ZMpbdK0uqU/default.jpg,120,90,...,PT8M37S,2d,hd,False,True,rectangular,132379,2181,0,57
6,youtube#video,aVHOLgRyv1_PM73nPJcxbIcsJVo,fXa_2rllZTI,2022-06-02T13:45:01Z,UCSTYGpIpMIiQPspjLplB6Ow,Что такое API?,👉 Получи высокооплачиваемые знания в Merion Ac...,https://i.ytimg.com/vi/fXa_2rllZTI/default.jpg,120,90,...,PT6M5S,2d,hd,True,False,rectangular,214244,11576,0,295
7,youtube#video,2TjjaBoPFFMQRX8aWnm0ve2SE-o,-ykeT6kk4bk,2021-05-29T15:00:00Z,UC4JX40jDee_tINbkjycV4Sg,Python FAST API Tutorial,"Welcome back to my channel! In this video, I w...",https://i.ytimg.com/vi/-ykeT6kk4bk/default.jpg,120,90,...,PT58M20S,2d,hd,True,True,rectangular,253550,6767,0,239
8,youtube#video,-6E25tcSs9D_ayQjbnBC72GxM08,_k22Bs3zYyA,2023-07-04T16:10:08Z,UCbjozK_PYCTLEluFlrJ8UZg,FULL STACK PYTHON Offline Training @ DURGASOFT,FULL STACK PYTHON Offline Training @ DURGASOFT...,https://i.ytimg.com/vi/_k22Bs3zYyA/default.jpg,120,90,...,PT34S,2d,hd,False,True,rectangular,45,0,0,0
9,youtube#video,AopqYU1vlUP4Yqp9KSOWACHEhHg,-oPuGc05Lxs,2021-06-20T17:00:00Z,UC8tgRQ7DOzAbn9L7zDL8mLg,Working With APIs in Python - Pagination and D...,In this video I will show you how to work with...,https://i.ytimg.com/vi/-oPuGc05Lxs/default.jpg,120,90,...,PT22M36S,2d,hd,False,True,rectangular,62748,1815,0,103


In [27]:
table['statistics.viewCount'] = pd.to_numeric(table['statistics.viewCount'])

In [28]:
table.sort_values(by = 'statistics.viewCount', ascending = False)

Unnamed: 0,kind,etag,id,snippet.publishedAt,snippet.channelId,snippet.title,snippet.description,snippet.thumbnails.default.url,snippet.thumbnails.default.width,snippet.thumbnails.default.height,...,contentDetails.duration,contentDetails.dimension,contentDetails.definition,contentDetails.caption,contentDetails.licensedContent,contentDetails.projection,statistics.viewCount,statistics.likeCount,statistics.favoriteCount,statistics.commentCount
1,youtube#video,3U5P15_vIhdYNxyl7Qg__3vyB3I,0sOvCWFmrtA,2021-11-01T13:11:23Z,UC8butISFwT-Wl7EV0hUK0BQ,Python API Development - Comprehensive Course ...,Learn Python API development in one of the mos...,https://i.ytimg.com/vi/0sOvCWFmrtA/default.jpg,120,90,...,PT19H27S,2d,hd,False,True,rectangular,1611342,43622,0,1718
4,youtube#video,JZzOmrfxt-HvqCKkCSVF1E4YRiw,qbLc5a9jdXo,2020-11-19T20:27:58Z,UCZUyPT9DkJWmS_DzdOi7RIA,REST API Crash Course - Introduction + Full Py...,💯 FREE Courses (100+ hours) - https://calcur.t...,https://i.ytimg.com/vi/qbLc5a9jdXo/default.jpg,120,90,...,PT52M50S,2d,hd,False,True,rectangular,683336,16737,0,591
3,youtube#video,jPnN2TJWV12bJCBCSOJxP6O4sr0,hpc5jyVpUpw,2019-11-02T14:00:09Z,UCF1dnm4HfA9LYQo9fVU5RKQ,Working with APIs in Python - Code in 10 Minutes,"In this video, I teach you the basics of APIs ...",https://i.ytimg.com/vi/hpc5jyVpUpw/default.jpg,120,90,...,PT8M41S,2d,hd,False,True,rectangular,264052,4530,0,108
7,youtube#video,2TjjaBoPFFMQRX8aWnm0ve2SE-o,-ykeT6kk4bk,2021-05-29T15:00:00Z,UC4JX40jDee_tINbkjycV4Sg,Python FAST API Tutorial,"Welcome back to my channel! In this video, I w...",https://i.ytimg.com/vi/-ykeT6kk4bk/default.jpg,120,90,...,PT58M20S,2d,hd,True,True,rectangular,253550,6767,0,239
6,youtube#video,aVHOLgRyv1_PM73nPJcxbIcsJVo,fXa_2rllZTI,2022-06-02T13:45:01Z,UCSTYGpIpMIiQPspjLplB6Ow,Что такое API?,👉 Получи высокооплачиваемые знания в Merion Ac...,https://i.ytimg.com/vi/fXa_2rllZTI/default.jpg,120,90,...,PT6M5S,2d,hd,True,False,rectangular,214244,11576,0,295
5,youtube#video,FqzsvRFVkorq930v65OjgshknCs,5ZMpbdK0uqU,2021-01-27T08:30:00Z,UCuudpdbKmQWq2PPzYgVCWlA,Create your own Public API in Python Tutorial,Hey guys! In this video I'll be showing you ho...,https://i.ytimg.com/vi/5ZMpbdK0uqU/default.jpg,120,90,...,PT8M37S,2d,hd,False,True,rectangular,132379,2181,0,57
0,youtube#video,ZvVJz_gLWQiInqcH0Ui-bFhxAVg,zsYIw6RXjfM,2023-05-23T13:00:53Z,UC4JX40jDee_tINbkjycV4Sg,Create A Python API in 12 Minutes,Rapidly build and deploy APIs in seconds with ...,https://i.ytimg.com/vi/zsYIw6RXjfM/default.jpg,120,90,...,PT12M5S,2d,hd,True,True,rectangular,125510,3565,0,60
9,youtube#video,AopqYU1vlUP4Yqp9KSOWACHEhHg,-oPuGc05Lxs,2021-06-20T17:00:00Z,UC8tgRQ7DOzAbn9L7zDL8mLg,Working With APIs in Python - Pagination and D...,In this video I will show you how to work with...,https://i.ytimg.com/vi/-oPuGc05Lxs/default.jpg,120,90,...,PT22M36S,2d,hd,False,True,rectangular,62748,1815,0,103
2,youtube#video,211aeSNJ8nl_7sSOhOUMzaegh6M,0x0hOdvhCXU,2019-10-10T07:52:52Z,UCGuhp4lpQvK94ZC5kuOZbjA,Урок 4. Python. Быстрый старт. Изучаем API сер...,"Подробнее о курсе ""Python. Полное руководство""...",https://i.ytimg.com/vi/0x0hOdvhCXU/default.jpg,120,90,...,PT12M15S,2d,hd,False,False,rectangular,58359,959,0,28
8,youtube#video,-6E25tcSs9D_ayQjbnBC72GxM08,_k22Bs3zYyA,2023-07-04T16:10:08Z,UCbjozK_PYCTLEluFlrJ8UZg,FULL STACK PYTHON Offline Training @ DURGASOFT,FULL STACK PYTHON Offline Training @ DURGASOFT...,https://i.ytimg.com/vi/_k22Bs3zYyA/default.jpg,120,90,...,PT34S,2d,hd,False,True,rectangular,45,0,0,0
