## Дополнительный проект

В рамках дополнительного проекта попробуем освоить API, позволяющий получать данные о музейных коллекциях. Это задание может пригодиться для большего понимания того, какими способами можно собирать и обрабатывать данные, например, для собственного проекта или другой рабочей задачи. Также вы можете более глубоко изучить документацию, чтобы потом исследовать другие интересные для себя вопросы по полученным данным :)

## Описание API

__Документация__: https://metmuseum.github.io

Ключ: для использования выбранного API (на момент написания задания) ключ не требуется :)

Всего есть 4 основных раздела:

- Объекты (Objects)  
- Объект (Object) – данные об объекте (например, о картине)  
- Департаменты (Departments) –  данные о департаменте/разделе (например, "Современное искусство")   
- Поиск (Search) – используется для поиска  

В рамках задач поработаем с блоками Object и Search.

### 1

Для начала, импортируйте нужные библиотеки:

In [3]:
import requests
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

Сам запрос к API должен состоять из нескольких параметров. Пример обращения к поиску (Search):

In [4]:
r = requests.get('https://collectionapi.metmuseum.org/public/collection/v1/search?q=QUERY')
res = r.json()

In [5]:
res

{'total': 15,
 'objectIDs': [848290,
  778803,
  839361,
  208967,
  436180,
  435821,
  437449,
  60451,
  839021,
  857478,
  437489,
  503341,
  436105,
  436883,
  436283]}

где __QUERY__ – ключевое слово.

Предположим, ваша задача – найти все произведения, связанные с подсолнухами. Выполните поиск по слову "sunflowers". Внимательно посмотрите на формат ответа и сохраните id полученных объектов в список sunflower_ids.

В качестве ответа выберите id объектов (3), которые присутствуют в полученном списке:

- __2032__  
- __437329__  
- __436524__  
- 16822570  
- 20149  

In [6]:
r = requests.get('https://collectionapi.metmuseum.org/public/collection/v1/search?q=sunflowers')
sunflowers = r.json()

In [7]:
sunflowers

{'total': 89,
 'objectIDs': [436524,
  484935,
  437112,
  210191,
  431264,
  397949,
  656530,
  480725,
  486590,
  485308,
  375281,
  705155,
  11922,
  2032,
  343052,
  20141,
  2019,
  347980,
  208554,
  403496,
  360837,
  437115,
  207869,
  400581,
  423400,
  707887,
  223828,
  682927,
  57922,
  649813,
  79739,
  193938,
  339347,
  208218,
  202228,
  437984,
  436534,
  761604,
  437329,
  436252,
  363282,
  207753,
  822570,
  816522,
  487043,
  436580,
  437526,
  203893,
  367434,
  190739,
  423237,
  262423,
  839296,
  367817,
  822590,
  822589,
  13644,
  18362,
  820022,
  648617,
  761731,
  814626,
  892559,
  207967,
  626832,
  262430,
  262428,
  841928,
  707697,
  205386,
  262378,
  426804,
  633526,
  369073,
  747779,
  852414,
  427872,
  895564,
  436530,
  436535,
  436121,
  436529,
  724844,
  436144,
  437980,
  631808,
  834580,
  834585,
  834765]}

In [8]:
sunflower_ids = sunflowers['objectIDs']

In [9]:
sunflower_ids

[436524,
 484935,
 437112,
 210191,
 431264,
 397949,
 656530,
 480725,
 486590,
 485308,
 375281,
 705155,
 11922,
 2032,
 343052,
 20141,
 2019,
 347980,
 208554,
 403496,
 360837,
 437115,
 207869,
 400581,
 423400,
 707887,
 223828,
 682927,
 57922,
 649813,
 79739,
 193938,
 339347,
 208218,
 202228,
 437984,
 436534,
 761604,
 437329,
 436252,
 363282,
 207753,
 822570,
 816522,
 487043,
 436580,
 437526,
 203893,
 367434,
 190739,
 423237,
 262423,
 839296,
 367817,
 822590,
 822589,
 13644,
 18362,
 820022,
 648617,
 761731,
 814626,
 892559,
 207967,
 626832,
 262430,
 262428,
 841928,
 707697,
 205386,
 262378,
 426804,
 633526,
 369073,
 747779,
 852414,
 427872,
 895564,
 436530,
 436535,
 436121,
 436529,
 724844,
 436144,
 437980,
 631808,
 834580,
 834585,
 834765]

In [10]:
search_ids = [2032, 437329, 436524, 16822570, 20149]

In [11]:
correct_ids = [i for i in search_ids if i in sunflower_ids]

In [12]:
correct_ids

[2032, 437329, 436524]

### 2

Отлично! На предыдущем шаге мы получили результаты поиска. Следущий этап – собрать информацию об этих объектах.

Пример текста запроса для получения информации об одном объекте (Object):

Пример текста запроса для получения информации об одном объекте (Object):

In [13]:
r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/OBJECT_ID')
obj_test = r_test.json()

In [14]:
obj_test

{'message': 'could not parse objectID'}

где __OBJECT_ID__ – id объекта.

Выполните запрос для объекта 437980. Для проверки соотнесите полученные параметры с их значениями:

department > European Paintings  
objectID > 437980  
artistDisplayName > Vincent van Gogh  
culture > ''  
objectName > Painting  
GalleryNumber > 825  
title > Cypresses  

In [15]:
r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/437980')
obj_test = r_test.json()

In [16]:
obj_test

{'objectID': 437980,
 'isHighlight': False,
 'accessionNumber': '49.30',
 'accessionYear': '1949',
 'isPublicDomain': True,
 'primaryImage': 'https://images.metmuseum.org/CRDImages/ep/original/DP130999.jpg',
 'primaryImageSmall': 'https://images.metmuseum.org/CRDImages/ep/web-large/DP130999.jpg',
 'additionalImages': [],
 'constituents': [{'constituentID': 161947,
   'role': 'Artist',
   'name': 'Vincent van Gogh',
   'constituentULAN_URL': 'http://vocab.getty.edu/page/ulan/500115588',
   'constituentWikidata_URL': 'https://www.wikidata.org/wiki/Q5582',
   'gender': ''}],
 'department': 'European Paintings',
 'objectName': 'Painting',
 'title': 'Cypresses',
 'culture': '',
 'period': '',
 'dynasty': '',
 'reign': '',
 'portfolio': '',
 'artistRole': 'Artist',
 'artistPrefix': '',
 'artistDisplayName': 'Vincent van Gogh',
 'artistDisplayBio': 'Dutch, Zundert 1853–1890 Auvers-sur-Oise',
 'artistSuffix': '',
 'artistAlphaSort': 'Gogh, Vincent van',
 'artistNationality': 'Dutch',
 'artistB

In [18]:
obj_test['department']

'European Paintings'

In [19]:
obj_test['objectID']

437980

In [20]:
obj_test['artistDisplayName']

'Vincent van Gogh'

In [21]:
obj_test['culture']

''

In [22]:
obj_test['objectName']

'Painting'

In [23]:
obj_test['GalleryNumber']

'825'

In [24]:
obj_test['title']

'Cypresses'

### 3

Теперь напишите цикл, с помощью которого будет собрана информация об объектах, которые были получены на 2 шаге. Результаты запишите в датафрейм, а именно – следующие параметры:

- objectID – id объекта  
- title – название  
- artistDisplayName – автор  
- department – департамент  
- objectBeginDate – дата (начало)  
- objectEndDate – дата (конец)  
- period – название периода  
- objectName – название/категория объекта  
- culture – культура  

Сколько объектов относятся к японской культуре? (culture –Japan)

- __1__  
- 10
- 5
- 22  
- 45  
- 18

In [36]:
res["objectIDs"]

[848290,
 778803,
 839361,
 208967,
 436180,
 435821,
 437449,
 60451,
 839021,
 857478,
 437489,
 503341,
 436105,
 436883,
 436283]

In [34]:
ids = list(res["objectIDs"])

In [37]:
finalData = pd.DataFrame()

In [38]:
r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/437980')
obj_test = r_test.json()

In [39]:
for i in ids:
    try:
        r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/{i}')
        obj_test = r_test.json()
        dframe = pd.DataFrame({'objectID': obj_test['objectID'], 'title': obj_test['title'],
                               'artistDisplayName': obj_test['artistDisplayName'], 'department': obj_test['department'],
                               'objectBeginDate': obj_test['objectBeginDate'], 'objectEndDate': obj_test['objectEndDate'],
                               'period': obj_test['period'], 'objectName': obj_test['objectName'], 'culture': obj_test['culture']}, index=[0])
        finalData = finalData.append(dframe)
    except:
        continue

In [43]:
finalData.reset_index(drop=True)

Unnamed: 0,objectID,title,artistDisplayName,department,objectBeginDate,objectEndDate,period,objectName,culture
0,848290,What are we? III,Sosa Joseph,Modern and Contemporary Art,2012,2012,,Painting,
1,778803,Ensemble,Vaquera,Costume Institute,2017,2018,,Ensemble,American
2,839361,Earth & Sky,Lorna Simpson,Modern and Contemporary Art,2018,2018,,Collage,
3,208967,Tobacco box,,European Sculpture and Decorative Arts,1729,1739,,Tobacco box,
4,436180,The Natchez,Eugène Delacroix,European Paintings,1823,1835,,Painting,
5,435821,"Portrait of a Woman, Said to Be Emma (1765–181...",Adam Buck,European Paintings,1804,1804,,"Painting, miniature",
6,437449,The Honorable Henry Fane (1739–1802) with Inig...,Sir Joshua Reynolds,European Paintings,1761,1766,,Painting,
7,60451,Letter to the Nun Jōjūbō,Myōe Kōben 明恵高弁,Asian Art,1221,1221,Kamakura period (1185–1333),Hanging scroll,Japan
8,839021,Synthèse photo-cinématographique,Jean Dréville,Photographs,1927,1927,,Photograph,
9,857478,Kodak Advertising Department All-bum,Unknown,Photographs,1940,1940,,Photograph; Album,


In [45]:
finalData.query('culture == "Japan"').shape

(1, 9)

### 4

Теперь попробуем построить более сложный запрос с помощью секции "Search"! На этот раз параметры необходимо передать через "&", например, departmentId (id департамента – 1) и q (ключевое слово – cat):

In [54]:
r = requests.get('https://collectionapi.metmuseum.org/public/collection/v1/search?departmentId=6&q=cat')
cats = r.json()

In [55]:
cats

{'total': 3056,
 'objectIDs': [49698,
  49470,
  53222,
  36221,
  60873,
  70541,
  752008,
  43402,
  47358,
  49467,
  54747,
  54626,
  55919,
  59775,
  55923,
  36075,
  50826,
  57204,
  53653,
  42922,
  56602,
  47051,
  47052,
  72842,
  69780,
  59121,
  38952,
  39199,
  38177,
  59903,
  73809,
  59763,
  49050,
  58462,
  38158,
  38160,
  39092,
  50780,
  38162,
  38994,
  45282,
  53441,
  55948,
  54124,
  59248,
  36411,
  58779,
  52996,
  73046,
  671015,
  42932,
  45065,
  56780,
  42915,
  59249,
  36346,
  38949,
  51660,
  38452,
  39698,
  39699,
  670898,
  75200,
  39764,
  69410,
  68841,
  55148,
  76442,
  37011,
  36621,
  58218,
  54445,
  57560,
  56070,
  41681,
  53590,
  50827,
  46723,
  45667,
  36539,
  55967,
  55914,
  58002,
  57106,
  38176,
  54809,
  38951,
  38293,
  75909,
  38462,
  38315,
  52995,
  52994,
  53005,
  53422,
  671014,
  670965,
  73158,
  70582,
  75747,
  671023,
  74813,
  53408,
  53203,
  53007,
  53200,
  53457,
  

Выполните поисковый запрос для департамента "Asian art" (departmentId = 6) с тегом "cat" и запишите id объектов в cat_ids. Используйте цикл из шага 4, чтобы получить данные о первой 1000 объектов из списка.

В качестве ответа укажите, в каком периоде (period) было выполнено наибольшее количество работ, представленных в музее?

- Timurid period (1370–1507)  
- __Edo period (1615–1868)__    
- Tang dynasty (618–907)  
- Meiji period (1868–1912)  
- Период чаще всего не указан 

In [56]:
cats_id = cats["objectIDs"]

In [57]:
len(cats_id)

3056

In [58]:
data_frame = pd.DataFrame()
for i in cats_id[:1000]:
    try:
        r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/{i}')
        obj_test = r_test.json()
        dframe = pd.DataFrame({'objectID': obj_test['objectID'], 'title': obj_test['title'],
                               'artistDisplayName': obj_test['artistDisplayName'], 'department': obj_test['department'],
                               'objectBeginDate': obj_test['objectBeginDate'], 'objectEndDate': obj_test['objectEndDate'],
                               'period': obj_test['period'], 'objectName': obj_test['objectName'], 'culture': obj_test['culture']}, index=[0])
        data_frame = data_frame.append(dframe)
    except:
        continue

In [59]:
data_frame

Unnamed: 0,objectID,title,artistDisplayName,department,objectBeginDate,objectEndDate,period,objectName,culture
0,49698,Cat,Zhang Yuguang,Asian Art,1900,1968,,Folding fan mounted as an album leaf,China
0,49470,Cat,Wang Li,Asian Art,1813,1879,Qing dynasty (1644–1911),Hanging scroll,China
0,53222,Musk Cat,Uto Gyoshi,Asian Art,1550,1599,Muromachi period (1392–1573),Hanging scroll,Japan
0,36221,Cat,Wang Yun,Asian Art,1900,1933,,Hanging scroll,China
0,60873,Head ornament,,Asian Art,960,1279,Song dynasty (960–1279) or later,Head ornament,China
...,...,...,...,...,...,...,...,...,...
0,44448,Square Flask,,Asian Art,1700,1799,Edo period (1615–1868),Square flask,Japan
0,45554,Water Jar with Design of the Seven Sages in th...,,Asian Art,1767,1799,Edo period (1615–1868),Jar,Japan
0,45555,Water Jar (Mizusashi) with the Seven Sages of ...,,Asian Art,1767,1799,Edo period (1615–1868),Water jar,Japan
0,46968,Square Flask,,Asian Art,1700,1799,Edo period (1615–1868),Square flask,Japan


In [67]:
data_frame.period.value_counts()

Edo period (1615–1868)                                          440
                                                                122
Qing dynasty (1644–1911)                                         45
Eastern Javanese period                                          29
Muromachi period (1392–1573)                                     29
                                                               ... 
Malla period                                                      1
Ming dynasty (1368–1644), Jiajing mark and period (1522–66)       1
Qing dynasty (1644–1911), Kangxi mark and period (1662–1722)      1
Qing dynasty (1644–1911), Yongzheng period (1723–35)              1
late Edo (1615–1868)-early Meiji period (1868–1912)               1
Name: period, Length: 97, dtype: int64