В рамках дополнительного проекта попробуем освоить API, позволяющий получать данные о музейных коллекциях. Это задание может пригодиться для большего понимания того, какими способами можно собирать и обрабатывать данные, например, для собственного проекта или другой рабочей задачи. Также вы можете более глубоко изучить документацию, чтобы потом исследовать другие интересные для себя вопросы по полученным данным :)
Описание API

Документация: https://metmuseum.github.io

Ключ: для использования выбранного API (на момент написания задания) ключ не требуется :)

Всего есть 4 основных раздела:

    Объекты (Objects)
    Объект (Object) – данные об объекте (например, о картине)
    Департаменты (Departments) –  данные о департаменте/разделе (например, "Современное искусство") 
    Поиск (Search) – используется для поиска

В рамках задач поработаем с блоками Object и Search.

С более подробным описанием каждого доступного параметра можно ознакомиться в документации.

Для начала, импортируйте нужные библиотеки:

import requests
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

Сам запрос к API должен состоять из нескольких параметров. Пример обращения к поиску (Search):

r = requests.get('https://collectionapi.metmuseum.org/public/collection/v1/search?q=QUERY')
res = r.json()

где QUERY – ключевое слово.

Предположим, ваша задача – найти все произведения, связанные с подсолнухами. Выполните поиск по слову "sunflowers". Внимательно посмотрите на формат ответа и сохраните id полученных объектов в список sunflower_ids.

В качестве ответа выберите id объектов (3), которые присутствуют в полученном списке

Отлично! На предыдущем шаге мы получили результаты поиска. Следущий этап – собрать информацию об этих объектах.

Пример текста запроса для получения информации об одном объекте (Object):

r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/OBJECT_ID')
obj_test = r_test.json()

где OBJECT_ID – id объекта.

Выполните запрос для объекта 437980. Для проверки соотнесите полученные параметры с их значениями

Теперь напишите цикл, с помощью которого будет собрана информация об объектах, которые были получены на 2 шаге. Результаты запишите в датафрейм, а именно – следующие параметры:

     objectID – id объекта
    title – название
    artistDisplayName – автор
    department – департамент
    objectBeginDate – дата (начало)
    objectEndDate – дата (конец)
    period – название периода
    objectName – название/категория объекта
    culture – культура

Сколько объектов относятся к японской культуре? (culture –Japan)

Теперь попробуем построить более сложный запрос с помощью секции "Search"! На этот раз параметры необходимо передать через "&", например, departmentId (id департамента – 1) и q (ключевое слово – cat):

r = requests.get('https://collectionapi.metmuseum.org/public/collection/v1/search?departmentId=1&q=cat')
cats = r.json()

Выполните поисковый запрос для департамента "Asian art" (departmentId = 6) с тегом "cat" и запишите id объектов в cat_ids. Используйте цикл из шага 4, чтобы получить данные о первой 1000 объектов из списка.

Note: выполнение цикла может занять некоторое время (~5 минут), поэтому проверять его работоспособность лучше на более маленькой выборке!

В качестве ответа укажите, в каком периоде (period) было выполнено наибольшее количество работ, представленных в музее?

In [1]:
import requests
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

In [2]:
r = requests.get('https://collectionapi.metmuseum.org/public/collection/v1/search?q=QUERY')
res = r.json()

In [3]:
res

{'total': 13,
 'objectIDs': [778803,
  839361,
  208967,
  436180,
  435821,
  437449,
  60451,
  839021,
  857478,
  503341,
  436105,
  436883,
  436283]}

In [4]:
url = 'https://collectionapi.metmuseum.org/public/collection/v1/search?q='
IDs = 'sunflowers'
r = requests.get(url+IDs)
res = r.json()

In [5]:
sunflower_ids = res['objectIDs']

In [6]:
sunflower_ids

[436524,
 484935,
 437112,
 210191,
 431264,
 397949,
 656530,
 480725,
 486590,
 485308,
 375281,
 705155,
 11922,
 816522,
 2032,
 343052,
 20141,
 2019,
 208554,
 403496,
 360837,
 437115,
 207869,
 761604,
 400581,
 423400,
 707887,
 223828,
 682927,
 57922,
 649813,
 79739,
 193938,
 339347,
 208218,
 437984,
 202228,
 436534,
 704667,
 696949,
 437329,
 436252,
 437526,
 436580,
 363282,
 190739,
 207753,
 347980,
 822570,
 487043,
 203893,
 367434,
 423237,
 262423,
 839296,
 367817,
 13644,
 18362,
 820022,
 648617,
 761731,
 814626,
 207967,
 626832,
 262430,
 262428,
 707697,
 205386,
 262378,
 426804,
 664519,
 633526,
 436121,
 369073,
 747779,
 436144,
 852414,
 427872,
 436530,
 436535,
 436529,
 437980,
 724844,
 834585,
 834580,
 834765]

In [8]:
numbers = [437329, 436524, 20149, 16822570, 2032]

In [10]:
r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/210191')
obj_test = r_test.json()

In [11]:
obj_test

{'objectID': 210191,
 'isHighlight': False,
 'accessionNumber': '2000.126',
 'accessionYear': '2000',
 'isPublicDomain': False,
 'primaryImage': '',
 'primaryImageSmall': '',
 'additionalImages': [],
 'constituents': [{'constituentID': 38872,
   'role': 'Manufacturer',
   'name': 'Rozenburg Plateelfabriek',
   'constituentULAN_URL': 'http://vocab.getty.edu/page/ulan/500054784',
   'constituentWikidata_URL': '',
   'gender': ''}],
 'department': 'European Sculpture and Decorative Arts',
 'objectName': 'Vase',
 'title': 'Vase with sunflowers',
 'culture': '',
 'period': '',
 'dynasty': '',
 'reign': '',
 'portfolio': '',
 'artistRole': 'Manufacturer',
 'artistPrefix': '',
 'artistDisplayName': 'Rozenburg Plateelfabriek',
 'artistDisplayBio': '1883–1917',
 'artistSuffix': '',
 'artistAlphaSort': 'Rozenburg Plateelfabriek',
 'artistNationality': 'Dutch',
 'artistBeginDate': '1883',
 'artistEndDate': '1917',
 'artistGender': '',
 'artistWikidata_URL': '',
 'artistULAN_URL': 'http://vocab.ge

In [12]:
sunflower_ids

[436524,
 484935,
 437112,
 210191,
 431264,
 397949,
 656530,
 480725,
 486590,
 485308,
 375281,
 705155,
 11922,
 816522,
 2032,
 343052,
 20141,
 2019,
 208554,
 403496,
 360837,
 437115,
 207869,
 761604,
 400581,
 423400,
 707887,
 223828,
 682927,
 57922,
 649813,
 79739,
 193938,
 339347,
 208218,
 437984,
 202228,
 436534,
 704667,
 696949,
 437329,
 436252,
 437526,
 436580,
 363282,
 190739,
 207753,
 347980,
 822570,
 487043,
 203893,
 367434,
 423237,
 262423,
 839296,
 367817,
 13644,
 18362,
 820022,
 648617,
 761731,
 814626,
 207967,
 626832,
 262430,
 262428,
 707697,
 205386,
 262378,
 426804,
 664519,
 633526,
 436121,
 369073,
 747779,
 436144,
 852414,
 427872,
 436530,
 436535,
 436529,
 437980,
 724844,
 834585,
 834580,
 834765]

In [13]:
df = []

In [14]:
df

[]

In [15]:
for i in sunflower_ids:
    try:
        r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/{i}')
        obj_test = r_test.json()
        df.append([obj_test['objectID'], obj_test['title'], obj_test['artistDisplayName'], obj_test['department'], obj_test['objectBeginDate'], obj_test['objectEndDate'], obj_test['period'], obj_test['objectName'], obj_test['culture']])
    except:
        continue

In [16]:
df

[[436524,
  'Sunflowers',
  'Vincent van Gogh',
  'European Paintings',
  1887,
  1887,
  '',
  'Painting',
  ''],
 [484935,
  'Sunflowers',
  'Edward McKnight Kauffer',
  'Modern and Contemporary Art',
  1921,
  1921,
  '',
  'Painting',
  ''],
 [437112,
  'Bouquet of Sunflowers',
  'Claude Monet',
  'European Paintings',
  1881,
  1881,
  '',
  'Painting',
  ''],
 [210191,
  'Vase with sunflowers',
  'Rozenburg Plateelfabriek',
  'European Sculpture and Decorative Arts',
  1896,
  1896,
  '',
  'Vase',
  ''],
 [431264,
  'Sunflowers',
  'Lily Converse',
  'Drawings and Prints',
  1941,
  1941,
  '',
  'Print',
  ''],
 [397949,
  'Sunflowers',
  'Angela Straeter',
  'Drawings and Prints',
  1935,
  1943,
  '',
  'Print',
  ''],
 [656530,
  'Sunflowers',
  'Howard Cook',
  'Drawings and Prints',
  1930,
  1930,
  '',
  'Print',
  ''],
 [480725,
  'Large Sunflowers',
  'Emil Nolde',
  'Modern and Contemporary Art',
  1928,
  1928,
  '',
  'Painting',
  ''],
 [486590,
  'Moroccan Sunflow

In [17]:
df_1 = pd.DataFrame(df)

In [18]:
df_1

Unnamed: 0,0,1,2,3,4,5,6,7,8
0,436524,Sunflowers,Vincent van Gogh,European Paintings,1887,1887,,Painting,
1,484935,Sunflowers,Edward McKnight Kauffer,Modern and Contemporary Art,1921,1921,,Painting,
2,437112,Bouquet of Sunflowers,Claude Monet,European Paintings,1881,1881,,Painting,
3,210191,Vase with sunflowers,Rozenburg Plateelfabriek,European Sculpture and Decorative Arts,1896,1896,,Vase,
4,431264,Sunflowers,Lily Converse,Drawings and Prints,1941,1941,,Print,
...,...,...,...,...,...,...,...,...,...
78,437980,Cypresses,Vincent van Gogh,European Paintings,1889,1889,,Painting,
79,724844,Design for Embroidery with Two Large Garlands ...,Italian School,Drawings and Prints,1845,1905,,Drawing Ornament & Architecture,
80,834585,"A Life in a Year–The Garden–Noon, from ""Pictur...",Arthur Boyd Houghton,Drawings and Prints,1866,1874,,Print,
81,834580,"A Life in a Year–The Garden–Noon, from ""Pictur...",Arthur Boyd Houghton,Drawings and Prints,1866,1874,,Print,


In [19]:
df_2 = df_1.rename(columns = {0: 'objectID', 1: 'title', 2: 'artistDisplayName', 3: 'department', 4: 'objectBeginDate', 5: 'objectEndDate', 6: 'period', 7: 'objectName', 8: 'culture'})

In [20]:
df_2.query('culture == "Japan"')

Unnamed: 0,objectID,title,artistDisplayName,department,objectBeginDate,objectEndDate,period,objectName,culture
29,57922,Incense box,,Asian Art,1700,1799,Edo period (1615–1868),Incense box,Japan


In [21]:
sunflower_ids

[436524,
 484935,
 437112,
 210191,
 431264,
 397949,
 656530,
 480725,
 486590,
 485308,
 375281,
 705155,
 11922,
 816522,
 2032,
 343052,
 20141,
 2019,
 208554,
 403496,
 360837,
 437115,
 207869,
 761604,
 400581,
 423400,
 707887,
 223828,
 682927,
 57922,
 649813,
 79739,
 193938,
 339347,
 208218,
 437984,
 202228,
 436534,
 704667,
 696949,
 437329,
 436252,
 437526,
 436580,
 363282,
 190739,
 207753,
 347980,
 822570,
 487043,
 203893,
 367434,
 423237,
 262423,
 839296,
 367817,
 13644,
 18362,
 820022,
 648617,
 761731,
 814626,
 207967,
 626832,
 262430,
 262428,
 707697,
 205386,
 262378,
 426804,
 664519,
 633526,
 436121,
 369073,
 747779,
 436144,
 852414,
 427872,
 436530,
 436535,
 436529,
 437980,
 724844,
 834585,
 834580,
 834765]

In [22]:
df_5 = []

In [23]:
for i in sunflower_ids:
    try:
        r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/{i}')
        obj_test = r_test.json()
        df_5.append(obj_test['culture'])
    except:
        continue

In [24]:
df_5

['',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 'American',
 '',
 'American',
 '',
 'American',
 'American',
 '',
 '',
 '',
 '',
 '',
 'American',
 '',
 '',
 '',
 '',
 '',
 'Japan',
 '',
 'British',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 'American',
 'American',
 '',
 '',
 'American',
 'American',
 '',
 'Ancestral Pueblo',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '']

In [25]:
r = requests.get('https://collectionapi.metmuseum.org/public/collection/v1/search?departmentId=6&q=cat')
cats = r.json()

In [26]:
cats

{'total': 2964,
 'objectIDs': [49698,
  49470,
  53222,
  36221,
  60873,
  70541,
  752008,
  43402,
  47358,
  49467,
  54747,
  54626,
  55919,
  59775,
  55923,
  36075,
  50826,
  57204,
  53653,
  42922,
  56602,
  47051,
  47052,
  72842,
  69780,
  59121,
  38952,
  39199,
  38177,
  59903,
  73809,
  59763,
  49050,
  58462,
  45282,
  39092,
  38158,
  38160,
  38162,
  38994,
  50780,
  53441,
  55948,
  54124,
  59248,
  36411,
  58779,
  73046,
  38949,
  671015,
  42932,
  45065,
  56780,
  42915,
  59249,
  36346,
  51660,
  670898,
  55914,
  39764,
  55967,
  69410,
  68841,
  55148,
  76442,
  37011,
  36621,
  58218,
  54445,
  57560,
  56070,
  41681,
  53590,
  58002,
  45667,
  50827,
  46723,
  36539,
  38452,
  39698,
  39699,
  54809,
  57106,
  75200,
  38951,
  38176,
  38462,
  75909,
  38293,
  38315,
  52995,
  52994,
  53005,
  53422,
  70582,
  73158,
  671014,
  670965,
  75747,
  671023,
  74813,
  53408,
  53203,
  53007,
  53200,
  53457,
  53231,
  

In [27]:
cat_ids = cats['objectIDs']

In [28]:
cat_ids

[49698,
 49470,
 53222,
 36221,
 60873,
 70541,
 752008,
 43402,
 47358,
 49467,
 54747,
 54626,
 55919,
 59775,
 55923,
 36075,
 50826,
 57204,
 53653,
 42922,
 56602,
 47051,
 47052,
 72842,
 69780,
 59121,
 38952,
 39199,
 38177,
 59903,
 73809,
 59763,
 49050,
 58462,
 45282,
 39092,
 38158,
 38160,
 38162,
 38994,
 50780,
 53441,
 55948,
 54124,
 59248,
 36411,
 58779,
 73046,
 38949,
 671015,
 42932,
 45065,
 56780,
 42915,
 59249,
 36346,
 51660,
 670898,
 55914,
 39764,
 55967,
 69410,
 68841,
 55148,
 76442,
 37011,
 36621,
 58218,
 54445,
 57560,
 56070,
 41681,
 53590,
 58002,
 45667,
 50827,
 46723,
 36539,
 38452,
 39698,
 39699,
 54809,
 57106,
 75200,
 38951,
 38176,
 38462,
 75909,
 38293,
 38315,
 52995,
 52994,
 53005,
 53422,
 70582,
 73158,
 671014,
 670965,
 75747,
 671023,
 74813,
 53408,
 53203,
 53007,
 53200,
 53457,
 53231,
 53416,
 53414,
 53001,
 53234,
 52996,
 53006,
 53410,
 53176,
 53002,
 671016,
 670994,
 53419,
 761386,
 53221,
 53439,
 671056,
 53456

In [29]:
dff = []

In [30]:
i = 0
for i in cat_ids[:1000]:
    try:
        r_test = requests.get(f'https://collectionapi.metmuseum.org/public/collection/v1/objects/{i}')
        obj_test = r_test.json()
        dff.append([obj_test['objectID'], obj_test['title'], obj_test['artistDisplayName'], obj_test['department'], obj_test['objectBeginDate'], obj_test['objectEndDate'], obj_test['period'], obj_test['objectName'], obj_test['culture']])
    except:
        continue
dff_1 = pd.DataFrame(dff)
dff_2 = dff_1.rename(columns = {0: 'objectID', 1: 'title', 2: 'artistDisplayName', 3: 'department', 4: 'objectBeginDate', 5: 'objectEndDate', 6: 'period', 7: 'objectName', 8: 'culture'})

In [31]:
dff_2

Unnamed: 0,objectID,title,artistDisplayName,department,objectBeginDate,objectEndDate,period,objectName,culture
0,49698,Cat,Zhang Yuguang,Asian Art,1900,1968,,Folding fan mounted as an album leaf,China
1,49470,Cat,Wang Li,Asian Art,1813,1879,Qing dynasty (1644–1911),Hanging scroll,China
2,53222,Musk Cat,Uto Gyoshi,Asian Art,1550,1599,Muromachi period (1392–1573),Hanging scroll,Japan
3,36221,Cat,Wang Yun,Asian Art,1900,1933,,Hanging scroll,China
4,60873,Burial Crown,,Asian Art,960,1279,Song dynasty (960–1279) or later,Burial crown,China
...,...,...,...,...,...,...,...,...,...
995,63054,Jar with Scrolling Peony Design,,Asian Art,1870,1870,Meiji period (1868–1912),Jar,Japan
996,63046,Wine pot,,Asian Art,1820,1820,Edo period (1615–1868),Wine pot,Japan
997,63041,Small Dish with Cherry Blossoms in Bamboo Baskets,,Asian Art,1690,1720,Edo period (1615–1868),Dish,Japan
998,63032,Square Stand with Dutch Landscape,,Asian Art,1750,1833,Edo period (1615–1868),Stand,Japan


In [32]:
dff_2.value_counts('period')

period
Edo period (1615–1868)                           442
                                                  99
Qing dynasty (1644–1911)                          58
Ming dynasty (1368–1644)                          41
Muromachi period (1392–1573)                      30
                                                ... 
Kofun period (ca. 3rd–7th century)                 1
Kofun period (ca. 300–710)                         1
Khmer Empire (802–1431)                            1
Kandyan period                                     1
Sui (581–618) or early Tang (618-907) dynasty      1
Length: 109, dtype: int64