# Работа с API

API – это механизмы, которые позволяют двум программным компонентам взаимодействовать друг с другом, используя набор определений и протоколов. Например, система ПО метеослужбы содержит ежедневные данные о погоде. Приложение погоды на телефоне «общается» с этой системой через API и показывает ежедневные обновления погоды на телефоне.

С помощью API можно легко собрать нужную информацию из сайта или приложения.

# На примере HH

In [None]:
# !pip install -U requests

In [1]:
import requests

import pandas as pd

In [13]:
url = 'https://api.hh.ru/vacancies'

text = 'аналитик данных'

In [14]:
parameters = {
    'vacancy_search_fields': 'name',
    'text': text,
    'area': '113',
    'per_page': '10',
    'page': 1,
    'responses_count_enabled': True,
}

In [15]:
r = requests.get(url, params=parameters)
r

<Response [200]>

In [17]:
vacancies_info = r.json()

In [9]:
df = pd.DataFrame({
    'id':[],
    'name':[],
    'salary':[],
    'company':[],
    'url': []
})

In [10]:
for vac in vacancies_info['items']:
    vac_parser = {
        'id': vac['id'],
        'name': vac['name'],
        'salary': vac['salary'],
        'company': vac['employer']['name'],
        'url': vac['url']
    }
    df.loc[len(df)] = vac_parser

In [11]:
df

Unnamed: 0,id,name,salary,company,url
0,81431752,Аналитик данных,,Газпромбанк Автолизинг,https://api.hh.ru/vacancies/81431752?host=hh.ru
1,79591647,Data Analyst (Санкт-Петербург/Тбилиси) в марке...,,Garage Eight,https://api.hh.ru/vacancies/79591647?host=hh.ru
2,78199871,Аналитик данных,,КОМПЛИТ,https://api.hh.ru/vacancies/78199871?host=hh.ru
3,81916778,Data Science/Data Analyst,"{'from': 120000, 'to': None, 'currency': 'RUR'...",Ит-Финанс,https://api.hh.ru/vacancies/81916778?host=hh.ru
4,81839685,Аналитик данных,,СберМегаМаркет,https://api.hh.ru/vacancies/81839685?host=hh.ru
5,81842703,Аналитик данных / Инженер по качеству данных,,X5 Tech,https://api.hh.ru/vacancies/81842703?host=hh.ru
6,81241165,Аналитик данных / Data Analyst (Junior),"{'from': 50000, 'to': 70000, 'currency': 'RUR'...",Щербин Алексей Сергеевич,https://api.hh.ru/vacancies/81241165?host=hh.ru
7,81695072,Финансовый аналитик / Аналитик данных / удаленно,"{'from': 70000, 'to': 100000, 'currency': 'RUR...",Liara,https://api.hh.ru/vacancies/81695072?host=hh.ru
8,81958065,Аналитик данных,,Брайт Софт,https://api.hh.ru/vacancies/81958065?host=hh.ru
9,81907051,Аналитик данных,"{'from': 80000, 'to': 120000, 'currency': 'RUR...",Орион,https://api.hh.ru/vacancies/81907051?host=hh.ru


# Парсинг с помощью BeautifulSoup

Beautiful Soup - это библиотека для Python, которая позволяет парсить (анализировать) HTML и XML документы. Она предоставляет удобный способ искать, навигировать, и модифицировать дерево DOM (Document Object Model), представляющее HTML/XML документ.

In [22]:
# !pip install -U beautifulsoup4

In [23]:
from bs4 import BeautifulSoup

In [24]:
url = 'http://quotes.toscrape.com/'

In [25]:
r = requests.get(url, verify=False, timeout=10)
r

<Response [200]>

In [26]:
soup = BeautifulSoup(r.content, 'html.parser')

In [33]:
divs = soup.find_all('div', attrs={'class':'quote'})

In [60]:
df = pd.DataFrame({
    'text':[],
    'author':[],
    'author_url':[],
    'tags':[],
})

In [61]:
def get_quotes(soup, data=df):

    divs = soup.find_all('div', attrs={'class':'quote'})

    for div in divs:
        quote = {}
        quote['text'] = div.find('span', class_='text').text
        quote['author'] = div.find('small', class_='author').text
        quote['author_url'] = div.find_all('span')[1].find('a').get('href')
        tags = []
        for a_tag in div.find('div', class_='tags').find_all('a', class_='tag'):
            tags.append(a_tag.text)
        quote['tags'] = ', '.join(tags)
        df.loc[len(df)] = quote

In [62]:
url = 'https://quotes.toscrape.com/page/'

for i in range(1, 21):
    print(f'Page N:{i}')
    r = requests.get(url + str(i), timeout=10)
    soup = BeautifulSoup(r.content, 'html.parser')

    get_quotes(soup, df)

    if 'No quotes found!' in soup.text:
        break

Page N:1
Page N:2
Page N:3
Page N:4
Page N:5
Page N:6
Page N:7
Page N:8
Page N:9
Page N:10
Page N:11


In [65]:
df.tail()

Unnamed: 0,text,author,author_url,tags
95,“You never really understand a person until yo...,Harper Lee,/author/Harper-Lee,better-life-empathy
96,“You have to write the book that wants to be w...,Madeleine L'Engle,/author/Madeleine-LEngle,"books, children, difficult, grown-ups, write, ..."
97,“Never tell the truth to people who are not wo...,Mark Twain,/author/Mark-Twain,truth
98,"“A person's a person, no matter how small.”",Dr. Seuss,/author/Dr-Seuss,inspirational
99,“... a mind needs books as a sword needs a whe...,George R.R. Martin,/author/George-R-R-Martin,"books, mind"


In [66]:
df

Unnamed: 0,text,author,author_url,tags
0,“The world as we have created it is a process ...,Albert Einstein,/author/Albert-Einstein,"change, deep-thoughts, thinking, world"
1,"“It is our choices, Harry, that show what we t...",J.K. Rowling,/author/J-K-Rowling,"abilities, choices"
2,“There are only two ways to live your life. On...,Albert Einstein,/author/Albert-Einstein,"inspirational, life, live, miracle, miracles"
3,"“The person, be it gentleman or lady, who has ...",Jane Austen,/author/Jane-Austen,"aliteracy, books, classic, humor"
4,"“Imperfection is beauty, madness is genius and...",Marilyn Monroe,/author/Marilyn-Monroe,"be-yourself, inspirational"
...,...,...,...,...
95,“You never really understand a person until yo...,Harper Lee,/author/Harper-Lee,better-life-empathy
96,“You have to write the book that wants to be w...,Madeleine L'Engle,/author/Madeleine-LEngle,"books, children, difficult, grown-ups, write, ..."
97,“Never tell the truth to people who are not wo...,Mark Twain,/author/Mark-Twain,truth
98,"“A person's a person, no matter how small.”",Dr. Seuss,/author/Dr-Seuss,inspirational
