## МЕТОДЫ ЗАПРОСОВ В ПРОТОКОЛЕ HTTP

Для того чтобы указать серверу на то, какое действие мы хотим произвести с ресурсом, в протоколе HTTP используются так называемые методы. В HTTP существует несколько методов, которые описывают действия с ресурсами. Чаще всего используются GET и POST.

### GET — ПОЛУЧЕНИЕ РЕСУРСА

Метод GET запрашивает информацию из указанного источника и не может влиять на его содержимое. Запрос доступен для кэширования данных (то есть для сохранения, восстановления и дальнейшего использования) и добавления в закладки. Длина запроса ограничена (максимальная длина — 2048 символов).

Пример GET-запроса, отправляемого через адресную строку браузера:

In [2]:
# http://site.ru/page.php?name=dima&age=27


### POST — СОЗДАНИЕ РЕСУРСА

Метод POST используется для отправки данных, которые могут оказывать влияние на содержимое ресурса. В отличие от метода GET, запросы POST не могут быть кэшированы, они не остаются в истории браузера и их нельзя добавить в закладки. Длина запроса POST не ограничивается.

Пример POST-запроса, отправляемого через форму запроса:

In [3]:
# POST / HTTP/1.0\r\n
# Host: www.site.ru\r\n
# Referer: http://www.site.ru/index.html\r\n
# Cookie: income=1\r\n
# Content-Type: application/x-www-form-urlencoded\r\n
# Content-Length: 35\r\n
# \r\n
# login=Dima&password=12345

Как только библиотека установлена, импортируем её и отправим наш первый запрос к ресурсу Курсы валют ЦБ РФ в XML и JSON. Используем метод get() из библиотеки requests, передав ему соответствующий URL —  https://www.cbr-xml-daily.ru/daily_json.js:

In [4]:
import requests # Импортируем библиотеку requests
url = 'https://www.cbr-xml-daily.ru/daily_json.js' # Определяем значение URL страницы для запроса
response = requests.get(url) # Делаем GET-запрос к ресурсу и результат ответа сохраняем в переменной response

print(response) # Выводим значение response на экран как объект

<Response [200]>


Мы получили объект ответа Response, который содержит всю нужную нам информацию. По умолчанию в квадратных скобках на экран выводится код статуса ответа. В данном случае он равен 200 — то есть запрос был корректным и сервер отдал нам нужную информацию. Значение кода статуса 404 означало бы, что страница по указанному адресу не найдена, а значение 403 — что синтаксис GET-запроса неверный.

Код ответа в виде числовой переменной можно получить с помощью метода status_code:

In [5]:
print(response.status_code) # Выводим числовое значение response на экран

200


In [6]:
# Задание 3.1
# 1 point possible (graded)
# Вы уже импортировали модуль requests в ваш код. Напишите строку кода, при выполнении которой будет сделан GET-запрос к ресурсу 
# https://www.cbr-xml-daily.ru/daily.xml, а результат ответа будет сохранён в переменной response:


import requests # Импортируем библиотеку requests
# url = 'https://www.cbr-xml-daily.ru/daily.xml' # Определяем значение URL страницы для запроса
response = requests.get('https://www.cbr-xml-daily.ru/daily_json.js') # Делаем GET-запрос к ресурсу и результат ответа сохраняем в переменной response

print(response) # Выводим значение response на экран как объект
print(response.status_code)

<Response [200]>
200


### РАБОТАЕМ С ОТВЕТОМ

Мы сделали запрос и получили корректный ответ (код статуса — 200). Дальнейшую работу производим с результатом запроса к ресурсу Курсы валют ЦБ РФ в XML и JSON.

?
Как получить доступ ко всей информации, которую содержит ответ?

Текст ответа хранится в атрибуте text. Выведем значение атрибута на экран и посмотрим на его содерж

In [7]:
print(response.text)

{
    "Date": "2022-04-16T11:30:00+03:00",
    "PreviousDate": "2022-04-15T11:30:00+03:00",
    "PreviousURL": "\/\/www.cbr-xml-daily.ru\/archive\/2022\/04\/15\/daily_json.js",
    "Timestamp": "2022-04-16T16:00:00+03:00",
    "Valute": {
        "AUD": {
            "ID": "R01010",
            "NumCode": "036",
            "CharCode": "AUD",
            "Nominal": 1,
            "Name": "Австралийский доллар",
            "Value": 59.6966,
            "Previous": 60.6246
        },
        "AZN": {
            "ID": "R01020A",
            "NumCode": "944",
            "CharCode": "AZN",
            "Nominal": 1,
            "Name": "Азербайджанский манат",
            "Value": 47.0845,
            "Previous": 47.8165
        },
        "GBP": {
            "ID": "R01035",
            "NumCode": "826",
            "CharCode": "GBP",
            "Nominal": 1,
            "Name": "Фунт стерлингов Соединенного королевства",
            "Value": 104.361,
            "Previous": 105.9833
  

In [8]:
# Для того чтобы удобно было работать с полученной информацией, нам необходимо преобразовать строку в словарь.
# В объект ответа Response  из библиотеки requests уже встроен метод json() .
# Импортируем функцию pprint(), применим к полученному ответу метод json() и выведем полученный результат на экран:

from pprint import pprint # Импортируем функцию pprint()
currencies = response.json() # Применяем метод json()
pprint(currencies) # Выводим результат на экран)

{'Date': '2022-04-16T11:30:00+03:00',
 'PreviousDate': '2022-04-15T11:30:00+03:00',
 'PreviousURL': '//www.cbr-xml-daily.ru/archive/2022/04/15/daily_json.js',
 'Timestamp': '2022-04-16T16:00:00+03:00',
 'Valute': {'AMD': {'CharCode': 'AMD',
                    'ID': 'R01060',
                    'Name': 'Армянских драмов',
                    'Nominal': 100,
                    'NumCode': '051',
                    'Previous': 17.2399,
                    'Value': 16.9786},
            'AUD': {'CharCode': 'AUD',
                    'ID': 'R01010',
                    'Name': 'Австралийский доллар',
                    'Nominal': 1,
                    'NumCode': '036',
                    'Previous': 60.6246,
                    'Value': 59.6966},
            'AZN': {'CharCode': 'AZN',
                    'ID': 'R01020A',
                    'Name': 'Азербайджанский манат',
                    'Nominal': 1,
                    'NumCode': '944',
                    'Previous': 47.8165,


In [9]:
print(currencies['Valute']['CZK']['Name'])

Чешских крон


### ПОЛУЧАЕМ СОДЕРЖИМОЕ ВЕБ-СТРАНИЦЫ

Получим HTML-код интересующей нас страницы.

Для этого отправим GET-запрос с помощью библиотеки requests и метода get() и посмотрим на текст ответа на наш запрос (как мы помним, он содержится в атрибуте text):

In [10]:
import requests # Импортируем библиотеку requests
url = 'https://nplus1.ru/news/2021/10/11/econobel2021' # Определяем адрес страницы
response = requests.get(url)  # Выполняем GET-запрос
print(response.text)  # Выводим содержимое атрибута text

<!doctype html>
<html class="old-town-road no-js bg-fixed _no-bg" style="background-image:url(https://nplus1.ru/images/2021/10/11/9c6bcb5f7c01c6d88d49410e16ebc003.jpg)" lang="">
<head>
    
    <meta charset="utf-8">
    <meta http-equiv="x-ua-compatible" content="ie=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
        <meta name="apple-mobile-web-app-capable" content="yes">
    <meta name="apple-mobile-web-app-status-bar-style" content="black">
                <meta name='wmail-verification' content='7991d7eb02d759f05b9050e111a7e3eb' />

    <link rel="canonical" href="https://nplus1.ru/news/2021/10/11/econobel2021" />

    <link rel="icon" href="/i/favicon-bw.png" />


        <title>Премию Нобеля по экономике присудили за исследования экономики труда и причинно-следственных связей</title>

    	    <meta itemprop="datePublished" content="2021-10-11"/>
	
	    <meta name="mediator_author" content="Илья Ферапонтов"/> 
	
        <!-- amp page -->
    <

In [11]:
%pip install beautifulsoup4 




In [12]:
from bs4 import BeautifulSoup # Импортируем библиотеку BeautifulSoup


Ранее мы уже получили содержимое страницы с помощью GET-запроса и сохранили информацию в переменной response , теперь создадим объект BeautifulSoup с именем page, указывая в качестве параметра html.parser.

Для примера получим информацию o title (с англ. заголовок) — это строка, которая отображается на вкладке браузера:

In [13]:
import requests # Импортируем библиотеку requests
from bs4 import BeautifulSoup # Импортируем библиотеку BeautifulSoup

url = 'https://nplus1.ru/news/2021/10/11/econobel2021' # Определяем адрес страницы
response = requests.get(url) # Выполняем GET-запрос, содержимое ответа присваивается переменной response
page = BeautifulSoup(response.text, 'html.parser') # Создаём объект BeautifulSoup, указывая html-парсер
print(page.title) # Получаем тег title, отображающийся на вкладке браузера
print(page.title.text) # Выводим текст из полученного тега, который содержится в атрибуте text

<title>Премию Нобеля по экономике присудили за исследования экономики труда и причинно-следственных связей</title>
Премию Нобеля по экономике присудили за исследования экономики труда и причинно-следственных связей


### ИЗВЛЕКАЕМ ЗАГОЛОВОК И ВРЕМЯ НАПИСАНИЯ СТАТЬИ

Выполним поставленную ранее задачу: получить информацию о странице и извлечь заголовок статьи, опубликованной на этой странице, дату публикации, а также текст статьи.

Предположим, что мы знаем, что в HTML-коде рассматриваемой нами страницы заголовок статьи заключён в тег <h1> … </h1> (заголовок первого уровня).

Тогда мы можем получить его текст с помощью метода find() (с англ. найти) объекта BeautifulSoup, передав ему название интересующего нас тега:

In [14]:
print(page.find('h1').text) # Применяем метод find() к объекту и выводим результат на экран


Премию Нобеля по экономике присудили за исследования экономики труда и причинно-следственных связей


In [15]:
print(page.find('time').text) # Выводим на экран содержимое атрибута text тега time


13:04
11 Окт. 2021



In [16]:
# Задание 5.4
# Напишите функцию wiki_header, которая по адресу страницы возвращает заголовок для статей на Wikipedia.

def wiki_header(url_string):
    import requests # Импортируем библиотеку requests
    from bs4 import BeautifulSoup # Импортируем библиотеку BeautifulSoup
    url = url_string # Определяем адрес страницы
    response = requests.get(url) # Выполняем GET-запрос, содержимое ответа присваивается переменной response
    page = BeautifulSoup(response.text, 'html.parser') # Создаём объект BeautifulSoup, указывая html-парсер
    return page.find('h1').text

url = 'https://en.wikipedia.org/wiki/Operating_system'
print(wiki_header(url))


Operating system


In [17]:
print(page.find('div').text) # Выводим содержимое атрибута text тега div




In [None]:
# Дело в том, что теги <div> … </div> очень распространённые и на странице их очень много. Метод find() нашёл первый из них, но это не то, что нам надо.
# Посмотрим на нашу страницу, используя инструмент разработчика, ещё раз. Можем заметить, что у искомого текста есть свой класс — body js-mediator-article :
# Передадим название класса в метод find() с помощью аргумента class_ и получим текст статьи:

print(page.find('div', class_='body').text) # Выводим содержимое атрибута text тега div класса body js-mediator-article

### СБОР НЕСКОЛЬКИХ ЭЛЕМЕНТОВ: СОБИРАЕМ ВСЕ ССЫЛКИ НА СТРАНИЦЕ
Рассмотрим ещё один сценарий: вы хотите собрать сразу несколько элементов со страницы. Например, представьте, что вы хотите получить названия всех языков программирования, упомянутых на странице в Wikipedia в статье про языки программирования.

Можно заметить, что все названия языков программирования на этой странице связаны ссылками c соответствующими статьями о них. Таким образом, нам необходимо собрать все ссылки на странице. Для ссылок в HTML предусмотрен тег <a> … </a>. Попробуем использовать find():

In [19]:
url = 'https://en.wikipedia.org/wiki/List_of_programming_languages' # Задаём адрес ресурса
response = requests.get(url) # Делаем GET-запрос к ресурсу
page = BeautifulSoup(response.text, 'html.parser') # Создаём объект BeautifulSoup
print(page.find('a')) # Ищем ссылку по тегу <a> и выводим её на экран

<a id="top"></a>


In [20]:
# Мы получили только одну ссылку, хотя на странице их явно больше.
# Это происходит, потому что метод find() возвращает только первый подходящий элемент. Если требуется получить больше элементов, необходимо воспользоваться методом find_all() (с англ. найти все):

links = page.find_all('a') # Ищем все ссылки на странице и сохраняем в переменной links в виде списка
print(len(links)) # Выводим количество найденных ссылок

938


In [21]:
# Итак, на момент создания этих учебных материалов на странице содержалось 928 ссылок. Посмотрим на некоторые из них:
print([link.text for link in links[500:510]]) # Выводим ссылки с 500 по 509 включительно

['Opal', 'Open Programming Language', 'OpenCL', 'OpenEdge Advanced Business Language', 'OpenVera', 'OpenQASM', 'OPS5', 'OptimJ', 'Orc', 'ORCA/Modula-2']


In [22]:
# Не все ссылки соответствуют названиям языков программирования — страница содержит также «служебные» ссылки, такие, например, как Jump to navigation (с англ. Перейти к навигации) или Alphabetical (с англ. По алфавиту):
print([link.text for link in links[0:10]]) # Выводим ссылки с 1 по 9 включительно

['', 'Jump to navigation', 'Jump to search', 'Programming languagelists', 'Alphabetical', 'Categorical', 'Chronological', 'Generational', 'v', 't']


In [73]:
# читаем токен
with open('token.txt', 'r') as file_object:
    token = file_object.read().strip()
http_string ='https://api.vk.com/method/users.get?user_id=1&v=5.131&access_token='
url = http_string + token
response = requests.get(url) # Делаем GET-запрос к ресурсу
response.text

'{"response":[{"id":1,"first_name":"Павел","last_name":"Дуров","can_access_closed":true,"is_closed":false}]}'

In [74]:
http_string ='https://api.vk.com/method/users.get?user_id=1&v=5.95&fields=sex,bdate&access_token='
url = http_string + token
response = requests.get(url) # Делаем GET-запрос к ресурсу
response.text

'{"response":[{"id":1,"first_name":"Павел","last_name":"Дуров","can_access_closed":true,"is_closed":false,"sex":2,"bdate":"10.10.1984"}]}'

In [75]:
# ЗАПРОС К API ИЗ КОДА
# Продолжаем пользоваться всё той же библиотекой requests.
import requests # Импортируем модуль requests
# token = '' # Указываем свой сервисный токен
url = 'https://api.vk.com/method/users.get' # Указываем адрес страницы к которой делаем запрос
params = {'user_id': 1, 'v': 5.131, 'fields': 'sex,bdate', 'access_token': token, 'lang': 'ru'} # Перечисляем параметры нашего запроса в словаре params
response = requests.get(url, params=params) # Отправляем запрос
print(response.text) # Выводим текст ответа на экран

{"response":[{"id":1,"first_name":"Павел","last_name":"Дуров","can_access_closed":true,"is_closed":false,"sex":2,"bdate":"10.10.1984"}]}


In [67]:
# Словари нагляднее выводить с помощью функции pprint(), которую мы уже использовали ранее:

from pprint import pprint # Импортируем функцию pprint()
pprint(response.json()) # Выводим содержимое словаря, содержащего ответ, на экран

{'response': [{'bdate': '10.10.1984',
               'can_access_closed': True,
               'first_name': 'Павел',
               'id': 1,
               'is_closed': False,
               'last_name': 'Дуров',
               'sex': 2}]}


In [76]:
user = response.json()['response'][0] # Извлекаем из словаря по ключу response информацию о первом пользователе
print(user['bdate']) # Выводим дату рождения первого пользователя на экран

10.10.1984


In [38]:
# Метод users.get() позволяет запрашивать информацию о множестве (до 1 000) пользователей одновременно. Для этого нужно использовать параметр user_ids и передавать id через запятую в строковом формате. Например, чтобы получить информацию о пользователях с id=1, id=2, id=3, необходимо передать значение параметра user_ids='1,2,3'.
ids = ",".join(map(str, range(1, 500))) # Формируем строку, содержащую информацию о поле id первых трёх пользователей
params = {'user_ids': ids, 'v': 5.131, 'fields': 'sex,bdate', 'access_token': token, 'lang': 'ru'} # Формируем строку параметров
users = requests.get(url, params=params).json() # Посылаем запрос, полученный ответ в формате JSON-строки преобразуем в словарь и выводим на экран его содержимое, используя функцию pprint()

In [39]:
import json # Импортируем модуль json
from pprint import pprint # Импортируем функцию pprint()
import pandas as pd # Импортируем модуль pandas
from IPython.display import display
# pprint(users)
df = pd.DataFrame(users['response']) # Создаём объект DataFrame из списка recipes
display(df.head()) # Выводим на экран первые строки полученного DataFra(users)

mask_sex = df['sex'] != 0
display(round(df[mask_sex]['sex'].value_counts(normalize=True), 2))




Unnamed: 0,id,first_name,last_name,can_access_closed,is_closed,sex,bdate,deactivated
0,1,Павел,Дуров,True,False,2,10.10.1984,
1,2,Александра,Владимирова,False,True,1,,
2,3,DELETED,,,,0,,deleted
3,4,DELETED,,,,0,,deleted
4,5,Илья,Перекопский,True,False,2,18.11,


2    0.51
1    0.49
Name: sex, dtype: float64

Мы видим, что всего пользователей в группе больше 11 миллионов, а получили мы только первую тысячу пользователей группы. По информации, указанной в документации о параметре count, это максимум, который может отдать API за один раз.

Для получения следующей тысячи пользователей можно воспользоваться параметром offset (с англ. смещение), который передвинет начало отсчёта. Для выгрузки всех пользователей группы будем в цикле выгружать по 1000 пользователей (count будет всегда равен 1000), увеличивая смещение offset на величину count.

Для тренировки напишем цикл выгрузки первых 20 пользователей со значением count=5. Иными словами, мы будем выгружать по пять пользователей за запрос до тех пор, пока не получим информацию о 20 пользователях.

Давайте выведем на экран первые 20 пользователей из нашей первой попытки получить информацию о 1000 пользователей, чтобы мы могли сверить результат выгрузки из 20 пользователей:

In [77]:
import requests # Импортируем модуль requests

url = 'https://api.vk.com/method/groups.getMembers' # Указываем адрес обращения
params = {'group_id': 'vk', 'v': 5.131, 'access_token': token} # Формируем строку параметров
response = requests.get(url, params = params) # Посылаем запрос
data = response.json() # Ответ сохраняем в переменной data в формате словаря
# print(data) # Выводим содержимое переменной data на экран (отображён фрагмент)
len(data['response']['items'])
users_for_checking = data['response']['items'][:20] # Загружаем в переменную информацию об id первых 20 пользователей в виде списка
print(users_for_checking) # Выводим перечень id первых 20 пользователей
max_count = data['response']['count']
max_count


[6, 19, 47, 54, 79, 177, 198, 212, 219, 239, 243, 345, 407, 450, 467, 485, 510, 550, 619, 640]


12499885

In [70]:
import requests # Импортируем модуль requests

url = 'https://api.vk.com/method/groups.getMembers' # Указываем адрес обращения
count = 500 
offset = 0 
user_ids = [] 
max_count = 20000 
while offset < max_count: 
    # Будем выгружать по count=5 пользователей, 
    # начиная с того места, где закончили на предыдущей итерации (offset) 
    print('Выгружаю {} пользователей с offset = {}'.format(count, offset))   
    params = {'group_id': 'vk', 'v': 5.131, 'count': count, 'offset': offset, 'access_token': token} 
    response = requests.get(url, params = params) 
    data = response.json() 
    user_ids += data['response']['items'] 
    # Увеличиваем смещение на количество строк, которое мы уже выгрузили 
    offset += count 
print(user_ids) 

Выгружаю 500 пользователей с offset = 0
Выгружаю 500 пользователей с offset = 500
Выгружаю 500 пользователей с offset = 1000
Выгружаю 500 пользователей с offset = 1500
Выгружаю 500 пользователей с offset = 2000
Выгружаю 500 пользователей с offset = 2500
Выгружаю 500 пользователей с offset = 3000
Выгружаю 500 пользователей с offset = 3500
Выгружаю 500 пользователей с offset = 4000
Выгружаю 500 пользователей с offset = 4500
Выгружаю 500 пользователей с offset = 5000
Выгружаю 500 пользователей с offset = 5500
Выгружаю 500 пользователей с offset = 6000
Выгружаю 500 пользователей с offset = 6500
Выгружаю 500 пользователей с offset = 7000
Выгружаю 500 пользователей с offset = 7500
Выгружаю 500 пользователей с offset = 8000
Выгружаю 500 пользователей с offset = 8500
Выгружаю 500 пользователей с offset = 9000
Выгружаю 500 пользователей с offset = 9500
Выгружаю 500 пользователей с offset = 10000
Выгружаю 500 пользователей с offset = 10500
Выгружаю 500 пользователей с offset = 11000
Выгружаю 500

### ОГРАНИЧЕНИЕ ПО ЧАСТОТЕ ЗАПРОСОВ

→ В API часто добавляют ограничение по частоте запросов, чтобы отдельно взятые пользователи слишком сильно не перегружали сервер. Подобное ограничение есть и у ВКонтакте — в документации указано, что можно делать не более трёх запросов в секунду.

Чтобы не следить за частотой отправки запросов с секундомером в руках, мы можем после каждого запроса делать паузу. В этом случае, даже если код будет выполняться на самом быстром компьютере, мы не нарушим установленное ограничение, так как периодичность отправки запросов будет искусственно замедлена.

Воспользуемся библиотекой time и методом sleep, с помощью которого мы можем добавить паузу, например в 0.5 секунд, после каждого запроса:

In [42]:
import requests # Импортируем модуль requests
import time # Импортируем модуль time
token = 'db2ce76cdb2ce76cdb2ce76c2edb50d491ddb2cdb2ce76cb9774c31d3f8c8400533adf3' # Указываем свой сервисный токен
url = 'https://api.vk.com/method/groups.getMembers' # Указываем адрес страницы, к которой делаем запрос
count = 1000
offset = 0  
user_ids = []  
while offset < 5000: 
    params = {'group_id': 'vk', 'v': 5.95, 'count': count, 'offset': offset, 'access_token': token} 
    response = requests.get(url, params = params) 
    # pprint(response.text)
    data = response.json() 
    user_ids += data['response']['items'] 
    offset += count 
    print('Ожидаю 0.5 секунды...') 
    time.sleep(0.5) 

print('Цикл завершен, offset =',offset) 

Ожидаю 0.5 секунды...
Ожидаю 0.5 секунды...
Ожидаю 0.5 секунды...
Ожидаю 0.5 секунды...
Ожидаю 0.5 секунды...
Цикл завершен, offset = 5000


### ЛАЙКИ, РЕПОСТЫ И КОММЕНТАРИИ

Через API новостной ленты ВКонтакте мы можем получить информацию о взаимодействии с сообщениями в ленте.

Для примера продолжим работать с группой https://vk.com/vk и рассмотрим последние 1000 сообщений в новостной ленте.

Для получения информации о сообщениях на стене в API ВКонтакте предусмотрен метод wall.get. Применим его:

In [43]:
import requests # Импортируем модуль requests
from pprint import pprint # Импортируем функцию pprint()
token = 'db2ce76cdb2ce76cdb2ce76c2edb50d491ddb2cdb2ce76cb9774c31d3f8c8400533adf3' # Указываем свой сервисный токен
url = 'https://api.vk.com/method/wall.get' # Указываем адрес страницы, к которой делаем запрос
params = {'domain': 'vk', 'filter': 'owner', 'count': 1000, 'offset': 0, 'access_token': token, 'v': 5.95} 
response = requests.get(url, params = params) 
pprint(response.json()) 

{'response': {'count': 484,
              'items': [{'attachments': [{'type': 'video',
                                          'video': {'access_key': '5bd99da508c4b69bd5',
                                                    'can_add': 1,
                                                    'can_add_to_faves': 1,
                                                    'can_comment': 0,
                                                    'can_like': 1,
                                                    'can_repost': 1,
                                                    'can_subscribe': 1,
                                                    'comments': 0,
                                                    'date': 1650036655,
                                                    'description': '',
                                                    'duration': 30,
                                                    'first_frame_1280': 'https://i.mycdn.me/getVideoPreview?id=2382458915369&idx

In [44]:
# Анализируя ответ, понимаем, что по ключу count можно найти общее количество сообщений в новостной ленте, а по ключу items — сами сообщения.
# Посмотрим на информацию об отдельном сообщении:

response.json()['response']['items'][5] 

{'id': 1289547,
 'from_id': -22822305,
 'owner_id': -22822305,
 'date': 1648885800,
 'marked_as_ads': 0,
 'post_type': 'post',
 'text': 'В этом месяце пользователи ВКонтакте стали добавляться в друзья на десятки миллионов раз чаще. Количество новых дружб выросло на 250%.\n\nЧтобы пригласить своих друзей ВКонтакте, нужно открыть мобильное приложение и импортировать контакты из вашей телефонной книги. Как это сделать, наглядно показываем на видео.\n\nВы также можете найти знакомого с помощью поиска. Выберите страну и город, возраст и/или учебное заведение, чтобы точно отыскать того, кого нужно. Обратите внимание: по номеру телефона найти пользователя таким образом нельзя, даже если он указал его в контактной информации.',
 'attachments': [{'type': 'video',
   'video': {'access_key': '12b20e600ca344e611',
    'can_comment': 0,
    'can_like': 1,
    'can_repost': 1,
    'can_subscribe': 1,
    'can_add_to_faves': 1,
    'can_add': 1,
    'comments': 2,
    'date': 1648538727,
    'descrip

В полях comments, likes и reposts содержится статистика по взаимодействию с сообщением пользователей (на момент получения информации) — число комментариев, лайков и репостов.

Давайте соберём итоговую статистику для последних десяти непустых сообщений в словарь stats. В качестве ключа будем использовать начало сообщения (если начало сообщения пустое, то информацию о таком сообщении проигнорируем), в качестве значения — список с тремя интересующими нас метриками и временем публикации (комментарии, лайки, репосты, дата публикации):

In [45]:
stats = {} 
count_post = 0 # Счётчик «непустых» сообщений
for record in response.json()['response']['items'][:]:
    title = record['text'][:30] 
    if title: 
        stats[title] = [record['comments']['count'], record['likes']['count'], record['reposts']['count'], record['date']] 
        count_post += 1 
    if count_post < 10: 
        continue 
    else: 
        break 
pprint(stats)

{'Аудитория ВКонтакте растёт: в ': [402, 1115, 265, 1648644620],
 'В VK Видео обновление для тех,': [326, 1374, 306, 1649349732],
 'В VK Видео — обновление для лю': [171, 731, 178, 1649929834],
 'В мультивселенной ВКонтакте от': [1178, 4014, 1096, 1649757486],
 'В этом месяце пользователи ВКо': [481, 1586, 330, 1648885800],
 'Весной пользователи стали созд': [152, 707, 174, 1648803000],
 'Запустили приложение VK Видео ': [534, 1398, 533, 1648119076],
 'Подсчитали: просмотры историй ': [1077, 900, 270, 1648975800],
 'Представляем мобильное приложе': [169, 662, 234, 1650036838],
 'Что посмотреть ВКонтакте? [htt': [382, 506, 86, 1648715757]}


ДОПОЛНИТЕЛЬНО

Если вы размещаете рекламу во ВКонтакте, то можно выгружать всю статистику через ads API(https://vk.com/dev/ads).

Полный список методов ВКонтакте можно посмотреть в документации.(https://vk.com/dev/methods)

### КАК НАСТРОИТЬ АВТОМАТИЧЕСКИЙ ЗАПУСК

Во всех операционных системах есть встроенные средства запуска программ по расписанию. Однако можно задать расписание запуска необходимых вам функций на языке Python внутри скрипта.

Исполняемый по расписанию код часто называют задачей (англ. task). Для планирования задач в Python есть несколько библиотек, среди которых — популярный и простой в использовании модуль schedule (c англ. расписание). Он позволяет запускать код как с определённым интервалом, так и в заданное время.

Модуль schedule не входит в стандартную библиотеку Python, поэтому его необходимо установить:

In [46]:
# Устанавливаем библиотеку schedule
%pip3 install schedule 
# Для того чтобы у нас появилась возможность использовать модуль в коде, импортируем его:

import schedule # Импортируем модуль schedule


UsageError: Line magic function `%pip3` not found.


In [47]:
# import schedule

# def task(): 
#     print('Hello! I am a task!') 
#     return

# schedule.every(2).minutes.do(task)

# import time 
# while True: 
#     schedule.run_pending() 
#     time.sleep(1)

In [48]:
class sample:
    pass
test=sample()
test.name="test1"
print(test.name)

test1


In [49]:
print(list(zip([1,2,3], ['apple', 'grape', 'orange'], ['x', 2, True])))

for num, fruit, thing in zip([1,2,3], ['apple', 'grape', 'orange'], ['x', 2, True]):
    print(num)
    print(fruit)
    print(thing)

[(1, 'apple', 'x'), (2, 'grape', 2), (3, 'orange', True)]
1
apple
x
2
grape
2
3
orange
True


ВЫПОЛНЕНИЕ ФУНКЦИИ

После того как мы создали нашу функцию и определились со временем её запуска, мы можем запустить наш менеджер расписания (schedule). Для этого надо создать бесконечный цикл. Да-да, именно так, ведь скрипт должен выполняться постоянно, чтобы постоянно проверять, не пришло ли время снова выполнить задачу.

Внутри цикла мы будем вызывать особый метод run_pending() для объекта schedule, который будет проверять, нет ли задачи, которую пора выполнить.

После вызова метода run_pending() нужно будет сделать небольшую паузу, после которой можно будет снова проверять, не пришло ли время для выполнения какой-либо функции.

Давайте напишем этот код.

Для создания паузы мы будем использовать метод sleep из модуля time, поэтому наш код начнётся с импорта данного модуля:

In [50]:
a = '1'
b = '2'
c = '3'
s = a + '[' + b + ':' + c + ']'
print(s)

1[2:3]


In [51]:
#Пример *args
def sample(*args):
    print(args)

sample('time', 1, True)

#Пример **kwargs
def sample(**kwargs):
    print(kwargs)

sample(a = 'time', b = 1)

('time', 1, True)
{'a': 'time', 'b': 1}


In [52]:
def star_triangle(r):
   for x in range(r):
      print(' '*(r-x-1)+'*'*(2*x+1))

star_triangle(7)

      *
     ***
    *****
   *******
  *********
 ***********
*************


In [53]:
a = [1,2,3]
b = a
c = [1,2,3]
print(a == b, a == c, a is b, a is c)

True True True False


In [54]:
def apply_discounts(products, stocks):
    """
    Напишите функцию apply_discounts(), которая снижает цену продуктов в словаре products на указанный в словаре stocks процент. 
    Функция должна вернуть результирующий словарь, ключи которого — товары, а значения — новые цены.
    Если продукта из словаря stocks нет в словаре products, то его необходимо пропустить. Цены округлите до второго знака после запятой.
    """
    for product, price in products.items():
        for stock, discount in stocks.items():
            if product == stock:
                products[product] = round(price * (1 - float(discount.replace('%' , ''))/100), 2)
    return products


    
if __name__ == '__main__':
    products={
        "Oranges (packaged)": 114.99, 
        "Candy (Rotfront)": 280.00,
        "Boiled sausage": 199.99,
        "Juice J7 (orange)": 119.99,
        "Trout (Seven Seas)": 399.99
        }
    stocks = {
        "Boiled sausage": "33%",
        "Juice J7 (orange)": "12%",
        "Trout (Seven Seas)": "18%"
    }
    new_products = apply_discounts(products, stocks)
    print(new_products)

{'Oranges (packaged)': 114.99, 'Candy (Rotfront)': 280.0, 'Boiled sausage': 133.99, 'Juice J7 (orange)': 105.59, 'Trout (Seven Seas)': 327.99}


In [60]:
#https://vk.com/dev/groups.getMembers
req = requests.get('https://api.vk.com/method/groups.getMembers', 
        params = {'access_token':token, 
                  'v':'5.81', 'fields': 'sex, bdate, city', 'group_id': 174948538, 'offset':1000})

req.json()

{'response': {'count': 9007,
  'items': [{'id': 76499531,
    'first_name': 'Natasha',
    'last_name': 'Nekrasova',
    'sex': 1},
   {'id': 76705504,
    'first_name': 'Minaev',
    'last_name': 'Sergy',
    'sex': 2,
    'city': {'id': 4902, 'title': 'Semikarakorsk'}},
   {'id': 76865858,
    'first_name': 'Yury',
    'last_name': 'Plotnikov',
    'sex': 2,
    'city': {'id': 1115119, 'title': 'Opytny'}},
   {'id': 77044186,
    'first_name': 'Alexander',
    'last_name': 'Koshenko',
    'sex': 2,
    'bdate': '5.6',
    'city': {'id': 49, 'title': 'Yekaterinburg'}},
   {'id': 77076967,
    'first_name': 'Vugar',
    'last_name': 'Abdullaev',
    'sex': 2,
    'bdate': '30.12.1989',
    'city': {'id': 1957236, 'title': 'Baku'}},
   {'id': 77269574,
    'first_name': 'Igor',
    'last_name': 'Ryzhikov',
    'sex': 2,
    'bdate': '19.12.1986',
    'city': {'id': 75, 'title': 'Kursk'}},
   {'id': 77776801,
    'first_name': 'Alexey',
    'last_name': 'Kuldonoshvili',
    'sex': 2,
   

In [62]:
len(req.json()['response']['items'])

804

In [63]:
df = pd.DataFrame.from_records(items)
df['city'] = list(map(get_title, items))
df

NameError: name 'items' is not defined

In [65]:
import vk_api


vk = vk_session.get_api()

def get_by_query(length=10):
#     req = requests.get('https://api.vk.com/method/groups.search', 
#             params = {'access_token':token, 
#                       'v':'5.73', 'q':str(query), 'count':10, 'sort':0}).json()['response']
    req = vk.groups.search(q='python')
    groups = [req['items'][i]['id'] for i in range(length)]
    return groups


result = get_by_query()
result

NameError: name 'vk_session' is not defined