Skip to content

Latest commit

 

History

History
25 lines (17 loc) · 2.6 KB

matplotlib+vk+homework.md

File metadata and controls

25 lines (17 loc) · 2.6 KB

Домашнее задание

Matplotlib + VK

В домашнем задании вам нужно написать программу, которая обращается к открытому (то есть такому, чтобы для просмотра контента не нужна была авторизация) сообществу VK.com, выкачивает посты со стены и комментарии к ним. Выберите сообщество поживее, чтобы там было много постов и много комментариев к ним. Обязательное условие: программа должна уметь скачивать со стены больше, чем 100 постов, и больше, чем 100 комментариев к посту (если их действительно больше 100). Кроме выкачивания нужно сделать следующее:

  • Посчитайте питоном длину каждого поста и каждого комментария в словах.

  • Создайте график, описывающий, как длина поста соотносится со средней длиной комментариев.

  • Помимо выкачивания постов и комментариев, программа должна смотреть в профиль пользователя, который написал пост или сделал комментарий, и узнавать о нём социолингвистическую информацию: возраст и город (если они указаны). Для города достаточно id (то есть название узнавать не обязательно, хотя это можно сделать средствами API, а возраст нужно уметь вычислять.

  • Для каждого возраста нужно вычислить среднюю длину поста и комментария, нарисовать график, отражающий эту информацию.

  • Аналогичные графики нужно нарисовать для каждого города.

  • Выложить скачанные тексты (тексты, как и в случае с газетным корпусом, нужно выкладывать не на github, а в репозитории дать ссылку), построенные графики и сам код.

Дедлайн - 23 апреля 23:59