# VK parser

1. Получает посты и комментарии из VK API (парсер)
2. Отправляет комментарии в FastAPI сервис для классификации и сохранить результат в CSV

In [None]:
import requests
import time
import csv

# Параметры
TOKEN = "..." # токен получен при регистрации приложения в ВК
GROUP_ID = -....  # ID группы
API_VERSION = "5.199"
TARGET_COMMENTS = 20  # количество комментариев для скачивания

API_URL = "http://127.0.0.1:8000/predict_model" # указан локальный адрес сервиса

# Функции
def get_total_posts():
    """Получаем общее количество постов в группе"""
    url = "https://api.vk.com/method/wall.get"
    params = {"owner_id": GROUP_ID, "count": 1, "access_token": TOKEN, "v": API_VERSION}
    r = requests.get(url, params=params).json()
    return r["response"]["count"]

def get_posts(offset=0, count=100):
    """Скачиваем посты пачкой с указанного смещения"""
    url = "https://api.vk.com/method/wall.get"
    params = {
        "owner_id": GROUP_ID,
        "count": count,
        "offset": offset,
        "access_token": TOKEN,
        "v": API_VERSION
    }
    r = requests.get(url, params=params).json()
    if "response" not in r:
        print("Ошибка при получении постов:", r)
        return []
    return r["response"]["items"]

def get_comments(post_id, max_comments=1000):
    """Скачиваем комментарии к одному посту"""
    comments = []
    offset = 0
    while True:
        url = "https://api.vk.com/method/wall.getComments"
        params = {
            "owner_id": GROUP_ID,
            "post_id": post_id,
            "count": 100,
            "offset": offset,
            "access_token": TOKEN,
            "v": API_VERSION,
        }
        r = requests.get(url, params=params).json()
        if "response" not in r:
            print("Ошибка при получении комментариев:", r)
            break
        data = r["response"]["items"]
        comments.extend([c["text"] for c in data if "text" in c])
        if len(data) < 100 or len(comments) >= max_comments:
            break
        offset += 100
        time.sleep(0.35)
    return comments[:max_comments]

def classify_comments(comments):
    """Отправляем список комментариев в FastAPI и получаем предсказания"""
    data = {"text": comments}
    response = requests.post(API_URL, json=data)
    if response.status_code == 200:
        return response.json()["predictions"]
    else:
        print("Ошибка классификации:", response.text)
        return ["error"] * len(comments)


# Основной код
total_comments = 0
post_offset = 0
posts_per_batch = 100
total_posts = get_total_posts()
print(f"Всего постов в группе: {total_posts}")

with open("vk_comments_classified.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.writer(f)
    writer.writerow(["comment", "sentiment"])

    while total_comments < TARGET_COMMENTS and post_offset < total_posts:
        posts = get_posts(offset=post_offset, count=posts_per_batch)
        if not posts:
            break
        for post in posts:
            if total_comments >= TARGET_COMMENTS:
                break
            post_id = post["id"]
            remaining = TARGET_COMMENTS - total_comments
            print(f"Скачиваем комменты к посту {post_id} (осталось {remaining})...")
            comments = get_comments(post_id, max_comments=remaining)

            if comments:
                # Отправляем на классификацию
                sentiments = classify_comments(comments)
                for c, s in zip(comments, sentiments):
                    writer.writerow([c, s])

            total_comments += len(comments)
        post_offset += posts_per_batch

print(f"Собрано всего {total_comments} комментариев")
print("CSV файл сохранён: vk_comments_classified.csv")

Скачиваем комменты к посту 448377 (осталось 292)...
Скачиваем комменты к посту 448374 (осталось 292)...
Скачиваем комменты к посту 448370 (осталось 289)...
Скачиваем комменты к посту 448347 (осталось 287)...
Скачиваем комменты к посту 448338 (осталось 283)...
Скачиваем комменты к посту 448330 (осталось 270)...
Скачиваем комменты к посту 448326 (осталось 270)...
Скачиваем комменты к посту 448306 (осталось 266)...
Скачиваем комменты к посту 448303 (осталось 261)...
Скачиваем комменты к посту 448292 (осталось 261)...
Скачиваем комменты к посту 448266 (осталось 256)...
Скачиваем комменты к посту 448125 (осталось 249)...
Скачиваем комменты к посту 448123 (осталось 164)...
Скачиваем комменты к посту 448102 (осталось 163)...
Скачиваем комменты к посту 448076 (осталось 160)...
Скачиваем комменты к посту 448045 (осталось 148)...
Скачиваем комменты к посту 448024 (осталось 137)...
Скачиваем комменты к посту 447959 (осталось 122)...
Скачиваем комменты к посту 447921 (осталось 120)...
Скачиваем ко