In [3]:
"""Скрипт для получения примера товара с названием 'Футболка' из датасета."""

import pandas as pd
from pathlib import Path
import numpy as np

# Пути к файлам
# Определяем корень проекта (на уровень выше папки notebooks)
current_dir = Path().resolve()
if current_dir.name == "notebooks":
    project_root = current_dir.parent
else:
    project_root = current_dir

raw_data_path = project_root / "data/raw/lamoda_reviews.csv"
output_path = project_root / "data/interim/one_example.csv"

print("=" * 80)
print("ЗАГРУЗКА ДАННЫХ")
print("=" * 80)

# Загружаем данные
df = pd.read_csv(raw_data_path)
print(f"Загружено отзывов: {len(df)}")
print(f"Уникальных товаров (SKU): {df['product_sku'].nunique()}")

# Ищем товары с названием "Футболка"
target_name = "Футболка"
futbolka_products = df[df['name'] == target_name].copy()

if futbolka_products.empty:
    print(f"\n⚠ Товары с названием '{target_name}' не найдены!")
    print("Доступные названия (первые 10):")
    available_names = df['name'].dropna().unique()[:10]
    for name in available_names:
        print(f"  - {name}")
    raise ValueError(f"Товар с названием '{target_name}' не найден в датасете")

# Получаем уникальные SKU для товаров "Футболка"
futbolka_skus = futbolka_products['product_sku'].unique()
print(f"\nНайдено товаров с названием '{target_name}': {len(futbolka_skus)} SKU")

# Выбираем первый SKU (или можно выбрать случайный)
selected_sku = futbolka_skus[0]
print(f"\nВыбранный SKU: {selected_sku}")

# Фильтруем данные по выбранному SKU
one_example_df = df[df['product_sku'] == selected_sku].copy()

print(f"\nКоличество отзывов для выбранного товара: {len(one_example_df)}")
print(f"Название товара: {one_example_df['name'].iloc[0] if 'name' in one_example_df.columns else 'N/A'}")
print(f"Категория: {one_example_df['good_type'].iloc[0] if 'good_type' in one_example_df.columns else 'N/A'}")
print(f"Подтип: {one_example_df['good_subtype'].iloc[0] if 'good_subtype' in one_example_df.columns else 'N/A'}")

# Сохраняем в interim
one_example_df.to_csv(output_path, index=False, encoding='utf-8')
print(f"\n✓ Данные сохранены в: {output_path}")
print("=" * 80)


ЗАГРУЗКА ДАННЫХ
Загружено отзывов: 1774267
Уникальных товаров (SKU): 254307

Найдено товаров с названием 'Футболка': 16983 SKU

Выбранный SKU: MP002XG057UN

Количество отзывов для выбранного товара: 4
Название товара: Футболка
Категория: Clothes
Подтип: TEE-SHIRTS & POLOS

✓ Данные сохранены в: /Users/a.danyarov/Library/CloudStorage/GoogleDrive-abdaniarov@gmail.com/Мой диск/02 Education/01 CU master/lamoda-bootcamp/data/interim/one_example.csv
