# Zadania z Systemów Rekomendacyjnych i Analizy Danych

## Przygotowanie środowiska i pobranie danych

In [None]:
import os
import requests
import pandas as pd
import numpy as np
from zipfile import ZipFile
from io import BytesIO
import urllib.request

# Tworzenie katalogów dla danych
data_dirs = ['movie_data', 'ecommerce_data', 'social_media_data']
for dir_name in data_dirs:
    os.makedirs(dir_name, exist_ok=True)

# MovieLens dataset
print("Pobieranie danych MovieLens...")
movielens_url = "https://files.grouplens.org/datasets/movielens/ml-100k.zip"
try:
    response = requests.get(movielens_url)
    with ZipFile(BytesIO(response.content)) as zip_ref:
        zip_ref.extractall("movie_data")
    print("Pomyślnie pobrano i rozpakowano dane MovieLens")
except Exception as e:
    print(f"Błąd podczas pobierania danych MovieLens: {e}")

# E-commerce dataset
print("\nPobieranie danych E-commerce...")
ecommerce_url = "https://archive.ics.uci.edu/ml/machine-learning-databases/00502/online_retail_II.xlsx"
try:
    urllib.request.urlretrieve(ecommerce_url, "ecommerce_data/online_retail_II.xlsx")
    print("Pomyślnie pobrano dane E-commerce")
except Exception as e:
    print(f"Błąd podczas pobierania danych E-commerce: {e}")

# Twitter data
print("\nPobieranie danych Twitter...")
twitter_url = "https://raw.githubusercontent.com/gedeck/practical-statistics-for-data-scientists/master/data/twitter_trends.csv"
try:
    urllib.request.urlretrieve(twitter_url, "social_media_data/twitter_trends.csv")
    print("Pomyślnie pobrano dane Twitter")
except Exception as e:
    print(f"Błąd podczas pobierania danych Twitter: {e}")

## Ładowanie i przegląd danych

In [None]:
def load_movielens_data():
    """Ładuje i przygotowuje dane MovieLens"""
    ratings_file = 'movie_data/ml-100k/u.data'
    movies_file = 'movie_data/ml-100k/u.item'
    users_file = 'movie_data/ml-100k/u.user'
    
    try:
        ratings = pd.read_csv(ratings_file, 
                             sep='\t',
                             names=['user_id', 'movie_id', 'rating', 'timestamp'])
        
        movies = pd.read_csv(movies_file,
                            sep='|',
                            encoding='latin-1',
                            names=['movie_id', 'title', 'release_date', 'video_release_date',
                                  'IMDb_URL'] + [f'genre_{i}' for i in range(19)])
        
        users = pd.read_csv(users_file,
                           sep='|',
                           names=['user_id', 'age', 'gender', 'occupation', 'zip_code'])
        
        return ratings, movies, users
    except Exception as e:
        print(f"Błąd podczas wczytywania danych MovieLens: {e}")
        return None, None, None

def load_ecommerce_data():
    """Ładuje i przygotowuje dane E-commerce"""
    try:
        data = pd.read_excel('ecommerce_data/online_retail_II.xlsx')
        data = data.dropna()
        data['TotalPrice'] = data['Quantity'] * data['Price']
        return data
    except Exception as e:
        print(f"Błąd podczas wczytywania danych E-commerce: {e}")
        return None

def load_twitter_data():
    """Ładuje i przygotowuje dane Twitter"""
    try:
        data = pd.read_csv('social_media_data/twitter_trends.csv')
        return data
    except Exception as e:
        print(f"Błąd podczas wczytywania danych Twitter: {e}")
        return None

# Wczytanie zbiorów danych
print("Wczytywanie zbiorów danych...")
ratings, movies, users = load_movielens_data()
ecommerce_data = load_ecommerce_data()
twitter_data = load_twitter_data()

# Wyświetlenie informacji
print("\nPodstawowe informacje o zbiorach danych:")
if ratings is not None:
    print("\nMovieLens - Oceny:")
    print(ratings.info())
    
if ecommerce_data is not None:
    print("\nE-commerce:")
    print(ecommerce_data.info())
    
if twitter_data is not None:
    print("\nTwitter:")
    print(twitter_data.info())

## Zadanie 1: System Rekomendacji Filmów

Zaimplementuj system rekomendacji wykorzystujący filtrowanie kolaboratywne oraz reprezentacje głębokie.

In [None]:
import torch
import torch.nn as nn
from typing import Dict, List, Tuple

class MovieRecommender:
    def __init__(self, n_users: int, n_movies: int, embedding_dim: int = 100):
        self.model = DeepRecommenderModel(n_users, n_movies, embedding_dim)
        self.optimizer = torch.optim.Adam(self.model.parameters())
        self.criterion = nn.MSELoss()
    
    def train(self, ratings_data: pd.DataFrame, epochs: int = 10):
        """Trenuje model rekomendacji"""
        for epoch in range(epochs):
            # TODO: Implementacja treningu
            pass
    
    def get_recommendations(self, user_id: int, n_recommendations: int = 10) -> List[Tuple[int, float]]:
        """Generuje rekomendacje dla użytkownika"""
        # TODO: Implementacja rekomendacji
        pass

## Zadanie 2: Analiza Zachowań Użytkowników

Zaimplementuj system analizy zachowań użytkowników w e-commerce.

In [None]:
class UserBehaviorAnalyzer:
    def __init__(self):
        self.session_processor = None
        self.pattern_detector = None
    
    def analyze_sessions(self, session_data: pd.DataFrame) -> Dict:
        """Analizuje sesje użytkowników"""
        # TODO: Implementacja analizy sesji
        pass
    
    def detect_patterns(self, user_data: pd.DataFrame) -> List[Dict]:
        """Wykrywa wzorce zachowań"""
        # TODO: Implementacja detekcji wzorców
        pass

## Zadanie 3: Analiza Trendów Społecznościowych

Zaimplementuj system analizy trendów w mediach społecznościowych.

In [None]:
class TrendAnalyzer:
    def __init__(self):
        self.trend_detector = None
        self.sentiment_analyzer = None
    
    def analyze_trends(self, social_data: pd.DataFrame) -> Dict:
        """Analizuje trendy"""
        # TODO: Implementacja analizy trendów
        pass
    
    def predict_trend_development(self, trend_data: pd.DataFrame) -> Dict:
        """Przewiduje rozwój trendów"""
        # TODO: Implementacja predykcji trendów
        pass

## Zadania do wykonania

1. System rekomendacji filmów:
   - Implementacja głębokiego modelu rekomendacji
   - Dodanie mechanizmu uwagi
   - Implementacja cold-start
   - Ewaluacja rekomendacji

2. Analiza zachowań użytkowników:
   - Segmentacja użytkowników
   - Detekcja anomalii
   - Predykcja zachowań
   - Wizualizacje

3. Analiza trendów:
   - Detekcja trendów
   - Analiza sentymentu
   - Predykcja rozwoju
   - Raporty i dashboardy