# MAVERICK - Adatfelfedezés

Ez a notebook az ABS_torveny és labels adatok feltárására szolgál.

In [None]:
# Google Drive csatlakoztatás
from google.colab import drive
drive.mount('/content/drive')

# Projekt klónozása GitHub-ról
!git clone https://github.com/Koppi02/AI-Agent.git
%cd AI-Agent

# Függõségek telepítése
!pip install -q -r requirements.txt

In [None]:
import sys
sys.path.insert(0, '/content/AI-Agent')

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from src.data.loader import DataLoader
from src.utils.io_utils import load_config
from src.utils.visualization import plot_category_distribution

In [None]:
# Konfiguráció betöltése
config = load_config('config/config.yaml')

# Frissítsd a Drive elérési utat
config['data']['drive_path'] = '/content/drive/MyDrive/AI_PROJECTS/'

print("Konfiguráció betöltve!")

## ABS_torveny Feltárás

In [None]:
# ABS_torveny betöltése
data_loader = DataLoader(config)
abs_df = data_loader.load_abs_torveny()

print(f"\nABS_torveny méret: {abs_df.shape}")
display(abs_df.head())

In [None]:
# Hierarchia eloszlások
print(f"Unique Segments: {abs_df['SegmentName'].nunique()}")
print(f"Unique Brands: {abs_df['BrandName'].nunique()}")
print(f"Unique BaseBrands: {abs_df['BaseBrandName'].nunique()}")
print(f"Unique Advertisers: {abs_df['AdvertiserName'].nunique()}")

In [None]:
# Vizualizáció
plot_category_distribution(abs_df, 'SegmentName', 'Top 20 Segment Distribution', top_n=20)
plot_category_distribution(abs_df, 'BrandName', 'Top 20 Brand Distribution', top_n=20)

## Labels Adatok Feltárása

In [None]:
# Labels betöltése
labels_df = data_loader.load_labels(use_processed=True)

print(f"\nLabels méret: {labels_df.shape}")
display(labels_df.head())

In [None]:
# Képek eloszlása kategóriánként
plot_category_distribution(labels_df, 'a_segment', 'Képek Segment szerint', top_n=20)
plot_category_distribution(labels_df, 'a_brand', 'Képek Brand szerint', top_n=20)