# ფინალური პროექტი: წიგნების ბაზრის ანალიზი

## პროექტის მიმოხილვა
მოცემული პროექტის მიზანია ქართულ ბაზარზე არსებული პოპულარული წიგნების მონაცემების შეგროვება, დამუშავება და ვიზუალიზაცია. პროექტი დაყოფილია სამ ეტაპად, როგორც ეს დავალებაშია მოთხოვნილი.

## ეტაპი 1: მონაცემების მოგროვება
ამ ეტაპზე ჩვენ ვიყენებთ `pandas` ბიბლიოთეკას მონაცემების სტრუქტურირებისთვის და შესანახად. მონაცემები მოიცავს წიგნის სათაურს, ავტორს, ფასს, კატეგორიას და რეიტინგს.

In [None]:
import pandas as pd

# მონაცემების წაკითხვა CSV ფაილიდან
df = pd.read_csv('books_data.csv')

# პირველი რამდენიმე ჩანაწერის ნახვა
print("მონაცემები წარმატებით ჩაიტვირთა:")
display(df.head())

## ეტაპი 2: მონაცემების დამუშავება და ანალიზი
ამ ეტაპზე ჩვენ დავამუშავებთ მონაცემებს და გამოვყოფთ სამ საინტერესო მიგნებას:
1. საშუალო ფასი კატეგორიების მიხედვით.
2. ყველაზე მაღალრეიტინგული ჟანრები.
3. ავტორები, რომელთა წიგნებიც ყველაზე ძვირადღირებულია.

In [None]:
# 1. საშუალო ფასი კატეგორიების მიხედვით
avg_price_by_category = df.groupby('category')['price'].mean().sort_values(ascending=False)
print("საშუალო ფასი კატეგორიების მიხედვით:")
print(avg_price_by_category)

# 2. საშუალო რეიტინგი კატეგორიების მიხედვით
avg_rating_by_category = df.groupby('category')['rating'].mean().sort_values(ascending=False)
print("\nსაშუალო რეიტინგი კატეგორიების მიხედვით:")
print(avg_rating_by_category)

# 3. ყველაზე ძვირადღირებული წიგნების ტოპ 5
top_expensive_books = df.nlargest(5, 'price')[['title', 'author', 'price']]
print("\nყველაზე ძვირადღირებული 5 წიგნი:")
print(top_expensive_books)

## ეტაპი 3: ვიზუალიზაცია
მონაცემების უკეთ აღსაქმელად გამოვიყენებთ `matplotlib` და `seaborn` ბიბლიოთეკებს.

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# ვიზუალიზაციის სტილის დაყენება
sns.set(style="whitegrid")

# თუ გრაფიკზე ქართული ასოები არ გამოჩნდა, გამოიყენეთ შემდეგი ხაზი (Windows-ზე):
# plt.rcParams['font.family'] = 'Sylfaen'

# 1. ფასების განაწილება კატეგორიების მიხედვით
plt.figure(figsize=(12, 6))
sns.barplot(x=avg_price_by_category.index, y=avg_price_by_category.values, palette="viridis")
plt.title('საშუალო ფასი კატეგორიების მიხედვით')
plt.xlabel('კატეგორია')
plt.ylabel('საშუალო ფასი (ლარი)')
plt.xticks(rotation=45)
plt.show()

# 2. რეიტინგების განაწილება
plt.figure(figsize=(10, 6))
sns.histplot(df['rating'], bins=10, kde=True, color='skyblue')
plt.title('წიგნების რეიტინგების განაწილება')
plt.xlabel('რეიტინგი')
plt.ylabel('რაოდენობა')
plt.show()

## დასკვნა
ჩატარებული ანალიზის შედეგად გამოიკვეთა, რომ ფენტეზის ჟანრის წიგნები გამოირჩევა მაღალი ფასით, ხოლო საბავშვო და კლასიკური ლიტერატურა სტაბილურად მაღალ რეიტინგს ინარჩუნებს მომხმარებლებში.