# Комплексний аналіз готелів Львова

**Jupyter Notebook для презентації проекту**  
*Дата підготовки: 26.07.2025*

---

## Як користуватися цим ноутбуком

1. Відкрийте цей файл у [Google Colab](https://colab.research.google.com) (рекомендовано) або Jupyter Notebook.
2. Завантажте обидва CSV-файли (`lviv_hotels_data.csv`, `lviv_reviews_data.csv`) у те саме місце, де знаходиться ноутбук (або підгрузіть у Colab через меню).
3. Натисніть "Run all" / "Запустити все" для швидкого перегляду результатів.
4. Щоб зберегти презентацію у PDF: **File → Print → Save as PDF**.

---

## Зміст
1. Огляд даних
2. Статичні графіки (matplotlib)
3. Інтерактивний графік (Plotly)
4. Висновки та поради для презентації


## 1. Огляд даних

In [None]:

import pandas as pd
hotels = pd.read_csv('anaconda_projects_50d6bded-17c1-4d1a-9eea-aeb88799abb1_lviv_hotels_data.csv')
reviews = pd.read_csv('anaconda_projects_50d6bded-17c1-4d1a-9eea-aeb88799abb1_lviv_reviews_data.csv')
hotels.head()


**Опис основних показників (готелі):**

In [None]:
hotels.describe()

**Огляд відгуків:**

In [None]:
reviews.head()

**Опис основних показників (відгуки):**

In [None]:
reviews.describe()

## 2. Статичні графіки (matplotlib)

In [None]:

import matplotlib.pyplot as plt
import seaborn as sns

plt.figure(figsize=(8,4))
sns.histplot(hotels['rating'], bins=10, kde=True)
plt.title('Розподіл рейтингів готелів')
plt.xlabel('Рейтинг')
plt.ylabel('Кількість')
plt.show()


In [None]:

plt.figure(figsize=(8,4))
sns.scatterplot(x='distance_km', y='price_uah', hue='stars', data=hotels, palette='viridis', s=80)
plt.title('Ціна vs Відстань від центру (за категоріями зірок)')
plt.xlabel('Відстань від центру, км')
plt.ylabel('Ціна, грн')
plt.show()


In [None]:

top10 = hotels.nlargest(10, 'rating')
plt.figure(figsize=(10,5))
sns.barplot(y=top10['name'], x=top10['rating'], palette='crest')
plt.title('ТОП-10 готелів за рейтингом')
plt.xlabel('Рейтинг')
plt.ylabel('Готель')
plt.show()


In [None]:

sentiment_counts = reviews['sentiment'].value_counts()
plt.figure(figsize=(7,3))
sns.barplot(x=sentiment_counts.index, y=sentiment_counts.values, palette='coolwarm')
plt.title('Тональність відгуків')
plt.xlabel('Тональність')
plt.ylabel('Кількість')
plt.show()


## 3. Інтерактивний графік (Plotly)

In [None]:

import plotly.express as px

fig = px.scatter(hotels, x='distance_km', y='price_uah', color='stars',
                 size='rating', hover_name='name', title='Ціна vs Відстань від центру (інтерактивно)',
                 labels={'distance_km': 'Відстань від центру, км', 'price_uah': 'Ціна, грн', 'stars': 'Зірки'})
fig.show()



> **Пояснення:** цей інтерактивний графік дозволяє навести курсор на кожен готель, бачити його параметри та фільтрувати за кількістю зірок.

Якщо ви не бачите графік — переконайтеся, що запущено у Google Colab чи Jupyter Notebook.



## 4. Висновки та поради для презентації

- Покажіть різницю між статичними та інтерактивними графіками.
- Наочний аналіз даних працює краще за суху статистику!
- Можна змінювати код або дані для демонстрації сценаріїв (наприклад, топ-5 найдорожчих або найдешевших готелів).
- Збережіть результат у PDF для розсилки.

---

**Успіхів у презентації!**
