### Alisher Narzulloev

In [24]:
import pandas as pd
import psycopg2
import numpy as np
import plotly
import plotly.express as px
import sqlalchemy as db

In [25]:
connection = r'postgresql://postgres:1234@localhost:5432/postgres'
engine = db.create_engine(connection)

# Домашняя работа по кастомизации `plotly`  

## Задание №1  
1. Создайте датафрейм содержащий сумму и количество продаж треков в разбивке по странам и континентам.  
2. Создайте scatter plot показывающий соотношение суммы продаж и количества треков.  
3. Добавьте разделение по цвету на основе континента. Цвет Азии должен быть **жёлтым**, цвет Европы **синим**, цвет Северной Америки **красным**.
4. При наведении на точки данных в диаграмме должна всплывать информация о стране продажи (жирным), сумме продаж, количестве треков, средней сумме на один трек
5. Добавьте название диаграмме. Шрифт должен быть 30, цвет шрифта серый.
6. Измените шрифт тиков (значения осей) на 14, цвет на серый.

In [26]:
df_sales_analytics = pd.read_sql('SELECT * FROM sales_analytics_view1', engine)
df_sales_analytics.head(10)

Unnamed: 0,country,continent,track_count,sales_sum,year,month,monthly_revenue,region
0,Spain,Europe,38,334.62,2025,1,37.62,Other
1,Spain,Europe,38,334.62,2025,2,27.72,Other
2,Spain,Europe,38,334.62,2025,3,37.62,Other
3,Spain,Europe,38,334.62,2025,4,33.66,Other
4,Spain,Europe,38,334.62,2025,5,37.62,Other
5,Spain,Europe,38,334.62,2025,6,37.62,Other
6,Spain,Europe,38,334.62,2025,7,37.62,Other
7,Spain,Europe,38,334.62,2025,8,37.62,Other
8,Spain,Europe,38,334.62,2025,9,37.62,Other
9,Spain,Europe,38,334.62,2025,10,37.62,Other


In [28]:

color_map = {
    'Asia': 'yellow',
    'Europe': 'blue',
    'North America': 'red',
    'South America': 'orange',
    'Australia': 'green'
}

fig = px.scatter(
    df_sales_analytics, 
    x='sales_sum', 
    y='track_count', 
    color='continent',
    hover_data={
        'country': True, 
        'sales_sum': ':.2f', 
        'track_count': True
    },
    title='Sales Sum vs Track Count by Country',
    color_discrete_map=color_map
)

fig.update_traces(
    marker=dict(size=12),
    hovertemplate='<b>%{customdata[0]}</b><br>Sales Sum: %{x}<br>Track Count: %{y}'
)
fig.update_layout(
    title_font=dict(size=30, color='gray'),
    xaxis_title='Sales Sum',
    yaxis_title='Track Count',
    xaxis_tickfont=dict(size=14, color='gray'),
    yaxis_tickfont=dict(size=14, color='gray')
)

fig.show()

## Задание №2  
1. Создайте датафрейм содержащий количество треков в разбивке по названиям жанров.
2. Создайте столбчатую диаграмму. По оси X должны быть названия жанров, по оси Y - количество треков.
3. Кастомизируйте диаграмму так, чтобы столбики всех жанров были серого цвета. За исключением жанров *Jazz*, *Rock* и *Alternative & Punk*. Эти жанры должны выделяться цветом. Цвета можете выбирать сами.
4. Уберите легенду.  
5. Добавьте название диаграмме. Название должно быть курсивным.
6. Фон диаграммы должен быть белым.  

In [31]:
df_track_count = pd.read_sql("""select 
    g.name as genre_name,
    count(t.track_id) as track_count
from track t
join genre g on t.genre_id = g.genre_id
group by g.name
order by track_count desc;""", engine)
df_track_count.head(10)

Unnamed: 0,genre_name,track_count
0,Rock,1297
1,Latin,579
2,Metal,374
3,Alternative & Punk,332
4,Jazz,130
5,TV Shows,93
6,Blues,81
7,Classical,74
8,Drama,64
9,R&B/Soul,61


In [33]:
bar_colors = ['#A9A9A9' if genre not in ['Jazz', 'Rock', 'Alternative & Punk'] 
              else ('#FFD700' if genre == 'Jazz' else '#FF6347' if genre == 'Rock' else '#8A2BE2') 
              for genre in df_track_count['genre_name']]

fig = px.bar(
    df_track_count, 
    x='genre_name', 
    y='track_count', 
    title='<i>Track Count by Genre</i>'
)

fig.update_traces(marker_color=bar_colors)
fig.update_layout(
    plot_bgcolor='white', 
    showlegend=False, 
    title_font=dict(size=24, color='black'), 
    xaxis_title='Genre',
    yaxis_title='Track Count',
    xaxis_tickfont=dict(size=14),
    yaxis_tickfont=dict(size=14)
)


fig.show()
