# Analiza albumów wszechczasów (UK Charts)

In [None]:
import pandas as pd
import numpy as np

## Wczytanie danych

In [None]:
url = 'https://www.officialcharts.com/chart-news/the-best-selling-albums-of-all-time-on-the-official-uk-chart__15551/'
tables = pd.read_html(url)
df = tables[0]
df.head()

## 1. Zamiana nagłówków i czyszczenie danych

In [None]:
df.columns = ['POZ', 'TYTUŁ', 'ARTYSTA', 'ROK', 'MAX POZ']
df['ROK'] = pd.to_numeric(df['ROK'], errors='coerce')
df['ARTYSTA'] = df['ARTYSTA'].astype(str).str.strip().str.title()
df.head()

## 2. Liczba unikalnych artystów

In [None]:
df['ARTYSTA'].nunique()-1

## 3. Najczęściej pojawiający się artyści

In [None]:
df['ARTYSTA'].value_counts().head(10)

## 4. Zmiana wielkości liter w nagłówkach

In [None]:
df = df.drop('POZ', axis=1)
df.columns = [col.capitalize() for col in df.columns]
df.head()

## 5. Usunięcie kolumny 'Max poz'

In [None]:
df = df.drop('Max poz', axis=1)
df.head()

## 6. Rok z największą liczbą albumów

In [None]:
df['Rok'].value_counts().idxmax()

## 7. Ile albumów wydano w latach 1960–1990?

In [None]:
len(df[(df['Rok'] >= 1960) & (df['Rok'] <= 1990)])

## 8. Najmłodszy album

In [None]:
youngest_year = df['Rok'].max()
df[df['Rok'] == youngest_year]

## 9. Najwcześniejszy album każdego artysty

In [None]:
df = df.dropna(subset=['Rok'])
earliest_albums = df.loc[df.groupby('Artysta')['Rok'].idxmin()][['Artysta', 'Tytuł', 'Rok']]
earliest_albums.sort_values('Artysta').reset_index(drop=True)

## 10. Zapis do CSV

In [None]:
earliest_albums.to_csv('najwczesniejsze_albumy_artystow.csv', index=False, encoding='utf-8')