In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from urllib.parse import quote

url = "https://uk.wikipedia.org/wiki/Населення_України"

encoded_url = quote(url, safe=":/")

try:
    tables = pd.read_html(encoded_url)
    df = tables[0]
except Exception as e:
    print("Помилка завантаження таблиці:", e)
    exit()

print("Перші рядки таблиці:")
print(df.head())

print("Кількість рядків і стовпців у таблиці:")
print(df.shape)

df.replace("—", np.nan, inplace=True)

print("Типи даних у стовпцях до перетворення:")
print(df.dtypes)

for col in df.columns[1:]:
    df[col] = pd.to_numeric(df[col], errors="coerce")

print("Типи даних у стовпцях після перетворення:")
print(df.dtypes)

missing_fraction = df.isnull().sum() / len(df)
print("Частка пропусків у кожному стовпці:")
print(missing_fraction)

df = df[df["Регіон "] != "Україна"]

df.fillna(df.mean(), inplace=True)

average_birth_rate_2019 = df["2019"].mean()
higher_than_average = df[df["2019"] > average_birth_rate_2019]["Регіон"]
print("Регіони з народжуваністю у 2019 році вище середньої:")
print(higher_than_average.tolist())

highest_birth_2014 = df.loc[df["2014"].idxmax(), "Регіон"]
print("Регіон із найвищою народжуваністю у 2014 році:")
print(highest_birth_2014)

plt.figure(figsize=(10, 6))
df.plot(kind="bar", x="Регіон", y="2019", legend=False, color="skyblue")
plt.title("Народжуваність по регіонах у 2019 році")
plt.xlabel("Регіон")
plt.ylabel("Рівень народжуваності")
plt.xticks(rotation=90)
plt.tight_layout()
plt.show()


Перші рядки таблиці:
          0            1
0  Точність  переглянута
Кількість рядків і стовпців у таблиці:
(1, 2)
Типи даних у стовпцях до перетворення:
0    object
1    object
dtype: object
Типи даних у стовпцях після перетворення:
0     object
1    float64
dtype: object
Частка пропусків у кожному стовпці:
0    0.0
1    1.0
dtype: float64


KeyError: 'Регіон '