In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [None]:
regions = ['warszawski', 'krakowski', 'poznański', 'wrocławski', 'gdański',
           'łódzki', 'katowicki', 'lubelski', 'bydgoski', 'szczecinski']

years = [2020, 2021, 2022, 2023, 2024]

crime_types = ['kradzież', 'rozbój', 'włamanie', 'oszustwo', 'pobicie',
               'uszkodzenie mienia', 'kradzież samochodu', 'wymuszenie']

population_data = {
    'warszawski': 3500000,
    'krakowski': 1800000,
    'poznański': 1400000,
    'wrocławski': 1300000,
    'gdański': 1100000,
    'łódzki': 1050000,
    'katowicki': 2200000,
    'lubelski': 800000,
    'bydgoski': 950000,
    'szczecinski': 700000
}

np.random.seed(42)

powiaty = np.random.choice(regions, size=200)

data = {
    'rok': np.random.choice(years, size=200),
    'powiat': powiaty,
    'rodzaj_przestepstwa': np.random.choice(crime_types, size=200),
    'liczba': np.random.randint(10, 1500, size=200),
    'ludność': [population_data[p] for p in powiaty]
}

df = pd.DataFrame(data)

df = df.sort_values(['rok', 'powiat', 'rodzaj_przestepstwa']).reset_index(drop=True)

print(df.head(20))
print(f"\nWymiary DataFrame: {df.shape}")
print(f"\nLiczba unikalnych wartości:")
print(f"  - Lata: {df['rok'].nunique()}")
print(f"  - Powiaty: {df['powiat'].nunique()}")
print(f"  - Rodzaje przestępstw: {df['rodzaj_przestepstwa'].nunique()}")
print(df.describe())

In [None]:
max_crime_region = df.groupby('powiat').agg({
    'liczba': 'sum',
    'ludność': 'first'
}).reset_index()

max_crime_region['liczba_przestepstw_na_100k'] = (max_crime_region['liczba'] / max_crime_region['ludność']) * 100000

print(max_crime_region.sort_values(by='liczba_przestepstw_na_100k', ascending=False))

In [None]:
plt.figure(figsize=(12, 6))
plt.bar(max_crime_region['powiat'], max_crime_region['liczba_przestepstw_na_100k'])
plt.xlabel('Powiat')
plt.ylabel('Liczba przestępstw na 100 tys. mieszkańców')
plt.title('Liczba przestępstw na 100 tys. mieszkańców według powiatów')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

In [None]:
crime_trend = df.groupby(['rok', 'powiat']).agg({
    'liczba': 'sum',
    'ludność': 'first'
}).reset_index()

crime_trend['liczba_na_100k'] = (crime_trend['liczba'] / crime_trend['ludność']) * 100000

top5_regions = crime_trend.groupby('powiat')['liczba_na_100k'].mean().nlargest(5).index

crime_trend_top5 = crime_trend[crime_trend['powiat'].isin(top5_regions)]

plt.figure(figsize=(12, 7))

for region in top5_regions:
    region_data = crime_trend_top5[crime_trend_top5['powiat'] == region]
    plt.plot(region_data['rok'], region_data['liczba_na_100k'], marker='o', label=region, linewidth=2)

plt.xlabel('Rok')
plt.ylabel('Liczba przestępstw na 100 tys. mieszkańców')
plt.title('Trend liczby przestępstw na 100 tys. mieszkańców - TOP 5 powiatów')
plt.legend()
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()