In [176]:
import pandas as pd
import numpy as np
import plotly.express as px

In [177]:
colnames = [
    "white_king_file","white_king_rank",
    "white_rook_file","white_rook_rank",
    "black_king_file","black_king_rank",
    "white_depth_of_win"
]

df = pd.read_csv("C:/IAD/Semestr_3/Techniki_Wizualizacji_Danych/Homework/hw6/chess+king+rook+vs+king/krkopt.data", header=None, names=colnames)

In [178]:
position_map = {
    "a": 1,
    "b": 2,
    "c": 3,
    "d": 4,
    "e": 5,
    "f": 6,
    "g": 7,
    "h": 8
}

cols = ["white_king_file", "white_rook_file", "black_king_file"]
df[cols] = df[cols].apply(lambda s: s.map(position_map))

In [179]:
label_to_int = {
    "draw": -1,
    "zero": 0,
    "one": 1,
    "two": 2,
    "three": 3,
    "four": 4,
    "five": 5,
    "six": 6,
    "seven": 7,
    "eight": 8,
    "nine": 9,
    "ten": 10,
    "eleven": 11,
    "twelve": 12,
    "thirteen": 13,
    "fourteen": 14,
    "fifteen": 15,
    "sixteen": 16,
}

df["white_depth_of_win"] = df["white_depth_of_win"].map(label_to_int)

In [180]:
def euk(x1, x2, y1, y2):
    return np.sqrt(((x1-x2)**2)+((y1-y2)**2))

def man(x1, x2, y1, y2):
    return np.abs(x1-x2)+np.abs(y1-y2)

def cze(x1, x2, y1, y2):
    return np.maximum(np.abs(x1-x2), np.abs(y1-y2))

In [181]:
df["dist_euk"] = euk(df["white_king_rank"], df["black_king_rank"], df["white_king_file"], df["black_king_file"])
df["dist_man"] = man(df["white_king_rank"], df["black_king_rank"], df["white_king_file"], df["black_king_file"])
df["dist_cze"] = cze(df["white_king_rank"], df["black_king_rank"], df["white_king_file"], df["black_king_file"])

In [182]:
def from_edge(x, y):
    return np.minimum(x-1, np.minimum(8-x, np.minimum(y-1, 8-y)))

In [183]:
df["black_to_edge"] = from_edge(df["black_king_rank"], df["black_king_file"])

In [184]:
df

Unnamed: 0,white_king_file,white_king_rank,white_rook_file,white_rook_rank,black_king_file,black_king_rank,white_depth_of_win,dist_euk,dist_man,dist_cze,black_to_edge
0,1,1,2,3,3,2,-1,2.236068,3,2,1
1,1,1,3,1,3,2,-1,2.236068,3,2,1
2,1,1,3,1,4,1,-1,3.000000,3,3,0
3,1,1,3,1,4,2,-1,3.162278,4,3,1
4,1,1,3,2,3,1,-1,2.000000,2,2,0
...,...,...,...,...,...,...,...,...,...,...,...
28051,2,1,7,7,5,5,16,5.000000,7,4,3
28052,2,1,7,7,5,6,16,5.830952,8,5,2
28053,2,1,7,7,5,7,16,6.708204,9,6,1
28054,2,1,7,7,6,5,16,5.656854,8,4,2


Zadanie 1

In [155]:
mates = df.loc[df["white_depth_of_win"]==0, :]
mates

Unnamed: 0,white_king_file,white_king_rank,white_rook_file,white_rook_rank,black_king_file,black_king_rank,white_depth_of_win,dist_euk,dist_man,dist_cze,black_to_edge
2796,3,1,1,3,1,1,0,2.0,2,2,0
2797,3,1,1,4,1,1,0,2.0,2,2,0
2798,3,1,1,5,1,1,0,2.0,2,2,0
2799,3,1,1,6,1,1,0,2.0,2,2,0
2800,3,1,1,7,1,1,0,2.0,2,2,0
2801,3,1,1,8,1,1,0,2.0,2,2,0
2802,3,2,1,3,1,1,0,2.236068,3,2,0
2803,3,2,1,4,1,1,0,2.236068,3,2,0
2804,3,2,1,4,1,2,0,2.0,2,2,0
2805,3,2,1,5,1,1,0,2.236068,3,2,0


In [91]:
mates_counts = mates.groupby(["black_king_rank", "black_king_file"]).agg("size")
heat = mates_counts.unstack(fill_value=0).reindex(index = range(1, 9), columns = range(1, 9), fill_value = 0)
heat

black_king_file,1,2,3,4,5,6,7,8
black_king_rank,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
1,12,0,5,5,0,0,0,0
2,5,0,0,0,0,0,0,0
3,0,0,0,0,0,0,0,0
4,0,0,0,0,0,0,0,0
5,0,0,0,0,0,0,0,0
6,0,0,0,0,0,0,0,0
7,0,0,0,0,0,0,0,0
8,0,0,0,0,0,0,0,0


In [None]:
arr = heat.to_numpy()
vmin = 0
vmax = int(arr.max())

fig = px.imshow(
    heat,
    text_auto = True,
    labels=dict(x="Kolumna (file)", y="Wiersz (rank)", color="Liczność"),
    color_continuous_scale=[(0.0, "#F7E1DC"), (1.0, "red")],
    range_color=(vmin, vmax)
)
fig.update_layout(title="Pozycje czarnego króla kiedy jest matowany")

fig.show()

In [168]:
draws = df.loc[df["white_depth_of_win"]==-1, :]
draw_counts = draws.groupby(["black_king_rank", "black_king_file"]).agg("size")
heat2 = draw_counts.unstack(fill_value=0).reindex(index = range(1, 9), columns = range(1, 9), fill_value = 0)

arr = heat2.to_numpy()
vmin = 0
vmax = int(arr.max())

fig = px.imshow(
    heat2,
    text_auto = True,
    labels=dict(x="Kolumna (file)", y="Wiersz (rank)", color="Liczność"),
    color_continuous_scale=[(0.0, "white"), (1.0, "blue")],
    range_color=(vmin, vmax)
)
fig.update_layout(title="Pozycje czarnego króla kiedy jest pat")

fig.show()

Przedstawione na heatmapach dane pokazują, że król najczęściej jest matowany znajdując się w rogu szachownicy. Do remisu najczęściej dochodzi, gdy czarny król jest blisko krawędzi, ale nie bezpośrednio przy niej.

Zadanie 2

In [158]:
df_nd = df[df["white_depth_of_win"] != -1].copy()

spearman = {
    "Euklides": df_nd["dist_euk"].corr(df_nd["white_depth_of_win"], method="spearman"),
    "Manhattan": df_nd["dist_man"].corr(df_nd["white_depth_of_win"], method="spearman"),
    "Czebyszew": df_nd["dist_cze"].corr(df_nd["white_depth_of_win"], method="spearman"),
}
spearman_df = pd.DataFrame({"metryka": list(spearman.keys()), "spearman_rho": list(spearman.values())}).sort_values("spearman_rho", ascending=False)
spearman_df

Unnamed: 0,metryka,spearman_rho
1,Manhattan,0.256605
0,Euklides,0.242819
2,Czebyszew,0.21266


In [163]:
dist_col = "dist_euk"

n_bins = 16
bins = np.linspace(df_nd[dist_col].min(), df_nd[dist_col].max(), n_bins + 1)

df_bp = df_nd[[dist_col, "white_depth_of_win"]].copy()
df_bp["dist_bin"] = pd.cut(df_bp[dist_col], bins=bins, include_lowest=True)

df_bp["dist_mid"] = df_bp["dist_bin"].apply(lambda b: round(b.mid, 2))

fig = px.box(
    df_bp,
    x="dist_mid",
    y="white_depth_of_win",
    points=False,
    title="Ilość ruchów do zwycięstwa białego vs dystans między królami (Euklides)",
    labels={"dist_mid": "Dystans (bin, środek przedziału)", "white_depth_of_win": "Liczba ruchów do mata"}
)

fig.update_xaxes(type="category", categoryorder="category ascending")

fig.show()

In [173]:
dist_col = "dist_man"

n_bins = 16
bins = np.linspace(df_nd[dist_col].min(), df_nd[dist_col].max(), n_bins + 1)

df_bp = df_nd[[dist_col, "white_depth_of_win"]].copy()
df_bp["dist_bin"] = pd.cut(df_bp[dist_col], bins=bins, include_lowest=True)

df_bp["dist_mid"] = df_bp["dist_bin"].apply(lambda b: round(b.mid, 2))

fig = px.box(
    df_bp,
    x="dist_mid",
    y="white_depth_of_win",
    points=False,
    title="Ilość ruchów do zwycięstwa białego vs dystans między królami (Manhattan)",
    labels={"dist_mid": "Dystans (bin, środek przedziału)", "white_depth_of_win": "Liczba ruchów do mata"}
)

fig.update_xaxes(categoryorder="category ascending")

fig.show()

In [164]:
dist_col = "dist_cze"

n_bins = 16
bins = np.linspace(df_nd[dist_col].min(), df_nd[dist_col].max(), n_bins + 1)

df_bp = df_nd[[dist_col, "white_depth_of_win"]].copy()
df_bp["dist_bin"] = pd.cut(df_bp[dist_col], bins=bins, include_lowest=True)

df_bp["dist_mid"] = df_bp["dist_bin"].apply(lambda b: round(b.mid, 2))

fig = px.box(
    df_bp,
    x="dist_mid",
    y="white_depth_of_win",
    points=False,
    title="Ilość ruchów do zwycięstwa białego vs dystans między królami (Czebyszew)",
    labels={"dist_mid": "Dystans (bin, środek przedziału)", "white_depth_of_win": "Liczba ruchów do mata"}
)

fig.update_xaxes(type="category", categoryorder="category ascending")

fig.show()

Stosując współczynnik korelacji Spearmana widzimy na wykresach korelację między odległością między królami a liczbą ruchów do mata. Najlepiej oszacowaniu ilości ruchów do zwycięstwa sprawdza się metryka Manhattana, ale wszystkie działają podobnie dobrze.

Zadanie 3

In [165]:
df_nd = df[df["white_depth_of_win"] != -1]

fig = px.box(
    df_nd,
    x="black_to_edge",
    y="white_depth_of_win",
    points=False,
    title="Ilość ruchów do zwycięstwa białego vs odległość czarnego króla od krawędzi",
    labels={"black_to_edge": "Odległość czarnego króla od krawędzi", "white_depth_of_win": "Liczba ruchów do mata"}
)
fig.update_xaxes(type="category", categoryorder="category ascending")
fig.show()

In [175]:
dist_best = "dist_man"

n_bins = 10
bins = pd.cut(df_nd[dist_best], bins=n_bins)

tmp = df_nd[[dist_best, "black_to_edge", "white_depth_of_win"]].copy()
tmp["dist_bin"] = pd.cut(tmp[dist_best], bins=n_bins, include_lowest=True)
tmp["dist_mid"] = tmp["dist_bin"].apply(lambda b: round(b.mid, 2))

fig = px.box(
    tmp,
    x="dist_mid",
    y="white_depth_of_win",
    facet_col="black_to_edge",
    points=False,
    title="Ilość ruchów do zwycięstwa białego vs odległość czarnego króla od krawędzi (uzupełnione o metryczkę Manhattana)",
    labels={"dist_mid": f"{dist_best} (bin)", "white_depth_of_win": "Liczba ruchów do mata", "black_to_edge": "Odległość do krawędzi"}
)
fig.update_xaxes(categoryorder="category ascending")
fig.show()

Sama odległość czarnego króla od krawędzi pozwala oszacować, w ilu ruchach zakończy się gra. Rozszerzenie analizy o dystans między królami w najlepszej metryce z poprzedniego podpunktu zawęża przedział liczby ruchów do mata, więc to rozszerzenie skutecznie poprawia analizę.