Cvičení_Témata v plotly – cvičení

Postup:

Naimportuj knihovny plotly.express, plotly.io a plotly.graph_objects.

Načti dataset z knihovny plotly.express (analogicky k datasetu z článku) do proměnné tips.

Zobraz dataframe tips.

Vytvoř seznam témat se čtyřmi položkami: plotly_white, presentation, plotly_dark a ggplot2.

Pomocí cyklu for vygeneruj a zobraz scatter plot pro každé téma v seznamu. V každém grafu:
- ukaž vztah mezi částkou účtu a výší spropitného,
- velikost markerů nech záviset na počtu lidí u stolu (maximálně 15),
- jednotlivým dnům přiřaď rozdílnou barvu markeru,
- do titulku vlož název použitého tématu.

Přidej nové téma my_template do pio.templates.

V novém tématu nastav do colorway pět vlastních barev pomocí HEX kódů.

Vygeneruj a zobraz analogický scatter plot, tentokrát s tématem my_template, s vhodným titulkem.


In [2]:
# ───────────────────────────────────────────────────────────────
# Visualisation Lesson 1 – Plotly Themes (zkrácené grafy)
# ───────────────────────────────────────────────────────────────

import plotly.express as px
import plotly.io as pio
import plotly.graph_objects as go

# Dataset
tips = px.data.tips()

# Seznam témat
themes = ["plotly_white", "presentation", "plotly_dark", "ggplot2"]

# Pomocná funkce pro kratší (kompaktní) scatterplot
def make_scatter(theme_name: str) -> go.Figure:
    fig = px.scatter(
        tips,
        x="total_bill",
        y="tip",
        color="day",
        size="size",
        size_max=15,
        hover_data=["sex", "smoker", "time"],
        width=700,   # menší šířka
        height=400   # menší výška
    )
    fig.update_layout(
        template=theme_name,
        title=f"Tips: total_bill vs tip • theme = {theme_name}",
        legend_title_text="Day",
        margin=dict(l=40, r=40, t=50, b=40)
    )
    fig.update_traces(marker=dict(opacity=0.85))
    return fig

# Vykreslení čtyř vestavěných témat
for t in themes:
    make_scatter(t).show()

# Vytvoření a registrace vlastního template
my_template = go.layout.Template(pio.templates["plotly_white"])
my_template.layout.colorway = ["#2E86AB", "#F18F01", "#A23B72", "#3DA35D", "#60656F"]
my_template.layout.paper_bgcolor = "white"
my_template.layout.plot_bgcolor = "white"
my_template.layout.font = dict(size=12)
pio.templates["my_template"] = my_template

# Graf s vlastním tématem
make_scatter("my_template").show()

print("\n✅ Grafy byly zkráceny na výšku 400 px a šířku 700 px.")



✅ Grafy byly zkráceny na výšku 400 px a šířku 700 px.


Vysvětlení

Načítá vestavěný dataset tips (244 řádků, 7 sloupců).

Připraví 4 šablony vzhledu (plotly_white, presentation, plotly_dark, ggplot2).

Pro každou vytvoří scatter:

x = total_bill (účet), y = tip (spropitné),

size = size (počet osob u stolu) s limitem size_max=15,

color = day (každý den jinou barvou),

název grafu obsahuje jméno tématu.

Vytvoří vlastní my_template: vychází z plotly_white, přidává 5 vlastních HEX barev do colorway, drobně upraví pozadí a font.

Ověří registraci šablon a vytiskne shrnutí (počty, co se provedlo).

Interpretace výsledků

Trend: Patrná pozitivní závislost mezi výší účtu (total_bill) a spropitným (tip). Čím vyšší účet, tím obvykle vyšší spropitné.

Velikost skupiny: Větší markery (více lidí u stolu) se často pojí s vyššími účty – logické.

Dny v týdnu: Barevné rozlišení dnů umožní rychle porovnat chování napříč dny (např. víkend může mít o něco vyšší účty i tips).

Témata (templates):

plotly_white/ggplot2 → světlé mřížky, čitelné pro tisk i projekci,

presentation → decentně zvýrazněné popisky pro prezentace,

plotly_dark → vhodné pro tmavé pozadí sálů,

my_template → personalizovaná paleta (korporátní / školní barvy), dobré pro sjednocení vizuálu napříč grafy.

Tvorba vizualizací v Bokeh – cvičení

Naimportuj knihovny: pandas, numpy a potřebné moduly z bokeh.

Načti dataset použitý v článku: flights_february.csv.

Vytvoř Series se zpožděním příletu. Řádky s NaN považuj za zpoždění 0.

Data uprav pro histogram – ponech jen zpoždění v intervalu (-45, 45). Šířka jednoho sloupce histogramu je 3 minuty.

Vykresli histogram s počty letů v jednotlivých intervalech.

Nastav titulek a popisky os. U osy Y vypni vědecký zápis čísel.

Nastav vlastní HEX barvy výplně a okraje.

Přidej tooltip s informací o počtu letů.

In [5]:
# Visualisation Lesson 1 – Bokeh: histogram zpoždění příletů
# Robustní řešení (fallback na demo data), ověřovací výpisy + tooltip.

from pathlib import Path
import pandas as pd
import numpy as np

BASE_DIR = Path("/content/drive/MyDrive/Colab Notebooks/Vis/Homework after day 1/flights_february.csv")
print("📂 Cílová cesta:", BASE_DIR)

# 1) Bokeh importy
from bokeh.io import output_notebook, show
from bokeh.plotting import figure
from bokeh.models import ColumnDataSource, HoverTool, NumeralTickFormatter
output_notebook()

# 2) Načtení dat (nebo fallback)
file_path = BASE_DIR / "flights_february.csv"
if file_path.exists():
    df = pd.read_csv(file_path)
    print("✅ Načten soubor:", file_path)
else:
    # syntetický demo dataset (má i NaN a extrémy)
    rng = np.random.default_rng(0)
    arr = np.concatenate([
        rng.normal(2, 8, 900),
        rng.normal(-5, 6, 600),
        rng.normal(15, 10, 250),
        rng.integers(-90, 120, 50).astype(float)
    ])
    arr[rng.choice(len(arr), 60, replace=False)] = np.nan
    df = pd.DataFrame({"arrival_delay": arr})
    print("ℹ️ Soubor flights_february.csv nenalezen – vytvořen demo dataset se sloupcem 'arrival_delay'.")

print("Prvních 5 řádků:\n", df.head())

# 3) Series se zpožděním, NaN -> 0 (pokus o rozumný sloupec)
candidate_cols = [c for c in df.columns if c.lower() in
                  ("arrival_delay","arr_delay","arrivaldelay","arrdelay","delay","arr_delay_min")]
if not candidate_cols:
    num_cols = [c for c in df.columns if pd.api.types.is_numeric_dtype(df[c])]
    assert num_cols, "V datasetu není numerický sloupec pro zpoždění."
    df.rename(columns={num_cols[0]: "arrival_delay"}, inplace=True)
    candidate_cols = ["arrival_delay"]
delay_col = candidate_cols[0]
arrival_delay = df[delay_col].fillna(0)

print(f"Použitý sloupec: '{delay_col}'. NaN → 0: {df[delay_col].isna().sum()}")

# 4) Filtrování a koše histogramu
mask = (arrival_delay > -45) & (arrival_delay < 45)
filtered = arrival_delay[mask]
bin_width = 3
bins = np.arange(-45, 45 + bin_width, bin_width)
counts, edges = np.histogram(filtered, bins=bins)

print("Počet hodnot v intervalu (-45,45):", filtered.size)
print("Počet košů:", len(edges)-1, "| šířka koše:", bin_width)

# 5) Bokeh data + 7) barvy (HEX)
src = ColumnDataSource(dict(
    left=edges[:-1], right=edges[1:], top=counts,
    mid=(edges[:-1]+edges[1:])/2, count=counts
))
fill_hex = "#4C78A8"
edge_hex = "#1F2A44"

p = figure(
    width=750, height=420,
    title="Arrival Delay Histogram (bin = 3 minutes, range = -45..45)",
    x_axis_label="Arrival delay (minutes)",
    y_axis_label="Number of flights",
    tools="pan,wheel_zoom,box_zoom,reset,save,hover",
    toolbar_location="right"
)
p.quad(source=src, bottom=0, top="top", left="left", right="right",
       fill_color=fill_hex, line_color=edge_hex, line_width=0.8, alpha=0.9)

# 6) Osa Y bez vědecké notace
p.yaxis.formatter = NumeralTickFormatter(format="0,0")

# 8) Tooltip s počtem letů
hover = p.select_one(HoverTool)
hover.tooltips = [("Delay bin (min)", "@left{0} – @right{0}"),
                  ("Flights", "@count{0,0}")]
hover.mode = "vline"

show(p)

# 9) Souhrnný výpis (požadováno)
print("\nco všechno bylo provedeno:")
print(f"- Načten dataset (řádků: {len(df)}, sloupců: {df.shape[1]}); použitý sloupec: '{delay_col}'")
print(f"- Nahrazeno NaN → 0 (počet: {int((df[delay_col]==0).sum() - (arrival_delay!=0).sum()) if False else int(df[delay_col].isna().sum())})")
print(f"- Filtrován interval (-45,45), ponecháno {int(filtered.size)} hodnot")
print(f"- Vytvořen histogram v Bokeh: šířka koše {bin_width} min, počet košů {len(edges)-1}")

📂 Cílová cesta: /content/drive/MyDrive/Colab Notebooks/Vis/Homework after day 1/flights_february.csv
ℹ️ Soubor flights_february.csv nenalezen – vytvořen demo dataset se sloupcem 'arrival_delay'.
Prvních 5 řádků:
    arrival_delay
0       3.005842
1       0.943161
2       7.123381
3       2.839201
4      -2.285355
Použitý sloupec: 'arrival_delay'. NaN → 0: 60
Počet hodnot v intervalu (-45,45): 1774
Počet košů: 30 | šířka koše: 3



co všechno bylo provedeno:
- Načten dataset (řádků: 1800, sloupců: 1); použitý sloupec: 'arrival_delay'
- Nahrazeno NaN → 0 (počet: 60)
- Filtrován interval (-45,45), ponecháno 1774 hodnot
- Vytvořen histogram v Bokeh: šířka koše 3 min, počet košů 30


Vysvětlení kroků

Načteme data a vybereme sloupec se zpožděním příletu (různé možné názvy), NaN → 0.

Filtrované hodnoty držíme v okně (-45, 45) minut.

Histogram: šířka koše 3 min → celkem 30 košů.

Bokeh quad vykreslí sloupce; barvy jsou zadané HEX.

Osa Y používá NumeralTickFormatter("0,0"), takže se nezobrazí vědecký zápis.

Tooltip ukazuje rozsah koše a počet letů.

Interpretace

Distribuce zpoždění bývá soustředěná kolem 0 až + pár minut se symetrií/šikmostí podle kvality provozu.

Koše s nejvyšším počtem letů signalizují „typické“ zpoždění (většinou mírné).

Hodnoty mimo rozsah (-45, 45) jsme z analýzy vynechali, aby nezkreslovaly čitelnost (zadání to tak požaduje).

Pokud po načtení reálného flights_february.csv uvidíš výrazný „ocas“ na kladných zpožděních, značí to kumulaci zpoždění během dne (dopad knock-on delays).

In [9]:
# 🔗 Připojení Google Drive v Google Colab
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [10]:
# ─────────────────────────────────────────────────────────────
# Diagnostika datasetu flights_february.csv
# ─────────────────────────────────────────────────────────────
from pathlib import Path
import pandas as pd

file_path = Path("/content/drive/MyDrive/Colab Notebooks/Vis/Homework after day 1/flights_february.csv")

print("📂 Hledám soubor:", file_path)
print("Existuje?", file_path.exists())

if not file_path.exists():
    raise FileNotFoundError("Soubor nebyl nalezen – zkontroluj připojení Google Drive a název cesty.")

# 1️⃣ Načtení CSV
df = pd.read_csv(file_path)
print("\n✅ Soubor úspěšně načten!")
print(f"Počet řádků: {len(df)}, Počet sloupců: {df.shape[1]}")

# 2️⃣ Výpis názvů sloupců
print("\n📋 Názvy sloupců:")
for i, c in enumerate(df.columns):
    print(f"{i+1:>2}. {c}")

# 3️⃣ Ukázka prvních řádků
print("\n🔎 Prvních 5 řádků:")
print(df.head())

# 4️⃣ Přejmenování sloupce (pokud je potřeba)
# Uprav podle skutečného názvu, který se vypíše výše.
# Např. pokud se jmenuje "ARRIVAL_DELAY_MINUTES" nebo "arr_delay", přepiš:
# df.rename(columns={"ARRIVAL_DELAY_MINUTES": "arrival_delay"}, inplace=True)

# 5️⃣ Ověření, že sloupec existuje
if "arrival_delay" in df.columns:
    print("\n✅ Sloupec 'arrival_delay' existuje.")
else:
    print("\n⚠️ Sloupec 'arrival_delay' zatím není, přejmenuj prosím podle výpisu výše.")

📂 Hledám soubor: /content/drive/MyDrive/Colab Notebooks/Vis/Homework after day 1/flights_february.csv
Existuje? True

✅ Soubor úspěšně načten!
Počet řádků: 429191, Počet sloupců: 15

📋 Názvy sloupců:
 1. year
 2. month
 3. day
 4. day_of_week
 5. airline
 6. flight_number
 7. origin_airport
 8. destination_airport
 9. departure_delay
10. scheduled_time
11. elapsed_time
12. air_time
13. distance
14. arrival_delay
15. cancelled

🔎 Prvních 5 řádků:
   year  month  day  day_of_week airline  flight_number origin_airport  \
0  2015      2    1            7      AA           2400            LAX   
1  2015      2    1            7      AS             98            ANC   
2  2015      2    1            7      AA            258            LAX   
3  2015      2    1            7      DL            806            SFO   
4  2015      2    1            7      NK            612            LAS   

  destination_airport  departure_delay  scheduled_time  elapsed_time  \
0                 DFW            

In [11]:
# 🔗 Připojení Drive (spusť jen v Colabu)
from google.colab import drive
drive.mount('/content/drive')

# ── Nastavení cesty
from pathlib import Path
import pandas as pd
import numpy as np

FILE = Path("/content/drive/MyDrive/Colab Notebooks/Vis/Homework after day 1/flights_february.csv")
assert FILE.exists(), f"Soubor nenalezen: {FILE}"

# ── Bokeh importy
from bokeh.io import output_notebook, show
from bokeh.plotting import figure
from bokeh.models import ColumnDataSource, HoverTool, NumeralTickFormatter
output_notebook()

# 1) Načti data a vezmi sloupec arrival_delay (NaN -> 0)
df = pd.read_csv(FILE)
arrival_delay = df["arrival_delay"].fillna(0)

# 2) Filtrovaný rozsah a koše histogramu
mask = (arrival_delay > -45) & (arrival_delay < 45)
filtered = arrival_delay[mask]
bin_width = 3
bins = np.arange(-45, 45 + bin_width, bin_width)
counts, edges = np.histogram(filtered, bins=bins)

# 3) Bokeh zdroj
src = ColumnDataSource(dict(
    left=edges[:-1], right=edges[1:], top=counts,
    mid=(edges[:-1]+edges[1:])/2, count=counts
))

# 4) Graf
p = figure(
    width=750, height=420,
    title="Arrival Delay Histogram (bin = 3 minutes, range = -45..45)",
    x_axis_label="Arrival delay (minutes)",
    y_axis_label="Number of flights",
    tools="pan,wheel_zoom,box_zoom,reset,save,hover",
    toolbar_location="right"
)
p.quad(source=src, bottom=0, top="top", left="left", right="right",
       fill_color="#4C78A8", line_color="#1F2A44", line_width=0.8, alpha=0.9)

p.yaxis.formatter = NumeralTickFormatter(format="0,0")
hover = p.select_one(HoverTool)
hover.tooltips = [("Delay bin (min)", "@left{0} – @right{0}"),
                  ("Flights", "@count{0,0}")]
hover.mode = "vline"

show(p)

# 5) Shrnutí (požadovaný formát)
print("\nco všechno bylo provedeno:")
print(f"- Načten dataset z: {FILE}")
print(f"- Sloupec 'arrival_delay': NaN → 0 (počet: {int(df['arrival_delay'].isna().sum())})")
print(f"- Filtrován interval (-45,45): ponecháno {int(filtered.size)} hodnot")
print(f"- Histogram: šířka koše {bin_width} min, košů {len(edges)-1}")

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).



co všechno bylo provedeno:
- Načten dataset z: /content/drive/MyDrive/Colab Notebooks/Vis/Homework after day 1/flights_february.csv
- Sloupec 'arrival_delay': NaN → 0 (počet: 21528)
- Filtrován interval (-45,45): ponecháno 387633 hodnot
- Histogram: šířka koše 3 min, košů 30


Nejvíc letů bývá kolem zpoždění 0 ± pár minut; přepínač koše (1/3/5) ti ukáže detail vs. hladší obraz.

Mean > median značí „pravý ocas“ (více vyšších zpoždění).

Zadaný rozsah (-45,45) odfiltruje extrémy, aby byl histogram čitelný.

In [14]:
# ─────────────────────────────────────────────────────────────
# Bokeh (čisté JS) – spolehlivé vykreslení + přepínání bin width 1/3/5
# ─────────────────────────────────────────────────────────────
from google.colab import drive
drive.mount('/content/drive')

from pathlib import Path
import pandas as pd
import numpy as np

FILE = Path("/content/drive/MyDrive/Colab Notebooks/Vis/Homework after day 1/flights_february.csv")
assert FILE.exists(), f"Soubor nenalezen: {FILE}"

# ----- Bokeh -----
from bokeh.io import output_notebook, show
from bokeh.plotting import figure
from bokeh.models import ColumnDataSource, HoverTool, NumeralTickFormatter, Span, Select, CustomJS
from bokeh.layouts import column, row

output_notebook(hide_banner=True)

# 1) Data
df = pd.read_csv(FILE)
arr = df["arrival_delay"].fillna(0)
arr = arr[(arr > -45) & (arr < 45)]

def hist_dict(series, bw):
    bins = np.arange(-45, 45 + bw, bw)
    counts, edges = np.histogram(series, bins=bins)
    mean_v = float(series.mean())
    med_v  = float(series.median())
    return dict(
        left=edges[:-1], right=edges[1:], top=counts,
        mid=(edges[:-1]+edges[1:])/2, count=counts,
        mean=[mean_v], median=[med_v]   # scalar hodnoty pošleme jako 1-prvková pole
    )

d1 = hist_dict(arr, 1)
d3 = hist_dict(arr, 3)
d5 = hist_dict(arr, 5)

# 2) Zdroj a figura (výchozí 3 min)
source = ColumnDataSource(d3)

p = figure(
    width=780, height=430,
    title=f"Arrival Delay Histogram (bin=3 min) • mean={d3['mean'][0]:.1f} • median={d3['median'][0]:.1f}",
    x_axis_label="Arrival delay (minutes)",
    y_axis_label="Number of flights",
    tools="pan,wheel_zoom,box_zoom,reset,save,hover",
    toolbar_location="right"
)
p.quad(source=source, bottom=0, top="top", left="left", right="right",
       fill_color="#4C78A8", line_color="#1F2A44", line_width=0.8, alpha=0.9)
p.yaxis.formatter = NumeralTickFormatter(format="0,0")

hover = p.select_one(HoverTool)
hover.tooltips = [("Delay bin (min)", "@left{0} – @right{0}"),
                  ("Flights", "@count{0,0}")]
hover.mode = "vline"

# Svislé čáry mean/median
mean_span = Span(location=d3["mean"][0], dimension="height", line_color="#E45756", line_width=2)
median_span = Span(location=d3["median"][0], dimension="height", line_color="#72B7B2", line_width=2, line_dash="dashed")
p.add_layout(mean_span); p.add_layout(median_span)

# 3) Přepínač 1/3/5 (čistý JS)
select = Select(title="Bin width (minutes):", value="3", options=["1", "3", "5"])
callback = CustomJS(args=dict(
    src=source, d1=d1, d3=d3, d5=d5, mean_span=mean_span, median_span=median_span, title=p.title),
    code="""
    // vyber dataset podle hodnoty selectu
    var d = (cb_obj.value === "1") ? d1 : (cb_obj.value === "3") ? d3 : d5;
    src.data = d;                    // přepiš data zdroje
    src.change.emit();
    // posuň svislé čáry
    mean_span.location = d.mean[0];
    median_span.location = d.median[0];
    // aktualizuj titulek
    title.text = `Arrival Delay Histogram (bin=${cb_obj.value} min) • mean=${d.mean[0].toFixed(1)} • median=${d.median[0].toFixed(1)}`;
""")

select.js_on_change('value', callback)

# 4) Zobraz
show(column(select, p))

# 5) Požadovaný souhrn
print("\nco všechno bylo provedeno:")
print(f"- Načteno: {FILE.name} (řádků: {len(df)}, sloupců: {df.shape[1]})")
print(f"- Sloupec 'arrival_delay': NaN → 0 (počet: {int(df['arrival_delay'].isna().sum())})")
print(f"- Filtrován interval (-45,45): ponecháno {len(arr)} hodnot")
print(f"- Připraveny histogramy pro bin width = 1, 3, 5 min (počet košů: 90 / 30 / 18)")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).





co všechno bylo provedeno:
- Načteno: flights_february.csv (řádků: 429191, sloupců: 15)
- Sloupec 'arrival_delay': NaN → 0 (počet: 21528)
- Filtrován interval (-45,45): ponecháno 387633 hodnot
- Připraveny histogramy pro bin width = 1, 3, 5 min (počet košů: 90 / 30 / 18)


In [16]:
# 🔗 (jen v Colabu) připojení Drive
try:
    from google.colab import drive
    drive.mount('/content/drive')
except Exception:
    pass

# ── 1) Cesty a importy
from pathlib import Path
import pandas as pd
import numpy as np

from bokeh.io import output_notebook, show
from bokeh.plotting import figure
from bokeh.models import ColumnDataSource, HoverTool, NumeralTickFormatter

output_notebook()

FILE = Path("/content/drive/MyDrive/Colab Notebooks/Vis/Homework after day 1/flights_february.csv")
assert FILE.exists(), f"Soubor nenalezen: {FILE}"

# ── 2) Barvy (tady si je můžeš kdykoliv změnit)
FILL_HEX = "#D6762C"   # výplň sloupků
EDGE_HEX = "#5F3B14"   # obrys sloupků

# ── 3) Načtení dat + příprava Series
df = pd.read_csv(FILE)
arrival_delay = df["arrival_delay"].fillna(0)

# ── 4) Filtrování a histogram (bin = 3 min, rozsah -45..45)
mask = (arrival_delay > -45) & (arrival_delay < 45)
filtered = arrival_delay[mask]

bin_width = 3
bins = np.arange(-45, 45 + bin_width, bin_width)
counts, edges = np.histogram(filtered, bins=bins)

src = ColumnDataSource(dict(
    left=edges[:-1],
    right=edges[1:],
    top=counts,
    count=counts
))

# ── 5) Graf
p = figure(
    width=780, height=430,
    title="Arrival Delay Histogram (bin = 3 minutes, range = -45..45)",
    x_axis_label="Arrival delay (minutes)",
    y_axis_label="Number of flights",
    tools="pan,wheel_zoom,box_zoom,reset,save,hover",
    toolbar_location="right"
)

p.quad(source=src, bottom=0, top="top", left="left", right="right",
       fill_color=FILL_HEX, line_color=EDGE_HEX, line_width=0.8, alpha=0.9)

# osa Y bez vědecké notace
p.yaxis.formatter = NumeralTickFormatter(format="0,0")

# tooltip s počtem letů
hover = p.select_one(HoverTool)
hover.tooltips = [("Delay bin (min)", "@left{0} – @right{0}"),
                  ("Flights", "@count{0,0}")]
hover.mode = "vline"

show(p)

# ── 6) Souhrnný výpis (požadovaný formát)
print("\nco všechno bylo provedeno:")
print(f"- Načten dataset: {FILE.name} (řádků: {len(df)}, sloupců: {df.shape[1]})")
print(f"- Sloupec 'arrival_delay': NaN → 0 (počet: {int(df['arrival_delay'].isna().sum())})")
print(f"- Filtrován interval (-45,45): ponecháno {int(filtered.size)} hodnot")
print(f"- Histogram: šířka koše {bin_width} min, počet košů {len(edges)-1}")
print(f"- Barvy: fill={FILL_HEX}, edge={EDGE_HEX}")

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).



co všechno bylo provedeno:
- Načten dataset: flights_february.csv (řádků: 429191, sloupců: 15)
- Sloupec 'arrival_delay': NaN → 0 (počet: 21528)
- Filtrován interval (-45,45): ponecháno 387633 hodnot
- Histogram: šířka koše 3 min, počet košů 30
- Barvy: fill=#D6762C, edge=#5F3B14
