In [4]:
import numpy as np
import pandas as pd
from nbformat import v4 as nbf
import nbformat

# Tworzenie danych
np.random.seed(42)
data_100 = np.random.normal(loc=3, scale=1, size=100)
data_10000 = np.random.normal(loc=3, scale=1, size=10000)

# Tworzenie notebooka
notebook = nbf.new_notebook()
cells = []

# Wprowadzenie
cells.append(nbf.new_markdown_cell("# Porównanie statystyk opisowych dla rozkładów normalnych\n"
                                   "Analizujemy dwa zbiory danych wygenerowane z rozkładu normalnego "
                                   "o średniej 3 i odchyleniu standardowym 1:\n\n"
                                   "- Zbiór 1: 100 obserwacji\n"
                                   "- Zbiór 2: 10 000 obserwacji\n\n"
                                   "Celem analizy jest porównanie statystyk opisowych i zbadanie, jak rozmiar próbki wpływa na stabilność statystyk."))

# Import i generowanie danych
cells.append(nbf.new_code_cell("import numpy as np\n"
                               "import pandas as pd\n"
                               "import matplotlib.pyplot as plt\n"
                               "import seaborn as sns\n\n"
                               "np.random.seed(42)\n"
                               "data_100 = np.random.normal(loc=3, scale=1, size=100)\n"
                               "data_10000 = np.random.normal(loc=3, scale=1, size=10000)"))

# Statystyki opisowe dla 100
cells.append(nbf.new_markdown_cell("## Statystyki opisowe – zbiór 100 elementów"))
cells.append(nbf.new_code_cell("pd.Series(data_100).describe()"))

# Statystyki opisowe dla 10 000
cells.append(nbf.new_markdown_cell("## Statystyki opisowe – zbiór 10 000 elementów"))
cells.append(nbf.new_code_cell("pd.Series(data_10000).describe()"))

# Boxploty
cells.append(nbf.new_markdown_cell("## Porównanie wykresów pudełkowych"))
cells.append(nbf.new_code_cell("plt.figure(figsize=(10, 4))\n"
                               "sns.boxplot(data=[data_100, data_10000])\n"
                               "plt.xticks([0, 1], ['n=100', 'n=10 000'])\n"
                               "plt.title('Boxplot dla dwóch rozkładów')\n"
                               "plt.show()"))

# Histogramy
cells.append(nbf.new_markdown_cell("## Histogramy"))
cells.append(nbf.new_code_cell("fig, axes = plt.subplots(1, 2, figsize=(14, 4))\n"
                               "sns.histplot(data_100, bins=20, kde=True, ax=axes[0])\n"
                               "axes[0].set_title('Histogram – 100 elementów')\n"
                               "sns.histplot(data_10000, bins=50, kde=True, ax=axes[1])\n"
                               "axes[1].set_title('Histogram – 10 000 elementów')\n"
                               "plt.show()"))

# Podsumowanie
cells.append(nbf.new_markdown_cell("## Wnioski\n"
                                   "- Statystyki w małym zbiorze (n=100) są bardziej podatne na losowe odchylenia.\n"
                                   "- Większy zbiór (n=10 000) lepiej odwzorowuje parametry rozkładu (średnia ~3, std ~1).\n"
                                   "- Histogram i boxplot zbioru 10 000 są gładsze i bardziej symetryczne.\n"
                                   "- Pokazuje to, że większe próby dostarczają bardziej stabilnych estymacji."))

# Przypisanie komórek
notebook['cells'] = cells

# Zapisanie notebooka
notebook_path = "rozk_normalny.ipynb"
with open(notebook_path, "w", encoding="utf-8") as f:
    nbformat.write(notebook, f)

notebook_path


'rozk_normalny.ipynb'