GPT od podstaw

Warsztaty w ramach Funduszu Zdolni (30 kwietnia - 2 maja 2026).

Materiały i inspiracje

MicroGPT by Andrej Karpathy
- Dyskusja na Hacker News
- MicroGPT - Growing SWE
Nanochat
nanoGPT - na nim oparte są Notebooki 4 i 5
Let's build GPT: from scratch, in code, spelled out (YouTube)
Attention Is All You Need (Vaswani i in., 2017)
Hugging Face LLM Course
GuppyLM
Thinking in tensors, writing in PyTorch
Neural Networks: Zero to Hero

Dane

Pan Tadeusz - Wolne Lektury (TXT) - pobierz i zapisz w data/pan-tadeusz.txt

Modele Markowa

Tworzymy GPT od podstaw

Wszystkie obecne wiodące AI to sztuczne sieci neuronowe opierające się na architekturze transformerów. W trakcie warsztatów i Ty możesz wytrenować miniaturową wersję Generative Pre-trained Transformer (GPT).

Będzie trochę teorii (o tym, że propagacja wsteczna to zwykłe różniczkowanie przez części, oraz co robi "entropia" i "temperatura"), ale głównie skupimy się na pisaniu i śledzeniu kodu w Pythonie (wcześniejsza znajomość nie jest wymagana).

Zobaczymy, co uda się nam zrobić w 3 dni - może wygenerować nazwy miejscowości, zaklęć i potworów? A może i dojść do poziomu GPT-2, najlepszej sieci z 2019 roku?

Plan warsztatów

Dzień 1

Co się dzieje, jak piszemy w czasie rzeczywistym?
Next token prediction (przewidywanie kolejnego tokenu)
Tokenizator
Ile historii model potrzebuje?
A może łańcuchy Markova?

Dzień 2

Encoding (kodowanie)
Sieć neuronowa (regresja logistyczna)
Sieć dwuetapowa (jeśli zdążymy)
Jak uczymy model?
Co to jest transformer?
Przygotowanie danych

Dzień 3

Trenujemy model

Wymagania i środowisko (How)

Laptop (narzędzie uv + Python)
Jupyter Notebook
Opcjonalnie: Google Colab lub Lightning.ai

Kluczowe spostrzeżenia (Insights)

It's all text (wszystko sprowadza się do tekstu)
Pretraining vs conversational models
Na ile się uczysz?

Bonus

Wystawienie wytrenowanego modelu jako strony internetowej

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
for_gpu		for_gpu
scripts		scripts
.gitignore		.gitignore
.python-version		.python-version
1_markov.ipynb		1_markov.ipynb
2_markov_word.ipynb		2_markov_word.ipynb
3_pytorch_network.ipynb		3_pytorch_network.ipynb
4_self_attention.ipynb		4_self_attention.ipynb
5_mini_gpt.ipynb		5_mini_gpt.ipynb
README.md		README.md
dane.md		dane.md
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GPT od podstaw

Materiały i inspiracje

Dane

Modele Markowa

Tworzymy GPT od podstaw

Plan warsztatów

Wymagania i środowisko (How)

Kluczowe spostrzeżenia (Insights)

Bonus

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

GPT od podstaw

Materiały i inspiracje

Dane

Modele Markowa

Tworzymy GPT od podstaw

Plan warsztatów

Wymagania i środowisko (How)

Kluczowe spostrzeżenia (Insights)

Bonus

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages