# DOKUMENTACJA
---

## Spis treści
1. Użyte technologie  
2. Struktura plików  
3. Instrukcja uruchomienia projektu  
4. Schemat bazy danych  
5. Normalizacja (EKNF / 3NF)  
6. Najtrudniejsze elementy projektu  

---

## 1. Użyte technologie

- MariaDB – relacyjna baza danych  
- Python 3 – główny język programowania  
- mysql-connector-python – komunikacja Python <-> MariaDB  
- pandas – przetwarzanie i analiza danych  
- matplotlib – wizualizacja danych  
- SciPy – testy statystyczne  
- Jupyter Notebook – środowisko analityczne i raportowe  
- nbconvert – automatyczne generowanie raportów HTML  

---

## 3. Lista plików:
- README.ipynb - dokumentacja
- schemat.png - zdjecie schematu bazy
- database_schema.py:
      Plik który tworzy schemat bazy danych ihrf w lokalnej instancjii MariaDB/MySQL z użytkownikiem root i haslem root_password
- fill_database.py - skryptowe wypełnienie bazy danych
- analiza_z_raportem.ipnyb - plik jupyter notebook który robi analizę i na podstawie którego tworzymy raport
- analiza_z_raportem.html - gotowy raport w html

---

## 4. Instrukcja uruchomienia projektu

- Musimy mieć działającą lokalną instancję MariaDB/MySQL z użytkownikiem root i haslem root_password
- Przy pomocy pythona uruchamiamy najpierw plik database_schema.py a potem fill_database.py
- w bashu uruchamiamy komendę
    "jupyter nbconvert \
  --to html \
  --execute \
  --no-input \
  analiza_z_raportem.ipnyb"
- dostajemy gotowy raport
---

## 5. Schemat bazy danych

![alt text](schemat.png)

---

## 6. Lista zależności funkcyjnych

1. Tabela employees

Klucz główny: employee_id

Zależności funkcyjne:

employee_id → first_name, last_name, job_title, start_date, end_date, salary_amount

Identyfikator pracownika jednoznacznie określa wszystkie dane opisujące danego pracownika federacji.

2. Tabela sponsors

Klucz główny: sponsor_id

Zależności funkcyjne:

sponsor_id → company_name, representative_name, contact_email

Każdy sponsor jest identyfikowany przez unikalne sponsor_id, które determinuje jego nazwę firmy oraz dane kontaktowe.

3. Tabela sponsorships

Klucz główny: sponsorship_id
Klucz obcy: sponsor_id → sponsors(sponsor_id)

Zależności funkcyjne:

sponsorship_id → sponsor_id, start_date, end_date, contribution_amount

Każda umowa sponsorska posiada unikalny identyfikator oraz przypisane parametry finansowe i czasowe.

4. Tabela funding_sources

Klucz główny: funding_id

Zależności funkcyjne:

funding_id → source_name, amount, start_date, end_date

Identyfikator źródła finansowania jednoznacznie wyznacza jego nazwę oraz warunki finansowe.

5. Tabela hamsters

Klucz główny: hamster_id
Ograniczenie: name jest unikalne (UNIQUE)

Zależności funkcyjne:

hamster_id → name, birth_date, retire_date, sex, owner_id, owner_name, owner_networth

name → hamster_id, birth_date, retire_date, sex, owner_id, owner_name, owner_networth

Każdy chomik jest jednoznacznie identyfikowany przez hamster_id.
Dodatkowo, unikalna nazwa chomika również pozwala jednoznacznie określić jego dane.

6. Tabela disciplines

Klucz główny: discipline_id

Zależności funkcyjne:

discipline_id → name, category, description


Identyfikator dyscypliny określa jej nazwę, kategorię oraz opis.

7. Tabela competitions

Klucz główny: competition_id
Klucze obce:

discipline_id → disciplines(discipline_id)

hamster_id → hamsters(hamster_id)

Zależności funkcyjne:

competition_id → discipline_id, competition_date, location, spectators_stadium, hamster_id, winner_result

Każde zawody są jednoznacznie identyfikowane przez competition_id i posiadają dokładnie jednego zwycięzcę wraz z jego wynikiem.

8. Tabela prohibited_substances

Klucz główny: substance_id

Zależności funkcyjne:

substance_id → name

Identyfikator substancji jednoznacznie określa jej nazwę.

9. Tabela doping_controls

Klucz główny: control_id
Klucze obce:

hamster_id → hamsters(hamster_id)

substance_id → prohibited_substances(substance_id)

Zależności funkcyjne:

control_id → hamster_id, control_date, substance_id, is_positive

Każda kontrola antydopingowa ma unikalny identyfikator i opisuje pojedyncze badanie wraz z jego wynikiem.

---
## 6. Normalizacja – EKNF

Baza danych jest w EKNF, ponieważ każda zależność funkcyjna ma po lewej stronie klucz główny albo klucz alternatywny (UNIQUE)

---

## 7. Najtrudniejsze elementy projektu

Największym wyzwaniem było zdecydowanie się na konkretny schemat bazy danych a potem wypełnienie go sensownymi danymi
