# Cvičení 3 - Analýza návštěvnosti obchodu

## ZADÁNÍ

Ve složce `archive/` se nacházejí podsložky: `2018`, `2019` a `2020`, a uvnitř každé z nich další podsložky s třípísmennými zkratkami měsíců (`jan`, `feb` atd.).

Každá z těchto složek obsahuje `.csv` soubory (jeden za každý den v měsíci) s informacemi o počtu nových, vracejících se a VIP zákazníků, kteří toho dne navštívili obchod.

**Napište skript, který sečte, kolik nových, vracejících se a VIP zákazníků navštívilo obchod v letech 2018, 2019 a 2020.**

### Očekávané výsledky:

```
V roce 2018 obchod navštívilo:
 - 853 nových zákazníků
 - 2842 vracejících se zákazníků
 - 315 VIP zákazníků
V roce 2019 obchod navštívilo:
 - 851 nových zákazníků
 - 2859 vracejících se zákazníků
 - 252 VIP zákazníků
V roce 2020 obchod navštívilo:
 - 757 nových zákazníků
 - 2767 vracejících se zákazníků
 - 255 VIP zákazníků
```

---

## KROK 1: Import potřebných modulů

Pro práci se soubory budeme potřebovat:
- **`glob`** - pro vyhledávání souborů podle vzoru
- **`csv`** - pro čtení CSV souborů

---

## KROK 2: Funkce pro vyhledání souborů

Cesty k souborům mají strukturu:
```
archive/ROK/MĚSÍC/DEN.csv
```

Pro nalezení všech souborů v daném roce použijeme funkci `glob.glob()` s těmito parametry:
- `**` znamená "všechny podsložky na jakékoli úrovni"
- `*.csv` znamená "všechny soubory končící na .csv"
- `recursive=True` povolí rekurzivní vyhledávání v podsložkách

In [None]:
def soubory_v_roce


### Test funkce:

In [None]:
# Vyzkoušíme, kolik souborů najdeme v roce 2018
soubory_2018 = soubory_v_roce(2018)
print(f"Počet souborů nalezených v roce 2018: {len(soubory_2018)}")
print(f"První 3 soubory: {soubory_2018[:3]}")

---

## KROK 3: Analýza struktury CSV souborů

Každý CSV soubor má tuto strukturu:
```
New customers,100
Returning customers,200
VIP customers,300
```

To znamená:
- 3 řádky
- 2 buňky v každém řádku (název kategorie, počet zákazníků)

### Postup čtení CSV souboru:

1. Otevřeme soubor pomocí `open()`
2. Použijeme `csv.reader()` pro čtení CSV
3. Převedeme výsledek na seznam pomocí `list()`
4. Data budou mít strukturu: `[[řádek1], [řádek2], [řádek3]]`

In [1]:
# Ukázka čtení jednoho souboru
priklad_soubor = soubory_2018[0]  # vezmeme první nalezený soubor

with open(priklad_soubor, newline='') as my_file:


NameError: name 'soubory_2018' is not defined

**Důležité:** Hodnoty z CSV jsou vždy stringy, proto je musíme převést na čísla pomocí `int()`!

---

## KROK 4: Kompletní řešení

### Logika řešení:

1. **Vnější cyklus** (pro každý rok 2018-2020):
   - Najdeme všechny soubory pro daný rok
   - Vytvoříme proměnné pro počítání: `novi`, `vracejici`, `vip` = 0
   
2. **Vnitřní cyklus** (pro každý soubor v roce):
   - Otevřeme soubor a přečteme data
   - Přičteme hodnoty k proměnným
   
3. Po projití všech souborů v roce vypíšeme výsledky

---

## DŮLEŽITÉ POZNÁMKY:

### Kde deklarujeme proměnné?

Proměnné `novi`, `vracejici` a `vip` deklarujeme ve **vnějším cyklu** (pro každý rok), ne ve vnitřním!

**Proč?**
- Chceme, aby se vynulovaly pouze při začátku nového roku
- Kdyby byly ve vnitřním cyklu, vynulovaly by se při každém souboru → nesprávný výsledek

### Správné strukturování cyklů:

```python
for rok in roky:                    # začátek roku
    novi = 0                        # vynulování pro nový rok
    
    for soubor in soubory:          # každý den v roce
        # novi = 0                  # CHYBA! Vynulovalo by se každý den
        novi = novi + hodnota       # přičítání hodnot z dne
    
    print(novi)                     # výpis po dokončení celého roku
```

---

## CELÝ KÓD DOHROMADY: