# Python tutorial: `enumerate()`, `zip()` ir comprehensions duomenų analitikoje


## Tikslas

- Pritaikyti `enumerate()` ir `zip()` dirbant su skirtingomis duomenų struktūromis.
- Suprasti list/dict/set comprehensions ir kada jas naudoti.
- Pateikti paprastus verslo pavyzdžius: kainynai, krepšeliai, kanalai, KPI suvestinės, duomenų valymas.
- Paminėti dažniausias klaidas ir kaip jų išvengti.


## 1) `enumerate()`: indeksas + reikšmė

`enumerate(iterable, start=0)` grąžinti poras (indeksas, reikšmė).
Tai dažnai pakeisti poreikį naudoti `range(len(...))`.

In [4]:
products = ["Milk", "Bread", "Eggs","Hot bear"]

for i, p in enumerate(products, start=1):
    print(i, p)

1 Milk
2 Bread
3 Eggs
4 Hot bear


### Pradėti numeraciją nuo 1

In [5]:
for i, p in enumerate(products, start=1):
    print(i, p)

1 Milk
2 Bread
3 Eggs
4 Hot bear


### Verslo pavyzdys: priskirti eilučių numerius ataskaitai

Situacija:
- Turėti prekių sąrašą.
- Sugeneruoti „eilutės numerį“ ir teksto formatą ataskaitai.

In [6]:
report_lines = []
for i, p in enumerate(products, start=1):
    report_lines.append(f"{i}. {p}")

report_lines

['1. Milk', '2. Bread', '3. Eggs', '4. Hot bear']

### Dažna klaida: `enumerate()` grąžina porą, todėl reikia išskaidyti į du kintamuosius

Žemiau pateikti neteisingą variantą komentaruose.

In [8]:
#for x in enumerate(products):
   #print(x.upper())  # klaida, nes x yra tuple (i, p), o ne tekstas

for i, p in enumerate(products):
    print(p.upper())

MILK
BREAD
EGGS
HOT BEAR


## 2) `zip()`: sujungti kelias sekas

`zip(a, b, ...)` sujungti elementus pagal poziciją.
Dažnas naudojimas: sujungti stulpelius, sukurti žodyną, sudaryti poras.

In [10]:
names = ["Milk", "Bread", "Eggs"]
prices = [1.50, 0.99, 0.80]

for name, price in zip(names, prices):
    print(name, "|", price)

Milk | 1.5
Bread | 0.99
Eggs | 0.8


### Verslo pavyzdys: sukurti kainyną (dict) iš dviejų sąrašų

In [11]:
price_list = dict(zip(names, prices))
price_list

{'Milk': 1.5, 'Bread': 0.99, 'Eggs': 0.8}

### `zip()` su skirtingo ilgio sąrašais

`zip()` sustos ties trumpiausiu sąrašu.
Tai gali „tyliai“ prarasti dalį duomenų, jei ilgiai nesutampa.

In [12]:
names2 = ["Milk", "Bread", "Eggs", "Butter"]
prices2 = [1.50, 0.99, 0.80]

pairs = list(zip(names2, prices2))
pairs

[('Milk', 1.5), ('Bread', 0.99), ('Eggs', 0.8)]

### Dažna klaida: manyti, kad `zip()` įtrauks visus elementus

Jei reikia tikrinti ilgį, naudoti `len()` palyginimą prieš jungiant.

In [13]:
if len(names2) != len(prices2):
    print("Įspėjimas: sąrašų ilgiai nesutampa:", len(names2), "vs", len(prices2))

Įspėjimas: sąrašų ilgiai nesutampa: 4 vs 3


## 3) Comprehensions: trumpa forma sąrašams, aibėms ir žodynams

Comprehensions leidžia sukurti naują struktūrą vienoje eilutėje.
Pagrindinės formos:
- List comprehension: `[expr for x in it if condition]`
- Set comprehension: `{expr for x in it if condition}`
- Dict comprehension: `{key: value for x in it if condition}`

### 3.1) List comprehension: transformacija ir filtravimas

In [None]:
raw_emails = ["  A@B.COM ", "test@example.com", "", None]

# Išvalyti tekstą ir palikti tik teisingus (paprasta logika)
clean_emails = [
    e.strip().lower()
    for e in raw_emails
    if isinstance(e, str) and e.strip() != ""
]

clean_emails

### Dažna klaida: bandyti kviesti `.strip()` reikšmei `None`

Tokiu atveju reikia pirmiausia patikrinti tipą (`isinstance(e, str)`).

### 3.2) Set comprehension: unikalios reikšmės

In [None]:
channels = ["online", "direct", "online", "partner", "direct"]

unique_channels = {c for c in channels}
unique_channels

### 3.3) Dict comprehension: sukurti suvestinę arba pervadinti raktus

In [14]:
# Pritaikyti 10% PVM ir apvalinti kainas
price_list = {"Milk": 1.50, "Bread": 0.99, "Eggs": 0.80}

prices_with_vat = {k: round(v * 1.10, 2) for k, v in price_list.items()}
prices_with_vat

{'Milk': 1.65, 'Bread': 1.09, 'Eggs': 0.88}

## 4) Verslo mini-pavyzdys: krepšelio suma ir eilučių numeravimas

Situacija:
- Turime prekių pavadinimus ir kiekius atskiruose sąrašuose.
- Turime kainyną kaip žodyną.
- Su `zip()` sujungti prekę su kiekiu.
- Suskaičiuoti eilutės sumą ir viso krepšelio sumą.
- Su `enumerate()` parengti ataskaitos eilutes.

In [None]:
products = ["Milk", "Bread", "Eggs"]
qtys = [2, 1, 3]
prices = {"Milk": 1.50, "Bread": 0.99, "Eggs": 0.80}

lines = []
total = 0.0

for product, qty in zip(products, qtys):
    price = prices.get(product, 0.0)
    line_total = qty * price
    total += line_total
    lines.append((product, qty, price, line_total))

report = []
for i, (product, qty, price, line_total) in enumerate(lines, start=1):
    report.append(f"{i}. {product} | kiekis={qty} | kaina={price} | suma={round(line_total, 2)}")

print("\n".join(report))
print("Iš viso:", round(total, 2))

### Dažna klaida: `zip()` nutraukti pagal trumpiausią sąrašą

Jei `products` ir `qtys` ilgiai nesutampa, dalis eilučių likti neapdorota.

In [None]:
products = ["Milk", "Bread", "Eggs", "Butter"]
qtys = [2, 1, 3]

if len(products) != len(qtys):
    print("Įspėjimas: produktų ir kiekių skaičius nesutampa.")

## 5) Kada rinktis ciklą, o kada comprehension

- Comprehension rinktis, kai logika trumpa: filtravimas, transformacija, paprastas žodyno kūrimas.
- `for` ciklą rinktis, kai:
  - reikia kelių tarpinių žingsnių,
  - reikia kaupti kelis rezultatus,
  - reikia aiškiai tvarkyti klaidas arba sąlygas.

## 6) `zip()` su keliomis sekomis ir `dict.items()`

In [None]:
months = ["2025-11", "2025-12", "2026-01"]
revenue = [1200, 1500, 900]
orders = [40, 55, 30]

rows = list(zip(months, revenue, orders))
rows

### Verslo pavyzdys: apskaičiuoti vidutinę užsakymo vertę (AOV) per mėnesį

- AOV = revenue / orders
- Apsaugoti nuo dalybos iš nulio.

In [None]:
aov_rows = []

for month, rev, ord_cnt in zip(months, revenue, orders):
    if ord_cnt == 0:
        aov = None
    else:
        aov = round(rev / ord_cnt, 2)
    aov_rows.append((month, aov))

aov_rows

## 7) Dažniausios klaidos ir kaip jų išvengti

- `enumerate()` nepaskirstyti į du kintamuosius ir pamiršti, kad grąžinama pora (tuple).
- `zip()` naudoti su nevienodais sąrašų ilgiais ir nepastebėti, kad dalis duomenų „nukrenta“.
- Comprehension naudoti per sudėtingai ir prarasti skaitomumą.
- Teksto metodus (`strip`, `lower`) taikyti `None` reikšmėms ir gauti `AttributeError`.
- Žodyne naudoti `dict[key]`, kai raktas gali neegzistuoti, ir gauti `KeyError`; dažnai saugiau naudoti `.get()`.

## Santrauka

- `enumerate()` patogiai pridėti indeksą iteruojant per sąrašą.
- `zip()` sujungti kelias sekas pagal poziciją, dažnai naudoti stulpeliams sujungti arba žodynui sukurti.
- Comprehensions padėti greitai kurti naujas struktūras, kai logika trumpa ir aiški.
- Praktikoje svarbu tikrinti duomenų tipą ir ilgį, kad klaidos būtų pastebėtos anksti.