## Kas yra comprehension

Comprehension yra trumpa sintaksė, leidžianti sukurti naują kolekciją iš iteruojamų duomenų.

- List comprehension: `[išraiška for x in seka if sąlyga]`
- Set comprehension: `{išraiška for x in seka if sąlyga}`
- Dict comprehension: `{raktas: reikšmė for x in seka if sąlyga}`
- Generator expression: `(išraiška for x in seka if sąlyga)`

Pastaba: tuple neturi atskiros „tuple comprehension“ sintaksės; vietoje to naudojamas generator expression ir, jei reikia, `tuple(...)` konvertavimas.

## 1) List comprehension: transformacija ir filtravimas

### Transformacija

Situacija: turėti prekių pavadinimus ir suvienodinti formatą.

In [1]:
raw_products = [" milk", "BREAD ", "Eggs   ", " butter ", "salmon  "]

clean_products_loop = []
for p in raw_products:
    clean_products_loop.append(p.strip().title())

clean_products_comp = [p.strip().title() for p in raw_products]

print(clean_products_loop)
print(clean_products_comp)

['Milk', 'Bread', 'Eggs', 'Butter', 'Salmon']
['Milk', 'Bread', 'Eggs', 'Butter', 'Salmon']


### Filtravimas

Situacija: atrinkti tik pajamas virš 100.

In [2]:
revenues = [50, 120, 90, 300, 110]

high_loop = []
for r in revenues:
    if r > 100:
        high_loop.append(r)

high_comp = [r for r in revenues if r > 100]

print(high_loop)
print(high_comp)

[120, 300, 110]
[120, 300, 110]


### Transformacija + filtravimas

Situacija: turėti užsakymų sumas ir apskaičiuoti PVM (21%) tik tiems, kurie viršija 100.

In [3]:
orders_total = [80, 120, 250, 40]

vat_loop = []
for total in orders_total:
    if total > 100:
        vat_loop.append(round(total * 0.21, 2))

vat_comp = [round(total * 0.21, 2) for total in orders_total if total > 100]

print(vat_loop)
print(vat_comp)

[25.2, 52.5]
[25.2, 52.5]


## 2) Set comprehension: deduplikacija ir unikalios reikšmės

Situacija: turėti kanalų sąrašą su pasikartojimais ir gauti unikalius kanalus.

In [1]:
channels = ["online", "direct", "online", "partner", "direct", "online"]

unique_loop = set()
for c in channels:
    unique_loop.add(c)

unique_comp = {c for c in channels}

print(unique_loop)
print(unique_comp)
print(set(channels))

{'partner', 'online', 'direct'}
{'partner', 'online', 'direct'}
{'partner', 'online', 'direct'}


Situacija: turėti el. paštus ir gauti unikalius domenus (po `@`).

In [6]:
emails = ["a@company.com", "b@company.com", "x@shop.lt", "y@shop.lt", "test@news.io"]

domains = {e.split("@")[1] for e in emails}
domains

{'company.com', 'news.io', 'shop.lt'}

## 3) Dict comprehension: suvestinės ir perdirbimas

### Paprastas perdirbimas

Situacija: turėti kainyną ir pritaikyti nuolaidą 10% visoms prekėms.

In [7]:
prices = {"Milk": 1.50, "Bread": 0.99, "Eggs": 0.80}

discounted_loop = {}
for product, price in prices.items():
    discounted_loop[product] = round(price * 0.90, 2)

discounted_comp = {product: round(price * 0.90, 2) for product, price in prices.items()}

print(discounted_loop)
print(discounted_comp)

{'Milk': 1.35, 'Bread': 0.89, 'Eggs': 0.72}
{'Milk': 1.35, 'Bread': 0.89, 'Eggs': 0.72}


### Filtravimas kuriant žodyną

Situacija: palikti tik prekes, kurių kaina didesnė nei 1.00.

In [8]:
filtered_comp = {product: price for product, price in prices.items() if price > 1.00}
filtered_comp

{'Milk': 1.5}

### Verslo pavyzdys: kanalų pajamų suvestinė

Pastaba: dict comprehension nėra patogiausias kaupimui, todėl suvestinei dažniausiai pasirenkamas ciklas.
Žemiau parodyti aiškus ciklas ir „vienos eilutės“ variantas su `sum()`.

In [9]:
sales = [
    {"channel": "online", "revenue": 100},
    {"channel": "direct", "revenue": 80},
    {"channel": "online", "revenue": 40},
    {"channel": "partner", "revenue": 30},
]

# Aiškus ciklas (rekomenduojamas kaupimui)
revenue_by_channel = {}
for s in sales:
    ch = s["channel"]
    revenue_by_channel[ch] = revenue_by_channel.get(ch, 0) + s["revenue"]

print(revenue_by_channel)

# Dict comprehension su sum (tinkamas mažiems pavyzdžiams)
channels_unique = {s["channel"] for s in sales}
revenue_by_channel_comp = {
    ch: sum(x["revenue"] for x in sales if x["channel"] == ch)
    for ch in channels_unique
}

revenue_by_channel_comp

{'online': 140, 'direct': 80, 'partner': 30}


{'partner': 30, 'online': 140, 'direct': 80}

## 4) Generator expression ir tuple konvertavimas

Generator expression rašomas kaip `(expr for x in it if ...)`.
Jis neskaičiuoja visko iš karto, o grąžina generatorių, kuris reikšmes pateikia iteruojant.

Situacija: turėti pajamas ir suformuoti tuple tik su reikšmėmis virš 100.

In [None]:
revenues = [50, 120, 90, 300, 110]

gen = (r for r in revenues if r > 100)
print(gen)  # generator object

high_tuple = tuple(r for r in revenues if r > 100)
high_tuple

Situacija: turėti užsakymų eilučių sumas ir paskaičiuoti bendrą sumą naudojant generator expression.

In [None]:
lines = [
    {"qty": 2, "price": 1.50},
    {"qty": 1, "price": 0.99},
    {"qty": 3, "price": 0.80},
]

total = sum(line["qty"] * line["price"] for line in lines)
round(total, 2)

## 5) Įdėtinės (nested) comprehension konstrukcijos

Įdėtines comprehension naudoti atsargiai, nes jos greitai tampa sunkiai skaitomos.

Situacija: turėti dvi produktų grupes ir sudaryti visas poras (bundle poros).

In [None]:
group_a = ["Milk", "Bread"]
group_b = ["Eggs", "Butter"]

pairs_loop = []
for a in group_a:
    for b in group_b:
        pairs_loop.append((a, b))

pairs_comp = [(a, b) for a in group_a for b in group_b]

print(pairs_loop)
print(pairs_comp)

## 6) Duomenų valymas: filtravimas ir normalizavimas

Situacija:
- Turėti mišrias reikšmes (tekstas, tuščios reikšmės, `None`).
- Palikti tik tekstą ir normalizuoti reikšmes.

In [None]:
raw = ["  Online ", None, "", "DIRECT", " partner ", 123]

clean_loop = []
for x in raw:
    if isinstance(x, str) and x.strip() != "":
        clean_loop.append(x.strip().lower())

clean_comp = [x.strip().lower() for x in raw if isinstance(x, str) and x.strip() != ""]

print(clean_loop)
print(clean_comp)

## 7) Dažniausios klaidos

- Per daug logikos vienoje comprehension eilutėje ir prastas skaitomumas.
- `None` ar ne-teksto reikšmėms taikyti `.strip()` arba `.lower()` ir gauti `AttributeError`.
- Tikėtis, kad generator expression yra tuple; realiai jis yra generatorius, kol neįvyksta `tuple(...)` konvertavimas.
- Naudoti dict comprehension kaupimui, kai reikia „group by“ tipo logikos; dažnai aiškesnis yra `for` ciklas su `.get()`.
- Pamiršti, kad `set` neturi tvarkos; jei reikia rikiavimo, naudoti `sorted(...)`.

## Santrauka

- List comprehension tinka greitam filtravimui ir transformacijai.
- Set comprehension patogus unikalioms reikšmėms ir deduplikacijai.
- Dict comprehension tinka perdirbti raktus ir reikšmes bei filtruoti žodynus.
- Generator expression tinka skaičiavimams su `sum()`, kai nereikia kurti tarpinio sąrašo.
- Ciklas yra aiškesnis, kai reikia kelių žingsnių ir tarpinių rezultatų.