# List comprehensions (Składanie listy)


**List comprehensions are a concise and readable Python syntax for creating lists in a single line of code, often replacing for loops and conditional statements within the list creation process.** **They make code shorter, cleaner, and often faster.**
**They are used for:**

**-transforming data (e.g., modifying list elements),**

**-filtering elements based on a condition,**

**-generating lists from other iterable objects.**

---------------------------------------------------------------------------------------------------
List comprehensions to zwięzła i czytelna składnia w Pythonie, która pozwala tworzyć listy w jednej linijce kodu, często zastępując pętle for oraz instrukcje warunkowe wbudowane w proces generowania listy. Dzięki nim kod jest krótszy, bardziej przejrzysty i często szybszy.
Stosuje się je do:

-przekształcania danych (np. modyfikacji elementów listy),

-filtrowania elementów według warunku,

-tworzenia list na podstawie innych iterowalnych obiektów.

Docs:
1. https://docs.python.org/2/tutorial/datastructures.html#list-comprehensions
2. https://realpython.com/list-comprehension-python/

<br><br>



## Core syntax  / Podstawowa składnia

**The core syntax consists of an expression ( This is what gets evaluated and added to the list) , a variable ( The loop variable that takes values from the iterable) , and an iterable (The sequence of values that variable will loop through):**

**List comprehension is specified by square brackets (just like the list itself) inside which you have a for loop over some iterable object.**

-------------------------------------------------

Podstawowa składnia składa się z : wyrażenia ( wykonanie zadanej operacji i dodanie obiektu do listy) , zmiennej (zmienna która przechodzi przez wartości iteratora /sekwencji) i iteratora ( wartości przez które nasza zmienna będzie 'przechodzić') :

List comprehension jest tworzona przy uzyciu nawaisów kwadratowych (jak sama lista) wewnątrz których zdefiniowana jest pętla for która iteruje po iteratorze/sekwencji)

`new_list = [x for x in some_iterable]`

`new_list = [expression for item in sequence / iterable]`

<br> <br>

## Benefits / Zalety:

**Conciseness: replace 4–5 lines with 1.**

**Readability: once someome get used to the pattern, it’s clearer than a verbose loop.**

**Performance: slightly faster than regular for loops.**

----------------------

Zwięzłość: zastępuje 4–5 linijek kodu jedną.

Czytelność: kiedy ktoś przyzwyczai się do wzorca, jest to bardziej przejrzyste niż rozwlekła pętla.

Wydajność: nieco szybsze niż zwykłe pętle for.

<br> <br>

###  Examples / Przykłady

**Let’s go through the operation of list construction with an example. We will multiply each element of the list. Let’s do it using the familiar for loop approach:**

-------------------
Prześledźmy operację składania list na przykładzie. Pomnożymy kolejne elementy listy. Zróbmy to za pomocą znanego sposobu z pętlą for:

In [None]:
simple_list = [0, 5, 2, 10, -1, 3]

In [None]:
new_list = []
for elem in simple_list:
  new_list.append(2 * elem)

In [None]:
new_list

<br> <br>


**Python allows performing the same transformation in a more concise way**

-------------------------------------------------------------


Python umożliwia wykonanie takiej samej transformacji w bardziej zwięzły sposób:


In [None]:
[2 * elem for elem in simple_list]

<br> <br>

**Another example with sequence/iterable of different type:**

----------------------------
Kolejny przykład z sekwencją/obektem iterowalnym innego typu:


In [None]:
pairs = [(x, y) for x in range(3) for y in range(2)]
pairs



'''
pairs = []
for x in range(3):
    for y in range(2):
        pairs.append((x, y))

'''

<br> <br>

## List comprehensions with 'if' / Lista składana z 'if'

**List comprehension with an if condition allows you to create a new list by adding only those elements from an existing sequence that meet a specified condition.**

------------------

List comprehension z warunkiem if pozwala na tworzenie nowej listy, dodając do niej tylko te elementy z istniejącej sekwencji, które spełniają określony warunek.


`new_list = [x for x in some_iterable if condition == True]`

`[expression for item in sequence / iterable if condition == True]`

<br> <br>


**If we also wanted to filter out elements greater than 0:**

------------------

Gdybyśmy chcieli przy okazji odfiltrować elementy większe od 0:



In [None]:
new_list = []
for elem in simple_list:
  if elem > 0:
    new_list.append(2 * elem)

new_list

<br> <br>

**More concisely, we can do the same thing using a list comprehension:**

------------------
Bardziej zwięźle możemy zrobić to samo za pomocą list comprehension:

In [None]:
[2 * elem for elem in simple_list if elem > 0]

<br> <br>

## 'if' and its position / 'if' i jego pozycja

**Let's assume we don't want to filter items of the iterable/ sequence but we would like iterate through all of the elements and make an updates only if specific condition is met:**

-------------------

Nie chcemy filtrować elementów sekwencji ale przejśc przez wszystkie elementy i zmodyfikować tylko te elementy które spełniają określony warunek:


In [None]:
[2 * elem if elem > 0 else elem for elem in simple_list]


In [None]:
dna = 'ACCGTA'
alkali = ['puryna' if a == 'A' or a == 'G' else 'pirymidyna' for a in dna]
alkali

<br> <br>

**Why, when we used the `if` exepression without `else`, we placed it on the right side of the  `for ... in ...` expression**

**Whereas when using the `if ... else ...` we placed it on the left side of the `for ... in ....` expression:**

--------------------------------------------------------------------------------------------------------------------
Dlaczego kiedy używaliśmy wyrażenia `if`, bez `else`, umieszczaliśmy je po prawej stronie wyrażenia `for ... in ...`:

natomiast używając konstrukcji `if ... else ...`, umieszczaliśmy ją po lewej stronie wyrażenia `for ... in ....`:


`[2 * elem for elem in simple_list if elem > 0]`

`[2 * elem if elem > 0 else elem for elem in simple_list]`

<br> <br>

**In fact, in these two cases, we are doing two different things:**

**-A standalone `if` only filters elements, so the expression is placed on the right side**

**-In the case of `if ... else ...`, depending on whether certain conditions are met or not, we choose one value or another to return.**

--------------------------------------------------------------------

Tak naprawdę w tych dwu przypadkach robimy dwie różne rzeczy:

Samo `if` powoduje, że tylko filtrujemy elementy, zatem wyrażenie umieszczamy po prawej stronie.

W przypadku `if ... else ...` w zależności od spełniania, lub nie określonych warunków, wybieramy taką lub inną zwracaną wartość.

<br> <br>


## Exercise

**Given a list of numbers, create a new list with their squares:**

----------------
Dla danej listy liczb, utwórz nową listę zawierającą ich kwadraty.



In [None]:
numbers = [2, 5, 3, 9, 1]
# Your turn 👇
# squares= [.....]


<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here
squares= [n * n for n in numbers]
squares




<br> <br>

## Exercise

**Given a list of words, filter words shorter than 3 letters:**

----------------
Dla danej listy słów, utwórz nową listę zawierającą tylko słowa krótsze niż 3 litery.


In [None]:
tech = ["airflow", "dag", "spark", "sql"]
# Your turn 👇
# short = [...]


<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here
short = [w for w in tech if len(w) <= 3]
short

<br> <br>


## Examples ( list of dictionaries) / Przykład (lista słowników)




**From a list of dictionaries , get the list of names**

------------------

Z listy słowników stwórz liste z imionami



In [None]:
kids = [
    {"name": "Alan", "age": 3},
    {"name": "Jessica", "age": 6},
    {"name": "Bryan", "age": 11}
]


names = [kid["name"] for kid in kids]
names


<br> <br>

**Get ages above 3**

------------------

Wybierz tylko wiek większy niż 3


In [None]:

ages_above_3 = [kid["age"] for kid in kids if kid["age"] > 3]
ages_above_3

<br> <br>

**Create a new list of dictionaries with discounted product names and their discounted prices (10% off)**

---------------------------

Stwórz nową listę słowników z nazwą  produktów podlegających przecenie i  ceną obniżoną o 10 %

In [None]:

products = [
    {"id": 1, "name": "Laptop", "price": 3200, "discount": True},
    {"id": 2, "name": "Mouse", "price": 150, "discount": False},
    {"id": 3, "name": "Monitor", "price": 1200, "discount": True},
    {"id": 4, "name": "Keyboard", "price": 400, "discount": False}
]


discounted = [
    {"name": product["name"], "discounted_price": round(product["price"] * 0.9, 2)}
    for product in products
    if product["discount"]
]
discounted

<br> <br>

## Exercise 

**From the list of user dicts, get emails of active users from PL only:**

----------------
Z listy słowników użytkowników pobierz adresy e-mail aktywnych użytkowników tylko z Polski (PL).


In [None]:
users = [
    {"name":"Ala", "email":"a@example.com", "active":True, "country":"PL"},
    {"name":"Bob", "email":"b@example.com", "active":False, "country":"PL"},
    {"name":"Carl", "email":"c@example.com", "active":True, "country":"DE"},
    {"name":"Dana", "email":"d@example.com", "active":True, "country":"PL"},
]

# Your turn 👇
# Place for solution
# emails = [....]

<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here
emails = [u.get("email") for u in users if u.get("active") and u.get("country") == "PL"] ## safer version
emails_ = [u["email"] for u in users if u["active"] and u["country"] == "PL"]

# Avoids KeyError: .get() returns None (or a default value) if the key doesn’t exist, preventing runtime errors.
# Supports Defaults: You can specify a fallback value, e.g., my_dict.get("key", "default").
# Cleaner Code: It simplifies conditional logic compared to checking key existence with if key in dict.

print(emails)
print(emails_)

<br> <br>

##  Example( dictionary unpacking ) / Rozpakowywanie słowników



**Converting prices from one currency to another. For example:**

--------------------------------------------------

Przeliczanie cen z jednej waluty na inną. Przykładowo:


```python

[{**dict} for dict in list]  ### JUST A COPY OF A DICTIONARY

[{**dict, "new_key": "value"} for dict in list] 

[{**dict, **{"existing_key":"new_value ", "new_key": "new_value"}} for dict in list]  ### UPDATES VALUES/ ADD NEW VALUES INTO IN EXISTING DICTIONARY


```

<br> <br>

In [None]:
stock_levels = [
    {"item": "Samsung", "price": 700.0, "quantity": 5, "currency": "EUR"},
    {"item": "IPhone", "price": 1000.0, "quantity": 3, "currency": "EUR"},
]

<br> <br>

**We have a given EUR/PLN exchange rate:**

------------


Mamy dany kurs EUR/PLN:

In [None]:
exchange_rate = 4.26

<br> <br>

**Using the list comprehension, we can concisely convert prices at the EUR/PLN exchange rate:**

----------------------------------

Korzystając z list comprehension możemy w zwięzły sposób przeliczyć ceny po kursie EUR/PLN::

In [None]:
stock_levels_pln = [{**stock, "price": stock["price"] * exchange_rate, "currency": "PLN"} for stock in stock_levels]



stock_levels_pln_ = [
    {**stock, **{"price": stock["price"] * exchange_rate, "currency": "PLN"}} for stock in stock_levels
]


print(stock_levels_pln)
print(stock_levels_pln_)

<br> <br>

## Exercise

**How would total revenue for the `TV` product change if the price increased by 10%. Here is the list of transactions:**

----------------------------------------

Jak zmieniłby się łączny przychód dla produktu `TV`, jeśli cena zwiększyłaby się o 10%. Oto lista transakcji:

In [None]:
transactions = [
    {"id": 1, "item": "TV", "quantity": 2, "price": 2000.0},
    {"id": 2, "item": "TV", "quantity": 1, "price": 4000.0},
    {"id": 3, "item": "PC", "quantity": 3, "price": 2500.0},
]

In [None]:
# Your turn 👇
# Place for solution
  

<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here
updated_price_transactions = [{**t, "price": t["price"] * 1.10} if t["item"] == "TV" else t for t in transactions]
print(updated_price_transactions)

list_of_incomes = [t["quantity"] * t["price"] for t in updated_price_transactions if t["item"] == "TV"]
print(list_of_incomes)

revenue_before = sum([t["quantity"] * t["price"] for t in transactions if t["item"] == "TV"])
print(revenue_before)
revenue_updated  = sum([t["quantity"] * t["price"] for t in updated_price_transactions if t["item"] == "TV"])
print(revenue_updated)

f'difference between revenues after price changes is {revenue_updated - revenue_before}'

<br> <br>

## Exercise

**Use list comprehension to clean `data`:**

**1. Remove `None`**

**2. Cast the string to numeric values**

**3. Extract numeric values from the tuple**

**4. Leave only values greater than or equal to `0`**

**5. Sort the result ascending**

------------------------------------


Za pomocą list comprehension oczyść `dane`:
1. Usuń `None`
2. Zrzutuj string na wartości liczbowe
3. Wyciagnij wartości liczbowe z tuple
4. Zostaw tylko wartości większe bądź równe `0`
5. Posortuj wynik rosnąco


In [None]:
data = [None, "12", -5, ("result", 8), "7", None, 5, "-8", ("ranking", 15), 0, None, "3", -2, ("value", 21)]
# result = [0, 3, 5, 7, 8, 12, 15, 21]

In [None]:
# Your turn 👇
# HINT
# isinstance() is a built-in Python function used to check the type of an object.
# isinstance(object, type)
# x = 5
# isinstance(intx, )  # → True

# Place for solution


<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here
step1 = [d for d in data if d is not None]
print(step1)
step2 = [int(d) if isinstance(d, str) else d for d in step1]
print(step2)
step3 = [d[1] if isinstance(d, tuple) else d for d in step2]
print(step3)
step4 = [d for d in step3 if d >= 0]
print(step4)
result = sorted(step4)
print(result)
result_combined = [int(d) if isinstance(d, str)
          else
          d[1] if isinstance(d, tuple)
          else
          d
          for d in data if d is not None]
result_final =sorted( [d for d in result_combined if d >= 0])
result_final

<br> <br>

# Dict comprehensions ( Wyrażenie słownikowe )

Docs:
1. https://realpython.com/python-dictionary-comprehension/


<br> <br>

## Example

**We will use an example of a dictionary that contains information about temperatures in various cities in Poland:**

--------------------------------------------------

Posłużymy się przykładem słownika, który zawiera informacje o temperaturach w różnych miastach w Polsce:

In [None]:
temperatures = {
    "Poznań": 10,
    "Warszawa": 5,
    "Kraków": 8,
    "Wrocław": 12,
    "Gdańsk": 7,
}
temperatures

<br> <br>

**Little reminder on how the following functions work:**

**When you use .items(), .values(), or .keys() on a dictionary in Python, you’re creating special view objects that behave like dynamic, iterable collections.**

**dynamic - automatically reflect any changes made to the dictionary they come from**

-----------------------------------


Przypomnijmy sobie działanie poniższych funkcji:

Kiedy używasz .items(), .values() lub .keys() na słowniku w Pythonie, tworzysz specjalne obiekty widoku, które zachowują się jak dynamiczne, kolekcje po których można iterować.

dynamiczne - automatycznie odzwierciedlają wszelkie zmiany w słowniku, z którego pochodzą

In [None]:
print(temperatures.items())

print(type(temperatures.items()))

print(temperatures.values())

print(type(temperatures.values()))

print(temperatures.keys())

print(type(temperatures.keys()))

In [None]:
for city, temp in temperatures.items():
    print(city, temp)

<br> <br>

**We want to transform `temperatures` to include information about cities where the temperature is greater than 7 degrees Celsius. Using a `for` loop, we would do this as follows:**

--------------------------------


Chcemy przekształcić `temperatures`, tak aby zawierał informacje o miastach, w których temperatura jest większa niż 7 stopni. Za pomocą pętli `for` zrobilibyśmy to w następujący sposób:

In [None]:
temperatures_dict = {}
for city, temp_ in temperatures.items():
  if temp_ > 7:
    temperatures_dict[city] = temp_

temperatures_dict

<br> <br>

**The similar code for the dict comprehension operation is below:**

----------------------------------------

Analogiczny kod dla operacji comprehension znajduje się poniżej:

In [None]:
{  city: temp_ 
   for city, temp_ in temperatures.items()
   if temp_ > 7}

<br> <br>

**In case we still want to convert the temperature from Celsius to Fahrenheit using the function below:**

----------------------------------------


W przypadku, gdybyśmy jeszcze chcieli przekształcić temperaturę ze stopni Celsjusza na Fahrenheita za pomocą poniższej funkcji:

In [None]:
def celsius2fahrenheit(c):
  return (c * 9/5) + 32

<br> <br>

**The only change will be to call the `celsius2fahrenheit` function, for the temperature values:**

--------------------------------

Jedyną zmiana będzie wywołanie funkcji `celsius2fahrenheit`, na wartościach temperatury:

In [None]:
{
    city: celsius2fahrenheit(temp_)
    for city, temp_ in temperatures.items()
    if temp_ > 7
}

<br> <br>

**There is nothing stopping you from creating lists based on key-value pairs from a dictionary:**

---------------------------------------------


Nic nie stoi na przeszkodzie, aby na bazie par klucz-wartość ze słownika tworzyć listy:

In [None]:
temperatures_list = [(city, celsius2fahrenheit(temp_)) for city, temp_ in temperatures.items() if temp_ > 7]
temperatures_list

<br> <br>

**And vice versa:**

------------------------------------------

I na odwrót:

In [None]:
{
    city: temp_
    for city, temp_ in temperatures_list
}

<br> <br>

**Although it will be simpler to use built-in Python function:**

---------------------------------------

Chociaż prościej będzie użyć wbudowanej funkcji Pythona:

In [None]:
dict(temperatures_list)


In [None]:
'''
temperatures = {
    "Poznań": 10,
    "Warszawa": 5,
    "Kraków": 8,
    "Wrocław": 12,
    "Gdańsk": 7,
}
'''

list(temperatures)

In [None]:
list(temperatures.items())

<br> <br>

## Exercise

**Based on the data below, create a dictionary with the key "name" and the value "salary." We're interested in people with salaries below 10,000.**

Na podstawie poniższych danych utwórz słownik, którego kluczem będzie imię a wartością pensja. Interesują nas osoby z pensją poniżej 10000.

In [None]:
data = [
    {"id": 1, "name": "Alicja", "salary": 7000},
    {"id": 2, "name": "Robert", "salary": 5000},
    {"id": 3, "name": "Jerzy", "salary": 12000}
]

In [None]:
# Your turn 👇
# Place for solution


<details>
<summary>Click to reveal the solution</summary>

```python

# Your solution code here
name_to_salary = {d["name"]: d["salary"] for d in data if d["salary"] < 10000}
name_to_salary
name_to_salary = {d.get("name"): d.get("salary") for d in data if d.get("salary", 0) < 10000}  -> Treat missing salary as 0

<br> <br>

**From a dictionary of words, classify each word as True if it starts with a vowel, else False.**

---------------------------------------------

Z podanego słownika słów sklasyfikuj każde słowo jako True, jeśli zaczyna się samogłoską, w przeciwnym razie jako False.



In [None]:
words = ["jabłko", "awokado", "pomarańcza", "gruszka", "agrest", "ostrężyna"]

In [None]:
# Your turn 👇
# Place for solution

# word_classification = {....}


<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here
word_classification = {
    word: word[0].lower() in "aeiou" 
    for word in words
}
word_classification

###########################

word_classification = {
    word: word.lower().startswith(("a", "e", "i", "o", "u")) 
    for word in words}
word_classification

##################3
word_classification = {
    word: True if word[0].lower() in "aeiou" else False
    for word in words
}
word_classification

<br> <br>

## Set comprehension

**Set comprehension is very similar to dict comprehension. Instead of returning a key-value pair, we simply return the value. Let's use an example similar to the last one. We'll add an additional record for another person named Alicja:**

------------------------------

Set comprehension wygląda bardzo podobnie do dict comprehension. Zamiast pary klucz-wartość zwracamy tylko wartość. Posłużmy się przykładem podobnym do ostatniego. Dodamy rekord z kolejną osobą o imieniu Alicja:

In [None]:
data = [
    {"id": 1, "name": "Alicja", "salary": 7000},
    {"id": 2, "name": "Robert", "salary": 5000},
    {"id": 3, "name": "Jerzy", "salary": 12000},
    {"id": 4, "name": "Alicja", "salary": 9999},
]

<br> <br>

**Our task will be to find people whose salary is below 10,000:**

------------------------------------

Naszym zadaniem będzie znalezienie osób, których pensja jest poniżej 10000:

In [None]:
data_as_set = {
    d["name"]
    for d in data
    if d["salary"] < 10000           
}

print(data_as_set)
type(data_as_set)

<br> <br>
NOTE:

**Referring to the previous exercise, note that the salary value is determined by the last record in the list under the same key:**

-------------------------------------------


Nawiązując do poprzedniego ćwiczenia zwróćmy uwagę, że o wartości pensji decyduje ostatni rekord z listy pod tym samym kluczem:

In [None]:
{
    d["name"]: d["salary"]
    for d in data
    if d["salary"] < 10000
}


<br> <br>

# Nested comprehensions / Zagnieźdzone comprehensions

Docs:
1. https://www.geeksforgeeks.org/nested-list-comprehensions-in-python/
2. https://realpython.com/list-comprehension-python/#watch-out-for-nested-comprehensions

<br> <br>


**Let's use an example to analyze temperature measurements. Each row represents a separate measurement device. The values of the elements in the rows represent subsequent measurements.**

-------------------------------------------------

Posłużmy się przykładem, w który będziemy analizować pomiary temperatur. Każdy wiersz reprezentuje osobne urządzenie pomiarowe. Wartości elementów w wierszach są kolejnymi pomiarami.


In [None]:
temperatures = [
    [-10, 30, 8],
    [-50, 0, -20, 10],
    [-30, 25],
    [5, 40, 22],
]

<br> <br>

**In example 1, we want to convert degrees Celsius to Fahrenheit, leaving only the results with Celcius temperature higher than 0.**

**Using a `for` loop, we will do this as follows:**

--------------------


W 1. przykładzie chcemy zamienić stopnie Celsjusza na Fahrenheita pozostawiając wyniki tylko dla temperatur wiekszych od 0. 

Za pomocą pętli `for` zrobimy to następująco:

<br> <br>

In [None]:
def celsius2fahrenheit(c):
  return (c * 9/5) + 32

In [None]:
result = []
for internal_temp in temperatures:
  result.append([celsius2fahrenheit(element) for element in internal_temp if element > 0])

result

<br> <br>

**If we want to use only the comprehensions, we need to nest subsequent operations:**

--------------------

W przypadku gdybyśmy chceli skorzystać wyłącznie z comprehensions musimy zagnieżdżać kolejne operacje:

In [None]:
[
    [celsius2fahrenheit(element) for element in wewn_temp if element > 0]
    for wewn_temp in temperatures
]

<br> <br>

**What if we wanted a flat list of temperatures? Let's start with the loop solution:**

-------------------------

A co jeśli chcielibyśmy otrzymać płaską listę temperatur? Zacznijmy od rozwiązania z pętlą:

In [None]:
temp_list = []
for internal_temp in temperatures:
  temp_list += [celsius2fahrenheit(element) for element in internal_temp if element > 0]

temp_list

<br> <br>

**Solution based solely on comprehensions:**

Rozwiązanie oparte wyłącznie o comprehensions:

In [None]:
'''LIST INSIDE LIST
[
    [celsius2fahrenheit(element) for element in wewn_temp if element > 0]
    for wewn_temp in temperatures
]
'''

'''temperatures = [
    [-10, 30, 8],
    [-50, 0, -20, 10],
    [-30, 25],
    [5, 40, 22],
]'''
    
[
    celsius2fahrenheit(element)
    for internal_temp in temperatures
    for element in internal_temp if element > 0
]

## Examples

**Squares of numbers in groups**

-----------------------

Kwadraty liczby w grupach

```python

numbers = [[1, 2, 3], [4, 5], [6, 7, 8]]

```

In [None]:
numbers = [[1, 2, 3], [4, 5], [6, 7, 8]]

#### LIST IN LIST ###

squares_nested = [[n**2 for n in group] for group in numbers]
print(squares_nested)

## FLATTENED

squares_flat = [n**2 for group in numbers for n in group]
print(squares_flat)


**Go through a shopping list**
- **Skip any item with fewer than 5 letters.**
- **If an item starts with "c", capitalize it.**
- **Otherwise, leave as is.**

---------------------------------------

Przejdź przez listę zakupów
- Pomiń każdy element krótszy niż 5 liter.
- Jeśli element zaczyna się na „c”, zapisz go wielką literą.
- W przeciwnym razie pozostaw bez zmian.


In [None]:
shopping_lists = [
    ["milk", "bread", "chips"],
    ["apple", "banana", "candy"],
    ["water", "cola", "beer"]
]

#### LIST IN LIST ###
nested_result = [
    [item.capitalize() if item.startswith("c") else item
     for item in group if len(item) >= 5]
    for group in shopping_lists
]

print(nested_result)

## FLATTENED
flat_result = [
    item.capitalize() if item.startswith("c") else item
    for group in shopping_lists
    for item in group if len(item) >= 5
]

print(flat_result)

<br> <br>

## Exercise

**Create a flattened list of products starting with 'A'**

-----------

Stwórz listę produktów zaczynających się na literę 'A'



In [None]:
products = [
    ["Apple", "Banana", "Avocado"],
    ["Apricot", "Blueberry"],
    ["Almond", "Cherry", "Anise"]
]

# Your turn 👇
# Place for solution


<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here

a_products = [
    fruit 
    for sublist in products 
    for fruit in sublist if fruit.startswith("A") ]
a_products

<br> <br>

## Nested comprehensions - nested dictionaries / Zagnieżdżone słowniki



## Example


**Filter: only students with Math grade >= 60**

----------------------

Przefiltruj: Tylko studenci z Math grade >= 60


In [None]:

grades = {
    "Alice": {"Math": 85, "Science": 90},
    "Bob": {"Math": 55, "Science": 75},
    "Charlie": {"Math": 92, "Science": 88}
}

passed_math = {student: subjects for student, subjects in grades.items() if subjects["Math"] >= 60}
passed_math

**You have a dictionary of employees with their department and salary:**
**Build a new dictionary using comprehension where Keys are employee names, Values are nested dicts containing**
- **"salary_eur" → salary converted from PLN to EUR (assume 1 EUR = 4.5 PLN).**
- **"is_high_salary" → True if salary > 10,000, otherwise False.**

-------------------------------

Masz słownik pracowników z ich działem i pensją:
Zbuduj nowy słownik przy użyciu składni comprehension, w którym kluczami będą imiona pracowników, a wartościami będą zagnieżdżone słowniki zawierające:
„salary_eur” → pensja przeliczona z PLN na EUR (przyjmij kurs 1 EUR = 4,5 PLN).
„is_high_salary” → True, jeśli pensja > 10 000, w przeciwnym razie False.

<br> <br>


In [None]:
employees = {
    "Alice": {"department": "IT", "salary": 9000},
    "Bob": {"department": "HR", "salary": 12000},
    "Charlie": {"department": "Finance", "salary": 7000},
    "Diana": {"department": "IT", "salary": 15000},
}
# 1 #

salaries_in_euro = {
    employee: {
        "salary_eur": details["salary"] / 4.50,
        "is_high_slary": True if details["salary"] > 10000 else False
    }
    for employee, details in employees.items()
}
print(salaries_in_euro)

# 2 #
salaries_in_euro_ = {
    employee: {
        "salary_eur": details["salary"] / 4.50,
        "is_high_salary": details["salary"] > 10000
    }
    for employee, details in employees.items()
}
salaries_in_euro_



<br> <br>

## Exercise

**Transform the server logs as follows:**

**1. Filter out log entries where the CPU metric exceeds 75 (i.e., 75% utilization).**

**2. Two possible results:**

----------------

Przekształć w następujący sposób logi z serwera:
1. Odfiltruj ( odrzuć) wpisy w logach, gdzie metryka cpu przekracza 75 (tj. 75% utylizacji)
2. Dwa warianty wyniku:

<br> <br>
* variant I:
```
{
  'server_1': {
    'service_a': {'cpu': 55, 'memory': 1200, 'requests': 3200},
    'service_b': {'cpu': 70, 'memory': 1800, 'requests': 4500}
  },
  'server_2': {
    'service_a': {'cpu': 65, 'memory': 1400, 'requests': 3800}
  }
}
```
* variant II:
```
{
  'server_1-service_a': {'cpu': 55, 'memory': 1200, 'requests': 3200},
  'server_1-service_b': {'cpu': 70, 'memory': 1800, 'requests': 4500},
  'server_2-service_a': {'cpu': 65, 'memory': 1400, 'requests': 3800}
}
```
<br> <br>



In [None]:
logs = {
    "server_1": {
        "service_a": {"cpu": 55, "memory": 1200, "requests": 3200},
        "service_b": {"cpu": 70, "memory": 1800, "requests": 4500}
    },
    "server_2": {
        "service_a": {"cpu": 65, "memory": 1400, "requests": 3800},
        "service_c": {"cpu": 80, "memory": 2200, "requests": 5100}
    }
}

In [None]:
# Your turn 👇
# Placeholder for solution - variant I

filtered_logs_copy = {server : services for server, services in logs.items()}
# that will just copy the items -> what we want to do is to make additional changes in nested'services' dictionary,

<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here

filtered_logs_copy = {server : {
    service : metrics for service, metrics in services.items()
    if metrics["cpu"] <= 75

} for server, services in logs.items()}
filtered_logs_copy

In [None]:
# Your turn 👇
# Placeholder for solution - variant II

<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here

flat_filtered_logs = {
    f"{server}-{service}": metrics
    for server, services in logs.items()
    for service, metrics in services.items()
    if metrics['cpu'] <= 75
}

<br> <br>

# Generator expressions  / Generators - Wyrażenia generatorowe / Generatory

**A generator is a function that returns an iterator — it produces values lazily, one at a time, using the `yield` keyword instead of return.**

**Why care?**

**- Saves memory: values are produced on demand (no big lists in RAM).**

**- Can model streams (files, sockets, infinite sequences).**

**- Composable: chain multiple simple steps into a data pipeline.**


<br> <br>

**Generator expressions are a concise Python syntax for creating generators in a single line of code, similar to list comprehensions but without building the entire list in memory.** 

**Instead, they return a generator object that produces elements lazily – only when they are needed.**

**This makes them more memory-efficient and ideal for working with large datasets or data streams.**

--------------------------------------------------------

Generator to funkcja która zwraca iterator - czyli produkuje wartości leniwie ( na żądanie) używając słowa kluczowego `yield`  zamiast return

Dlaczego warto używać generatorów?
- Oszczędność pamięci: wartości są generowane na żądanie ( w locie)  (brak dużych list w RAM-ie).
- Obsługa strumieni: można modelować dane z plików, sieci, czy nieskończonych sekwencji.
- Możliwość łączenia: łatwo łączyć wiele prostych kroków w jeden 'pipeline'.

<br> <br>

Wyrażenia generowane (generator expressions) to zwięzła składnia w Pythonie pozwalająca tworzyć generatory w jednej linijce kodu, podobnie jak list comprehensions, ale bez tworzenia całej listy w pamięci. 

Zamiast tego zwracają obiekt generatora, który wytwarza elementy leniwie – dopiero wtedy, gdy są potrzebne.

Dzięki temu są bardziej pamięciooszczędne i nadają się do pracy z dużymi zbiorami danych lub strumieniami.

Docs:
1. https://docs.python.org/3/reference/expressions.html#grammar-token-python-grammar-generator_expression
2. https://realpython.com/introduction-to-python-generators/#creating-data-pipelines-with-generators


<br> <br>

**Generator function:**

**`yield` pauses the function and sends a value to the caller. On the next iteration, execution resumes right after the yield.**

-------------

Funkcja generatora:

`yield` zatrzymuje funkcję i wysyła wrtość. Podczas następnej iteracji, procesowanie rozpoczyna się zaraz po `yield`


In [None]:
### GENERATOR ###
def countdown_generator(n: int):
    print("Start!")
    while n > 0:
        print("About to yield", n)
        yield n
        n -= 1
    print("Done.")

gen = countdown_generator(10)  # doesn't compute anything yet

print(gen)


<br> <br>

**next() - retrieve next  item from a generator**

-------------

next() - pobiera następną wartość z generatora

In [None]:
next(gen) # consumes one value at a time / pobiera jedna wartość i zatrzymuje się

In [None]:
list(gen) # continue consuming remaining values / pobiera resztę wartości

<br> <br>

**A simple example of a generator created with generator expression:**

--------------------

Prosty przykład generatora stworzonego przy uzyciu wyrażenia generatorowego:

In [None]:
generator_ = (x**2 for x in range(10))

In [None]:
print(type(generator_))
generator_

In [None]:
squares_list = [x**2 for x in range(10)]
type(squares_list)

**Let's check if the result is as expected:**

Sprawdźmy, czy wynik jest zgodny z oczekiwanym:

In [None]:
list(generator_)

<br> <br>

### list comprehension vs generator expression

`squares_list` takes up memory for 1 million items.

`squares_gen` uses almost no memory until you iterate over it.
____________

List comprehension

`squares_list = [x**2 for x in range(1000000)]`

Generator expression

`squares_gen = (x**2 for x in range(1000000))`


<br><br>

**Generators can be used to create call chains that resemble data flows. This way, instead of triggering calculations for subsequent variables, we create a "recipe" for obtaining them. For example: (lazy, memory-efficient pipelines)**

Korzystanie z generatorów można łączyć w ciągi wywołań, które przypominają przepływy danych. W ten sposób nie wywołujemy obliczeń kolejnych zmiennych, a tworzymy "przepis" na ich otrzymanie. Przykładowo:

In [None]:
squares = (x**2 for x in range(10))

In [None]:
divided_by_3 = (x for x in squares if x % 3 == 0)

**At this point, the calculations are performed:**

W tym momencie wykonywane są obliczenia:

In [None]:
next(divided_by_3)

In [None]:
list(divided_by_3)

<br> <br>

**Real-life use case**

**Imagine you're working in a factory that collects temperature, humidity, and vibration data from hundreds of sensors. Instead of processing all the data at once, you can build a lazy pipeline using generator expressions and functions that resemble a recipe for how data should be processed.**

------------------------

Przykładowe zastosowanie 

Wyobraź sobie że pracujesz w fabryce która zbieram odczyty temperatury, wilgotności i wibracji z setek czujników. Zamiast procesować wszystkie dane na raz, możesz zbudować 'leniwy' pipeline używając wyrażeń generatorowych, który jest przepisem na to jak dane mają być procesowane.

```python

# lazily generates raw sensor readings.
def read_sensor_data(n):
    return ((choice(SENSORS), randint(-30, 30)) for _ in range(n))

# filters out values outside the desired range.
def filter_extreme_values(data):
    return ((sensor, value) for sensor, value in data if -20 <= value <= 20)

# scales the values
def normalize(data):
    return ((sensor, value / 20) for sensor, value in data)

# adds a status label based on the normalized value
def tag(data):
    return ((sensor, value, "OK" if abs(value) < 0.5 else "CHECK") for sensor, value in data)

## all together

tagged = tag(normalize(filter_extreme_values(read_sensor_data(1000))))  # data is only processed when you iterate over tagged.

for record in tagged:
    print(record)

    
tagged_list = list(tag(normalize(filter_extreme_values(read_sensor_data(1000))))) # materialize the results - wrapped in list



## You can test it

In [None]:
from random import choice, randint

SENSORS = ["temp", "pressure", "humidity"]
# lazily generates raw sensor readings.
def read_sensor_data(n):
    return ((choice(SENSORS), randint(-30, 30)) for _ in range(n))

# filters out values outside the desired range.
def filter_extreme_values(data):
    return ((sensor, value) for sensor, value in data if -20 <= value <= 20)

# scales the values
def normalize(data):
    return ((sensor, value / 20) for sensor, value in data)

# adds a status label based on the normalized value
def tag(data):
    return ((sensor, value, "OK" if abs(value) < 0.5 else "CHECK") for sensor, value in data)

## all together

tagged = tag(normalize(filter_extreme_values(read_sensor_data(1000))))  # data is only processed when you iterate over tagged.

for record in tagged:
    print(record)

    
tagged_list = list(tag(normalize(filter_extreme_values(read_sensor_data(100))))) # materialize the results - wrapped in list

<br> <br>

**Exemplary use cases:**

- Processing Large Files: Reading a massive log file line by line without loading the entire file into memory.
- Streaming Data Analysis : Calculating statistics (like average, min, max) from a live data stream (e.g., sensor data, financial tickers).
- Filtering Data : Filtering out invalid entries from a large list without creating a new list in memory.
- Mathematical Computations: Generating squares of numbers for mathematical modeling or simulations without storing all results.
- Log Monitoring : Monitoring logs for specific keywords ( ERROR) in real-time.
- Memory-Efficient Machine Learning Preprocessing : Preprocessing large datasets for ML models without creating temporary arrays.

------------

Przykładowe użycie:

- Przetwarzanie dużych plików: Odczytywanie ogromnego pliku logów linia po linii bez ładowania całego pliku do pamięci.
- Analiza strumieni danych: Obliczanie statystyk (np. średnia, minimum, maksimum) ze strumienia danych na żywo (np. dane z czujników, notowania finansowe).
- Filtrowanie danych: Usuwanie nieprawidłowych wpisów z dużej listy bez tworzenia nowej listy w pamięci.
- Obliczenia matematyczne: Generowanie kwadratów liczb na potrzeby modelowania matematycznego lub symulacji bez zapisywania wszystkich wyników.
- Monitorowanie logów: Śledzenie logów w czasie rzeczywistym pod kątem określonych słów kluczowych (np. ERROR).
- Efektywne pamięciowo przetwarzanie danych dla uczenia maszynowego: Przetwarzanie dużych zbiorów danych dla modeli ML bez tworzenia tymczasowych tablic.

<br><br>


## Exercise

**Use a generator expression to lazily read lines from a list (simulate a log file) and filter only those containing "ERROR".**

-------------------

Użyj wyrażenia generatorowego do leniwego czytania linii z listy (symulacja pliku logów) i przefiltruj tylko te, które zawierają "ERROR".:


In [None]:
logs = [
    "2025-08-26 INFO User logged in",
    "2025-08-26 ERROR Connection lost",
    "2025-08-26 INFO Data saved",
    "2025-08-26 ERROR Timeout",
]

# Your turn 👇
# Place for solution

# errors = (.....)



<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here

errors = (line for line in logs if "ERROR" in line)
list(errors)


<br> <br>

## Exercise

**We have a list which simulates CSV file:**

**Convert the function so it returns a generator expression that yields float(price) for each non-header row.**

------------------------------

Mamy listę która symuluje plik CSV

Przerób funkcję tak, aby zwracała wyrażenie generatorowe float(price) dla każdej linii poza nagłówkiem.



In [None]:
# Dataset (CSV-like rows)
csv_rows = [
    "1,TV,2000",
    "2,Laptop,3500",
    "3,Phone,1500",
]

# def iter_prices(lines):
#     for row in lines:
#         _, _, price = row.strip().split(",")
#         yield float(price)

# Your turn 👇
# Place for solution - modify function and test whether it works



<details>
<summary>Click to reveal the solution</summary>

```python
# Your solution code here

def iter_prices(lines):
    return (float(row.strip().split(",")[2]) for row in lines)

prices = iter_prices(csv_rows)
list(prices)