# **Генераторные выражения в Python: полное руководство с примерами**

In [1]:
# Генераторные выражения (generator expressions) — это мощный инструмент Python для создания 
# итераторов с минимальным потреблением памяти. Они похожи на генераторы 
# списков, но работают "лениво", вычисляя элементы по требованию, что делает их 
# идеальными для обработки больших объемов данных.

In [2]:
## **1. Основные концепции**

### **1.1 Что такое генераторное выражение?**
# Генераторное выражение — это компактный синтаксис для создания генераторов (итераторов)
# без явного написания функции с `yield`.

# **Базовый синтаксис:**
# ```python
# (expression for item in iterable)
# ```

### **1.2 Отличие от генераторов списков**
# | Характеристика       | Генератор списка          | Генераторное выражение    |
# |----------------------|---------------------------|---------------------------|
# | Синтаксис            | `[x for x in range(10)]`  | `(x for x in range(10))`  |
# | Возвращаемый тип     | Список                    | Итератор (генератор)      |
# | Память               | Хранит все элементы       | Генерирует "на лету"      |
# | Оценка               | Сразу (энергичная)        | По требованию (ленивая)   |

In [3]:
## **2. Базовые примеры**

### **2.1 Простое генераторное выражение**
# ```python
numbers = (x for x in range(5))
print(next(numbers))  # 0
print(next(numbers))  # 1
# ```

### **2.2 С условием фильтрации**
# ```python
even_numbers = (x for x in range(10) if x % 2 == 0)
print(list(even_numbers))  # [0, 2, 4, 6, 8]
# ```

### **2.3 С преобразованием элементов**
# ```python
squares = (x**2 for x in range(5))
print(sum(squares))  # 30 (0 + 1 + 4 + 9 + 16)
# ```

0
1
[0, 2, 4, 6, 8]
30


In [4]:
## **3. Продвинутые техники**

### **3.1 Вложенные генераторные выражения**
# ```python
matrix = [[1, 2], [3, 4], [5, 6]]
flat = (num for row in matrix for num in row)
print(list(flat))  # [1, 2, 3, 4, 5, 6]
# ```

### **3.2 Комбинация с функциями**
# ```python
import math
roots = (math.sqrt(x) for x in (1, 4, 9, 16))
print(list(roots))  # [1.0, 2.0, 3.0, 4.0]
# ```

### **3.3 Пайплайны обработки данных**
# ```python
data = (1, 2, 3, 4, 5)
pipeline = (
    x**2 
    for x in data 
    if x % 2 == 0
)
print(list(pipeline))  # [4, 16]
# ```

[1, 2, 3, 4, 5, 6]
[1.0, 2.0, 3.0, 4.0]
[4, 16]


In [6]:
## **4. Практическое применение**

### **4.1 Чтение больших файлов**
# ```python
def read_large_file(file_path):
    with open(file_path) as f:
        return (line.strip() for line in f)

# Обработка без загрузки всего файла в память
for line in read_large_file("huge.log"):
    process(line)
# ```

### **4.2 Фильтрация данных в реальном времени**
# ```python
sensor_data = (get_sensor_value() for _ in iter(int, 1))
high_values = (x for x in sensor_data if x > 0.8)

for value in high_values:  # Бесконечный поток
    alert(value)
# ```

### **4.3 Экономия памяти при агрегации**
# ```python
# Плохо: загружает все в память
sum([x**2 for x in range(10**6)])

# Хорошо: вычисляет "на лету"
sum(x**2 for x in range(10**6))
# ```

FileNotFoundError: [Errno 2] No such file or directory: 'huge.log'

In [7]:
## **5. Оптимизация производительности**

### **5.1 Сравнение с альтернативами**
# ```python
import sys
from timeit import timeit

# Генератор списка
lst = [x**2 for x in range(1000000)]
print(sys.getsizeof(lst))  # ~8.5 MB

# Генераторное выражение
gen = (x**2 for x in range(1000000))
print(sys.getsizeof(gen))  # ~120 bytes
# ```

### **5.2 Оптимальные сценарии использования**
# - **Большие/бесконечные последовательности**
# - **Цепочки преобразований данных**
# - **Когда нужен только один проход по данным**

8448728
200


In [8]:
## **6. Ограничения и подводные камни**

# 1. **Одноразовость**:
#    ```python
#    gen = (x for x in range(3))
#    list(gen)  # [0, 1, 2]
#    list(gen)  # [] (генератор исчерпан)
#    ```

# 2. **Нет индексации**:
#    ```python
#    gen = (x for x in range(10))
#    gen[5]  # TypeError: 'generator' object is not subscriptable
#    ```

# 3. **Сложная отладка** — ошибки возникают только при выполнении

In [9]:
## **7. Комбинация с другими инструментами**

### **7.1 С функциями высшего порядка**
# ```python
from functools import reduce
product = reduce(lambda x, y: x * y, (x for x in range(1, 6)))
print(product)  # 120 (5!)
# ```

### **7.2 В генераторах словарей и множеств**
# ```python
squares_dict = {x: x**2 for x in (i for i in range(5))}
# {0: 0, 1: 1, 2: 4, 3: 9, 4: 16}
# ```

120


In [11]:
## **8. Лучшие практики**

# 1. **Именуйте сложные выражения**:
#    ```python
#    # Вместо:
#    result = sum(x**2 for x in (y for y in data if y > 0))

#    # Лучше:
#    positive_numbers = (y for y in data if y > 0)
#    squares = (x**2 for x in positive_numbers)
#    result = sum(squares)
#    ```

# 2. **Избегайте длинных цепочек** — максимум 3-4 преобразования

# 3. **Используйте круглые скобки** явно для ясности:
#    ```python
#    # Неоднозначно:
#    sum(x**2 for x in range(10))

#    # Явно:
#    sum((x**2 for x in range(10)))
#    ```

In [12]:
## **Заключение**

# Генераторные выражения — это мощный инструмент для:
# - **Экономии памяти** при работе с большими данными
# - **Создания эффективных пайплайнов** обработки
# - **Ленивых вычислений** по требованию

# **Идеальные сценарии:**
# - Обработка потоковых данных
# - Фильтрация и трансформация больших наборов
# - Интеграция с `map()`, `filter()`, `reduce()`

# **Пример из реальной практики (обработка логов):**
# ```python
def parse_logs(file):
    return (parse_line(line) for line in file if is_valid(line))

for entry in parse_logs(open("production.log")):
    analyze(entry)  # Обработка без загрузки всего файла
# ```

# Освоив генераторные выражения, вы сможете писать более эффективный и "питоничный" код, особенно при работе с большими объемами данных!

FileNotFoundError: [Errno 2] No such file or directory: 'production.log'