<a href="https://colab.research.google.com/github/CodeHunterOfficial/ABC_DataMining/blob/main/Python/Lecture_3/%D0%A0%D0%B0%D0%B1%D0%BE%D1%82%D0%B0_%D1%81_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D1%8F%D0%BC%D0%B8_%D0%B2_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Работа с коллекциями в Python — `enumerate`, `filter`, `map`, `zip`, `reduce`

Python предоставляет множество встроенных функций и инструментов для работы с коллекциями данных, такими как списки, кортежи, словари и другие итерируемые объекты. В этой лекции мы подробно рассмотрим пять важных функций: `enumerate`, `filter`, `map`, `zip` и `reduce`. Эти функции позволяют эффективно обрабатывать данные, упрощают написание кода и делают его более читаемым.



## 1. **`enumerate`**

### Что это?
Функция `enumerate` добавляет счётчик к элементам итерируемого объекта, возвращая пары `(индекс, элемент)`. Это особенно полезно, когда нужно работать с элементами коллекции и их индексами одновременно.

### Синтаксис:
```python
enumerate(iterable, start=0)
```
- `iterable`: любой итерируемый объект (например, список, кортеж или строка).
- `start`: начальное значение счётчика (по умолчанию `0`).

### Пример:
```python
fruits = ["apple", "banana", "cherry"]
for index, fruit in enumerate(fruits):
    print(f"Индекс: {index}, Фрукт: {fruit}")
```

#### Вывод:
```
Индекс: 0, Фрукт: apple
Индекс: 1, Фрукт: banana
Индекс: 2, Фрукт: cherry
```

### Особенности:
- Если нужно начать счёт с другого значения, можно указать параметр `start`:
```python
for index, fruit in enumerate(fruits, start=1):
    print(f"Номер: {index}, Фрукт: {fruit}")
```

#### Вывод:
```
Номер: 1, Фрукт: apple
Номер: 2, Фрукт: banana
Номер: 3, Фрукт: cherry
```

### Практическое применение:
- Перебор элементов с индексами.
- Создание словарей из списков:
```python
fruits = ["apple", "banana", "cherry"]
fruit_dict = {index: fruit for index, fruit in enumerate(fruits)}
print(fruit_dict)  # {0: 'apple', 1: 'banana', 2: 'cherry'}
```



## 2. **`filter`**

### Что это?
Функция `filter` используется для фильтрации элементов итерируемого объекта. Она принимает функцию и итерируемый объект, а возвращает только те элементы, для которых функция вернула `True`.

### Синтаксис:
```python
filter(function, iterable)
```
- `function`: функция, которая принимает один аргумент и возвращает `True` или `False`.
- `iterable`: итерируемый объект (например, список).

### Пример:
Оставим только чётные числа:
```python
numbers = [1, 2, 3, 4, 5, 6]
even_numbers = filter(lambda x: x % 2 == 0, numbers)
print(list(even_numbers))  # [2, 4, 6]
```

### Особенности:
- Если функция не указана, то `filter` вернёт только элементы, которые являются "истинными" (например, не `None`, не `0`, не пустые строки и т.д.):
```python
values = [0, 1, "", "hello", None, False, True]
filtered_values = filter(None, values)
print(list(filtered_values))  # [1, 'hello', True]
```

### Практическое применение:
- Фильтрация данных по условию.
- Удаление пустых значений из списка:
```python
data = ["apple", "", "banana", None, "cherry"]
clean_data = list(filter(None, data))
print(clean_data)  # ['apple', 'banana', 'cherry']
```


## 3. **`map`**

### Что это?
Функция `map` применяет заданную функцию к каждому элементу итерируемого объекта и возвращает итератор с результатами.

### Синтаксис:
```python
map(function, iterable)
```
- `function`: функция, которая принимает один аргумент.
- `iterable`: итерируемый объект (например, список).

### Пример:
Преобразуем список чисел в их квадраты:
```python
numbers = [1, 2, 3, 4]
squares = map(lambda x: x**2, numbers)
print(list(squares))  # [1, 4, 9, 16]
```

### Работа с несколькими итерируемыми объектами:
```python
list1 = [1, 2, 3]
list2 = [4, 5, 6]

# Сумма соответствующих элементов двух списков
result = map(lambda x, y: x + y, list1, list2)
print(list(result))  # [5, 7, 9]
```

### Особенности:
- `map` возвращает итератор, который можно преобразовать в список, кортеж и т.д.
- Можно использовать как с анонимными функциями (`lambda`), так и с обычными функциями.

### Практическое применение:
- Преобразование данных (например, перевод всех строк в верхний регистр):
```python
words = ["hello", "world"]
upper_words = map(str.upper, words)
print(list(upper_words))  # ['HELLO', 'WORLD']
```


## 4. **`zip`**

### Что это?
Функция `zip` объединяет несколько итерируемых объектов в один объект типа `zip`. Каждый элемент результирующего объекта — это кортеж, содержащий элементы из входных итераций.

### Синтаксис:
```python
zip(*iterables)
```
- `*iterables`: любое количество итерируемых объектов.

### Пример:
```python
names = ["Alice", "Bob", "Charlie"]
ages = [25, 30, 35]

zipped = zip(names, ages)
print(list(zipped))  # [('Alice', 25), ('Bob', 30), ('Charlie', 35)]
```

### Особенности:
- Если длины итерируемых объектов разные, то `zip` остановится на самом коротком:
```python
names = ["Alice", "Bob", "Charlie"]
scores = [85, 90]

zipped = zip(names, scores)
print(list(zipped))  # [('Alice', 85), ('Bob', 90)]
```

### Распаковка с помощью `*`:
Можно также "распаковать" данные из `zip` обратно в отдельные списки:
```python
zipped = [('Alice', 25), ('Bob', 30), ('Charlie', 35)]
unzipped_names, unzipped_ages = zip(*zipped)
print(unzipped_names)  # ('Alice', 'Bob', 'Charlie')
print(unzipped_ages)   # (25, 30, 35)
```

### Практическое применение:
- Объединение данных из нескольких источников.
- Создание словарей из двух списков:
```python
keys = ["name", "age", "city"]
values = ["Alice", 25, "New York"]
person = dict(zip(keys, values))
print(person)  # {'name': 'Alice', 'age': 25, 'city': 'New York'}
```



## 5. **`reduce`**

### Что это?
Функция `reduce` (из модуля `functools`) последовательно применяет указанную функцию к элементам итерируемого объекта, сводя их к одному значению.

### Синтаксис:
```python
from functools import reduce

reduce(function, iterable[, initializer])
```
- `function`: функция, которая принимает два аргумента.
- `iterable`: итерируемый объект.
- `initializer`: начальное значение (опционально).

### Пример:
Вычислим произведение всех чисел в списке:
```python
from functools import reduce

numbers = [1, 2, 3, 4]
product = reduce(lambda x, y: x * y, numbers)
print(product)  # 24
```

### Особенности:
- Если указан `initializer`, он будет использоваться как первый аргумент при первом вызове функции:
```python
numbers = [1, 2, 3, 4]
product = reduce(lambda x, y: x * y, numbers, 10)
print(product)  # 240
```

### Практическое применение:
- Агрегация данных (например, вычисление суммы или произведения).
- Поиск максимального или минимального значения:
```python
numbers = [10, 20, 5, 40]
max_value = reduce(lambda x, y: x if x > y else y, numbers)
print(max_value)  # 40
```



#Работа с коллекциями в Python — `iterable`, `yield` и генераторы

В дополнение к предыдущей лекции, где мы рассмотрели функции `enumerate`, `filter`, `map`, `zip` и `reduce`, давайте углубимся в концепцию **итерируемых объектов** (`iterables`) и **генераторов**, а также познакомимся с ключевым словом `yield`. Эти темы являются фундаментальными для понимания работы с коллекциями и эффективного управления памятью в Python.


## 1. **Итерируемые объекты (`iterable`)**

### Что это?
Итерируемый объект (`iterable`) — это любой объект, который можно перебирать (например, в цикле `for`). Примерами итерируемых объектов являются:
- Списки (`list`)
- Кортежи (`tuple`)
- Строки (`str`)
- Словари (`dict`)
- Множества (`set`)
- Файлы
- Генераторы

### Как это работает?
Чтобы быть итерируемым, объект должен реализовать метод `__iter__()`, который возвращает **итератор**. Итератор — это объект, который реализует метод `__next__()`, возвращающий следующий элемент. Когда элементы заканчиваются, вызывается исключение `StopIteration`.

### Пример:
```python
my_list = [1, 2, 3]
iterator = iter(my_list)  # Создаем итератор из списка
print(next(iterator))  # 1
print(next(iterator))  # 2
print(next(iterator))  # 3
# print(next(iterator))  # StopIteration
```

### Особенности:
- Итераторы "исчерпываются". После того как все элементы были перебраны, они не могут быть использованы повторно.
- Итерируемые объекты (например, списки) не исчерпываются, так как каждый раз создаётся новый итератор.

### Практическое применение:
- Перебор элементов в цикле `for`:
```python
for item in [1, 2, 3]:
    print(item)
```
- Встроенные функции, такие как `sum`, `min`, `max`, работают с итерируемыми объектами:
```python
numbers = [1, 2, 3, 4]
print(sum(numbers))  # 10
```



## 2. **Генераторы**

### Что это?
Генераторы — это особый тип итераторов, которые позволяют создавать последовательности данных "на лету", без необходимости хранить их полностью в памяти. Это особенно полезно при работе с большими данными.

### Как создать генератор?
Генераторы создаются с помощью:
1. **Генераторных выражений** (похожи на генераторы списков).
2. **Функций с ключевым словом `yield`**.

#### 1. Генераторные выражения
Генераторное выражение выглядит как генератор списка, но вместо квадратных скобок используются круглые:
```python
squares = (x**2 for x in range(5))
print(squares)  # <generator object <genexpr> at ...>
print(next(squares))  # 0
print(next(squares))  # 1
```

#### 2. Функции с `yield`
Ключевое слово `yield` используется в функциях для создания генераторов. Когда функция встречает `yield`, она приостанавливается и возвращает значение. При следующем вызове функция продолжает выполнение с того места, где остановилась.

### Пример:
```python
def generate_numbers():
    yield 1
    yield 2
    yield 3

gen = generate_numbers()
print(next(gen))  # 1
print(next(gen))  # 2
print(next(gen))  # 3
# print(next(gen))  # StopIteration
```

### Особенности:
- Генераторы "ленивы" — они вычисляют значения только тогда, когда это необходимо.
- Они занимают меньше памяти по сравнению со списками, так как не хранят все элементы одновременно.

### Практическое применение:
- Генерация бесконечных последовательностей:
```python
def infinite_sequence():
    num = 0
    while True:
        yield num
        num += 1

gen = infinite_sequence()
print(next(gen))  # 0
print(next(gen))  # 1
```

- Обработка больших файлов построчно:
```python
def read_large_file(file_path):
    with open(file_path, 'r') as file:
        for line in file:
            yield line.strip()

for line in read_large_file("large_file.txt"):
    print(line)
```



## 3. **Ключевое слово `yield`**

### Что это?
Ключевое слово `yield` используется в функциях для создания генераторов. Оно позволяет функции приостанавливаться и возобновляться, сохраняя своё состояние между вызовами.

### Пример:
```python
def fibonacci(n):
    a, b = 0, 1
    while n > 0:
        yield a
        a, b = b, a + b
        n -= 1

fib_gen = fibonacci(5)
for num in fib_gen:
    print(num)
```

#### Вывод:
```
0
1
1
2
3
```

### Особенности:
- Функция с `yield` возвращает генератор, который можно перебирать.
- Каждый вызов `yield` приостанавливает выполнение функции и возвращает значение. При следующем вызове выполнение продолжается с места остановки.

### Практическое применение:
- Генерация сложных последовательностей:
```python
def powers_of_two():
    power = 1
    while True:
        yield power
        power *= 2

gen = powers_of_two()
for _ in range(5):
    print(next(gen))
```

#### Вывод:
```
1
2
4
8
16
```



Давайте рассмотрим несколько **конкретных примеров** использования ключевого слова `yield`. Эти примеры помогут вам лучше понять, как работает `yield` и в каких ситуациях его можно применять.



## 1. **Генерация чисел Фибоначчи**
Функция генерирует последовательность чисел Фибоначчи до заданного количества элементов.

### Пример:
```python
def fibonacci(n):
    a, b = 0, 1
    for _ in range(n):
        yield a
        a, b = b, a + b

# Использование
for num in fibonacci(10):
    print(num, end=" ")
```

#### Вывод:
```
0 1 1 2 3 5 8 13 21 34
```

### Объяснение:
- Функция начинает с двух значений: `a = 0`, `b = 1`.
- На каждом шаге она "выдаёт" текущее значение `a` с помощью `yield`.
- Затем обновляет значения `a` и `b` для следующей итерации.



## 2. **Генерация бесконечной последовательности**
Создадим генератор, который выдает числа, начиная с 1, до бесконечности.

### Пример:
```python
def infinite_numbers():
    num = 1
    while True:
        yield num
        num += 1

# Использование
gen = infinite_numbers()
for _ in range(5):
    print(next(gen), end=" ")
```

#### Вывод:
```
1 2 3 4 5
```

### Объяснение:
- Генератор никогда не завершается, так как цикл `while True` бесконечен.
- Каждый вызов `next(gen)` возвращает следующее число.



## 3. **Чтение больших файлов построчно**
Если файл слишком большой для загрузки в память целиком, можно использовать генератор для чтения файла построчно.

### Пример:
```python
def read_large_file(file_path):
    with open(file_path, 'r') as file:
        for line in file:
            yield line.strip()  # Убираем символы переноса строки

# Использование
file_path = "example.txt"
for line in read_large_file(file_path):
    print(line)
```

#### Объяснение:
- Файл открывается внутри функции, и каждая строка читается по очереди.
- `yield` возвращает очищенную строку (без лишних символов).



## 4. **Генерация простых чисел**
Создадим генератор, который выдает простые числа до заданного предела.

### Пример:
```python
def is_prime(num):
    if num < 2:
        return False
    for i in range(2, int(num**0.5) + 1):
        if num % i == 0:
            return False
    return True

def generate_primes(limit):
    for num in range(2, limit + 1):
        if is_prime(num):
            yield num

# Использование
for prime in generate_primes(20):
    print(prime, end=" ")
```

#### Вывод:
```
2 3 5 7 11 13 17 19
```

### Объяснение:
- Функция `is_prime` проверяет, является ли число простым.
- Генератор `generate_primes` проходит через все числа от 2 до `limit` и выдает только простые.



## 5. **Генерация случайных чисел**
Создадим генератор, который выдает случайные числа из заданного диапазона.

### Пример:
```python
import random

def generate_random_numbers(start, end, count):
    for _ in range(count):
        yield random.randint(start, end)

# Использование
for num in generate_random_numbers(1, 100, 5):
    print(num, end=" ")
```

#### Вывод (пример):
```
42 17 89 3 56
```

### Объяснение:
- Функция использует модуль `random` для генерации случайных чисел.
- Каждый вызов `yield` возвращает новое случайное число.



## 6. **Разбиение данных на фрагменты (chunking)**
Если нужно разбить большой список на части (например, для обработки данных), можно использовать генератор.

### Пример:
```python
def chunked(iterable, size):
    for i in range(0, len(iterable), size):
        yield iterable[i:i + size]

# Использование
data = [1, 2, 3, 4, 5, 6, 7, 8, 9]
for chunk in chunked(data, 3):
    print(chunk)
```

#### Вывод:
```
[1, 2, 3]
[4, 5, 6]
[7, 8, 9]
```

### Объяснение:
- Генератор разбивает список на подсписки заданного размера (`size`).
- Каждый вызов `yield` возвращает один фрагмент.



## 7. **Имитация состояния (state machine)**
Создадим генератор, который имитирует простой конечный автомат.

### Пример:
```python
def state_machine():
    states = ["IDLE", "RUNNING", "PAUSED", "STOPPED"]
    current_state = 0
    while True:
        yield states[current_state]
        current_state = (current_state + 1) % len(states)

# Использование
machine = state_machine()
for _ in range(10):
    print(next(machine))
```

#### Вывод:
```
IDLE
RUNNING
PAUSED
STOPPED
IDLE
RUNNING
PAUSED
STOPPED
IDLE
RUNNING
```

### Объяснение:
- Генератор циклически перебирает состояния.
- Каждый вызов `yield` возвращает текущее состояние.



## 8. **Генерация степеней числа**
Создадим генератор, который выдает степени числа (например, степени двойки).

### Пример:
```python
def powers_of(base):
    power = 1
    while True:
        yield power
        power *= base

# Использование
gen = powers_of(2)
for _ in range(10):
    print(next(gen), end=" ")
```

#### Вывод:
```
1 2 4 8 16 32 64 128 256 512
```

### Объяснение:
- Генератор начинает с `power = 1`.
- На каждом шаге он умножает текущую степень на основание (`base`).



## Заключение

Мы рассмотрели несколько конкретных примеров использования ключевого слова `yield`. Вот краткий обзор их применения:

| Пример                         | Описание                                                                 |
|--------------------------------|--------------------------------------------------------------------------|
| Числа Фибоначчи                | Генерация последовательности чисел Фибоначчи                              |
| Бесконечная последовательность | Генерация чисел от 1 до бесконечности                                      |
| Чтение больших файлов          | Построчное чтение файла без загрузки его целиком в память                 |
| Простые числа                  | Генерация простых чисел до заданного предела                              |
| Случайные числа                | Генерация случайных чисел из заданного диапазона                          |
| Разбиение на фрагменты         | Разделение списка на части (chunks)                                       |
| Конечный автомат               | Имитация состояний (state machine)                                        |
| Степени числа                  | Генерация степеней числа                                                  |

Эти примеры демонстрируют, что `yield` — это мощный инструмент для создания эффективных и ленивых (lazy) генераторов, которые могут значительно упростить работу с большими данными или сложными последовательностями.
