# 🧠 Урок 29: Продвинутый Python — генераторы, корутины, многопоточность и многопроцессность
**Цель урока:** Понять, как использовать генераторы, корутины, потоки и процессы для эффективной обработки данных и ускорения вычислений. Подходит для новичков.

## 📌 Зачем нужны продвинутые концепции Python?
- **Генераторы** — экономят память при работе с большими данными.
- **Корутины** — позволяют писать асинхронный код.
- **Многопоточность (threading):** Для I/O-операций (загрузка файлов, сетевые запросы).
- **Многопроцессность (multiprocessing):** Для CPU-интенсивных задач (распознавание текста, обработка изображений).
- **Аналогия:** Если программирование — это строительство дома, то генераторы — это как строить по частям, корутины — как общение с бригадой, многопоточность — как распределение задач между рабочими, многопроцессность — как строить несколько домов одновременно .

## 🔄 Генераторы
- **Что это?** Функции, которые возвращают значения по одному, не храня все в памяти.
- **Зачем?** Для работы с большими наборами данных (например, чтение файла по строкам).
- **Как создать?** Используйте `yield` вместо `return`.
- **Пример:**
  ```python
  def my_generator():
      for i in range(10):
          yield i
  
  for value in my_generator():
      print(value)
  ```
- **Аналогия:** Представьте, что вы покупаете мороженое по одному шару, а не всю коробку сразу .

## 🔄 Корутины
- **Что это?** Функции, которые могут получать данные во время выполнения.
- **Где используется?** В асинхронных приложениях, чат-ботах, обработке событий.
- **Как создать?** Используйте `yield` для получения данных.
- **Пример:**
  ```python
  def my_coroutine():
      while True:
          value = yield
          print(f'Получено: {value}')
  
  co = my_coroutine()
  next(co)  # Активация корутины
  co.send('Привет')
  co.send('Пока')
  ```
- **Аналогия:** Корутина — как почтовый ящик, который принимает письма в любой момент .

## 🧱 Многопоточность (threading)
- **Что это?** Выполнение нескольких задач одновременно в одном процессе.
- **Зачем?** Для I/O-интенсивных операций (загрузка файлов, веб-запросы).
- **Ограничения:** Не ускоряет CPU-интенсивные задачи из-за GIL (Global Interpreter Lock).
- **Пример:**
  ```python
  import threading
  def print_numbers():
      for i in range(5):
          print(i)
  
  thread = threading.Thread(target=print_numbers)
  thread.start()
  thread.join()
  ```
- **Аналогия:** Несколько людей работают за одним столом, передавая инструменты друг другу .

## 🧠 Многопроцессность (multiprocessing)
- **Что это?** Выполнение задач в отдельных процессах, с независимой памятью.
- **Зачем?** Для CPU-интенсивных задач (обработка изображений, численные вычисления).
- **Преимущества:** Обходит GIL, использует несколько ядер процессора.
- **Пример:**
  ```python
  import multiprocessing as mp
  def square(x):
      return x * x
  
  with mp.Pool(4) as pool:
      results = pool.map(square, [1, 2, 3, 4])
  print(results)  # [1, 4, 9, 16]
  ```
- **Аналогия:** Каждый процесс — это отдельная кухня, где готовят одно и то же блюдо параллельно .

## 🛠️ Практика: Генераторы и корутины
### Шаг 1: Генератор для чтения файла

In [None]:
def read_file_lines(filename):
    with open(filename, 'r') as f:
        for line in f:
            yield line.strip()

# Пример использования
for line in read_file_lines('example.txt'):
    print(line)

### Шаг 2: Корутина для обработки данных

In [None]:
def filter_words(target):
    while True:
        word = yield
        if target in word:
            print(f'Найдено: {word}')

# Использование корутины
coroutine = filter_words('Python')
next(coroutine)
coroutine.send('Это строка с Python')
coroutine.send('Это не та строка')

## 🧪 Практика: Многопоточность
### Шаг 1: Загрузка данных из сети

In [None]:
import requests
import threading

urls = [
    'https://example.com',
    'https://example.org',
    'https://example.net'
]

def fetch_url(url):
    response = requests.get(url)
    print(f'{url} — {len(response.text)} байт')

# Запуск в потоках
threads = [threading.Thread(target=fetch_url, args=(url,)) for url in urls]
for t in threads:
    t.start()
for t in threads:
    t.join()

## 🧱 Практика: Многопроцессность
### Шаг 1: Параллельная обработка данных

In [None]:
import multiprocessing as mp
import numpy as np

def process_data(data_chunk):
    return np.mean(data_chunk)

# Создание данных
data = np.random.rand(1000000).reshape(10, 100000)

# Распределение данных
with mp.Pool(4) as pool:
    results = pool.map(process_data, data)
print("Средние значения:", results)

## 📊 Сравнение threading и multiprocessing
- **threading:**
  - Подходит для I/O-операций (сетевые запросы, чтение/запись).
  - Ограничен GIL (только один поток выполняется одновременно).
- **multiprocessing:**
  - Подходит для CPU-интенсивных задач.
  - Использует несколько ядер процессора.
  - Требует больше памяти (каждый процесс имеет свою копию данных).
- **Аналогия:**
  - `threading` — как несколько людей, работающих за одним столом.
  - `multiprocessing` — как несколько столов, где каждый человек работает самостоятельно .

## 📝 Домашнее задание
**Задача 1:** Добавьте обработку ошибок в генератор `read_file_lines` (например, если файл не найден).
**Задача 2:** Используйте корутину для фильтрации слов, содержащих определенные буквы (например, 'a' или 'python').
**Задача 3:** Напишите отчет (200–300 слов), где:
- Опишите, как работают генераторы и корутины.
- Объясните, почему `threading` не ускоряет CPU-интенсивные задачи.
- Сравните `threading` и `multiprocessing` на примере своего кода.
- Приведите примеры, где эти методы полезны (например, обработка логов, распознавание текста).

In [None]:
# Ваш код здесь
def read_file_lines(filename):
    try:
        with open(filename, 'r') as f:
            for line in f:
                yield line.strip()
    except FileNotFoundError:
        print("Файл не найден!")

In [None]:
# Пример использования корутины
def filter_words(target):
    while True:
        word = yield
        if target in word:
            print(f'Слово найдено: {word}')

coroutine = filter_words('python')
next(coroutine)
coroutine.send('Это тестовый текст')
coroutine.send('Python — мой любимый язык')

In [None]:
# Сравнение threading и multiprocessing
import time
import threading
import multiprocessing as mp

def count_numbers(limit):
    for _ in range(limit):
        pass

# Сравнение времени
start = time.time()
[count_numbers(1000000) for _ in range(4)]
print(f'Однопоточный: {time.time() - start:.2f} секунд')

start = time.time()
threads = [threading.Thread(target=count_numbers, args=(1000000,)) for _ in range(4)]
for t in threads:
    t.start()
for t in threads:
    t.join()
print(f'threading: {time.time() - start:.2f} секунд')

start = time.time()
processes = [mp.Process(target=count_numbers, args=(1000000,)) for _ in range(4)]
for p in processes:
    p.start()
for p in processes:
    p.join()
print(f'multiprocessing: {time.time() - start:.2f} секунд')

## ✅ Рекомендации по выполнению
- **Задача 1:** Используйте `try-except` для обработки ошибок.
- **Задача 2:** Модифицируйте корутину, чтобы она принимала разные условия фильтрации.
- **Задача 3:** Для сравнения используйте `time` и выводите время выполнения для каждого метода.