# Лекция 3. Работа с файлами. Модули и пакеты.

In [None]:
!python -m venv .venv 

In [4]:
!.venv\Scripts\activate

In [None]:
!.venv\Scripts\deactivate

## Работа с файлами

### Режимы работы с файлом

**r** - чтение; указатель на начале файла; вызывается по умолчанию,

**r+** - одновременные чтение и запись; указатель на начале файла,

**rb** - чтение в бинарном формате; указатель на начале файла,

**rb+** - одновременные чтение и запись в бинарном формате; указатель на начале файла,

**w** - запись; перезаписывает файл, если он есть; создает новый файл, если его нет,

**wb** - запись в бинарном формате; перезаписывает файл, если он есть; создает новый файл, если его нет,

**w+** - одновременные чтение и запись; перезаписывает файл, если он есть; создает новый файл, если его нет,

**a** - добавление; указатель на конце файла, если файл есть; создает новый файл, если его нет,

**ab** - добавление в бинарном формате; указатель на конце файла, если файл есть; создает новый файл, если его нет,

**a+** - одновременные чтение и добавление; указатель на конце файла, если файл есть, создает новый файл, если его нет,

**ab+** - одновременные чтение и добавление в бинарном формате; указатель на конце файла, если файл есть; создает новый файл, если его нет.

### Открытие файлов

Для работы с файлом используется встроенная функция `open()`. Основные аргументы:
1. `file` - путь к файлу (обязательный)
2. `mode` - режим работы (по умолчанию `'r'`)

Также часто используется именованный параметр `encoding`, позволяющий указать кодировку.

Классический способ (требует закрытия):

In [5]:
file = open('file.txt', 'a+', encoding='utf-8')
try:
    content = file.read()
finally:
    file.close()

Современный способ с автоматическим закрытием файла (рекомендуется):

In [6]:
with open('file.txt', 'a+', encoding='utf-8') as file:
    content = file.read()

### Чтение файлов

Чтение всего файла:

In [7]:
with open('requirements.txt', 'r', encoding='utf-8') as file:
    content = file.read()
print(content)

numpy>=1.20.0
pandas==2.3.2



Получение списка всех строк:

In [8]:
with open('requirements.txt', 'r', encoding='utf-8') as file:
    lines = file.readlines()
print(lines)

['numpy>=1.20.0\n', 'pandas==2.3.2\n']


Итерация по строкам:

In [9]:
with open('requirements.txt', 'r') as file:
    for line in file:
        print(line.strip())

numpy>=1.20.0
pandas==2.3.2


Чтение определенного количества символов:

In [10]:
with open('requirements.txt', 'r') as file:
    first = file.read(14)  # Первые 14 символов
    second = file.read(14)  # Следующие 14 символов
first, second

('numpy>=1.20.0\n', 'pandas==2.3.2\n')

### Запись в файлы

Запись всего текста:

In [11]:
with open('file.txt', 'w', encoding='utf-8') as file:
    file.write('Это первая строка\nЭто вторая строка')

Запись нескольких строк:

In [12]:
with open('file.txt', 'w', encoding='utf-8') as file:
    file.writelines(['Строка 1\n', 'Строка 2\n', 'Строка 3\n'])

### Позиционирование в файле

`tell()` - текущая позиция в файле:

In [15]:
with open('file.txt', 'r') as file:
    print(file.tell())
    file.read(10)
    print(file.tell())

0
10


`seek()` - перемещает позицию на указанный символ:

In [16]:
with open('file.txt', 'r') as file:
    print(file.tell())
    file.seek(10)
    print(file.tell())

0
10


## Модули и пакеты

**Модуль** - это файл с расширением `.py`, содержащий python-код (функции, классы, переменные). Модули позволяют организовывать код логически и повторно использовать его. Встроенные модули изначально написаны на С и встроены непосредственно в интерпретатор.

**Пакет** – это каталог, который может включать другие каталоги или модули.

### Создание модулей

Создадим для примера модуль и сохраним его в файл `area.py`:

In [17]:
%%writefile area.py
pi = 3.14159

def rectangle_area(a, b):
    return a * b

def triangle_area(a, h):
    return 0.5 * a * h

def circle_area(r):
    return pi * r ** 2

Writing area.py


### Импорт модулей

Импорт модуля выполняется с помощью команды `import`. При импорте модуля интерпретатор выполняет весь код в нем.

Процесс поиска модуля командой `import`:

1. среди встроенных модулей;
1. в директории с исполняемым скриптом;
1. в директории по умолчанию дистрибутива python;
1. в PYTHONPATH.

Импорт всего модуля:

In [18]:
import area

print(area.pi)
print(area.rectangle_area(10, 5))
print(area.triangle_area(4, 4))
print(area.circle_area(5))

3.14159
50
8.0
78.53975


Импорт с псевдонимом:

In [19]:
import area as a

print(a.circle_area(5))

78.53975


Импорт конкретных элементов:

In [20]:
from area import circle_area

print(circle_area(5))

78.53975


Импорт всех элементов (не рекомендуется):

In [21]:
from area import *

print(pi)
print(rectangle_area(10, 5))
print(triangle_area(4, 4))
print(circle_area(5))

3.14159
50
8.0
78.53975


### Создание пакетов

Создание директории для пакета:

In [22]:
!mkdir samplepackage

Создание модулей для пакета:

In [23]:
%%writefile samplepackage/constants.py

# выносим константы в отдельный файл
pi = 3.14159

Writing samplepackage/constants.py


In [24]:
%%writefile samplepackage/area.py
from samplepackage.constants import pi

def rectangle_area(a, b):
    return a * b

def triangle_area(a, h):
    return 0.5 * a * h

def circle_area(r):
    return pi * r ** 2

Writing samplepackage/area.py


In [25]:
%%writefile samplepackage/perimeter.py
from samplepackage.constants import pi

def rectangle_perimeter(a, b):
    return 2 * (a + b)

def triangle_perimeter(a, b,c):
    return a + b + c

def circle_perimeter(r):
    return pi * 2 * r

Writing samplepackage/perimeter.py


Создание `__init__.py` делает директорию пакетом (можно оставить пустым):

In [26]:
%%writefile samplepackage/__init__.py

# указываем, что будет импортировано командой from samplepackage import *
__all__ = ['constants', 'area', 'perimeter']

Writing samplepackage/__init__.py


### Импорт пакетов

Импорт модуля из пакета:

In [27]:
import samplepackage.area

print(samplepackage.area.circle_area(5))

78.53975


In [28]:
from samplepackage import area

print(area.circle_area(5))

78.53975


### Установка внешнего модуля

`pip (Package Installer for Python)` - стандартный менеджер пакетов Python.

Установка модуля происходит с помощью команды `pip install`:

In [None]:
!pip install numpy

Установка конкретной версии модуля:

In [None]:
!pip install pandas==2.3.2

Обновление модулей:

In [None]:
!pip install --upgrade numpy

Удаление модулей:

In [None]:
!pip uninstall pandas

С помощью файла `requirements.txt` можно сохранять и устанавливать все нужные для вашего проекта модули и пакеты:

In [29]:
%%writefile requirements.txt
numpy>=1.20.0
pandas==2.3.2

Overwriting requirements.txt


Создание файла со списком модулей из установленных модулей окружения:

In [None]:
!pip freeze > requirements.txt

Установка модулей из `requirements.txt`:

In [None]:
!pip install -r requirements.txt

## Встроенные модули в языке Python

### csv

**CSV** (Comma-Separated Values) - текстовый формат для представления табличных данных. Каждая строка - это запись, поля разделены разделителями (обычно запятыми).

In [30]:
import csv

#### Запись данных в csv файл

Создание нового файла и запись всех данных:

In [31]:
# данные для записи (список списков)
data = [
    ["Имя", "Возраст", "Город"],  # Заголовки
    ["Алексей", 30, "Москва"],
    ["Мария", 25, "Санкт-Петербург"],
    ["Иван", 22, "Екатеринбург"]
]

# запись данных в CSV файл
with open('data.csv', mode='w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerows(data) # запись всех строк

Дозапись в файл:

In [32]:
with open('data.csv', mode='a', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(["Ирина", 33, "Сочи"])

#### Чтение данных из csv файла

In [33]:
with open('data.csv', "r", newline="", encoding='utf-8') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)  # получаем список элементов строки

['Имя', 'Возраст', 'Город']
['Алексей', '30', 'Москва']
['Мария', '25', 'Санкт-Петербург']
['Иван', '22', 'Екатеринбург']
['Ирина', '33', 'Сочи']


#### Работа со словарями

Запись в файл:

In [34]:
# данные для записи в виде списка словарей
# ключи словаря - названия колонок
data = [
    {"Имя": "Алексей", "Возраст": 30},
    {"Имя": "Мария", "Возраст": 25},
    {"Имя": "Иван", "Возраст": 22}
]

with open('data2.csv', "w", newline="", encoding='utf-8') as file:
    columns = ["Имя", "Возраст"]
    writer = csv.DictWriter(file, fieldnames=columns)
    writer.writeheader()
    writer.writerows(data)

Чтение из файла:

In [35]:
with open('data2.csv', "r", newline="", encoding='utf-8') as file:
    reader = csv.DictReader(file)
    name, age = reader.fieldnames  # получаем названия колонок
    print(name, age)
    for row in reader:
        # теперь можно обращаться к колонкам по ключу
        print("Имя:", row[name], "Возраст:", row[age])

Имя Возраст
Имя: Алексей Возраст: 30
Имя: Мария Возраст: 25
Имя: Иван Возраст: 22


### json

**JSON** - текстовый формат обмена данными, основанный на синтаксисе JavaScript. Имеет структуру, напоминающую словарь.

Основные структуры:
- Объекты: {"key": "value"}
- Массивы: ["item1", "item2"]
- Значения: строки, числа, boolean, null

json не привязан к типам данных. Типы данных python конвертируются в json следующим образом:
- `dict` - object
- `list`, `tuple` - array
- `str` - string
- `int`, `long`, `float` - number
- `True` - true
- `False` - false
- `None` - null

Пример json файла:
```
{
  "store": {
    "name": "Магазин электроники",
    "location": "Москва",
    "products": [
      {
        "id": 1,
        "name": "Телевизор",
        "price": 30000
      },
      {
        "id": 2,
        "name": "Смартфон",
        "price": 20000
      }
    ]
  }
}
```

In [36]:
import json

#### Запись в json файл

In [37]:
# данные для записи
data = {
  "store": {
    "name": "Магазин электроники",
    "location": "Москва",
    "products": [
      {
        "id": 1,
        "name": "Телевизор",
        "price": 30000
      },
      {
        "id": 2,
        "name": "Смартфон",
        "price": 20000
      }
    ]
  }
}

# запись в файл (сериализация)
with open("data.json", "w", encoding='utf-8') as file:
    json.dump(data, file)

#### Чтение из файла

In [38]:
# чтение файла (десериализация)
with open("data.json", "r") as file:
    data = json.load(file)
print(data)

{'store': {'name': 'Магазин электроники', 'location': 'Москва', 'products': [{'id': 1, 'name': 'Телевизор', 'price': 30000}, {'id': 2, 'name': 'Смартфон', 'price': 20000}]}}


### pickle

**pickle** - модуль для сериализации и десериализации объектов Python.

pickle может сериализовать:
- Все встроенные типы
- Функции и классы (по имени)
- Экземпляры классов
- Сложные структуры данных

In [39]:
import pickle

Сериализация и сохранение в файл:

In [41]:
# создаём класс
class MyClass:
    def __init__(self, data):
        # поле класса
        self.data = data

    def print_data(self):
        print(self.data)

# создаём два экземпляра класса
c1 = MyClass(10)
c2 = MyClass('AAA')

# сериализация в файл
with open('data.pkl', 'wb') as file:
    pickle.dump([c1, c2], file)

Десериализация из файла:

In [42]:
# десериализация из файла
with open('data.pkl', 'rb') as file:
    loaded_data = pickle.load(file)

loaded_data[0].print_data()
loaded_data[1].print_data()
type(loaded_data[0])

10
AAA


__main__.MyClass

### os

Модуль `os` предоставляет интерфейс для взаимодействия с операционной системой. Он позволяет работать с файловой системой, процессами, переменными окружения и другими системными функциями.

In [43]:
import os

Исполнение строки как системной команды и возврат кода её завершения:

In [44]:
os.system("mkdir new_dir")

0

#### Получение информации о системе

Текущая рабочая директория:

In [45]:
os.getcwd()

'd:\\Преподавание\\python\\2025\\lections\\lection-3'

Имя операционной системы:

In [46]:
os.name

'nt'

Разделитель путей:

In [47]:
os.sep

'\\'

#### Навигация по директориям

Смена текущей директории:

In [48]:
os.chdir('samplepackage')
print(os.getcwd())
os.chdir('../')
print(os.getcwd())

d:\Преподавание\python\2025\lections\lection-3\samplepackage
d:\Преподавание\python\2025\lections\lection-3


Список фалов и папок:

In [49]:
os.listdir()  # текущая директория

['.venv',
 'area.py',
 'data.csv',
 'data.json',
 'data.pkl',
 'data2.csv',
 'file.txt',
 'new_dir',
 'requirements.txt',
 'samplepackage',
 '__pycache__',
 'Лекция 3.ipynb']

In [50]:
os.listdir('samplepackage')

['area.py', 'constants.py', 'perimeter.py', '__init__.py', '__pycache__']

Рекурсивный обход (доступен с версии Python 3.5):

In [51]:
for root, dirs, files in os.walk('samplepackage'):
    print(f"Директория: {root}")
    print(f"Поддиректории: {dirs}")
    print(f"Файлы: {files}")

Директория: samplepackage
Поддиректории: ['__pycache__']
Файлы: ['area.py', 'constants.py', 'perimeter.py', '__init__.py']
Директория: samplepackage\__pycache__
Поддиректории: []
Файлы: ['area.cpython-313.pyc', 'constants.cpython-313.pyc', '__init__.cpython-313.pyc']


#### Создание и удаление директорий

Создание одной директории:

In [54]:
# может вызвать исключение, если директория уже существует
os.mkdir('new_folder')

Создание цепочки директорий:

In [55]:
# параметр exist_ok=True не вызывает исключений, если директория уже существует
os.makedirs('path/to/new/folder', exist_ok=True)

Удаление директории:

In [56]:
# вызывает исключение, если папки не существует или в ней находятся файлы
os.rmdir('path/to/new/folder')

Рекурсивное удаление:

In [57]:
import shutil

# удаляет папку, даже если она не пустая
shutil.rmtree('path')

Переименование папки или файла:

In [None]:
os.rename("new_folder", "new_folder2")

#### Информация о файлах

Размер файла (в байтах):

In [59]:
os.path.getsize('area.py')

160

Время модификации (в миллисекнудах с 1 января 1970 года):

In [60]:
os.path.getmtime('area.py')

1757922157.0521333

#### **os.path** - Работа с путями

Объединение путей:

In [61]:
os.path.join('folder', 'subfolder', 'file.txt')

'folder\\subfolder\\file.txt'

Разделение пути на директорию и файл (на самом деле просто отделяет конец пути):

In [62]:
dirname, filename = os.path.split('/path/to/file.txt')
f"Директория: {dirname}, Файл: {filename}"

'Директория: /path/to, Файл: file.txt'

Расширение файла:

In [63]:
name, ext = os.path.splitext('document.pdf')
f"Имя: {name}, Расширение: {ext}"

'Имя: document, Расширение: .pdf'

Абсолютный путь (**не проверяет существует ли путь**, а просто присоединяет путь к рабочей директории к указанному пути!):

In [64]:
os.path.abspath('my/path')

'd:\\Преподавание\\python\\2025\\lections\\lection-3\\my\\path'

Проверка существовния пути:

In [65]:
os.path.exists('area.py')

True

Проверка указывает путь на файл или на директорию (проверяет наличие файла):

In [66]:
os.path.isfile('samplepackage/area.py')

True

In [67]:
os.path.isdir('samplepackage')

True

### **argparse** - аргументы командной строки

`argparse` - это модуль для создания пользовательских интерфейсов командной строки.

Пример использования:

In [68]:
%%writefile argparse_example.py
import argparse

# Создание парсера
parser = argparse.ArgumentParser(description='Описание программы')

# Добавление аргументов
parser.add_argument('filename', help='Имя файла для обработки')
parser.add_argument('--output', '-o', help='Выходной файл')

# Парсинг аргументов
args = parser.parse_args()

# Использование аргументов
print(f"Обрабатываем файл: {args.filename}")
# Проверка, что аргумент указан
if args.output:
    print(f"Сохраняем в: {args.output}")

Writing argparse_example.py


In [69]:
!python argparse_example.py input.txt

Обрабатываем файл: input.txt


In [70]:
!python argparse_example.py input.txt -o output.txt

Обрабатываем файл: input.txt
Сохраняем в: output.txt


Информация об аргументах:

In [71]:
!python argparse_example.py --help

usage: argparse_example.py [-h] [--output OUTPUT] filename

Описание программы

positional arguments:
  filename             Имя файла для обработки

options:
  -h, --help           show this help message and exit
  --output, -o OUTPUT  Выходной файл


#### Типы аргументов

Позиционные аргументы (обязательные) - указываются в порядке добавления.

In [72]:
import argparse
parser = argparse.ArgumentParser(description='Описание программы')

parser.add_argument('input_file', help='Входной файл')
parser.add_argument('output_file', help='Выходной файл')

_StoreAction(option_strings=[], dest='output_file', nargs=None, const=None, default=None, type=None, choices=None, required=True, help='Выходной файл', metavar=None, deprecated=False)

Опциональные аргументы - указываются после флага в любом порядке (`--output` или `-o` в примере).

In [73]:
parser.add_argument('--output', '-o', help='Выходной файл')

_StoreAction(option_strings=['--output', '-o'], dest='output', nargs=None, const=None, default=None, type=None, choices=None, required=False, help='Выходной файл', metavar=None, deprecated=False)

#### Основные параметры `add_argument()`

`action` - действие при встрече аргумента.

In [74]:
parser.add_argument('--verbose', action='store_true')  # Флаг
parser.add_argument('--append', action='append')  # Многократное использование

_AppendAction(option_strings=['--append'], dest='append', nargs=None, const=None, default=None, type=None, choices=None, required=False, help=None, metavar=None, deprecated=False)

`type` - тип данных.

In [75]:
parser.add_argument('--number', type=int)
parser.add_argument('--price', type=float)

_StoreAction(option_strings=['--price'], dest='price', nargs=None, const=None, default=None, type=<class 'float'>, choices=None, required=False, help=None, metavar=None, deprecated=False)

`default` - значение по умолчанию.

In [76]:
parser.add_argument('--port', type=int, default=8080)
parser.add_argument('--host', default='localhost')

_StoreAction(option_strings=['--host'], dest='host', nargs=None, const=None, default='localhost', type=None, choices=None, required=False, help=None, metavar=None, deprecated=False)

`choices` - ограничение значений.

In [77]:
parser.add_argument('--color', choices=['red', 'green', 'blue'])
parser.add_argument('--size', type=int, choices=range(1, 11))

_StoreAction(option_strings=['--size'], dest='size', nargs=None, const=None, default=None, type=<class 'int'>, choices=range(1, 11), required=False, help=None, metavar=None, deprecated=False)

`required` - является ли аргумент обязательным.

In [78]:
parser.add_argument('--key', '-k', required=True)

_StoreAction(option_strings=['--key', '-k'], dest='key', nargs=None, const=None, default=None, type=None, choices=None, required=True, help=None, metavar=None, deprecated=False)

`nargs` - количество значений.

In [79]:
parser.add_argument('--coord', nargs=2)
parser.add_argument('files', nargs='+')  # одно или больше
parser.add_argument('--items', nargs='*')  # ноль или больше

_StoreAction(option_strings=['--items'], dest='items', nargs='*', const=None, default=None, type=None, choices=None, required=False, help=None, metavar=None, deprecated=False)

### **re** - регулярные выражения

Регулярные выражения в Python используются для поиска, обработки и манипуляции строками, соответствующими заданным шаблонам. Шаблоном для регулярных выражений может считаться любая строка - в этом случае будет выполнен обычный поиск по подстроке. Если же мы хотим создать более сложный шаблон, то необходимо использовать спецсимволы.

#### Шаблоны, соответствующие одному символу:

- `.` - Один любой символ, кроме новой строки `\n`.

- `\d` - Любая цифра
- `\D` - Любой символ, кроме цифры

- `\s` - Любой пробельный символ (пробел, табуляция, конец строки и т.п.)
- `\S` - Любой непробельный символ

- `\w` - Любая буква (то, что может быть частью слова), а также цифры и `_`
- `\W` - Любая не-буква, не-цифра и не подчёркивание

- `[..]` - Один из символов в скобках,
а также любой символ из диапазона `a-b`
- `[^..]` - Любой символ, кроме перечисленных

- `[0-5]` - Диапазон символов

- `\b` - Начало или конец слова
- `\B` - Не граница слова

#### Квантификаторы (указание количества повторений):

- `{n}` - Ровно n повторений
- `{m,n}` - От m до n повторений включительно
- `{m,}` - Не менее m повторений
- `{,n}` - 	Не более n повторений
- `?` - Ноль или одно вхождение, синоним {0,1}
- `*` - Ноль или более, синоним {0,}
- `+` - Одно или более, синоним {1,}
- `^` - Начало строки
- `$` - Конец строки

#### Группировка:
- `( )` - захватывающая группировка (capturing groups)
- `(?: )` - незахватывающая группировка (non-capturing groups)
- `|` - или

#### Функции библиотеки `re`

`re.search()` - поиск первого совпадения.

In [80]:
import re

pattern = r"\d+"
string = "I'm 20 years old."

# поиск в строке string первой подстроки, подходящей под шаблон pattern
match = re.search(pattern, string)

if match:
    print(f"Найденный результат: {match.group()}")
    print(f"Позиция: {match.start()}-{match.end()}")

Найденный результат: 20
Позиция: 4-6


`re.match()` - поиск с начала строки.

In [81]:
text = "hello world"
match = re.match(r'hello', text)
if match:
    print('1', match.group())
match = re.match(r'world', text)
if match:
    print('2', match.group())

1 hello


`re.fullmatch()` - проверка соответствия шаблону.

In [82]:
pattern = r"\w+\s\w+"
string = "Big snake"

# Проверка соответствие строки string шаблону pattern
match = re.fullmatch(pattern, string)
print(match.group() if match else 'Not found')


string = "Big snake."

match = re.fullmatch(pattern, string)
print(match.group() if match else 'Not found')

Big snake
Not found


`re.split()` - разделение по шаблону.

In [83]:
pattern = r"[;,.!\s]+"
string = "один, два, три; четыре. пять!    шесть"

# разделение строки string по шаблону pattern
parts = re.split(pattern, string)

parts

['один', 'два', 'три', 'четыре', 'пять', 'шесть']

`re.findall()` - поиск всех совпадений.

In [84]:
pattern = r"\d+"
string = "Список чисел: 123, 456, 789 и 123"

# поиск в строке string всх непересекающихся шаблонов pattern
numbers = re.findall(pattern, string)

numbers

['123', '456', '789', '123']

`re.finditer()` - итератор по совпадениям.

In [85]:
pattern = r"\d+"
string = "Список чисел: 123, 456, 789 и 123"

# итератор по всем непересекающимся шаблонам pattern в строке string
for m in re.finditer(pattern, string):
    print(m.group())

123
456
789
123


`re.sub()` - замена подстроки.

In [86]:
pattern = r"\s+"
string = "Это    текст   с  лишними    пробелами."
repl = " "

# замена в строке string всех непересекающихся шаблонов pattern на repl
res = re.sub(pattern, repl, string)
res

'Это текст с лишними пробелами.'

`re.compile()` - компиляция регулярного выражения (для повторного использования).

In [87]:
pattern = re.compile(r'\d{3}-\d{2}-\d{2}')
text = "Номер: 123-45-67"
match = pattern.search(text)
match.group()

'123-45-67'

### Группировка

Группировка позволяет объединять части регулярного выражения и работать с ними как с единым целым. Группы обозначаются круглыми скобками `( )`.

Захватывающие группы - сохраняют найденный текст (в скобках)

In [88]:
text = "First group, second group"
pattern = r'(\w+) (\w+)'  # две захватывающие группы

matches = re.findall(pattern, text)
matches

[('First', 'group'), ('second', 'group')]

In [89]:
text = """Name: Alan
          Age:    24
          Name: Maksim
          Age:    25"""
pattern = r'Age:\s*(\d+)'

matches = re.findall(pattern, text)
matches

['24', '25']

Незахватывающие группы - не сохраняют найденный текст. Обозначаются `(?: )`

In [91]:
text = "apple orange 123 banana"
pattern = r'(?:\w+|\d+) (\w+)'

matches = re.findall(pattern, text)
matches

['orange', 'banana']

Именованные группы - дают группам имена для удобства доступа. Обозначаются `(?P<name>...)`

In [92]:
text = "Date: 2023-12-25"
pattern = r'(?P<year>\d{4})-(?P<month>\d{2})-(?P<day>\d{2})'

match = re.search(pattern, text)
if match:
    print(match.group('year'))
    print(match.group('month'))
    print(match.group('day'))

2023
12
25
