# Работа с файлами в Python

В прошлом уроке мы обсуждали ввод и вывод, но только ручной, в этой лекции мы подробно рассмотрим ввод и вывод файлов.

## 1. Зачем работать с файлами?
Действительно, зачем? И до этого нормально жили! Но это действительно нужно! И вот почему: 
Посмотрите на программы, которые вы используете. Посмотрели? Внимательно? Сколько из них вообще не работают с файлами? Ноль. Игры берут текстуры или сохраняют информацию из файлов, текстовые редакторы берут текст, графические редакторы берут данные об изображениях. Почти все серьезные программы так или иначе читают/записывают информацию в файлы.
## 2. Как работать с файлами?
Хорошая новость заключается в том, что работа с файлами на базовом уровне совсем не сложна! Она практически ничем не будет отличаться от чтения и вывода данных в консоль.
Алгоритм прост. Давайте разберемся в нем.

Для работы с файлами в Python предусмотрена встроенная функция open(). Эта функция используется для открытия файла и создания объекта file, который затем может быть использован для выполнения различных операций, таких как чтение, запись или изменение файла.
### Открытие файла
Чтобы открыть файл, необходимо воспользоваться функцией open() и указать путь к файлу и режим, в котором вы хотите открыть файл. Путь к файлу может быть как абсолютным (полный путь от корневого каталога), так и относительным (путь относительно текущего рабочего каталога).

Переведено с помощью DeepL.com (бесплатная версия)

In [3]:
file = open('file.txt', 'r')

В приведенном выше примере 'r' - это режим, который означает режим чтения. Другие распространенные режимы включают:

* 'w': Режим записи (перезаписывает файл, если он существует, и создает новый файл, если его нет)
* 'a': Режим добавления (открывает файл для добавления, создает новый файл, если он не существует)
* 'x': Режим создания исключений (создает новый файл, но выдает ошибку, если файл уже существует)
* 'b': Бинарный режим (используется для нетекстовых файлов, таких как изображения, видео и т. д.)

### Чтение из файла
Существует несколько способов чтения данных из файла: read - чтение всего содержимого, readline - чтение одной строки и readlines - чтение всех строк в список.

Переведено с помощью DeepL.com (бесплатная версия)

In [None]:
# Чтение всего файл
contents = file.read()

# Чтение одной строку
line = file.readline()

# Чтение нескольких строк
lines = file.readlines()

### Запись в файл
Для записи в файл необходимо открыть его в режиме записи ('w') или добавления ('a'):

In [9]:
file = open('example.txt', 'w')  # Открытие файла для записи

text= '''
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea — let's do more of those!
'''
file.write(text)  # Запись строки в файл
file.close()

### Закрытие файла
Важно закрыть файл после завершения работы с ним, чтобы освободить системные ресурсы и убедиться, что все буферизованные данные записаны в файл:

In [None]:
file.close()

**Теперь мы также знаем, как записывать с помощью команды print**.

In [6]:
print("Do it", file=open("new_file.txt", "w"))
!cat new_file.txt #cat utility check if there's anything there

Do it


Но давайте считаем его еще раз

In [7]:
f_new = open("new_file.txt", 'r')
f_new.read()

'Do it\n'

И еще

In [8]:
f_new.read()

''

**_Почему там пусто?

Причина в том, что чтение работает следующим образом:

По сути, мы создаем курсор, который перемещается по файлу и читает его элемент за элементом, перемещая этот курсор. Любой вызов `read` читает всю эту часть и остается в конце.

Поэтому, если вы вызовете `read` два раза подряд, то во второй раз вы ничего не прочитаете (курсор не может вернуться назад), что является проблемой.

Давайте узнаем, как переместить курсор так, как нам нужно. Для этого необходимо:

1. `read(n)` - чтение `n` символов из позиции курсора

2. `tell()` - сообщает нам, на каком символе мы сейчас находимся

3. `seek(offset)` - перейти на позицию `offset` относительно начала файла

In [10]:
with open("example.txt", "r") as f:  # with позволяет открыть файл и использовать его только в цикле, после чего файл будет закрыт
    print(f.tell())
    print(f.read(10))  # считывает не весь текст, а только первые 10 символов
    print(f.tell()) # сообщает нам, где в данный момент находится наш курсор
    print(f.seek(5))  # берет начало файла и перемещается на 5 символов
    print(f.tell())
    print(f.read(5))
    print(f.tell())

0

Beautiful
10
5
5
tiful
10


Как нам перемещаться не относительно начала файла, а относительно текущей позиции?

In [None]:
with open("example.txt", "r") as f:
    print(f.read(10))
    print(f.tell())
    print(f.seek(f.tell() - 5))  # вы можете передать tell() напрямую!
    print(f.tell())

В чем еще мы видим проблему? В том, что символы новой строки (и другие символы, такие как табуляция и т. д.) отображаются как отдельные символы.

А если попытаться читать строку за строкой?

In [None]:
with open("example.txt", "r") as f:
    for line in f:  # считывает строку за строкой до новой строки
        print(line.strip())
    print('-' * 30)

Мы также можем печатать и читать из одного и того же места:

**Учимся печатать и читать с одного и того же места**.

In [12]:
fh = open('example.txt', 'r+')  # 'r+' позволяет как писать, так и читать
fh.seek(11)
print(fh.read(5))
print(fh.tell())
fh.seek(11)
fh.write('Zen')
fh.seek(0)
content = fh.read()
print(content)
fh.close()

is be
16

Beautiful Zenbetter than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea — let's do more of those!



## Контекстные менеджеры (оператор with)
Python предоставляет удобный способ открытия и закрытия файлов с помощью оператора with, который автоматически позаботится о закрытии файла, даже если возникнет исключение:

In [None]:
with open('path/to/file.txt', 'r') as file:
    contents = file.read()

## Режимы файлов
Python поддерживает различные режимы работы с файлами, которые управляют открытием и доступом к файлу. Вот некоторые распространенные режимы файлов:

- 'r': Режим чтения (режим по умолчанию)
- 'w': Режим записи (перезаписывает файл, если он существует, создает новый файл, если его нет)
- 'a': Режим добавления (открывает файл для добавления, создает новый файл, если он не существует)
- 'x': Режим создания исключений (создает новый файл, но выдает ошибку, если файл уже существует)
- 'b': Двоичный режим (используется для нетекстовых файлов, таких как изображения, видео и т. д.)
- 't': Текстовый режим (режим по умолчанию, используется для текстовых файлов)
- '+': Режим обновления (позволяет как читать, так и записывать).

Вы можете комбинировать режимы, например 'rb' (бинарный режим чтения) или 'w+b' (бинарный режим записи и чтения).
## Операции с файлами
Python предоставляет несколько встроенных функций и методов для выполнения различных операций с файлами:
### Переименование и перемещение файлов
Чтобы переименовать или переместить файл, вы можете использовать функцию os.rename() из модуля os:

In [None]:
import os

source_path = 'path/to/source.txt'
destination_path = 'path/to/destination.txt'
os.rename(source_path, destination_path)

### Удаление файлов
Чтобы удалить файл, вы можете воспользоваться функцией os.remove() из модуля os:

In [None]:
import os

file_path = 'path/to/file.txt'
os.remove(file_path)

### Получение информации о файлах
Python предоставляет несколько функций для получения информации о файлах, таких как os.path.exists(), os.path.isfile(), os.path.isdir(), os.path.getsize() и os.path.getmtime().

In [None]:
import os

file_path = 'path/to/file.txt'

# Проверяет, существует ли файл.
if os.path.exists(file_path):
    # Проверяет, является ли это обычным файлом.
    if os.path.isfile(file_path):
        # Получает размер файла
        file_size = os.path.getsize(file_path)
        print(f'File size: {file_size} bytes')

        # Получает время последней модификации
        last_modified = os.path.getmtime(file_path)
        print(f'Last modified: {last_modified}')

### Пути и каталоги файлов
Python предоставляет модуль os.path для работы с путями и каталогами файлов. Вы можете использовать такие функции, как os.path.join(), os.path.split(), os.path.dirname() и os.path.basename() для работы с путями файлов.

In [None]:
import os

# Объединяет несколько компонентов пути
path = os.path.join('path', 'to', 'file.txt') # path/to/file.txt

# Разделяет путь на компоненты
head, tail = os.path.split(path) # ('path/to', 'file.txt')

# Получает имя каталога
dirname = os.path.dirname(path) # 'path/to'

# Получает основное имя
basename = os.path.basename(path) # 'file.txt'

## Пример программы
Рассмотрим пример программы, которая считывает два числа из файла 'input.txt', складывает их и записывает результат в файл 'output.txt'.

In [None]:
# Открывает файлы для чтения и записи
with open('input.txt', 'r') as fin, open('output.txt', 'w') as fout:
    # Считывает два числа из файла
    a = int(fin.readline())
    b = int(fin.readline())
    
    # Запишивает сумму чисел в файл
    fout.write(str(a + b))

## Обработка ошибок
Для безопасной работы с файлами вы можете использовать блок 'try...except', чтобы отлавливать возможные ошибки.

In [None]:
try:
    with open('input.txt', 'r') as fin, open('output.txt', 'w') as fout:
        a = int(fin.readline())
        b = int(fin.readline())
        fout.write(str(a + b))
except FileNotFoundError:
    print("File not found.")
except ValueError:
    print("Error reading a number from the file.")

Работа с файлами в Python проста и интуитивно понятна. Важно не забывать закрывать файлы после их использования и обрабатывать возможные ошибки, чтобы ваша программа работала надежно.

Вы наверняка замечали всевозможные import math и import os и задавались вопросом, что это такое?

### МОДУЛИ В PYTHON

Модуль - это отдельный файл, содержащий код на языке Python, который может определять переменные, функции, классы и другие объекты Python. Модули используются для организации и повторного использования кода в различных частях программы или в нескольких программах.
Пакет - это коллекция модулей, организованных в иерархию каталогов. Пакеты позволяют лучше организовать и структурировать большие кодовые базы, группируя связанные модули вместе.

#### Импорт модулей и пакетов

**Вариант 1:**
```python
import sys
sys.getsizeof(36)
```

**Вариант 2:**
```python
from sys import getsizeof
getsizeof(36)
```

Вывод для обоих вариантов - `14`.

### СТАНДАРТНЫЕ БИБЛИОТЕКИ PYTHON

- **sys** - функции и константы для взаимодействия с интерпретатором
- **datetime** - работа с датой и временем
- **os** - интерфейс к основным сервисам операционной системы
- **os.path** - платформонезависимое манипулирование путями файлов
- **string** - расширенные операции со строками
- **re** - работа с регулярными выражениями
- **csv** - работа с табличным форматом CSV (Comma Separated Values)
- **gzip** - создание и работа с архивами .gzip
- **zipfile** - создание и работа с архивами .zip
- **ConfigParser** - работа с конфигурационными (ini) файлами
- И многие другие (hashlib, sockets, smtplib, sqlite3 и т.д.).

Дополнительная информация:
- [Официальная документация](https://docs.python.org/3/library/index.html)
- [Статья из Википедии](https://en.wikipedia.org/wiki/Python_Standard_Library)

Трамплином для изучения новых тем и поворотным пунктом являются **функции**.

# ФУНКЦИИ
Функции - это именованные блоки кода (подпрограммы), которые могут быть вызваны из другой части программы.
Синтаксис: 
```
def имя_функции(параметры):
    ...
    тело функции
    ...
    return возвращаемое_значение
```

**Аргументы** функции - это данные, которые вы передаете функции для выполнения операции.

**Тело функции** функции - это блок кода, выполняющий определенную задачу.

**Возвращаемое значение** - это то, что функция возвращает после выполнения операции.

**Параметры функции** - это имена переменных, которые вы используете в определении функции для работы с переданными данными (аргументами).

**Вызов функции** - это место в коде, где вы используете имя функции и передаете значения для аргументов.

In [None]:
# Приммер
def hello(n):
    print("Hello, I am a function")
    print(n)
    
# Вызов функции 
def main():
    print("Now we will call the function")
    hello(5)

**Возврат оператора**

In [None]:
def test():
    print("Returning a value")
    return 667
    
#Вызов функции:
a = test()

Как вызвать эту функцию?

In [None]:
def multi_ret():
    print("This curious function")
    print("returns three values")
    return 1, 'test', [796, 69, 15]
#Таким образом
a, b, c = multi_ret()

**Что происходит, когда мы вызываем функцию?

Аргументы `num1` и `num2` передаются в функцию и присваиваются локальным переменным `a` и `b` соответственно.

`a = num1, b = num2`.

Далее над этими локальными переменными выполняются преобразования.

После ключевого слова `return` мы указываем, какое значение должна вернуть функция.

Так, `sum_nums_sqrt = ans`.

(Строки после оператора `return` не выполняются, действуя как `прерывание` для циклов)

Порядок передаваемых аргументов очень важен! Давайте посмотрим на другую функцию и сравним результаты.

In [None]:
def sum_sqrt(a, b):
    return a**2 + b**2

num1 = 5
num2 = 2
print(sum_sqrt(num1, num2))  # 5**2 + 2**2 = 25 + 4
print(sum_sqrt(num2, num1))  # 2**2 + 5**2 = 4 + 25

Мы также можем задать значения по умолчанию для параметров, то есть ввести меньшее количество данных, а оставшимся присвоить значения по умолчанию. Аргументы со значениями по умолчанию называются **ключевыми аргументами**, а остальные - **позиционными аргументами**.

In [None]:
def salute(person, salutation="Howdy"):
    return f"{salutation}, {person}!"

print(salute("Charlie"))
print(salute("Daisy", "Greetings"))


Но внимание, мы всегда ставим в конец параметры со значением по умолчанию, иначе возникнет ошибка

In [14]:
def salute(salutation="Howdy", person):
    return f"{salutation}, {person}!"

print(salute("Charlie"))
print(salute("Daisy", "Greetings"))

SyntaxError: non-default argument follows default argument (2310667371.py, line 1)

Вернемся к функциям с несколькими параметрами

In [17]:
# Function to calculate the total cost of items with a tax rate
def compute_total_cost(amount, units=3, vat_rate=0.08):
    subtotal = amount * units
    subtotal += subtotal * vat_rate
    return subtotal

print(compute_total_cost(20))
print(compute_total_cost(20, 5))
print(compute_total_cost(20, 5, 0.06))

64.8
108.0
106.0


Но что делать, если мы хотим использовать конкретное значение параметра, а для других используем значения по умолчанию, или мы не помним порядок следования параметров? Мы можем явно указать значения параметров.

In [None]:
print(compute_total_cost(20, vat_rate=0.06))

In [18]:
# Следующее не сработает, потому что 20 - это позиционный аргумент.
print(compute_total_cost(vat_rate=0.06, 20))

SyntaxError: positional argument follows keyword argument (20307214.py, line 2)

In [None]:
# Но мы можем переписать его следующим образом, и он будет работать
print(compute_total_cost(vat_rate=0.06, amount=20))

## КОГДА ПАРАМЕТРОВ МНОГО
`*args` и `**kwargs` - это специальные параметры, которые можно использовать в Python для передачи переменного количества аргументов в функцию. Они позволяют функции принимать произвольное количество позиционных аргументов и произвольное количество аргументов в виде ключевых слов, соответственно.

+ `*args`:
- Параметр `*args` позволяет передавать в функцию произвольное количество позиционных аргументов.
- Символ `*` перед именем параметра указывает на то, что все переданные после него аргументы будут собраны в кортеж и переданы в этот параметр. Мы как будто распаковываем кортеж.

+ `**kwargs`:
- Параметр `**kwargs` позволяет передавать в функцию произвольное количество аргументов-ключей.
- Символ `**` перед именем параметра указывает, что все переданные аргументы ключевых слов будут собраны в словарь и переданы в этот параметр. Мы как будто распаковываем словарь, превращая его в список пар ключ-значение, а затем снова распаковываем эти пары.

Произвольное количество параметров 

In [None]:
def f1(*args):
    for item in args:
        print(item)

f1('hello', 'world', 42, True)

Произвольное количество пар параметров 

In [22]:
def f2(**kwargs):
    for key, value in kwargs.items():
        print(f"{key} = {value}")

# Это приведет к ошибке, поскольку f2 принимает только аргументы в виде ключевых слов
#f2(3, 'asd')

f2(asdf='hello', qwerty=42)

asdf = hello
qwerty = 42


Вы можете передавать как `*args`, так и `**kwargs`, а также обычные позиционные и именные аргументы.

In [21]:
def f1(*args, **kwargs):
    for item in args:
        print(item)
    for key, value in kwargs.items():
        print(f"{key} = {value}")

f1('hello', 'world', 42, True, asdf='hello', qwerty=42)

def f2(name, age=30, *args, **kwargs):
    print(f"name: {name}, age: {age}")
    for item in args:
        print(item)
    for key, value in kwargs.items():
        print(f"{key} = {value}")

f2('Alice', 25, 'Python', 'Developer', city='NYC', language='English')


hello
world
42
True
asdf = hello
qwerty = 42
name: Alice, age: 25
Python
Developer
city = NYC
language = English


## Лямбда-функции

Когда функции состоят только из одной строки с `return`, очень удобно использовать лямбда-функции.

Например:

```python
sum = lambda a, b, c: a + b + c
print(sum(1, 3, 5))  # Вывод: 9
```

Эта лямбда-функция принимает три аргумента `a`, `b` и `c` и возвращает их сумму.

В качестве альтернативы вы можете написать это как обычную функцию:

```python
def sum(a, b, c):
    return a + b + c

print(sum(1, 3, 5))  # Output: 9
```

Однако когда логика функции проста и может быть выражена в одной строке, синтаксис лямбда-функции более лаконичен и удобен для чтения.

In [None]:
# Обычная функция
def square(x):
    return x ** 2

# Лямбда-функция
square = lambda x: x ** 2

print(square(5))  # Вывод: 25

In [None]:
multiply = lambda x, y: x * y
print(multiply(3, 4))  # Вывод: 12

In [None]:
# Лямбда-функция для сортировки списка кортежей по второму элементу
students = [('John', 22), ('Emily', 19), ('Michael', 21), ('Jessica', 20)]
sorted_students = sorted(students, key=lambda x: x[1])
print(sorted_students)  # Вывод: [('Emily', 19), ('Jessica', 20), ('Michael', 21), ('John', 22)]