# Работа с файлами. Файловые дескрипторы. Оператор with

Файл открывается встроенной функцией `open()`, которая открывает файл и возвращает соответствующий поток.

`open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)`

Подробнее о некоторых аргументах:

- **file** - путь к файлу. Может быть как абсолютным, так и относительным.

- **mode** - режим открытия файла.

Режимы могут быть объединены, то есть, к примеру, `'rb'` - чтение в двоичном режиме. По умолчанию режим равен `'rt'`.

|Режим|Обозначение|
|---|:---|
|'r'|открытие на чтение (является значением по умолчанию)|
|'w'|открытие на запись, содержимое файла удаляется, если файла не существует, создается новый|
|'x'|открытие на запись, если файла не существует, иначе исключение|
|'a'|открытие на дозапись, информация добавляется в конец файла|
|'b'|открытие в двоичном режиме|
|'t'|открытие в текстовом режиме (является значением по умолчанию)|
|'+'|открытие на чтение и запись|

- **encoding** нужен только в текстовом режиме чтения файла. Этот аргумент задает кодировку.

Закрывается файл соответственно функцией `close()`.

In [1]:
# Открываем файл
f = open('10/text.txt', 'r')
print(f)

f.close()

<_io.TextIOWrapper name='10/text.txt' mode='r' encoding='cp1251'>


## Чтение данных из файла

Существует несколько способов прочитать информацию из файла.

- метод **`read()`**: читает файл целиком, если используется без аргумента, или n символов.

In [2]:
f = open('10/text.txt', 'r')
print(f.read())
f.close()

Hello World
The End.



In [6]:
f = open('10/text.txt', 'r')
print(f.read(2))
# Информация из потока может быть прочитана лишь единожды,
# поэтому следующая строка возвращает остаток после предыдущей операции
f.seek(0)
print(f.read()) 
f.close()

He
Hello World
The End.



- чтение построчно в цикле **for**

In [7]:
f = open('10/text.txt', 'r')
for line in f:
    print(line, end="")
f.close()

Hello World
The End.


- **`readline()` и `readlines()`**: возвращают соответственно одну строку или список строк

In [8]:
f = open('10/text.txt', 'r')
print(f.readline())
f.close()

f = open('10/text.txt', 'r')
print(f.readlines())
f.close()

Hello World

['Hello World\n', 'The End.\n']


## Запись в файл

Запись осуществляется в режиме 'w' или 'wb' при помощи метода `write()`.

> **Примечание:**
>
> *Открытие существующего файла на запись удалит его исходное содержание!*

In [9]:
f = open('10/text2.txt', 'w')
f.write('This is brand new file.')
f.write('New line of brand new file.\n')
f.close()

# Откроем и проверим содержимое нового файла
f = open('10/text2.txt', 'r')
print(f.read())
f.close()

This is brand new file.New line of brand new file.



Еще один способ - метод `writelines()`, который будет принимать список строк, который дескриптор, в свою очередь, будет записывать по порядку на диск.

In [10]:
my_list = ['One another file.', 'A lot of lines.\n', 'LOL\n']

f = open('10/text2.txt', 'w')
f.writelines(my_list)
f.close()

# Откроем и проверим содержимое нового файла
f = open('10/text2.txt', 'r')
print(f.read())
f.close()

One another file.A lot of lines.
LOL



## Оператор with

В Python имеется встроенный инструмент `with`, применяя который можно заметно упростить чтение и редактирование файлов. Оператор `with` создает диспетчер контекста в Python, который автоматически закрывает файл по окончанию работы в нем.

In [8]:
with open("10/text.txt") as f:
    for line in f:
        print(line)

Hello World

The End.



Даже если при выполнении инструкций в блоке `with` возникнут какие-либо исключения, то файл все равно закрывается. Поэтому если такие исключения могут возникнуть, нужно использовать оператор `with`.

Сравним следующие ситуации без `with` и с `with`:

In [7]:
# Откроем файл обычным способом и попытаемся прочитать строки как числа

f = open("10/text.txt")
for line in f:
    i = int(line) # ловим исключение
    print(i)
f.close() # команда закрыть файл не успевает отработать

ValueError: invalid literal for int() with base 10: 'Hello World\n'

In [13]:
print(f.read()) # Видим остаток файла -> файл не закрылся
f.close() # Закрываем файл

The End.



In [14]:
# Откроем файл при помощи with и попытаемся сделать то же самое

with open("10/text.txt") as f:
    for line in f:
        i = int(line) # ловим исключение
        print(i)

ValueError: invalid literal for int() with base 10: 'Hello World\n'

In [15]:
print(f.read()) # Не можем прочитать -> файл закрылся

ValueError: I/O operation on closed file.

Вы можете выполнять все стандартные операции ввода\вывода в привычном порядке, пока находитесь в пределах блока кода. После того, как вы покинете блок кода, файловый дескриптор закроет его, и его уже нельзя будет использовать.

# Задание

Напишите функцию get_popular_name_from_file(filename), которая считывает файл, в котором в каждой строке записаны имя и фамилия через пробел. filename - это имя файла, в котором записаны эти имена. Вам нужно вернуть строку - самое популярное имя в файле. Если таких имен несколько, они должны быть перечислены через запятую внутри строки в алфавитном порядке. Проверить правильность решения вы можете в контесте в задании Файлы.

In [31]:
# опишите решение здесь
import os
def get_popular_name(filename):
    count = {}
    f = open(filename)
    if os.path.exists(filename):
        print(f"Файл {filename} существует.")
    else:
        print(f"Файл {filename} не найден.")
        return None
    for line in f:
        line = line.replace("\n", "")
        if line in count:
            count[line] += 1
        else:
            count[line] = 1
    print(count)
    co = sorted(count.items(), key = lambda x: x[1], reverse = True)
    print(co)
    popy = [i[0] for i in co if i[1] == co[0][1]]
    return popy
    f.close()
get_popular_name("10/task.txt")

Файл 10/task.txt существует.
{'max': 3, 'sergio': 3, 'diego': 1, 'palochka': 2}
[('max', 3), ('sergio', 3), ('palochka', 2), ('diego', 1)]


['max', 'sergio']

## Модуль `shutil`

Модуль `shutil` содержит набор функций высокого уровня для обработки файлов, групп файлов, и папок. В частности, доступные здесь функции позволяют копировать, перемещать и удалять файлы и папки. Часто используется вместе с модулем os.

### Операции над файлами и директориями

- `shutil.copyfileobj(fsrc, fdst[, length])` - скопировать содержимое одного файлового объекта (fsrc) в другой (fdst). Необязательный параметр length - размер буфера при копировании (чтобы весь, возможно огромный, файл не читался целиком в память).

- `shutil.copyfile(src, dst, follow_symlinks=True)` - копирует содержимое (но не метаданные) файла src в файл dst. Возвращает dst (т.е. куда файл был скопирован). src и dst это строки - пути к файлам. dst должен быть полным именем файла.

- `shutil.copymode(src, dst, follow_symlinks=True)` - копирует права доступа из src в dst. Содержимое файла, владелец, и группа не меняются.

- `shutil.copystat(src, dst, follow_symlinks=True)` - копирует права доступа, время последнего доступа, последнего изменения, и флаги src в dst. Содержимое файла, владелец, и группа не меняются.

- `shutil.copy(src, dst, follow_symlinks=True)` - копирует содержимое файла src в файл или папку dst. Если dst является директорией, файл будет скопирован с тем же названием, что было в src. Функция возвращает путь к местонахождению нового скопированного файла.

- `copy()` копирует содержимое файла, и права доступа.

- `shutil.copy2(src, dst, follow_symlinks=True)` - как copy(), но пытается копировать все метаданные.

- `shutil.copytree(src, dst, symlinks=False, ignore=None, copy_function=copy2, ignore_dangling_symlinks=False)` - рекурсивно копирует всё дерево директорий с корнем в src, возвращает директорию назначения.

- `shutil.ignore_patterns(*patterns)` - функция, которая создаёт функцию, которая может быть использована в качестве ignore для copytree(), игнорируя файлы и директории, которые соответствуют glob-style шаблонам.

- `shutil.rmtree(path, ignore_errors=False, onerror=None)` - Удаляет текущую директорию и все поддиректории; path должен указывать на директорию, а не на символическую ссылку.

- `shutil.move(src, dst, copy_function=copy2)` - рекурсивно перемещает файл или директорию (src) в другое место (dst), и возвращает место назначения.

- `shutil.disk_usage(path)` - возвращает статистику использования дискового пространства как namedtuple с атрибутами total, used и free, в байтах.

- `shutil.chown(path, user=None, group=None)` - меняет владельца и/или группу у файла или директории.

- `shutil.which(cmd, mode=os.F_OK | os.X_OK, path=None)` - возвращает путь к исполняемому файлу по заданной команде. Если нет соответствия ни с одним файлом, то None. mode это права доступа, требующиеся от файла, по умолчанию ищет только исполняемые.

### Архивация

Высокоуровневые функции для созданиия и чтения архивированных и сжатых файлов. Основаны на функциях из модулей zipfile и tarfile.

- `shutil.make_archive(base_name, format[, root_dir[, base_dir[, verbose[, dry_run[, owner[, group[, logger]]]]]]])` - создаёт архив и возвращает его имя.

- `shutil.get_archive_formats()` - список доступных форматов для архивирования.

- `shutil.unpack_archive(filename[, extract_dir[, format]])` - распаковывает архив. filename - полный путь к архиву.

- `shutil.get_unpack_formats()` - список доступных форматов для разархивирования.

### Запрос размера терминала вывода

- `shutil.get_terminal_size(fallback=(columns, lines))` - возвращает размер окна терминала.
fallback вернётся, если не удалось узнать размер терминала (терминал не поддерживает такие запросы, или программа работает без терминала). По умолчанию (80, 24).

### Некоторые примеры работы с модулем `shutil`:

In [33]:
# подготовим структуру файлов: удалим, если есть, папку files, и создадим пустую папку с этим
# именем

import shutil
import os
shutil.rmtree("11/files", ignore_errors=True)
os.mkdir("11/files")

Скопируем файл:

In [34]:
# Source path 
source = "10/text.txt"
# Destination path 
destination = "11/files/file2.txt"

# Скопирует содержимое файла из source в destination 
shutil.copyfile(source, destination) 

'11/files/file2.txt'

Скопируем папку:

In [40]:
from shutil import copytree, ignore_patterns
# Source path 
source = "01"
# Destination path (не должна существовать!)
destination = "11/files/01"

# Скопирует рекурсивно из source в destination все файлы, кроме заканчивающихся на .pyc или начинающихся с tmp
copytree(source, destination, ignore=ignore_patterns('*.pyc', 'tmp*'))

'11/files/01'

Создадим архив:

In [41]:
# В этом примере мы создаем архив tar.gz, содержащий все файлы, найденные в .ssh каталоге пользователя:
from shutil import make_archive
archive_name = "11/files"
root_dir = "11/files"
make_archive(archive_name, 'zip', root_dir)

'c:\\projects\\perfomanceQA\\PerfomanceQA\\Python\\4 week\\11\\files.zip'