# https://metanit.com/python/tutorial/4.1.php
# Работа с файлами
# Открытие и закрытие файлов

Python поддерживает множество различных типов файлов, но условно их можно разделить на два виде: текстовые и бинарные. Текстовые файлы - это к примеру файлы с расширением cvs, txt, html, в общем любые файлы, которые сохраняют информацию в текстовом виде. Бинарные файлы - это изображения, аудио и видеофайлы и т.д. В зависимости от типа файла работа с ним может немного отличаться.

При работе с файлами необходимо соблюдать некоторую последовательность операций:

1) Открытие файла с помощью метода open()

2) Чтение файла с помощью метода read() или запись в файл посредством метода write()

3) Закрытие файла методом close()

### Открытие и закрытие файла

Чтобы начать работу с файлом, его надо открыть с помощью функции open(), которая имеет следующее формальное определение:

In [None]:
open(file, mode)

Первый параметр функции представляет путь к файлу. Путь файла может быть абсолютным, то есть начинаться с буквы диска, например, `C://somedir/somefile.txt`. Либо можно быть относительным, например, `somedir/somefile.txt` - в этом случае поиск файла будет идти относительно расположения запущенного скрипта Python.

Второй передаваемый аргумент - mode устанавливает режим открытия файла в зависимости от того, что мы собираемся с ним делать. Существует 4 общих режима:

- __r (Read)__. Файл открывается для чтения. Если файл не найден, то генерируется исключение FileNotFoundError

- __w (Write)__. Файл открывается для записи. Если файл отсутствует, то он создается. Если подобный файл уже есть, то он создается заново, и соответственно старые данные в нем стираются.

- __a (Append)__. Файл открывается для дозаписи. Если файл отсутствует, то он создается. Если подобный файл уже есть, то данные записываются в его конец.

- __b (Binary)__. Используется для работы с бинарными файлами. Применяется вместе с другими режимами - w или r.

После завершения работы с файлом его обязательно нужно закрыть методом close(). Данный метод освободит все связанные с файлом используемые ресурсы.

Например, откроем для записи текстовый файл "hello.txt":

In [None]:
myfile = open("hello.txt", "w")
 
myfile.close()

При открытии файла или в процессе работы с ним мы можем столкнуться с различными исключениями, например, к нему нет доступа и т.д. В этом случае программа выпадет в ошибку, а ее выполнение не дойдет до вызова метода close, и соответственно файл не будет закрыт.

В этом случае мы можем обрабатывать исключения:

In [1]:
try:
    somefile = open("hello.txt", "w")
    try:
        somefile.write("hello world")
    except Exception as e:
        print(e)
    finally:
        somefile.close()
except Exception as ex:
    print(ex)

В данном случае вся работа с файлом идет во вложенном блоке __try__. И если вдруг возникнет какое-либо исключение, то в любом случае в блоке finally файл будет закрыт.

Однако есть и более удобная конструкция - конструкция __with__:
```
with open(file, mode) as file_obj:
    инструкции
```
Эта конструкция определяет для открытого файла переменную file_obj и выполняет набор инструкций. После их выполнения файл автоматически закрывается. Даже если при выполнении инструкций в блоке with возникнут какие-либо исключения, то файл все равно закрывается.

Так, перепишем предыдущий пример:

In [None]:
with open("hello.txt", "w") as somefile:
    somefile.write("hello world")

# Текстовые файлы
### Запись в текстовый файл

Чтобы открыть текстовый файл на запись, необходимо применить режим `w (перезапись)` или `a (дозапись)`. Затем для записи применяется метод write(str), в который передается записываемая строка. Стоит отметить, что записывается именно строка, поэтому, если нужно записать числа, данные других типов, то их предварительно нужно конвертировать в строку.

Запишем некоторую информацию в файл "hello.txt":

In [None]:
with open("hello.txt", "w") as file:
    file.write("hello world")

Если мы откроем папку, в которой находится текущий скрипт Python, то увидем там файл hello.txt. Этот файл можно открыть в любом текстовом редакторе и при желании изменить.

Теперь дозапишем в этот файл еще одну строку:

In [None]:
with open("hello.txt", "a") as file:
    file.write("\ngood bye, world")

Дозапись выглядит как добавление строку к последнему символу в файле, поэтому, если необходимо сделать запись с новой строки, то можно использовать эскейп-последовательность "\n". В итоге файл hello.txt будет иметь следующее содержимое:
```
hello world
good bye, world
```
Еще один способ записи в файл представляет стандартный метод print(), который применяется для вывода данных на консоль:

In [None]:
with open("hello.txt", "a") as hello_file:
    print("Hello, world", file=hello_file)

Для вывода данных в файл в метод print в качестве второго параметра передается название файла через параметр file. А первый параметр представляет записываемую в файл строку.
Чтение файла

Для чтения файла он открывается с режимом r (Read), и затем мы можем считать его содержимое различными методами:

- __readline()__: считывает одну строку из файла

- __read()__: считывает все содержимое файла в одну строку

- __readlines()__: считывает все строки файла в список

Например, считаем выше записанный файл построчно:

In [None]:
with open("hello.txt", "r") as file:
    for line in file:
        print(line, end="")

Несмотря на то, что мы явно не применяем метод readline() для чтения каждой строки, но в при переборе файла этот метод автоматически вызывается для получения каждой новой строки. Поэтому в цикле вручную нет смысла вызывать метод readline. И поскольку строки разделяются символом перевода строки "\n", то чтобы исключить излишнего переноса на другую строку в функцию print передается значение end="".

Теперь явным образом вызовем метод readline() для чтения отдельных строк:

In [None]:
with open("hello.txt", "r") as file:
    str1 = file.readline()
    print(str1, end="")
    str2 = file.readline()
    print(str2)

Консольный вывод:
```
hello world
good bye, world
```
Метод readline можно использовать для построчного считывания файла в цикле while:

In [None]:
with open("hello.txt", "r") as file:
    line = file.readline()
    while line:
        print(line, end="")
        line = file.readline()

Если файл небольшой, то его можно разом считать с помощью метода read():

In [None]:
with open("hello.txt", "r") as file:
    content = file.read()
    print(content)

И также применим метод __readlines()__ для считывания всего файла в список строк:

In [None]:
with open("hello.txt", "r") as file:
    contents = file.readlines()
    str1 = contents[0]
    str2 = contents[1]
    print(str1, end="")
    print(str2)

При чтении файла мы можем столкнуться с тем, что его кодировка не совпадает с ASCII. В этом случае мы явным образом можем указать кодировку с помощью параметра encoding:

In [None]:
filename = "hello.txt"
with open(filename, encoding="utf8") as file:
    text = file.read()

Теперь напишем небольшой скрипт, в котором будет записывать введенный пользователем массив строк и считывать его обратно из файла на консоль:

In [None]:
# имя файла
FILENAME = "messages.txt"
# определяем пустой список
messages = list()
 
for i in range(4):
    message = input("Введите строку " + str(i+1) + ": ")
    messages.append(message + "\n")

# запись списка в файл
with open(FILENAME, "a") as file:
    for message in messages:
        file.write(message)

# считываем сообщения из файла
print("Считанные сообщения")
with open(FILENAME, "r") as file:
    for message in file:
        print(message, end="")

Пример работы программы:
```
Введите строку 1: hello
Введите строку 2: world peace
Введите строку 3: great job
Введите строку 4: Python
Считанные сообщения
hello
world peace
great job
Python
```

# Файлы CSV

Одним из распространенных файловых форматов, которые хранят в удобном виде информацию, является формат __csv__. Каждая строка в файле csv представляет отдельную запись или строку, которая состоит из отдельных столбцов, разделенных запятыми. Собственно поэтому формат и называется Comma Separated Values. Но хотя формат csv - это формат текстовых файлов, Python для упрощения работы с ним предоставляет специальный встроенный модуль csv.

Рассмотрим работу модуля на примере:

In [None]:
import csv
 
FILENAME = "users.csv"
 
users = [
    ["Tom", 28],
    ["Alice", 23],
    ["Bob", 34]
]
 
with open(FILENAME, "w", newline="") as file:
    writer = csv.writer(file)
    writer.writerows(users)
     
with open(FILENAME, "a", newline="") as file:
    user = ["Sam", 31]
    writer = csv.writer(file)
    writer.writerow(user)

В файл записывается двухмерный список - фактически таблица, где каждая строка представляет одного пользователя. А каждый пользователь содержит два поля - имя и возраст. То есть фактически таблица из трех строк и двух столбцов.

При открытии файла на запись в качестве третьего параметра указывается значение newline="" - пустая строка позволяет корректно считывать строки из файла вне зависимости от операционной системы.

Для записи нам надо получить объект writer, который возвращается функцией csv.writer(file). В эту функцию передается открытый файл. А собственно запись производится с помощью метода writer.writerows(users) Этот метод принимает набор строк. В нашем случае это двухмерный список.

Если необходимо добавить одну запись, которая представляет собой одномерный список, например, ["Sam", 31], то в этом случае можно вызвать метод writer.writerow(user)

В итоге после выполнения скрипта в той же папке окажется файл users.csv, который будет иметь следующее содержимое:
```
Tom,28
Alice,23
Bob,34
Sam,31
```
Для чтения из файла нам наоборот нужно создать объект reader:

In [None]:
import csv
 
FILENAME = "users.csv"
 
with open(FILENAME, "r", newline="") as file:
    reader = csv.reader(file)
    for row in reader:
        print(row[0], " - ", row[1])

При получении объекта reader мы можем в цикле перебрать все его строки:
```
Tom  -  28
Alice  -  23
Bob  -  34
Sam - 31
```
### Работа со словарями

В примере выше каждая запись или строка представляла собой отдельный список, например, ["Sam", 31]. Но кроме того, модуль csv имеет специальные дополнительные возможности для работы со словарями. В частности, функция csv.DictWriter() возвращает объект writer, который позволяет записывать в файл. А функция csv.DictReader() возвращает объект reader для чтения из файла. Например:

In [None]:
import csv
 
FILENAME = "users.csv"
 
users = [
    {"name": "Tom", "age": 28},
    {"name": "Alice", "age": 23},
    {"name": "Bob", "age": 34}
]
 
with open(FILENAME, "w", newline="") as file:
    columns = ["name", "age"]
    writer = csv.DictWriter(file, fieldnames=columns)
    writer.writeheader()
     
    # запись нескольких строк
    writer.writerows(users)
     
    user = {"name" : "Sam", "age": 41}
    # запись одной строки
    writer.writerow(user)

with open(FILENAME, "r", newline="") as file:
    reader = csv.DictReader(file)
    for row in reader:
        print(row["name"], "-", row["age"])

Запись строк также производится с помощью методов writerow() и writerows(). Но теперь каждая строка представляет собой отдельный словарь, и кроме того, производится запись и заголовков столбцов с помощью метода writeheader(), а в метод csv.DictWriter в качестве второго параметра передается набор столбцов.

При чтении строк, используя названия столбцов, мы можем обратиться к отдельным значениям внутри строки: row["name"].

# Бинарные файлы
Бинарные файлы в отличие от текстовых хранят информацию в виде набора байт. Для работы с ними в Python необходим встроенный модуль pickle. Этот модуль предоставляет два метода:

- __dump(obj, file)__: записывает объект obj в бинарный файл file

- __load(file)__: считывает данные из бинарного файла в объект

При открытии бинарного файла на чтение или запись также надо учитывать, что нам нужно применять режим "b" в дополнение к режиму записи ("w") или чтения ("r"). Допустим, надо надо сохранить два объекта:

In [None]:
import pickle
 
FILENAME = "user.dat"
 
name = "Tom"
age = 19
 
with open(FILENAME, "wb") as file:
    pickle.dump(name, file)
    pickle.dump(age, file)

with open(FILENAME, "rb") as file:
    name = pickle.load(file)
    age = pickle.load(file)
    print("Имя:", name, "\tВозраст:", age)

С помощью функции dump последовательно записываются два объекта. Поэтому при чтении файла также последовательно посредством функции load мы можем считать эти объекты. Консольный вывод программы:
```
Имя: Tom 		Возраст: 28
```
Подобным образом мы можем сохранять и извлекать из файла наборы объектов:

In [None]:
import pickle
 
FILENAME = "users.dat"
 
users = [
    ["Tom", 28, True],
    ["Alice", 23, False],
    ["Bob", 34, False]
]
 
with open(FILENAME, "wb") as file:
    pickle.dump(users, file)
 
 
with open(FILENAME, "rb") as file:
    users_from_file = pickle.load(file)
    for user in users_from_file:
        print("Имя:", user[0], "\tВозраст:", user[1], "\tЖенат(замужем):", user[2])

В зависимости от того, какой объект мы записывали функцией dump, тот же объект будет возвращен функцией load при считывании файла.

Консольный вывод:
```
Имя: Tom 		Возраст: 28 	Женат(замужем): True
Имя: Alice 		Возраст: 23 	Женат(замужем): False
Имя: Bob 		Возраст: 34 	Женат(замужем): False
```

# Модуль shelve
Для работы с бинарными файлами в Python может применяться еще один модуль - __shelve__. Он сохраняет объекты в файл с определенным ключом. Затем по этому ключу может извлечь ранее сохраненный объект из файла. Процесс работы с данными через модуль shelve напоминает работу со словарями, которые также используют ключи для сохранения и извлечения объектов.

Для открытия файла модуль shelve использует функцию __open()__:

In [None]:
open(путь_к_файлу[, flag="c"[, protocol=None[, writeback=False]]])

Где параметр flag может принимать значения:

- __c__: файл открывается для чтения и записи (значение по умолчанию). Если файл не существует, то он создается.

- __r__: файл открывается только для чтения.

- __w__: файл открывается для записи.

- __n__: файл открывается для записи Если файл не существует, то он создается. Если он существует, то он перезаписывается

Для закрытия подключения к файлу вызывается метод close():

In [None]:
import shelve
d = shelve.open(filename)
d.close()

Либо можно открывать файл с помощью оператора __with__. Сохраним и считаем в файл несколько объектов:

In [None]:
import shelve
 
FILENAME = "states2"
with shelve.open(FILENAME) as states:
    states["London"] = "Great Britain"
    states["Paris"] = "France"
    states["Berlin"] = "Germany"
    states["Madrid"] = "Spain"
    
with shelve.open(FILENAME) as states:
    print(states["London"])
    print(states["Madrid"])

Запись данных предполагает установку значения для определенного ключа:

In [None]:
states["London"] = "Great Britain"

А чтение из файла эквивалентно получению значения по ключу:

In [None]:
print(states["London"])

В качестве ключей используются строковые значения.

При чтении данных, если запрашиваемый ключ отсутствует, то генерируется исключение. В этом случае перед получением мы можем проверять на наличие ключа с помощью оператора in:

In [None]:
with shelve.open(FILENAME) as states:
    key = "Brussels"
    if key in states:
        print(states[key])

Также мы можем использовать метод __get()__. Первый параметр метода - ключ, по которому следует получить значение, а второй - значение по умолчанию, которое возвращается, если ключ не найден.

In [None]:
with shelve.open(FILENAME) as states:
    state = states.get("Brussels", "Undefined")
    print(state)

Используя цикл for, можно перебрать все значения из файла:

In [None]:
with shelve.open(FILENAME) as states:
    for key in states:
        print(key," - ", states[key])

Метод __keys()__ возвращает все ключи из файла, а метод __values()__ - все значения:

In [None]:
with shelve.open(FILENAME) as states:
 
    for city in states.keys():
        print(city, end=" ")        # London Paris Berlin Madrid 
    print()
    for country in states.values():
        print(country, end=" ")     # Great Britain France Germany Spain 

Еще один метод __items()__ возвращает набор кортежей. Каждый кортеж содержит ключ и значение.

In [None]:
with shelve.open(FILENAME) as states:
 
    for state in states.items():
        print(state)

Консольный вывод:
```
("London", "Great Britain")
("Paris", "France")
("Berlin", "Germany")
("Madrid", "Spain")
```

### Обновление данных

Для изменения данных достаточно присвоить по ключу новое значение, а для добавления данных - определить новый ключ:

In [None]:
import shelve
 
FILENAME = "states2"
with shelve.open(FILENAME) as states:
    states["London"] = "Great Britain"
    states["Paris"] = "France"
    states["Berlin"] = "Germany"
    states["Madrid"] = "Spain"

with shelve.open(FILENAME) as states:
 
    states["London"] = "United Kingdom"
    states["Brussels"] = "Belgium"
    for key in states:
        print(key, " - ", states[key])
        

### Удаление данных

Для удаления с одновременным получением можно использовать функцию __pop()__, в которую передается ключ элемента и значение по умолчанию, если ключ не найден:

In [None]:
with shelve.open(FILENAME) as states:
 
    state = states.pop("London", "NotFound")
    print(state)

Также для удаления может применяться оператор __del__:

In [None]:
with shelve.open(FILENAME) as states:
 
    del states["Madrid"]    # удаляем объект с ключом Madrid

Для удаления всех элементов можно использовать метод clear():

In [None]:
with shelve.open(FILENAME) as states:
 
    states.clear()

# Модуль OS и работа с файловой системой
Ряд возможностей по работе с каталогами и файлами предоставляет встроенный модуль os. Хотя он содержит много функций, рассмотрим только основные из них:

-    __mkdir()__: создает новую папку

-    __rmdir()__: удаляет папку

-    __rename()__: переименовывает файл

-    __remove()__: удаляет файл

Создание и удаление папки

Для создания папки применяется функция __mkdir()__, в которую передается путь к создаваемой папке:

In [None]:
import os
 
# путь относительно текущего скрипта
os.mkdir("hello")
# абсолютный путь
os.mkdir("c://somedir")
os.mkdir("c://somedir/hello")

Для удаления папки используется функция __rmdir()__, в которую передается путь к удаляемой папке:

In [None]:
import os
 
# путь относительно текущего скрипта
os.rmdir("hello")
# абсолютный путь
os.rmdir("c://somedir/hello")

### Переименование файла

Для переименования вызывается функция rename(source, target), первый параметр которой - путь к исходному файлу, а второй - новое имя файла. В качестве путей могут использоваться как абсолютные, так и относительные. Например, пусть в папке C://SomeDir/ располагается файл somefile.txt. Переименуем его в файл "hello.txt":

In [None]:
import os
 
os.rename("C://SomeDir/somefile.txt", "C://SomeDir/hello.txt")

### Удаление файла

Для удаления вызывается функция remove(), в которую передается путь к файлу:

In [None]:
import os
 
os.remove("C://SomeDir/hello.txt")

### Существование файла

Если мы попытаемся открыть файл, который не существует, то Python выбросит исключение FileNotFoundError. Для отлова исключения мы можем использовать конструкцию try...except. Однако можно уже до открытия файла проверить, существует ли он или нет с помощью метода os.path.exists(path). В этот метод передается путь, который необходимо проверить:

In [None]:
filename = input("Введите путь к файлу: ")
if os.path.exists(filename):
    print("Указанный файл существует") 
else:
    print("Файл не существует") 

# Программа подсчета слов
Рассмотрим работу со строками на небольшом примере, который будет представлять программу подсчета слов.

Пусть весь код программы будет выглядеть следующим образом:

In [None]:
# Программа подсчета слов в файле
import os
 
def get_words(filename):
    with open(filename, encoding="utf8") as file:
        text = file.read()
    text = text.replace("\n", " ")
    text = text.replace(",", "").replace(".", "").replace("?", "").replace("!", "")
    text = text.lower()
    words = text.split()
    words.sort()
    return words
 
def get_words_dict(words):
    words_dict = dict()
 
    for word in words:
        if word in words_dict:
            words_dict[word] = words_dict[word] + 1
        else:
            words_dict[word] = 1
    return words_dict
 
def main():
    filename = input("Введите путь к файлу: ")
    if not os.path.exists(filename):
        print("Указанный файл не существует")
    else:
        words = get_words(filename)
        words_dict = get_words_dict(words)
        print(f"Кол-во слов: {len(words)}")
        print(f"Кол-во уникальных слов: {len(words_dict)}")
        print("Все использованные слова:")
        for word in words_dict:
            print(word.ljust(20), words_dict[word])
 
 
if __name__ == "__main__":
    main()

Здесь в функции __get_words()__ производится начальная сегментация текста на слова. Пи этом все пунктуационные знаки удаляются, а переводы стоки заменяется на пробелы. Затем происходит разбитие текста на слова. В качестве разделителя по умолчанию применяется пробел.

Далее в функции __get_words_dict()__ получаем словарь из слов, где ключ - это уникальное слово, а значение - количество вхождений данного слова в тексте.

В функции main осуществляется ввод пути к файлу и вызов выше определенных функций, а также вывод все статистики.

Консольный вывод программы:
```
Введите путь к файлу: C:\SomeDir\hello.txt
Кол-во слов: 66
Кол-во уникальных слов: 54
Все использованные слова:
благодетель          2
в                    1
всего                1
вы                   1
горчичным            1
ее                   1
ежели                3
еще                  1
.......................

```

# Запись и чтение архивных zip-файлов
__Zip__ представляет наиболее популярный формат архивации и сжатия файлов. И язык Python имеет встроенный модуль для работы с ними - __zipfile__. С помощью этого модуля можно создавать, считывать, записывать zip-файлы, получать их содержимое и добавлять в них файлы. Также поддерживается шифрование, но не поддерживается дешифрование.

Для представления zip-файла в этом модуле определен __класс ZipFile__. Он имеет следующий конструктор:

In [None]:
ZipFile(file, mode='r', compression=ZIP_STORED, allowZip64=True, compresslevel=None, *, strict_timestamps=True, metadata_encoding=None)

Параметры:

-    __file__: путь к zip-файлу

-    __mode__: режим открытия файла. Может принимать следующие значения:

-        __r__: применяется для чтения существующего файла

-        __w__: применяется для записи нового файла

-        __a__: применяется для добавления в файл

-    __compression__: тип сжатия файла при записи. Может принимать значения:

-        __ZIP_STORED__: архивация без сжатия (значение по умолчанию)

-        __ZIP_DEFLATED__: стандартный тип сжатия при архивации в zip

-        __ZIP_BZIP2__: сжатие с помощью способа BZIP2

-        __ZIP_LZMA__: сжатие с помощью способа LZMA

-    __allowZip64__: если равно True, то zip-файл может быть больше 4 Гб

-    __compresslevel__: уровень сжатия при записи файла. Для типов сжатия ZIP_STORED и ZIP_LZMA не применяется. Для типа ZIP_DEFLATED допустимые значения от 0 до 9, а для типа ZIP_BZIP2 допустимые значения от 1 до 9.

-    __strict_timestamps__: при значении False позволяет работать с zip-файлами, созданными ранее 01.01.1980 и позже 31.12.2107

-    __metadata_encoding__: применяется для декодирования метаданных zip-файла (например, коментариев)

Для работы с файлами этот класс предоставляет ряд методов:

-    __close()__: закрывает zip-файл

-    __getinfo()__: возвращает информацию об одном файле из архива в виде объекта ZipInfo

-    __namelist()__: возвращает список файлов архива

-    __infolist()__: возвращает информацию обо всех файлах из архива в виде списока объектов ZipInfo

-    __open()__: предоставляет доступ к одному из файлов в архиве

-    __read()__: считывает файл из архива в набор байтов

-    __extract()__: извлекает из архива один файл

-    __extractall()__: извлекает все элементы из архива

-    __setpassword()__: устанавливает пароль для zip-файла

-    __printdir()__: выводит на консоль содержимое архива

### Создание и закрытие файла

Для создания архивного файла в конструктор ZipFile передается режим "w" или "a":

In [None]:
from zipfile import ZipFile
 
myzip = ZipFile("metanit.zip", "w")

После выполнения кода в текущей папке будет создаваться пустой архивный файл "metanit.zip".

После окончания работы с архивом для его закрытия применяется метод __close()__:

In [None]:
from zipfile import ZipFile
 
myzip = ZipFile("metanit.zip", "w")
myzip.close()

Но так как ZipFile также представляет менеджер контекста, то он поддерживает выражение __with__, которое определяет контекст и автоматически закрывает файл по завершению контекста:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "w") as myzip:
    pass

### Запись файлов в архив

Для записи файлов в архив применяется файл __write()__:

In [None]:
write(filename, arcname=None, compress_type=None, compresslevel=None)

Первый параметр представляет файл, который записиывается в архив. Второй параметр - arcname устанавливает произвольное имя для файла внутри архива (по умолчанию это само имя файла). Третий параметр - compress_type представляет тип сжатия, а параметр compresslevel - уровень сжатия.

Например, запишем в архив "metanit.zip" файл "hello.txt" (который, как предполагается, находится в той же папке, где и текущий скрипт python):

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "w") as myzip:
    myzip.write("hello.txt")

Стоит учитывать, что при открытии файла в режиме "w" при всех последующих записях текущее содержимое будет затираться, то есть фактически архивный файл будет создаваться заново. Если нам необходимо добавить, то необходимо определять zip-файл в режиме "a":

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "a") as myzip:
    myzip.write("hello2.txt")
    myzip.write("forest.jpg")

Стоит отметить, что по умолчанию сжатие не применяется. Но при необходимости можно применить какой-нибудь способ сжатия и уровень сжатия"

In [None]:
from zipfile import ZipFile, ZIP_DEFLATED
 
with ZipFile("metanit.zip", "w", compression=ZIP_DEFLATED, compresslevel=3) as myzip:
    myzip.write("hello.txt")

Необходимо учитывать, что если мы попробуем добавить в архив файлы с уже имеющимися именами, то консоль выведет предупреждение. Чтобы избежать наличия файлов с дублирующимися именами можно через второй папаметр метода write явным образом определить для них уникальное имя внутри архива:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "a") as myzip:
    myzip.write("hello.txt", "hello1.txt")
    myzip.write("hello.txt", "hello2.txt")
    myzip.write("hello.txt", "hello3.txt")

### Получение информации о файлах в архиве

Метод __infolist()__ возвращает информацию о файлах в архиве с виде списка, где каждый отдельный файл представлен объектом ZipInfo:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "a") as myzip:
    print(myzip.infolist())

Класс ZipInfo предоставляет ряд атрибутов для хранения информации о файле. Основные из них:

-    __filename__: название файла

-    __date_time__: дата и время последнего изменения файла в виде кортежа в формате (год, месяц, день, час, минута, секунда)

-    __compress_type__: тип сжатия

-    __compress_size__: размер после сжатия

-    __file_size__: оригинальный размер файла до сжатия

Получим эти данные по каждому отдельному файлу в архиве:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "r") as myzip:
    for item in myzip.infolist():
        print(f"File Name: {item.filename} Date: {item.date_time} Size: {item.file_size}")

Примерный консольный вывод:
```
File Name: hello.txt  Date: (2022, 11, 23, 20, 21, 34)  Size: 18
File Name: forest.jpg  Date: (2022, 11, 19, 20, 46, 52)  Size: 103956
File Name: hello1.txt  Date: (2022, 11, 23, 20, 21, 34)  Size: 18
File Name: hello2.txt  Date: (2022, 11, 23, 20, 21, 34)  Size: 18
File Name: hello3.txt  Date: (2022, 11, 23, 20, 21, 34)  Size: 18
```
С помощью метода is_dir() можно проверить, является ли элемент в архиве папкой:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "r") as myzip:
    for item in myzip.infolist():
        if(item.is_dir()):  
            print(f"Папка: {item.filename}")
        else:  
            print(f"Файл: {item.filename}")

Если надо получить только список имен входящих в архив файлов, то применяется метод __namelist()__:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "r") as myzip:
    for item in myzip.namelist():
        print(item)

Консольный вывод в моем случае:
```
hello.txt
forest.jpg
hello1.txt
hello2.txt
hello3.txt
```
С помощью метода __getinfo()__ можно получить данные по одному из архивированных файлов, передав в метод его имя в архиве. Результат метода - объект ZipInfo:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "r") as myzip:
    try:
        hello_file = myzip.getinfo("hello.txt")
        print(hello_file.file_size)
    except KeyError:
        print("Указанный файл отсутствует")

Если в архиве не окажется элемента с указанным именем, то метод сгенерирует ошибку KeyError.
Извлечение файлов из архива

Для извлечения всех файлов из архива применяется метод __extractall()__:

In [None]:
extractall(path=None, members=None, pwd=None)

Первый параметр метода устанавливает каталог для извлечения архива (по умолчанию извлечение идет в текущий каталог). Параметр members представляет список строк - список названий файлов, которые надо извлечт из архива. И третий параметр - pwd представляет пароль, в случае если архив закрыт паролем.

Например, извлечем все файлы из архива:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "r") as myzip:
    myzip.extractall()

Извлечение в определенную папку:

In [None]:
myzip.extractall(path="metanit")

Извлечение части файлов:

In [None]:
# извлекаем файлы  "hello.txt", "forest.jpg" в папку "metanit2"
myzip.extractall(path="metanit2", members=["hello.txt", "forest.jpg"])

Для извлечения одного файла применяется метод __extract()__, в который в качестве обязательного параметра передается имя извлекаемого файла:

In [None]:
myzip.extract("hello.txt")

### Считывание файла

Метод __read()__ позволяет считать содержимое файла из архива в набор байтов:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "r") as myzip:
    content = myzip.read("hello5.txt")
    print(content)

### Открытие файла

Метод __open()__ позволяет открывать отдельные файлы из архива без непосредственного их извлечения:

In [None]:
open(name, mode='r', pwd=None, *, force_zip64=False)

В качестве первого обязательного параметра передается имя файла внутри архива. Второй параметр - mode устанавливает режим открытия. Параметр pwd задает пароль, если файл защищен паролем. И параметр force_zip64 при значении True позволяет открывать файлы больше 4 Гб.

Этот файл может быть полезен для манипулирования файлом, например, для считывания его содержимого или, наоборот, для записи в него. Например, откроем файл и считаем его содержимое:

In [None]:
from zipfile import ZipFile
 
with ZipFile("metanit.zip", "a") as myzip:
    # записываем в архив новый файл "hello5.txt"
    with myzip.open("hello5.txt", "w") as hello_file:
        encoded_str = bytes("Python...", "UTF-8")
        hello_file.write(encoded_str)