Сжатие информации – это процесс преобразования информации, хранящейся в файле, при котором уменьшается избыточность в ее представлении и, соответственно, требуется меньший объем памяти для хранения.

Сжатие информации в файлах производится за счет устранения избыточности различными способами, например, за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов.

Архивация файлов — упаковка нескольких файлов в один файл или поток — архив. Не следует путать архивацию со сжатием, которое далеко не всегда применяется при создании архива.

Архивный файл – это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.д.

Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5−40
%5−40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей – 60−90% 60−90%. Почти не сжимаются архивные файлы.

In [1]:
from zipfile import ZipFile

#Вывод структуры внутри zip
with ZipFile('test.zip') as zip_file:
    zip_file.printdir()

File Name                                             Modified             Size
test/                                          2021-11-27 12:47:10            0
test/Картинки/                                 2021-11-27 12:49:02            0
test/Картинки/1.jpg                            2021-09-02 12:30:20        90156
test/Картинки/avatar.png                       2021-08-20 09:38:44        19053
test/Картинки/certificate.png                  2021-10-23 09:46:36        43699
test/Картинки/py.png                           2021-07-28 17:55:56        33522
test/Картинки/World_Time_Zones_Map.png         2021-11-08 07:30:06      2324421
test/Картинки/Снимок экрана.png                2021-10-01 20:47:02        10878
test/Неравенства.djvu                          2021-08-19 08:39:06      5283010
test/Программы/                                2021-11-27 12:48:20            0
test/Программы/image_util.py                   2021-11-18 12:42:22         4955
test/Программы/sort.py                  

In [2]:
#Подробная информация о файлах из архива
with ZipFile('test.zip') as zip_file:
    info = zip_file.infolist()
    print(info[6].file_size)                # размер начального файла в байтах
    print(info[6].compress_size)            # размер сжатого файла в байтах
    print(info[6].filename)                 # имя файла
    print(info[6].date_time)                # дата изменения файла

2324421
2322032
test/Картинки/World_Time_Zones_Map.png
(2021, 11, 8, 7, 30, 6)


In [None]:
#Проверка является ли объект папкой или файлов
with ZipFile('test.zip') as zip_file:
    info = zip_file.infolist()
    print(info[0].is_dir()) #True
    print(info[6].is_dir()) #False

10


In [4]:
#Вывод только имен файлов
from zipfile import ZipFile

with ZipFile('test.zip') as zip_file:
    info = zip_file.namelist()
    print(*info, sep='\n')

test/
test/Картинки/
test/Картинки/1.jpg
test/Картинки/avatar.png
test/Картинки/certificate.png
test/Картинки/py.png
test/Картинки/World_Time_Zones_Map.png
test/Картинки/Снимок экрана.png
test/Неравенства.djvu
test/Программы/
test/Программы/image_util.py
test/Программы/sort.py
test/Разные файлы/
test/Разные файлы/astros.json


In [None]:
#Получение информации о файле по имени
with ZipFile('test.zip') as zip_file:
    info = zip_file.namelist()
    last_file = zip_file.getinfo(info[2])
    print(last_file.file_size)     #90156
    print(last_file.compress_size) #84676
    print(last_file.filename)      #test/Картинки/1.jpg
    print(last_file.date_time)     #(2021, 9, 2, 12, 30, 20)

90156
84676
test/Картинки/1.jpg
(2021, 9, 2, 12, 30, 20)


In [None]:
#Чтение содержимого из файла (Бинарный вид)
with ZipFile('test.zip') as zip_file:
    with zip_file.open('test/Разные файлы/astros.json') as file:
        print(file.read())
#b'{"number": 10, "people": [{"craft": "ISS", "name": "Mark Vande Hei"},
#  {"craft": "ISS", "name": "Pyotr Dubrov"}, {"craft": "ISS", "name": "Thomas Pesquet"},
#  {"craft": "ISS", "name": "Megan McArthur"}, {"craft": "ISS", "name": "Shane Kimbrough"},
#  {"craft": "ISS", "name": "Akihiko Hoshide"}, {"craft": "ISS", "name": "Anton Shkaplerov"}, 
# {"craft": "Shenzhou 13", "name": "Zhai Zhigang"}, {"craft": "Shenzhou 13", "name": "Wang Yaping"},
#  {"craft": "Shenzhou 13", "name": "Ye Guangfu"}], "message": "success"}'

b'{"number": 10, "people": [{"craft": "ISS", "name": "Mark Vande Hei"}, {"craft": "ISS", "name": "Pyotr Dubrov"}, {"craft": "ISS", "name": "Thomas Pesquet"}, {"craft": "ISS", "name": "Megan McArthur"}, {"craft": "ISS", "name": "Shane Kimbrough"}, {"craft": "ISS", "name": "Akihiko Hoshide"}, {"craft": "ISS", "name": "Anton Shkaplerov"}, {"craft": "Shenzhou 13", "name": "Zhai Zhigang"}, {"craft": "Shenzhou 13", "name": "Wang Yaping"}, {"craft": "Shenzhou 13", "name": "Ye Guangfu"}], "message": "success"}'


Обратите внимание на символ b перед выводом. Это бинарная строка. Метод file.read() возвращает сырые байты (тип bytes). 
Для того чтобы преобразовать их в строку (тип str), нужно использовать метод decode(), указав нужную кодировку (файл astros.json имеет кодировку UTF-8).

In [None]:
#Чтение содержимого из файла (Классический вид)
with ZipFile('test.zip') as zip_file:
    with zip_file.open('test/Разные файлы/astros.json') as file:
        print(file.read().decode('utf-8'))

In [None]:
#Создание архива и перенос в него файлов
with ZipFile('archive.zip',mode='w') as zip_file:
    zip_file.write('Файл поместится в архив.txt')
    # zip_file.write('lse.jpeg')
    print(zip_file.namelist())

['Файл поместится в архив.txt']


In [None]:
#Создание архива и перенос файлов с переименованием файлов
#mode = 'a' - добавление в существующий архив
with ZipFile('archive.zip',mode='w') as zip_file:
    zip_file.write('Файл поместится в архив.txt','Файл в архиве.txt')
    # zip_file.write('lse.jpeg')
    print(zip_file.namelist())

['Файл в архиве.txt']


In [None]:
#Извлечение отдельного файла
with ZipFile('test.zip') as zip_file:
    zip_file.extract('test/Картинки/avatar.png')

In [26]:
#Извлечение всех файлов
with ZipFile('test.zip') as zip_file:
    zip_file.extractall()