https://docs.python.org/3/tutorial/index.html

In [2]:
my_file = open("BabyFile.txt", "a+")
my_file.write("и еще кое-что!")
my_file.close()

# 7.2. Reading and Writing Files¶



функция open() возвращает файловый объект и чаще всего используется с двумя позиционными аргументами и одним ключевым словом: open(имя файла, режим, кодировка=Нет)

In [14]:
f = open('workfile', 'w', encoding="utf-8")

Первый аргумент - это строка, содержащая имя файла. Второй аргумент - это еще одна строка, содержащая несколько символов, описывающих способ использования файла. режим может быть "r", когда файл будет доступен только для чтения, "w" - только для записи (существующий файл с таким же именем будет удален), а "a" открывает файл для добавления; любые данные, записанные в файл, автоматически добавляются в конец. "r+" открывает файл как для чтения, так и для записи. Аргумент mode является необязательным; значение 'r' будет приниматься, если оно опущено.

Обычно файлы открываются в текстовом режиме, что означает, что вы читаете и записываете строки из файла и в сам файл, которые закодированы в определенной кодировке. Если кодировка не указана, то по умолчанию она зависит от платформы (см. open()). Поскольку UTF-8 является современным стандартом де-факто, рекомендуется использовать encoding="utf-8", если только вы не знаете, что вам нужно использовать другую кодировку. Добавление "b" к mode открывает файл в двоичном режиме. Данные в двоичном режиме считываются и записываются в виде объектов bytes. Вы не можете указать кодировку при открытии файла в двоичном режиме.

В текстовом режиме при чтении по умолчанию используется преобразование окончаний строк, зависящих от платформы (\n в Unix, \r\n в Windows), в просто \n. При записи в текстовом режиме по умолчанию используется преобразование вхождений \n обратно в окончания строк, зависящие от платформы. Такая скрытая модификация файловых данных подходит для текстовых файлов, но может привести к повреждению двоичных данных, как в файлах JPEG или EXE. Будьте очень осторожны при использовании двоичного режима при чтении и записи таких файлов.


Рекомендуется использовать ключевое слово with при работе с файловыми объектами. Преимущество заключается в том, что файл корректно закрывается после завершения его обработки, даже если в какой-то момент возникает исключение. Использование with также намного короче, чем написание эквивалентных блоков try-finally:




In [15]:
with open('workfile', encoding="utf-8") as f:
    read_data = f.read()

# We can check that the file has been automatically closed.
f.closed
True

True

Если вы не используете ключевое слово with, то вам следует вызвать функцию f.close(), чтобы закрыть файл и немедленно освободить все используемые им системные ресурсы.

Предупреждение: вызов функции f.write() без использования ключевого слова with или вызов функции f.close() может привести к тому, что аргументы функции f.write() не будут полностью записаны на диск, даже если программа завершит работу успешно.
После закрытия файлового объекта с помощью инструкции with или вызова функции f.close() попытки использования файлового объекта автоматически завершаются неудачей.

In [16]:
f.close()
f.read()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: I/O operation on closed file.

SyntaxError: invalid syntax. Perhaps you forgot a comma? (987387078.py, line 3)

# 7.2.1. Methods of File Objects


В остальных примерах этого раздела предполагается, что файловый объект с именем f уже создан.

Чтобы прочитать содержимое файла, вызовите функцию f.read(size), которая считывает некоторое количество данных и возвращает их в виде строки (в текстовом режиме) или байтового объекта (в двоичном режиме). размер - необязательный числовой аргумент. Если значение size не указано или оно отрицательное, все содержимое файла будет считано и возвращено обратно; это ваша проблема, если размер файла в два раза превышает объем памяти вашего компьютера. В противном случае считывается и возвращается не более символов (в текстовом режиме) или байтов (в двоичном режиме). Если достигнут конец файла, функция f.read() вернет пустую строку (").

In [1]:
f.read()
'This is the entire file.\n'
f.read()
''

NameError: name 'f' is not defined

f.функция readline() считывает одну строку из файла; символ новой строки (\n) остается в конце строки и опускается только в последней строке файла, если файл не заканчивается новой строкой. Это делает возвращаемое значение однозначным; если функция f.readline() возвращает пустую строку, значит, достигнут конец файла, в то время как пустая строка представлена символом '\n', строкой, содержащей только одну новую строку.

In [2]:
f.readline()
'This is the first line of the file.\n'
f.readline()
'Second line of the file\n'
f.readline()
''

NameError: name 'f' is not defined

Для чтения строк из файла вы можете выполнить цикл по файловому объекту. Это экономит память, работает быстро и позволяет создавать простой код:

In [3]:
for line in f:
    print(line, end='')

This is the first line of the file.
Second line of the file

SyntaxError: invalid syntax (1965385298.py, line 4)

Если вы хотите прочитать все строки файла в виде списка, вы также можете использовать list(f) или f.readlines().

f.write(string) записывает содержимое строки в файл, возвращая количество записанных символов.

In [4]:
f.write('This is a test\n')
15

NameError: name 'f' is not defined

Другие типы объектов необходимо преобразовать – либо в строку (в текстовом режиме), либо в байтовый объект (в двоичном режиме) – перед их записью:


In [5]:
value = ('the answer', 42)
s = str(value)  # convert the tuple to string
f.write(s)
18

NameError: name 'f' is not defined

f.tell() возвращает целое число, указывающее текущее положение файлового объекта в файле, представленное в виде числа байт от начала файла в двоичном режиме и непрозрачного числа в текстовом режиме.

Чтобы изменить положение файлового объекта, используйте f.seek(смещение, откуда). Положение вычисляется путем добавления смещения к опорной точке; опорная точка выбирается с помощью аргумента where. Значение where, равное 0, отсчитывается от начала файла, 1 использует текущее положение файла, а 2 использует конец файла в качестве точки отсчета. значение where может быть опущено и по умолчанию равно 0, при этом в качестве точки отсчета используется начало файла.

In [6]:
f = open('workfile', 'rb+')
f.write(b'0123456789abcdef')
16
f.seek(5)      # Go to the 6th byte in the file
5
f.read(1)
b'5'
f.seek(-3, 2)  # Go to the 3rd byte before the end
13
f.read(1)
b'd'

b'd'

В текстовых файлах (тех, которые открываются без буквы b в строке mode) разрешен поиск только относительно начала файла (исключение составляет поиск в самом конце файла с помощью seek(0, 2)), и единственными допустимыми значениями смещения являются те, которые возвращаются из f.tell(), или ноль. Любое другое значение смещения приводит к неопределенному поведению.

Файловые объекты имеют некоторые дополнительные методы, такие как isatty() и truncate(), которые используются реже; обратитесь к библиотечному справочнику для получения полного руководства по файловым объектам.

# 7.2.2. Saving structured data with json


Строки могут быть легко записаны в файл и считаны из него. С числами требуется немного больше усилий, поскольку метод read() возвращает только строки, которые должны быть переданы функции типа int(), которая принимает строку типа '123' и возвращает ее числовое значение 123. Когда вы хотите сохранить более сложные типы данных, такие как вложенные списки и словари, ручной разбор и сериализация усложняются.

Вместо того чтобы заставлять пользователей постоянно писать и отлаживать код для сохранения сложных типов данных в файлах, Python позволяет использовать популярный формат обмена данными, называемый JSON (JavaScript Object Notation). Стандартный модуль, называемый json, может использовать иерархии данных Python и преобразовывать их в строковые представления; этот процесс называется сериализацией. Восстановление данных из строкового представления называется десериализацией. Между сериализацией и десериализацией строка, представляющая объект, могла быть сохранена в файле или данных или отправлена по сетевому соединению на какой-либо удаленный компьютер.

Обратите внимание, что формат JSON широко используется современными приложениями для обмена данными. Многие программисты уже знакомы с ним, что делает его хорошим выбором для обеспечения взаимодействия.
Если у вас есть объект x, вы можете просмотреть его строковое представление в формате JSON с помощью простой строки кода:

import json
x = [1, 'simple', 'list']
json.dumps(x)
'[1, "simple", "list"]'


Другой вариант функции dumps(), называемый dump(), просто преобразует объект в текстовый файл. Итак, если f - это объект текстового файла, открытый для записи, мы можем сделать это:

In [7]:
json.dump(x, f)

NameError: name 'json' is not defined


Чтобы снова расшифровать объект, если f - это двоичный файл или текстовый файловый объект, который был открыт для чтения:

In [8]:
x = json.load(f)

NameError: name 'json' is not defined

Обратите внимание, что файлы JSON должны быть закодированы в UTF-8. Используйте encoding="utf-8" при открытии файла JSON как текстового файла как для чтения, так и для записи.
Этот простой метод сериализации позволяет обрабатывать списки и словари, но сериализация экземпляров произвольных классов в формате JSON требует дополнительных усилий. Ссылка на модуль json содержит объяснение этого.

Смотрите также pickle - модуль pickle
В отличие от JSON, pickle - это протокол, который позволяет сериализовать сколь угодно сложные объекты Python. Как таковой, он специфичен для Python и не может использоваться для взаимодействия с приложениями, написанными на других языках. Это также небезопасно по умолчанию: десериализация данных pickle, поступающих из ненадежного источника, может привести к выполнению произвольного кода, если данные были созданы опытным злоумышленником.