## Функция open для работы с файлами

Функция open открывает заданный файл на чтение или запись. По умолчанию - на чтение. 

open(file [, mode='r', encoding=None, ... ])<br>
- file - путь к файлу<br>
- mode - режим доступа к файлу(чтение/запись)<br>
- encoding - кодировка файла<br>

Путь к файлу может быть относительным или абсолютным (полным). Разделителем между каталогами принято использовать слэш - "\\". В отличии от обратного слэша - "/" это обеспечит большую кроссплатформенность, а также не потребует экранирования.

In [1]:
file = open('file.txt')

По умолчанию фунция open открывает файл только на чтение. Это означает, что можно только считывать информацию из файла, но не записывать.

Переменная file ссылается на файловый объект:

In [2]:
file

<_io.TextIOWrapper name='file.txt' mode='r' encoding='cp1252'>

Для чтения файла существует функция read. Если не передать ей никаких аргументов, она читает все содержимое файла:

In [3]:
print(file.read())

first string
second string


Если кодировка файла не соответствует кодировке по умолчанию, содержимое файла может быть прочитано некорректно. Для смены кодировки ее имя необходимо передать функции open вторым аргументом:

In [4]:
for i in file:
    print(i)

In [5]:
file = open('file.txt', encoding='utf-8')

На случай, если необходимо прочитать не весь файл, функции read можно передать максимальное количество символов, которое нужно прочитать:

In [6]:
print(file.read(10))

first stri


Если еще раз вызвать метод read - будут прочитаны следующие символы:

print(file.read(10))

Существует понятие "файловая позиция". Изначально она в начале файла. При частичном чтении она перемещается по файлу, и следующий вызов функции продолжает читать файл с того места, где был остановлен предыдущий. В конце - символ EOF (End Of File). Он сигнализирует о конце файла.

При необходимости можно управлять положением файловой позиции. Для этого у файлового объекта существует специальный символ seek:<br>
- file.seek(offset[, from_what]), где offset - значение, куда стоит установить файловую позицию

In [7]:
file.seek(0)

0

И теперь считывание файла начнется с начала:

In [8]:
print(file.read(5))

first


In [9]:
file.seek(0)

0

In [10]:
print(file.read(10))

first stri


Метод tell возвращает текущую файловую позицию:

In [11]:
file.tell()

10

Важно, что файловая позиция указывает не номер символа, а номер байта. Поэтому, напрмер, при чтении файлов, содержащих кириллицу, будет несовпадение.

In [12]:
file.seek(0)

0

Метод readline позволяет прочесть не весь файл, а только первую строку:

In [13]:
file.readline()

'first string\n'

метод readline понимает, что строка закончилась, когда доходит либо до символа конца строки, либо до конца файла.

In [14]:
file.seek(0)

0

Чтобы перебрать весь файл по строкам, можно воспользоваться циклом for:

In [15]:
for line in file:
    print(line)

first string

second string


In [16]:
file.seek(0)

0

Из-за того, что перенос строки есть как в переменной line, так и функции print, появляется пустая строка. Чтобы ее убрать:

In [17]:
for line in file:
    print(line, end='')

first string
second string

In [18]:
file.seek(0)

0

Для чтения всех строк сразу есть метод readlines:

In [19]:
file.readlines()

['first string\n', 'second string']

Он возвращает список, где каждый элемент - отдельная строка. Но такой метод стоит использовать с осторожностью, так как для чтения больших файлов таким образом требуется много памяти.

Как только завершается работа с файлом, его следует закрыть, используя метод close:

In [20]:
file.close()