# Файлы

Python использует объекты file для взаимодействия с файлами на Вашем компьютере. Эти объекты file могут быть любыми типами файлов - аудио файлы, текстовые файлы, emails, документы Excel и т.д. Обратите внимание: для работы с некоторыми типами файлов Вам может потребоваться установка определенных библиотек или модулей. Они легко доступны, мы обсудим как скачивать модули позднее в этом курсе.

Python имеет встроенную функцию open для открытия и работы с основными типами файлов. Но для начала нам нужен сам файл. Давайте используем небольшую магию IPython, чтобы создать файл!

## IPython - запись в файл 
#### Указанная ниже команда работает только в блокноте Jupyter Notebook (точнее, в IPython)! Как альтернативный вариант, Вы можете просто создать файл .txt в любом текстовом редакторе, например в sublime text editor.

In [1]:
%%writefile test.txt
Hello, this is a quick test file.

Overwriting test.txt


## Открываем файл в Python 

Давайте откроем файл test.txt, который располагается в той же папке, что и этот блокнот. Мы будем работать с файлами в той же папке, что и блокнот Jupyter Notebook или скрипт .py, который Вы используете.

На этом шаге можно легко получить ошибку, если Вы попытаетесь открыть файл, которого нет:

In [1]:
myfile = open('whoops.txt')

FileNotFoundError: [Errno 2] No such file or directory: 'whoops.txt'

Чтобы избежать ошибки, убедитесь что Ваш файл .txt находится там же, где и notebook. Чтобы проверить папку, в которой находится notebook, используйте **pwd**:

In [2]:
pwd

'C:\\Users\\Marcial\\Pierian-Data-Courses\\Complete-Python-3-Bootcamp\\00-Python Object and Data Structure Basics'

** Как альтернативный вариант, Вы можете прочитать файлы из любой папки на Вашем компьютере, просто указав полный путь к файлу. **

В Windows нужно использовать двойные обратные слэши \, чтобы python не воспринимал второй слэш как символ экранирования. Вот пример:

    myfile = open("C:\\Users\\YourUserName\\Home\\Folder\\myfile.txt")

В MacOS и Linux нужно использовать прямые слэши:

    myfile = open("/Users/YouUserName/Folder/myfile.txt")

In [2]:
# Открываем файл text.txt, который мы создали ранее
my_file = open('test.txt')

In [3]:
# Теперь мы можем прочитать данные из файла
my_file.read()

'Hello, this is a quick test file.'

In [4]:
# А что если мы попытаемся прочитать данные снова?
my_file.read()

''

Это произошло, потому что воображаемый "курсор" находится в конце файла после того, как чтение выполнено. Поэтому больше нечего прочитать. Мы можем сбросить "курсор" вот так:

In [5]:
# Перейти к началу файла (индекс 0)
my_file.seek(0)

0

In [6]:
# Теперь снова читаем
my_file.read()

'Hello, this is a quick test file.'

Вы также можете читать файл строка за строкой, используя метод readlines. Будьте осторожны с большими файлами, поскольку всё содержимое файла будет помещаться в память. Позднее мы узнаем, как выполнять последовательный проход по большим файлам, строка за строкой, без необходимости помещать весь файл в память.

In [7]:
# Readlines возвращает список строк в файле
my_file.seek(0)
my_file.readlines()

['Hello, this is a quick test file.']

Когда Вы закончили работу с файлом, хорошей практикой является закрыть его.

In [8]:
my_file.close()

## Запись в файл

По умолчанию, функция `open()` позволяет только читать файл. Чтобы перезаписать файл, мы можем передать аргумент `'w'`. Например:

In [9]:
# Добавляем второй параметр в функцию, 'w' означает write.
# Если передаём 'w+', то сможем выполнять и чтение, и запись.

my_file = open('test.txt','w+')

### <strong><font color='red'>Будьте осторожны!</font></strong> 
Открывая файл с помощью `'w'` или `'w+'`, существующий файл очищается, то есть всё что было в файле **удаляется**!

In [10]:
# Записываем строку в файл
my_file.write('This is a new line')

18

In [11]:
# Читаем из файла
my_file.seek(0)
my_file.read()

'This is a new line'

In [12]:
my_file.close()  # всегда делайте close, когда закончили работу с файлом

## Добавление данных в файл (append)
Значение `'a'` открывает файл и ставит курсор в конец файла, поэтому всё, что будет записано - будет записано (добавлено) в конец файла. По аналогии с `'w+'`, `'a+'` позволяет читать файл и записывать в файл. Если файл не существует, то он будет создан.

In [13]:
my_file = open('test.txt','a+')
my_file.write('\nThis is text being appended to test.txt')
my_file.write('\nAnd another line here.')

23

In [14]:
my_file.seek(0)
print(my_file.read())

This is a new line
This is text being appended to test.txt
And another line here.


In [15]:
my_file.close()

### Добавление данных с помощью `%%writefile`
Мы можем сделать то же самое с помощью магии IPython:

In [16]:
%%writefile -a test.txt

This is text being appended to test.txt
And another line here.

Appending to test.txt


Если Вы хотите, чтобы первая строка начиналась с новой строки, то добавьте пробел, поскольку Jupyter не распознает символы экранирования, такие как `\n`

## Проход по файлу

Давайте рассмотрим цикл for для прохода по текстовому файлу. Сначала создадим новый текстовый файл с помощью магии IPython:

In [17]:
%%writefile test.txt
First Line
Second Line

Overwriting test.txt


Теперь мы можем создать цикл, который пройдет по файлу строка за строкой, и сделает что-то:

In [18]:
for line in open('test.txt'):
    print(line)

First Line

Second Line


Не волнуйтесь, если это не вполне понятно - мы рассмотрим циклы for чуть позже. Но в двух словах, вот что мы сделали. Мы говорим, что для каждой строки файла, давайте распечатаем эту строку с помощью print. Здесь важно отметить следующие моменты:

1. Мы могли назвать объект "line" как угодно (см. пример ниже).
2. Поскольку мы не вызывали `.read()`, весь файл не был сохранен в памяти.
3. Обратите внимание на отступ во второй строке кода, для print. Этот отступ требуется в Python.

In [19]:
# Другой вариант того же кода
for asdf in open('test.txt'):
    print(asdf)

First Line

Second Line


Мы изучим это более подробно далее в этом курсе!