## С какими файлами мы будем работать

### файлы с расширением .txt — текстовые файлы
Используются для хранения неструктурированной информации в виде текста. Их можно открыть в любом текстовом редакторе (например, Блокноте). В конце таких файлов лучше оставлять перенос строки, чтобы последней была пустая строка. Это нужно для того, чтобы избежать ошибок при чтении файла. Также его следует сохранять в той же кодировке, в которой собираетесь работать (в нашем случае это UTF-8).

### файлы с расширением .csv — Comma-Separated Values (значения, разделённые запятыми)
Используются для хранения табличных данных. Данные записаны по строкам, а разделение по столбцам происходит с помощью запятых, отделяющих значения друг от друга. При необходимости разделитель можно поменять: вместо запятой могут стоять, например, точка с запятой или пробел. Главное, чтобы сохранялась структура строк и столбцов. Тогда эти файлы можно будет открыть не только текстовом редакторе (например, Блокноте), но и в редакторе таблиц (например, Excel и Google Sheets) — чтобы получить классическое табличное представление. В конце таких файлов также лучше ставить перенос строки и сохранять в нужной кодировке.

## Общая информация о чтении из файла и записи в файл

# Чтение из файла

_Примечание: если вы вдруг работаете не в Jupyter, а в Google Collaboratory, то сейчас лучше все же перейти в Jupyter, чтобы избежать сложностей с тем, что у онлайн-лаборатории нет доступа к другим файлам на вашем Google-диске._

## считать .txt
Существуют разные способы открыть файл. Мы воспользуемся тем, который сам же и закроет файл. Это удобно, так как если забыть закрыть файл, можно потерять данные — особенно при записи. Конструкция `with open() as` открывает файл, позволяет взять из него все, что нужно, и закрывает файл.

В `open()` передаем название файла (который лежит в той же папке, что и код), а после `as` пишем псевдоним, с помощью которого будем обращаться к файлу внутри программы.

In [None]:
with open('text.txt') as infile: # Открываем файл: пишем название файла и выбираем ему псевдоним
    print(infile)                     # Пробуем распечатать считанный файл

<_io.TextIOWrapper name='text_file.txt' mode='r' encoding='UTF-8'>


При попытке распечатать считанный файл получаем следующую информацию:

* `_io.TextIOWrapper` — это служебная информация о том, как Python внутри себя видит файл;
* `name='text_file.txt'` показывает имя исходного текстового файла, для которого мы выбрали псевдоним `infile`;
* `mode='r'` означает, что мы открыли этот файл только для чтения (`'r'` — _read_);
* `encoding='UTF-8'` показывает, что файл имеет кодировку UTF-8.

Мы могли бы прописать эти параметры в явном виде. Если возникают проблемы с кодировкой (содержимое файла отображается непонятными значками вместо букв), нужно указывать требуемую кодировку как раз таким образом.

In [None]:
with open('text.txt', mode='r', encoding='UTF-8') as infile: # Прописываем все параметры в явном виде
    print(infile)

<_io.TextIOWrapper name='text_file.txt' mode='r' encoding='UTF-8'>


Однако пока мы не видели содержимого файла. Давайте это исправим.

In [None]:
text = ''                # Создаем пустую строку, в которой будем хранить текст из файла
with open('text.txt', encoding='UTF-8') as infile:
    for line in infile:  # Сохраняем поочередно каждую строку файла infile в переменную line,
        text += line     # Добавляем новую строку к переменной text
print(text)              # Смотрим, как выглядит считанный текст

Привет! Это первая строка в файле.
А это вторая строка.

Третья строка была пустой, а это уже четвертая строка.



Чтобы понять, как Python видит переносы строк, мы можем сделать не стандартный вывод через `print()`, а просто написать название переменной и запустить код. Это позволит посмотреть, что находится "внутри" переменной, и увидеть все специальные символы.

In [None]:
text

'Привет! Это первая строка в файле.\nА это вторая строка.\n\nТретья строка была пустой, а это уже четвертая строка.'

При необходимости мы могли бы с помощью `strip()` удалить переносы строк и записать всё без `\n` в одну строку:

In [None]:
text = ''
with open('text.txt', encoding='UTF-8') as infile:
    for line in infile:
        text += line.strip() + ' ' # Удаляем пробельные символы по краям строки
                                   # Добавляем новую строку и пробел к переменной text
print(text)

Привет! Это первая строка в файле. А это вторая строка.  Третья строка была пустой, а это уже четвертая строка. 


## считать .csv
Точно так же можно открыть .csv файл и считать его в строку:

In [None]:
csv_data = ''            # Создаем пустую строку, в которой будем хранить информацию
with open('text.csv', encoding='UTF-8') as infile: # открываем файл под псевдонимом
    for line in infile:  # Сохраняем поочередно каждую строку файла infile в переменную line,
        csv_data += line # Добавляем новую строку к переменной csv_data,
print(csv_data)          # Смотрим, как выглядит считанный файл

Фамилия, Имя, Отчество, год рождения
Иванов, Иван, Иванович, 1980
Петрова, Ирина, Михайловна, 2000



При этом csv_data — это просто строка.

In [None]:
csv_data

'Фамилия, Имя, Отчество, год рождения\nИванов, Иван, Иванович, 1980\nПетрова, Ирина, Михайловна, 2000\n'

Чтобы работать с ней как с таблицей, потребуются дополнительные действия, о которых пойдет речь позже. А пока давайте научимся не только читать из файла, но и записывать в файл.

# 3. Запись в файл

In [None]:
important_text = 'Это очень важный текст. В нем даже несколько строк. \nОни отделены переносом строки.'
with open('info.txt', 'w') as outfile:    # Открываем файл, указываем, что это файл для записи:                                        # 'w', можем явно указать кодировку
    print(important_text, file=outfile)   # Печатаем в файл, передавая его псевдоним в качестве аргумента функции print()

In [None]:
important_text_2 = 'Это другой важный текст.'
with open('info.txt', 'w') as outfile:        # Открываем тот же файл, можем явно указать кодировку
    print(important_text_2, file=outfile)

In [None]:
important_text_3 = 'Это третий важный текст. Надеемся, что он запишется после второго'
with open('info.txt', 'a') as outfile:    # Открываем тот же файл, указываем, что это файл для ДОзаписи: 'a' (append)
    print(important_text_3, file=outfile)



Мы открываем файл с помощью конструкции `with open() as`, которая потом и закрывает файл.

Мы использовали три режима открытия файлов:
1. `mode='r'` — _read,  **чтение**_. При отсутствии указанного файла выдается ошибка. Это режим по умолчанию.
1. `mode='w'` — _write, **запись**_. При отсутствии указанного файла создается новый. При наличии файла содержимое перезаписывается.
1. `mode='a'` — _append, **дозапись**_. При отсутствии указанного файла создается новый. При наличии файла новое содержимое дозаписывается после имеющегося.

# Практика

### №1
Напишите функцию read_df(lines, file), которая будет открывать определенный файл и выводить на печать построчно последние строки в количестве lines (на всякий случай проверим, что задано положительное целое число). Протестируем функцию на файле data_1.txt со следующим содержимым:

Вечерело
Жужжали мухи
Светил фонарик
Кипела вода в чайнике
Венера зажглась на небе
Деревья шумели
Тучи разошлись
Листва зеленела

### №2
Требуется создать csv-файл data.csv со следующими столбцами:
– № - номер по порядку (от 1 до 300);
– Секунда – текущая секунда на вашем компьютере;
– Микросекунда – текущая миллисекунда на часах.
На каждой итерации цикла искусственно приостанавливайте скрипт на 0,01 секунды.

### №3
 Напишите программу на Python для чтения всего текстового файла.

### №4 Напишите программу на Python для чтения первых n строк файла.

### №5
Напишите программу на Python для добавления текста в файл и отображения текста.

### №6
Напишите программу на Python для чтения последних n строк файла.

### №7 Напишите программу на Python для построчного чтения файла и сохранения его в списке.

### №8
Напишите программу на Python для построчного чтения файла и сохраните его в переменной.

### №9
Напишите программу на Python для подсчета количества строк в текстовом файле.

### №10
Напишите программу на Python для записи списка в файл.