## Работа с файлами

### *Путь к файлу*

Для начала стоит вообще понять, *где мы находимся*. 

Путь к файлу бывает:
* абсолютный,
* относительный.

***В чем разница?***

**Абсолютный путь** $-$ это весь путь от "корневой папки". В Colab / Linux он начинается со слэша, а в Windows - с названия диска (`C:\Users\User\Documents\py1\sem08_file_io_katia.ipynb`).<br>
**Относительный путь** $-$ это путь от домашней / рабочей директории. Начинается с названия папки / файла внутри директории.

***Чем плох относительный путь?***

а. Вы можете забыть, где ваша рабочая / домашняя директория.<br>
б. Человеку, запускающему ваш код придется подстраивать его под свои директории.

***Чем плох абсолютный путь?***

Он специфичен относительно операционной системы (как раз, корневая папка, направление слэшей)

Способы решения проблемы:
1. класть в рабочую директорию всегда и без всяких подпапок, что бы путь выглядел просто так: `'my_file.txt'`
2. пользоваться библиотекой `pathlib`, которая за вас построит путь

Для второго способа потребуются:
* `pathlib.Path()` $-$ генерирует путь из аргументов, поданных через запятую
* `pathlib.Path.cwd()` $-$ показывает рабочую директорию

In [2]:
import pathlib


path_to_file = pathlib.Path(pathlib.Path.cwd(), 'some_folder', 'some_file.csv')

In [3]:
print(path_to_file)

c:\Users\User\Documents\семики\py1\some_folder\some_file.csv


### *Файлы*

***Порядок действий***:
1. открыть файл
2. выполнить какие-то действия
3. закрыть файл (!!)

Все постоянно забывают о последнем пункте, но так делать низя!

1. ***Как открыть файл?***

При помощи функции `open()`:

```python
open('path/to/file.txt', 'mode', encoding='encoding_of_file')
```

У нее есть три аргумента:
1. путь к файлу (тут мы уже все обсудили)
2. режим открытия:

| Режим | Обозначение                                                     |
|-------|-----------------------------------------------------------------|
| `'r'` | открытие на чтение (значение по умолчанию)                      |
| `'w'` | открытие на запись:<br> - содержимое файла **удаляется**, если файл существует,<br> - создается новый, если файла не существует               |
| `'x'` | открытие на запись, если файла не существует, иначе исключение  |
| `'a'` | открытие на дозапись, информация добавляется в конец файла      |
| `'b'` | открытие в двоичном режиме                                      |

3. кодировка (чаще всего `encoding='utf-8'`, но иногда случается...)



In [4]:
matrix_file = open('the_matrix.txt', 'r', encoding='utf-8')

In [5]:
new_file = open('new_file.txt', 'w', encoding='utf-8')

In [6]:
new_file = open('new_file.txt', 'x', encoding='utf-8')

FileExistsError: [Errno 17] File exists: 'new_file.txt'

2. ***Как закрыть файл?***

При помощи операции над переменной `.close()`

In [7]:
matrix_file.close()
new_file.close()

3. ***Как не забывать закрывать файл?***

Пользоваться альтернативной конструкцией:

```python
with open('path/to/file.txt', 'mode', encoding='utf-8') as file_name:
    # do something
```

*Что важно?*
- не надо думать о том, чтобы закрывать файл, так как он автоматически закрывается по окончании тела конструкции
- сначала кажется более громоздкой, но действительно удобнее!

4. ***Как прочитать текст в файле?***
    * `.read()` - читает текст целиком и возвращает строку;
    * `.readlines()` - читает текст по строкам (до переноса строки, заметьте, что `\n` на уонце останется) и возвращает список строк (`list`);
    * `.readline()` - читает одну строку из текста (до переноса строки) и возвращает.

Прочитать текст можно только один раз (чтобы сделать это второй раз из того же файла, надо его закрыть и открыть заново)!


In [8]:
with open('the_matrix.txt', encoding='utf-8') as matrix_file:
    text_matrix = matrix_file.read()
    print(text_matrix[:100])

           by

Larry and Andy Wachowski




                 NUMBERED SHOOTING SCRIPT

             


In [16]:
with open('the_matrix.txt', encoding='utf-8') as matrix_file:
    text_matrix_1 = matrix_file.read()
    print(text_matrix_1[:100])
    print('\n-------------------\n')

    # второй раз файл открыть не получится...
    text_matrix_2 = matrix_file.read()
    print(text_matrix_2[100:200])
    print('\n-------------------\n')
    
    # но если очень хочется...
    matrix_file.seek(0)
    text_matrix_3 = matrix_file.read()
    print(text_matrix_3[100:200])
    print('\n-------------------\n')

           by

Larry and Andy Wachowski




                 NUMBERED SHOOTING SCRIPT

             

-------------------



-------------------

    March 29, 1998
    FADE IN:


1   ON COMPUTER SCREEN                                           

-------------------



In [21]:
with open('the_matrix.txt', encoding='utf-8') as matrix_file:
    text_matrix = matrix_file.readlines()
    print(text_matrix[100:105])
    for i in range(100, 105):
        print(text_matrix[i], end='')

['                 I intend to, believe me. Someone\n', '                 has to.\n', '\n', '    The final NUMBER POPS into place --\n', '\n']
                 I intend to, believe me. Someone
                 has to.

    The final NUMBER POPS into place --



In [None]:
with open('the_matrix.txt', encoding='utf-8') as matrix_file:
    while (line := matrix_file.readline()):
        print(line.strip())

Еще можно дешево и сердито (но не оптимально по памяти):

In [None]:
with open('the_matrix.txt', encoding='utf-8') as matrix_file:
    for line in matrix_file:
      print(line)

#### Задание 1

Возьмите [этот](https://raw.githubusercontent.com/KatiaKozlova/files/refs/heads/main/three_thousand_years.txt) текст, сохраните его себе в формате `.txt`. Напишите программу, которая читает файл и…:
1. печатает сколько в этом файле строк.
2. выводит количество символов в каждой строке, а после этого — сколько всего символов во всем файле.

In [8]:
# ваш код здесь

5. ***Как записать текст в файл?***
    * `print('some_string', file=file_var)` $-$ печать в файл
    * `.write('some_string')` $-$ записывает строку;
    * `.writelines(['list ', 'of ', 'strings!'])` $-$ записывает список строк.

In [31]:
with open('new_file.txt', 'w', encoding='utf-8') as output_file:
    print('hello world!', file=output_file)

In [None]:
with open('new_file.txt', 'a', encoding='utf-8') as output_file:
    # не забываем про переносы в случае write(lines)!
    output_file.write('This is the file!\n\n')
    output_file.writelines(['Это файл\n', 'Я в него что-то пишу'])

*В чем проблема файлов?*

В том, что в них много лишнего! Поэтому файлы часто надо чистить:

In [None]:
with open('the_matrix.txt', encoding='utf-8') as matrix_file:
    for line in matrix_file:
        if line.strip():
            print(line.strip())

#### Задание 2

Однажды во время написания программы для учета заказов разработчик забыл добавить функцию, которая приводит имена пользователей к одинаковому виду (все имена должны быть с маленькой буквы). Из-за этого в базе данных заказов вида: `{имя_пользователя : [заказ1, заказ2, ...]}` появились двойники, e.g. *Андрей* / *андрей*. При этом заказы оказались разделены по двойникам. Помогите разработчику починить словарь $-$ собрать всех двойников воедино.

Изначальный словарь:
```python
{'андрей': [1202, 1203], 'Алексей': [2101, 2811], 'Андрей': [505], 'петр': [219, 303]}
```
Починенный словарь:
```python
{'андрей': [1202, 1203, 505], 'алексей': [2101, 2811], 'петр': [219, 303]}
```



In [None]:
# место для вашего кода

#### Задание 3

У пользователя есть несколько файлов. Он хочет объединить их в один. Напишите программу, которая спросит у пользователя все пути к файлам (названия вводятся одной строчкой через пробел) и соединит содержимое всех введенных файлов в один с именем, которое тоже нужно спросить у пользователя. В новом файле лучше как-то отделить содержимое изначальных файлов. Например, с помощью 2 переносов строк.

*Пример*
|Ввод                                                |
|:---------------------------------------------------|
|`file_one.txt` `file_two.txt`<br>`merge_result.txt` |

Содержимое исходных файлов:
- `file_one.txt`
    ```txt
    hello
    hi
    привет
    ```
- `file_two.txt`
    ```txt
    good bye
    bye
    пока
    ```
Содержимое полученного файла `merge_result.txt`:
```txt
hello
hi
привет


good bye
bye
пока
```

In [None]:
# ваш код тут

#### Задание 4

1. Имеется [файл](https://raw.githubusercontent.com/KatiaKozlova/files/main/marks.txt) с оценками: фамилия студента и его оценка через пробел (у одного человека может быть больше одной записи). Скачайте и прочитайте этот файл. Запишите его в словарь, где ключи — их фамилии, а значения — списки с их оценками (могут содержать одно значение).
2. Пользователь через пробел вводит фамилию студента и его оценку. Добавьте введенную строку в файл. Если студент есть в словаре, добавить в его список оценок введенную оценку, если нет — добавить студента в словарь.
3. Вывести пары: фамилия студента, его средняя оценка.
4. Сделать предыдущий пункт, но в лексикографическом (=алфавитном) порядке

In [None]:
# место для кода