## Основной метод:
fileobj = open(filename, mode, coding)

filename - путь к файлу

coding - кодировка (ASCII, UTF-8, CP1251 и др.)

mode — это строка, указывающая на тип файла и действия, которые вы хотите над ним произвести.
Первая буква строки mode указывает на операцию:
* r означает чтение;
* w означает запись. Если файла не существует, он будет создан. Если файл существует, он будет перезаписан;
* x означает запись, но только если файла еще не существует;
* a означает добавление данных в конец файла, если он существует.

Вторая буква строки mode указывает на тип файла:
* t (или ничего) означает, что файл текстовый;
* b означает, что файл бинарный

|          Режим          |  r   |  r+  |  w   |  w+  |  a   |  a+  |
| :--------------------: | :--: | :--: | :--: | :--: | :--: | :--: |
|          Чтение          |  +   |  +   |      |  +   |      |  +   |
|         Запись          |      |  +   |  +   |  +   |  +   |  +   |
|         Создание         |      |      |  +   |  +   |  +   |  +   |
|         Перезапись          |      |      |  +   |  +   |      |      |
| Курор в начале |  +   |  +   |  +   |  +   |      |      |
|    Курсор в конце    |      |      |      |      |  +   |  +   |

Какой режим использовать?
<img src="imgs/fileIO.png" width="600"/>

## Байтовые файлы / строки
Это обычные файлы, разбивающиеся на куски равного размера в двоичной / шестнадцатиричной / двоичной системе.

`00000000  89 50 4e 47 0d 0a 1a 0a  00 00 00 0d 49 48 44 52  |.PNG........IHDR|`

`00000010  00 00 00 87 00 00 00 a0  08 03 00 00 00 11 90 8f  |................|`

`00000020  b6 00 00 00 04 67 41 4d  41 00 00 d6 d8 d4 4f 58  |.....gAMA.....OX|`

`00000030  32 00 00 00 19 74 45 58  74 53 6f 66 74 77 61 72  |2....tEXtSoftwar|`

`00000040  65 00 41 64 6f 62 65 20  49 6d 61 67 65 52 65 61  |e.Adobe ImageRea|`

`00000050  64 79 71 c9 65 3c 00 00  03 00 50 4c 54 45 22 22  |dyq.e<....PLTE""|`

`00000060  22 56 56 56 47 47 47 33  33 33 30 30 30 42 42 42  |"VVVGGG333000BBB|`

`00000070  4b 4b 4b 40 40 40 15 15  15 4f 4f 4f 2c 2c 2c 3c  |KKK@@@...OOO,,,<|`

`00000080  3c 3c 3e 3e 3e 3a 39 39  04 04 04 1d 1d 1d 35 35  |<<>>>:99......55|`

`00000090  35 51 50 50 37 37 37 11  11 11 25 25 25 0d 0d 0d  |5QPP777...%%%...|`

`000000a0  27 27 27 1a 1a 1a 38 38  38 2a 2a 2a 08 08 08 20  |''' ...888**...  |`

`000000b0  20 20 17 17 17 2e 2e 2e  13 13 13 bb bb bb 88 88  |  .............. |`

## Запись/перезапись:

In [1]:
# откроем файл для перезаписи или создадим новый для записи
file = open(r'text_files\new_file.txt', 'w')

In [2]:
file.read()

UnsupportedOperation: not readable

In [3]:
py_zen='''Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!'''

In [4]:
# функция write возвращает число записанных байтов
file.write(py_zen)

822

In [5]:
# важно в конце работы файл закрыть, иначе он так и останется висеть открытым в процессе Python, 
# и придётся вырубать процесс через диспетчер задач
file.close()

## Чтение:

In [7]:
file = open(r'text_files\new_file.txt', 'r')
text = file.read()
print(text)
file.close()

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


Сначала функция поищет файл, считая название как относительный путь. Если не найдёт, то попробует как абсолютный.

Пути вводятся через "/" в Unix и через "\" в Windows.

Поэтому не забудьте указать Python, что ему не нужно искать в строке спецсимволы или регулярные выражения, иначе в строке ниже он начнёт искать \U, \i и т.д.

Используйте перед строкой модификатор **r** (т.е. raw string - сырая строка)

In [8]:
file = open(r'C:\Users\iom96\Google Диск\НИР\Python\PythonIntroCourse2020\notebooks\new_file.txt', 'r')
text = file.read()
print(text)
file.close()

FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\iom96\\Google Диск\\НИР\\Python\\PythonIntroCourse2020\\notebooks\\new_file.txt'

In [9]:
text_sep = text.split("\n")
text_sep

['Beautiful is better than ugly.',
 'Explicit is better than implicit.',
 'Simple is better than complex.',
 'Complex is better than complicated.',
 'Flat is better than nested.',
 'Sparse is better than dense.',
 'Readability counts.',
 "Special cases aren't special enough to break the rules.",
 'Although practicality beats purity.',
 'Errors should never pass silently.',
 'Unless explicitly silenced.',
 'In the face of ambiguity, refuse the temptation to guess.',
 'There should be one-- and preferably only one --obvious way to do it.',
 "Although that way may not be obvious at first unless you're Dutch.",
 'Now is better than never.',
 'Although never is often better than *right* now.',
 "If the implementation is hard to explain, it's a bad idea.",
 'If the implementation is easy to explain, it may be a good idea.',
 "Namespaces are one honking great idea -- let's do more of those!"]

## Построчное чтение:

In [10]:
# файлы могут быть большими и не помещаться в оперативной памяти
file = open(r'text_files\new_file.txt', 'r')

while True:
#     можно работать с ним построчно
    line = file.readline()
    if not line:
        break
    else:            
#         tell показывает позицию курсора в файле
        print(file.tell())
        print(line)
file.close()

31
Beautiful is better than ugly.

65
Explicit is better than implicit.

96
Simple is better than complex.

132
Complex is better than complicated.

160
Flat is better than nested.

189
Sparse is better than dense.

209
Readability counts.

265
Special cases aren't special enough to break the rules.

301
Although practicality beats purity.

336
Errors should never pass silently.

364
Unless explicitly silenced.

422
In the face of ambiguity, refuse the temptation to guess.

492
There should be one-- and preferably only one --obvious way to do it.

559
Although that way may not be obvious at first unless you're Dutch.

585
Now is better than never.

634
Although never is often better than *right* now.

693
If the implementation is hard to explain, it's a bad idea.

758
If the implementation is easy to explain, it may be a good idea.

822
Namespaces are one honking great idea -- let's do more of those!


In [11]:
# файлы могут быть большими и не помещаться в оперативной памяти
file = open(r'text_files\new_file.txt', 'r')
print(file.tell())
print(file.readline())
print(file.tell())

file.seek(0)

print(file.tell())
print(file.readline())
print(file.tell())

file.close()

0
Beautiful is better than ugly.

31
0
Beautiful is better than ugly.

31


## Менеджеры контекста with ... as
Используются, чтобы "обернуть" ваш код некоторым менеджером, который заменит конструкцию **try-except-finally**


```
"with" expression ["as" target] ("," expression ["as" target])* ":"

    code
```

менеджер функции open заставляет интерпретатор **обязательно закрыть файл**, что очень удобно

In [13]:
with open(r'text_files\new_file.txt', 'r', encoding='utf-8') as file:
    text = file.read()
    print(text)

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!



In [14]:
# файл уже закрыт, читать не могу
file.read()

ValueError: I/O operation on closed file.

## Структурированные файлы
Python умеет работать с более сложными файлами:
* .csv
* XML
* HTML
* JSON
* YAML
* и др.

Разумный вариант - найти библиотеку (встроенную или стороннюю), которая умеет парсить их и затем работать.

In [15]:
# Python умеет работать с .csv-файлами
import csv
with open(r'text_files\new_file.csv', 'r') as file:
    csv_text = csv.reader(file)
    acc = [row for row in csv_text] 
          
acc

FileNotFoundError: [Errno 2] No such file or directory: 'text_files\\new_file.csv'

In [29]:
# но разумнее установить для этого библиотеку Pandas (от англ. Pan Data)
import pandas as pd
data = pd.read_csv(r'text_files\new_file.csv', sep=';')
data

Unnamed: 0,col1,col2,col3
0,val1,val2,val3
1,1,2,3


## Хорошо бы сюда добавить информацию про OS и Paths
Например, [отсюда](https://www.datacamp.com/community/tutorials/reading-writing-files-python)