# **9 Работа с файлами и форматированный вывод**

## *Содержание*
* [9.1 Интро](#9.1-Интро)
* [9.2 Строки, байты кодировки](#9.2-Строки,-байты-кодировки)
* [9.3 Режимы открытия файлов](#9.3-Режимы-открытия-файлов)
* [9.4 Позиционирование в файле](#Позиционирование-в-файле)
* [9.5 Оператор **`with`**](#9.5-Оператор-withh)
  *   [Простые формы работы с файлами](#Простые-формы-работы-с-файлами)
  *   [Работа с файлами при помощи оператора **`with`**](#Работа-с-файлами-при-помощи-оператора-with)
* [9.6 Форматирование строк](#Форматирование-строк)
  *   [Форматирование вывода на консоль](#Форматирование-вывода-на-консоль)
  *   [Старый стиль: **`%`**. Аналог С-форматирования функции printf()](#Старый-стиль:-%.-Аналог-С-форматирования-функции-printf())
  *   [Более продвинутый способ - через метод строки **`.format()`**](#Более-продвинутый-способ---через-метод-строки-.format())
  *   [Новейший метод **`f-строки`**](#Новейший-метод-f-строки)
* [9.7 Файлы в операционной системе](#9.7-Файлы-в-операционной-системе)
  *   [Файлы в операционной системе](#Файлы-в-операционной-системе)
  *   [Самая удобная функция для прохода по всем файлам - это функция `os.walk`](#Самая-удобная-функция-для-прохода-по-всем-файлам---это-функция-os.walk)
  *   [Ещё одна полезная фунция для получения размера файла `getsize`](#Ещё-одна-полезная-фунция-для-получения-размера-файла-getsize)
  *   [Следующая функция позволяет получить дату модификации файла `getmtime`](#Следующая-функция-позволяет-получить-дату-модификации-файла-getmtime)
  *   [Как сформировать правильный путь к файлу или директории с учётом особенностей ОС](#Как-сформировать-правильный-путь-к-файлу-или-директории-с-учётом-особенностей-ОС)
  *   [Ещё какие полезняшки есть](#Ещё-какие-полезняшки-есть)
* [9.8 Итоги модуля](##9.8-Итоги-модуля)

## **9.1** *Интро*

*`Цели урока:`*<br>
>Цель: научиться работать с файлами

<u>Файлы</u> - очень важная часть в жизни программ, т.к. программа обменивается с реальными миром реальными данными. В общем случае, - с потоком данных, но файл - <u>это один из видов потоков данных.</u>

И поэтому, на этом уроке мы пройдём очень важную часть: научимся `работать с файлами`

Задачи:
* Разобраться со строками, байтами и кодировками
* Узнать как читать и писать файлы в разных режимах
* Научиться позиционироваться в файле
* Понять зачем нужен оператор with
* Разобрать форматирование строк при выводе на консоль и в файл
* Попробовать работу с файлами на уровне ОС
* Практика
* Начинаем дипломный проект

## **9.2** *Строки, байты кодировки*

Что есть символы, что есть коды символов и что такое кодировка?<br>
Каждый символ, который хранится в компьютере - как некий код, и мы можем узнать какой код есть у символа и посмотреть какой символ какому коду соответствует.

`ord(char)` - показать код символа<br>
`chr(code)` - показать символ, соответствующий коду

In [3]:
print(ord('h'))
print(chr(104))

104
h


In [4]:
# вот как хранится строка в памяти
for ch in 'hello':
    print(ord(ch))

104
101
108
108
111


In [5]:
codes = [104, 101, 108, 108, 111, ]

# можно её обратно из кодов собрать
out = ''
for code in codes:
    out += chr(code)
print(out)

hello


In [6]:
# а какие вообще символы есть?
for code in range(128):
    print(code, hex(code), chr(code))

0 0x0  
1 0x1 
2 0x2 
3 0x3 
4 0x4 
5 0x5 
6 0x6 
7 0x7 
8 0x8
9 0x9 	
10 0xa 

11 0xb 
12 0xc 
13 0xd 
14 0xe 
15 0xf 
16 0x10 
17 0x11 
18 0x12 
19 0x13 
20 0x14 
21 0x15 
22 0x16 
23 0x17 
24 0x18 
25 0x19 
26 0x1a 
27 0x1b 
28 0x1c 
29 0x1d 
30 0x1e 
31 0x1f 
32 0x20  
33 0x21 !
34 0x22 "
35 0x23 #
36 0x24 $
37 0x25 %
38 0x26 &
39 0x27 '
40 0x28 (
41 0x29 )
42 0x2a *
43 0x2b +
44 0x2c ,
45 0x2d -
46 0x2e .
47 0x2f /
48 0x30 0
49 0x31 1
50 0x32 2
51 0x33 3
52 0x34 4
53 0x35 5
54 0x36 6
55 0x37 7
56 0x38 8
57 0x39 9
58 0x3a :
59 0x3b ;
60 0x3c <
61 0x3d =
62 0x3e >
63 0x3f ?
64 0x40 @
65 0x41 A
66 0x42 B
67 0x43 C
68 0x44 D
69 0x45 E
70 0x46 F
71 0x47 G
72 0x48 H
73 0x49 I
74 0x4a J
75 0x4b K
76 0x4c L
77 0x4d M
78 0x4e N
79 0x4f O
80 0x50 P
81 0x51 Q
82 0x52 R
83 0x53 S
84 0x54 T
85 0x55 U
86 0x56 V
87 0x57 W
88 0x58 X
89 0x59 Y
90 0x5a Z
91 0x5b [
92 0x5c \
93 0x5d ]
94 0x5e ^
95 0x5f _
96 0x60 `
97 0x61 a
98 0x62 b
99 0x63 c
100 0x64 d
101 0x65 e
102 0x6

получается таблица символов ASCII  https://ru.wikipedia.org/wiki/ASCII

То есть каждый символ имеет свой код. В пайтоне символы храняться в кодах unicode
http://foxtools.ru/Unicode
Эта таблица стандарт для ВСЕХ симвлов, которое придумало человечество

Это именно стандарт, а не кодировка — сам по себе Юникод не определяет,
как символы будут сохранятся на жестком диске или передаваться по сети.
Он лишь определяет связь между символом и некоторым числом

In [7]:
for code in range(1000, 1200):
    print(code, chr(code))

1000 Ϩ
1001 ϩ
1002 Ϫ
1003 ϫ
1004 Ϭ
1005 ϭ
1006 Ϯ
1007 ϯ
1008 ϰ
1009 ϱ
1010 ϲ
1011 ϳ
1012 ϴ
1013 ϵ
1014 ϶
1015 Ϸ
1016 ϸ
1017 Ϲ
1018 Ϻ
1019 ϻ
1020 ϼ
1021 Ͻ
1022 Ͼ
1023 Ͽ
1024 Ѐ
1025 Ё
1026 Ђ
1027 Ѓ
1028 Є
1029 Ѕ
1030 І
1031 Ї
1032 Ј
1033 Љ
1034 Њ
1035 Ћ
1036 Ќ
1037 Ѝ
1038 Ў
1039 Џ
1040 А
1041 Б
1042 В
1043 Г
1044 Д
1045 Е
1046 Ж
1047 З
1048 И
1049 Й
1050 К
1051 Л
1052 М
1053 Н
1054 О
1055 П
1056 Р
1057 С
1058 Т
1059 У
1060 Ф
1061 Х
1062 Ц
1063 Ч
1064 Ш
1065 Щ
1066 Ъ
1067 Ы
1068 Ь
1069 Э
1070 Ю
1071 Я
1072 а
1073 б
1074 в
1075 г
1076 д
1077 е
1078 ж
1079 з
1080 и
1081 й
1082 к
1083 л
1084 м
1085 н
1086 о
1087 п
1088 р
1089 с
1090 т
1091 у
1092 ф
1093 х
1094 ц
1095 ч
1096 ш
1097 щ
1098 ъ
1099 ы
1100 ь
1101 э
1102 ю
1103 я
1104 ѐ
1105 ё
1106 ђ
1107 ѓ
1108 є
1109 ѕ
1110 і
1111 ї
1112 ј
1113 љ
1114 њ
1115 ћ
1116 ќ
1117 ѝ
1118 ў
1119 џ
1120 Ѡ
1121 ѡ
1122 Ѣ
1123 ѣ
1124 Ѥ
1125 ѥ
1126 Ѧ
1127 ѧ
1128 Ѩ
1129 ѩ
1130 Ѫ
1131 ѫ
1132 Ѭ
1133 ѭ
1134 Ѯ
1135 ѯ
1136 Ѱ
1137 ѱ
1138 Ѳ
1139 ѳ
1140 Ѵ
1141 ѵ
1142 Ѷ

Но коды символов больших чем байт (256) будут занимать несколько байт.
Поэтому есть форматы представления текста - как хранить коды юникода.
например старший байт из двух/трех/етс идет первым или вторым?

Наиболее распространенным является представление [Юникода] UTF-8 - https://ru.wikipedia.org/wiki/UTF-8
и в реальности на дисках наши тексты сохраняются в одном из форматов представления

Как хранить не строки, но сами байты?
В пайтоне есть тип данных, который позволяет хранить "сырые байты" - bytes

In [8]:
bb = b'\xd1\x84'
print(bb)

b'\xd1\x84'


т.е. мы храним не коды символов, а сырые данные. Можем хранить, например, состояние БД или музыку... Но мы можем хранить и символы

In [9]:
# Тип bytes очень похож на str
bb = b'\xd0\xbf\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82'
print(bb)
print(type(bb))

b'\xd0\xbf\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82'
<class 'bytes'>


In [10]:
# по сути это неизменяемые последовательности целых чисел,
# поддерживают те же операции что и str
print(bb[0])
print(bb.count(0xd0)) # так пишется байтовый код в hex формате. А в литералах это: \xd0
print(b'he' + b'llo') # конкатенация байтовой строки как обычной

208
4
b'hello'


Полный список операций - https://goo.gl/7Cznir

In [27]:
# bytes - неизменяемые
bb[0] = 110

TypeError: 'bytes' object does not support item assignment

In [49]:
# Пусть есть байты
bb = b'\xd1\x84'

Это UTF-8 представление русской буквы. Какой?
давайте разберем (на основе описания формата  - https://goo.gl/Um4xUz)

In [29]:
print(bin(0xd1)) # представление hex символов в двоичном виде
print(bin(0x84))

0b11010001
0b10000100


тут в первом 110, а во втором 10 - это октеты. Далее следуют значащие биты кода символа<br>
конкатенируем ТОЛЬКО значащие биты нашего кода символа:

Код символа в юникоде занимает 2 байта, значит в первом байте будет 110 сначала, а во втором 10<br>
значащие биты 10001 и 000100

In [31]:
code = 0b10001000100
print(code)
print(hex(code))

1092
0x444


а это код русской буквы ф в юникоде

In [32]:
print(chr(code))

ф


т.е. сырая последовательность байт может в пределённом смысле кодировать в себе символы Юникода. И выполнив определённый алгоритм, мы можем узнать, что за символы там были закодированы.

При выводе на терминал есть особенности:<br>
Латинские символы ASCII (которые имеют код до 127) - занимают 1 `октет` кодировки и значащих бит у них - 7.<br>
И как раз в эти 7 бит умещаются 128 символов.
И при выводе на консоль они отображаются как символы, а не коды.<br>
т.е.:

In [51]:
bb = b'\x68\xd1\x84'
print(bb)
print(bb.hex())

b'h\xd1\x84'
68d184


на консоль выводиться та же буква 'h', что и в hex `x68` - такая фича **Python**<br>
(видимо для удобства англоговорящих программистов)

Т.е. при выводе на консоль видно, что символы имеют код, меньший 128

Так же есть изменяемый (*mutable*) аналог `bytes` - это `bytearray`<br>
`bytearray` - позволяет хранить изменяемые данные:

In [52]:
ba = bytearray(b'hello')  # т.к. агнлийские буквы, то представление внутри будет как байты
ba[0] = 32  # код пробела
print(ba)

bytearray(b' ello')


Создаваться `bytearray` может только через конструктор

In [54]:
print(bytearray())
print(bytearray(16))
print(bytearray(range(16)))
print(bytearray(b'hello'))  # изменяемой функции передали неизменяемый параметр
print(bytearray('привет', encoding='utf-8'))
print(bytearray('привет'.encode(encoding='utf-8')))

bytearray(b'')
bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00')
bytearray(b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f')
bytearray(b'hello')
bytearray(b'\xd0\xbf\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82')
bytearray(b'\xd0\xbf\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82')


Для преобразования байтов в строку и обратно есть две функции:

In [58]:
# строка в байты (Юникодную строку кодируем в кодировке):
print('привет'.encode(encoding='utf-8'))
print('привет'.encode(encoding='utf-16'))
print('привет'.encode(encoding='cp866'))  # DOS кодировка
print('привет'.encode(encoding='utf-8').decode(encoding='utf-8')) # кодируем и тут же декодируем

b'\xd0\xbf\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82'
b'\xff\xfe?\x04@\x048\x042\x045\x04B\x04'
b'\xaf\xe0\xa8\xa2\xa5\xe2'
привет


То есть мы хотим ЗАКОДИРОВАТЬ коды Юникода в нужное представление

список всех кодировок - https://docs.python.org/3.5/library/codecs.html#standard-encodings

In [62]:
# байты в строку:
ss = b'\xd0\xbf\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82'.decode(encoding='utf-8') # нам нужно знать правильную кодировку последовательности байтов
print(ss)

привет


то есть обратная операция - ДЕКОДИРОВНИЕ из байтов (представления) в строку (unicode)

А как пайтон узнает что мы в текстах программ пайтон используем определенную кодировку?<br>
за это отвечает такой вот комментарий в первой или второй строке модуля:<br>
`# -*- coding: utf-8 -*-`<br>
если такого комментария нет - то предполагается UTF-8 (по умолчанию используется во всех операционных системах)<br>
`!НО` на диске всё хранится ввиде байтов `xd0\xbf` и т.д.<br>
https://docs.python.org/3/reference/lexical_analysis.html#encoding-declarations

`Итоги:`<br>
- Символы - это то, что человек читает и у каждого символа есть Юникод. В этом стандарте есть <u>все символы</u>,<br>
которые придумало человечество.<br>
- А форматы представления этих символов в сыром виде описаны с помощью этих форматов представления, которые называются UTF.<br>
- И чтобы прочитать файл из кодировки, нам нужно знать в какой кодировке нам пришёл этот файл.<br>
- **Python** может хранит последовательность 'сырых' байтов в специальном типе, который называется `bytes`, - этот тип<br>
очень похож на строку (неизменяемый объект), следовательно, можно конкатенировать, читать ... и делать любые операции,<br>
что и со строками.<br>
- Чтобы создать изменяемую последовательность байт, - есть такой тип - `bytearray`

In [1]:
ss = '# -*- coding: utf-8 -*-'

In [36]:
sss = ss.encode('utf-16')
sss

b'\xff\xfe#\x00 \x00-\x00*\x00-\x00 \x00c\x00o\x00d\x00i\x00n\x00g\x00:\x00 \x00u\x00t\x00f\x00-\x008\x00 \x00-\x00*\x00-\x00'

In [32]:
b'\xff\xfe#\x00 \x00-\x00*\x00-\x00 \x00c\x00o\x00d\x00i\x00n\x00g\x00:\x00 \x00u\x00t\x00f\x00-\x008\x00 \x00-\x00*\x00-\x00'.decode('utf-16')

'# -*- coding: utf-8 -*-'

## **9.3** *Режимы открытия файлов*

Итак, изучив кодировки, мы можем приступить к изучению файлов.<br>
**`Файл`** - это упорядоченная совокупность байтов, которая хранится на диске и/или занимает отдельную область внешней памяти

In [7]:
from pprint import pprint

In [6]:
# Файл можно открыть для чтения и прочитать в память содержимое
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\\byron.txt'
file = open(file_name, mode='rb')  # mode (режим): чтение бинарное
file_content = file.read()
file.close()
pprint(file_content)

(b'My soul is dark - Oh! quickly string\r\n     The harp I yet can brook to h'
 b"ear;\r\nAnd let thy gentle fingers fling\r\n     Its melting murmurs o'er mi"
 b'ne ear.\r\nIf in this heart a hope be dear,\r\n     That sound shall charm i'
 b"t forth again:\r\nIf in these eyes there lurk a tear,\r\n     'Twill flow, a"
 b'nd cease to burn my brain.\r\n\r\nBut bid the strain be wild and deep,\r\n'
 b'     Nor let thy notes of joy be first:\r\nI tell thee, minstrel, I must w'
 b'eep,\r\n     Or else this heavy heart will burst;\r\nFor it hath been by sor'
 b"row nursed,\r\n     And ached in sleepless silence, long;\r\nAnd now 'tis do"
 b'omed to know the worst,\r\n     And break at once - or yield to song.\r\n')


Имя файла может быть с путем по файловой системе,<br>
если путь не указан - то ищется в рабочей директории скрипта<br>
Начиная работать с файлами, мы касаемся окружения пайтона - операционной системы.<br>
И тут возможны ошибки ОС: файл не найден, у пользователя нет доступа к файлу и т.п.

In [9]:
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\\byron777.txt'
file = open(file_name, mode='rb')  # mode (режим): чтение бинарное
file_content = file.read()
file.close()
pprint(file_content)

FileNotFoundError: [Errno 2] No such file or directory: 'D:\\Курсы\\Skillbox\\Основы Python\\python_homeworks\\lesson_009\\python_snippets\\byron777.txt'

In [10]:
# С русскими символами все не так просто
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\pushkin.txt'
file = open(file_name, mode='rb')
file_content = file.read()
file.close()
pprint(file_content) # в сыром байтовом коде не видно русских символов

(b'\xd0\x97\xd0\xb8\xd0\xbc\xd0\xbd\xd0\xb5\xd0\xb5 \xd1\x83\xd1'
 b'\x82\xd1\x80\xd0\xbe\r\n\r\n\xd0\x9c\xd0\xbe\xd1\x80\xd0\xbe\xd0\xb7 '
 b'\xd0\xb8 \xd1\x81\xd0\xbe\xd0\xbb\xd0\xbd\xd1\x86\xd0\xb5; \xd0\xb4\xd0'
 b'\xb5\xd0\xbd\xd1\x8c \xd1\x87\xd1\x83\xd0\xb4\xd0\xb5\xd1\x81'
 b'\xd0\xbd\xd1\x8b\xd0\xb9!\r\n\xd0\x95\xd1\x89\xd0\xb5 \xd1\x82\xd1\x8b'
 b' \xd0\xb4\xd1\x80\xd0\xb5\xd0\xbc\xd0\xbb\xd0\xb5\xd1\x88\xd1\x8c, \xd0'
 b'\xb4\xd1\x80\xd1\x83\xd0\xb3 \xd0\xbf\xd1\x80\xd0\xb5\xd0\xbb'
 b'\xd0\xb5\xd1\x81\xd1\x82\xd0\xbd\xd1\x8b\xd0\xb9 \xe2\x80\x94\r\n\xd0\x9f'
 b'\xd0\xbe\xd1\x80\xd0\xb0, \xd0\xba\xd1\x80\xd0\xb0\xd1\x81\xd0\xb0\xd0\xb2'
 b'\xd0\xb8\xd1\x86\xd0\xb0, \xd0\xbf\xd1\x80\xd0\xbe\xd1\x81\xd0\xbd\xd0\xb8'
 b'\xd1\x81\xd1\x8c:\r\n\xd0\x9e\xd1\x82\xd0\xba\xd1\x80\xd0\xbe\xd0\xb9 '
 b'\xd1\x81\xd0\xbe\xd0\xbc\xd0\xba\xd0\xbd\xd1\x83\xd1\x82\xd1\x8b'
 b' \xd0\xbd\xd0\xb5\xd0\xb3\xd0\xbe\xd0\xb9 \xd0\xb2\xd0\xb7\xd0\xbe\xd1\x80'
 b'\xd1\x8b\r\n\xd0\x9d\xd0\xb0\xd0\xb2\xd

In [12]:
# поэтому перекодируем в UTF-8
pprint(file_content.decode('utf8'))

('Зимнее утро\r\n'
 '\r\n'
 'Мороз и солнце; день чудесный!\r\n'
 'Еще ты дремлешь, друг прелестный —\r\n'
 'Пора, красавица, проснись:\r\n'
 'Открой сомкнуты негой взоры\r\n'
 'Навстречу северной Авроры,\r\n'
 'Звездою севера явись!\r\n'
 '\r\n'
 'Вечор, ты помнишь, вьюга злилась,\r\n'
 'На мутном небе мгла носилась;\r\n'
 'Луна, как бледное пятно,\r\n'
 'Сквозь тучи мрачные желтела,\r\n'
 'И ты печальная сидела —\r\n'
 'А нынче... погляди в окно:\r\n'
 '\r\n'
 'Под голубыми небесами\r\n'
 'Великолепными коврами,\r\n'
 'Блестя на солнце, снег лежит;\r\n'
 'Прозрачный лес один чернеет,\r\n'
 'И ель сквозь иней зеленеет,\r\n'
 'И речка подо льдом блестит.\r\n'
 '\r\n'
 'Вся комната янтарным блеском\r\n'
 'Озарена. Веселым треском\r\n'
 'Трещит затопленная печь.\r\n'
 'Приятно думать у лежанки.\r\n'
 'Но знаешь: не велеть ли в санки\r\n'
 'Кобылку бурую запречь?\r\n'
 '\r\n'
 'Скользя по утреннему снегу,\r\n'
 'Друг милый, предадимся бегу\r\n'
 'Нетерпеливого коня\r\n'
 'И навестим поля 

In [18]:
# Если режим будет 'r' то  автоматически перекодируется из UTF8, но можно указать кодировку
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\pushkin.txt'
# file = open(file_name, mode='r')  # mode (режим): чтение символьное
file = open(file_name, mode='r', encoding='utf8')
file_content = file.read()
file.close()
pprint(file_content)

('Зимнее утро\n'
 '\n'
 'Мороз и солнце; день чудесный!\n'
 'Еще ты дремлешь, друг прелестный —\n'
 'Пора, красавица, проснись:\n'
 'Открой сомкнуты негой взоры\n'
 'Навстречу северной Авроры,\n'
 'Звездою севера явись!\n'
 '\n'
 'Вечор, ты помнишь, вьюга злилась,\n'
 'На мутном небе мгла носилась;\n'
 'Луна, как бледное пятно,\n'
 'Сквозь тучи мрачные желтела,\n'
 'И ты печальная сидела —\n'
 'А нынче... погляди в окно:\n'
 '\n'
 'Под голубыми небесами\n'
 'Великолепными коврами,\n'
 'Блестя на солнце, снег лежит;\n'
 'Прозрачный лес один чернеет,\n'
 'И ель сквозь иней зеленеет,\n'
 'И речка подо льдом блестит.\n'
 '\n'
 'Вся комната янтарным блеском\n'
 'Озарена. Веселым треском\n'
 'Трещит затопленная печь.\n'
 'Приятно думать у лежанки.\n'
 'Но знаешь: не велеть ли в санки\n'
 'Кобылку бурую запречь?\n'
 '\n'
 'Скользя по утреннему снегу,\n'
 'Друг милый, предадимся бегу\n'
 'Нетерпеливого коня\n'
 'И навестим поля пустые,\n'
 'Леса, недавно столь густые,\n'
 'И берег, милый для м

In [20]:
# но можно указать кодировку
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\pushkin_cp1251.txt'
file = open(file_name, mode='r', encoding='cp1251')  # mode (режим): чтение символьное
file_content = file.read()
file.close()
pprint(file_content)
# Если файла на диске нет - будет ошибка

('Зимнее утро\n'
 '\n'
 'Мороз и солнце; день чудесный!\n'
 'Еще ты дремлешь, друг прелестный —\n'
 'Пора, красавица, проснись:\n'
 'Открой сомкнуты негой взоры\n'
 'Навстречу северной Авроры,\n'
 'Звездою севера явись!\n'
 '\n'
 'Вечор, ты помнишь, вьюга злилась,\n'
 'На мутном небе мгла носилась;\n'
 'Луна, как бледное пятно,\n'
 'Сквозь тучи мрачные желтела,\n'
 'И ты печальная сидела —\n'
 'А нынче... погляди в окно:\n'
 '\n'
 'Под голубыми небесами\n'
 'Великолепными коврами,\n'
 'Блестя на солнце, снег лежит;\n'
 'Прозрачный лес один чернеет,\n'
 'И ель сквозь иней зеленеет,\n'
 'И речка подо льдом блестит.\n'
 '\n'
 'Вся комната янтарным блеском\n'
 'Озарена. Веселым треском\n'
 'Трещит затопленная печь.\n'
 'Приятно думать у лежанки.\n'
 'Но знаешь: не велеть ли в санки\n'
 'Кобылку бурую запречь?\n'
 '\n'
 'Скользя по утреннему снегу,\n'
 'Друг милый, предадимся бегу\n'
 'Нетерпеливого коня\n'
 'И навестим поля пустые,\n'
 'Леса, недавно столь густые,\n'
 'И берег, милый для м

Реално на диске лежат файлы в сырых байтах - там нет никаких символов. Кодировку определяет ОС по умолчанию: cp1251 - для Windows, utf8 - для Linux и MacOS

In [22]:
# А что с записью? тоже все просто
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\out.txt'
file = open(file_name, mode='w', encoding='utf8')  # mode (режим): запись символьная, кодировка по умолчанию utf8
file_content = 'hello, мир!' # тут уже запись не в сырых байтах, а в юникоде (в соответствии с выбранной кодировкой)
file.write(file_content)
file.close()

In [25]:
# бинарный режим требует байтов
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\out.txt'
file = open(file_name, mode='wb')  # mode (режим): запись бинарная
file_content = b'hello'
file.write(file_content)
file.close()
# Если файла на диске нет - он будет создан, пустой

**`Важно!`** Когда мы открываем файл в режиме write, то файл весь обнуляется (т.е. всё, что там было - удаляется) и программа заново начинает туда писать<br>
Если файла на диске нету - то он будет создан пустой, а если есть - то он будет обнулён (перезаписан)

In [36]:
# режим добавления в конец (режим a - append)
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\out.txt'
file = open(file_name, mode='a')  # mode (режим): запись в конец
file_content = 'hello, мир! '
file.write(file_content)
file.close()
# Если файла на диске нет - он будет создан, пустой

Т.е. в данном случае, если файла на диске нету - то он будет создан пустой, а если есть - то он будет обновлён (добавлена запись в конец файла)

In [45]:
# режим чтение с записью
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\\byron.txt'
file = open(file_name, mode='r+')  # mode (режим): чтение с записью
file_content = file.read()
file.write('\n appended line!')
file.close()
pprint(file_content)
# Если файла на диске нет - будет ошибка

('My soul is dark - Oh! quickly string\n'
 '     The harp I yet can brook to hear;\n'
 'And let thy gentle fingers fling\n'
 "     Its melting murmurs o'er mine ear.\n"
 'If in this heart a hope be dear,\n'
 '     That sound shall charm it forth again:\n'
 'If in these eyes there lurk a tear,\n'
 "     'Twill flow, and cease to burn my brain.\n"
 '\n'
 'But bid the strain be wild and deep,\n'
 '     Nor let thy notes of joy be first:\n'
 'I tell thee, minstrel, I must weep,\n'
 '     Or else this heavy heart will burst;\n'
 'For it hath been by sorrow nursed,\n'
 '     And ached in sleepless silence, long;\n'
 "And now 'tis doomed to know the worst,\n"
 '     And break at once - or yield to song.\n'
 '\n'
 'appended line!\n'
 ' appended line!\n'
 ' appended line!')


In [47]:
# режим запись с чтением
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\out.txt'
file = open(file_name, mode='w+')  # mode (режим): запись с чтением
file_content = file.read()
file.write('\n appended line!')
file.close()
pprint(file_content)
# Если файла на диске нет - создастся пустой, если есть - обнулится

''


Т.е. в этом режиме файл открывается, считывается, потом всё удаляется - и записывается заново

*Итак, мы посмотрели как мы можем работать с файлами в **Python**: если нам нужен "сырой" файл - мы открываем его в бинарном режиме,*<br>
*или же, открываем закодированные файлы, - тогда нужно делать раскодирование файла, поэтому нам нужно указывать кодировку*

## **9.4** *Позиционирование в файле*

Т.к. **`Файл`** - это упорядоченная совокупность байтов, которая хранится на диске и/или занимает отдельную область внешней памяти,<br>
то файл можно представить как ленту на шоколадной фабрике, только вместо конфет - байты.<br>
Лента имеет начало и конец, каждая конфета пронумерована. И мы можем ходить вдоль ленты - брать или класть конфеты.<br>
Если файл открыт только для чтения (посмотреть на конфеты), - то при открытии файла стоим вначале ленты, на 0 месте,<br>
А при самом чтении - сдвигаемся вдоль ленты на количество прочитанных конфет.<br>
`file.tell()` говорит нам текущую позицию

In [49]:
import io
from pprint import pprint

Сначала посмотрим пример с Байроном:

In [50]:
file_name = r'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\byron.txt'
file = open(file_name, mode='r', encoding='utf8')
print(file.tell())

0


In [51]:
print('читаем 100 символов')
file_content = file.read(100)  # кол-во прочитываемого в символах
print(file_content)
print(file.tell())  # текущая позиция в байтах!

читаем 100 символов
My soul is dark - Oh! quickly string
     The harp I yet can brook to hear;
And let thy gentle finge
102


In [52]:
print('читаем остальное')
file_content = file.read()
print(file_content)
print(file.tell())  # в байтах!

file.close()

читаем остальное
rs fling
     Its melting murmurs o'er mine ear.
If in this heart a hope be dear,
     That sound shall charm it forth again:
If in these eyes there lurk a tear,
     'Twill flow, and cease to burn my brain.

But bid the strain be wild and deep,
     Nor let thy notes of joy be first:
I tell thee, minstrel, I must weep,
     Or else this heavy heart will burst;
For it hath been by sorrow nursed,
     And ached in sleepless silence, long;
And now 'tis doomed to know the worst,
     And break at once - or yield to song.

641


Потом - с Пушкиным:

In [53]:
# Позицию чтения можно менять - переходить в начала или в коннец
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\pushkin.txt'
file = open(file_name, mode='r', encoding='utf8')

In [54]:
file_content = file.read(100)  # в символах
print(file_content)

Зимнее утро

Мороз и солнце; день чудесный!
Еще ты дремлешь, друг прелестный —
Пора, красавица, прос


In [55]:
new_position = file.seek(0, io.SEEK_SET) # первый параметр фунткции - на сколько мы сдвигаемся, а второй пармаетр - это признак, от которого мы двигаемся
# io.SEEK_SET - начало файла
# io.SEEK_CUR - текущая позиция
# io.SEEK_END - конец файла

In [56]:
# т.е. мы перемещаемся на самое начало файла и начинаем читать всё сначала
file_content = file.read(100)  # в символах
print(file_content)

file.close()
# аналогично для записи

Зимнее утро

Мороз и солнце; день чудесный!
Еще ты дремлешь, друг прелестный —
Пора, красавица, прос


На на самом деле это движение по файлу при помощи метода `seek` используется достаточно редко. Только если используются бинарные файлы.<br>
В текстовых же файлах побайтове разделение символов может привести к ошибке (если мы случайно неудачно разделим побайтово один символ

In [72]:
# Свойства и функции у обьекта файл
file_name = 'D:\Курсы\Skillbox\Основы Python\python_homeworks\lesson_009\python_snippets\pushkin.txt'
file = open(file_name, mode='w', encoding='utf8')
# file.close()
pprint(file.name)
pprint(file.mode)
pprint(file.encoding)
pprint(file.closed)

('D:\\Курсы\\Skillbox\\Основы '
 'Python\\python_homeworks\\lesson_009\\python_snippets\\pushkin.txt')
'w'
'utf8'
False


In [73]:
pprint(file.readable())  # файл можно читать
pprint(file.writable())  # файл можно писать
pprint(file.seekable())  # файл поддерживает произвольный доступ (кем является файл на самом деле). Если файл находится на диске или в памяти - то True. Но могут и не иметь этого произвольного доступа

False
True
True


In [95]:
pprint(file.truncate(10)) # обрезает файл до указанного количества строк
pprint(file.flush()) # обычно файл буферезирован, флаш записвыает весь буфер на диск. Гораздо быстрее и производительнее - буферизировать (пишется на диск лишь один раз для 4Кб,
# но если файл большой, то этот параметр позволяет записывать на диск не буферизируя в ОЗУ. Это полезно ещё и когда нам нельзя терять данные при падении программы во время чтения файла.
# Это очень полезная функция, очень часто встречающаяся в промышленных программах. А при закрытии программы, буфер автоматически записывается на диск. Причём, это всё только при записи в файл.

10
None


Файлы по сути являются потоками байтов - streams. Т.е. более высокий уровень абстракции над файлом - это потоки.<br>
Потому что, мы можем представить что у нас есть труба - и из этой трубы летит поток байтов - это и есть поток (stream).<br>
Потоком может быть что угодно: запись с микрофона например, которая превращается также в поток байтов.<br>
Точно также происходит работа с файлом - потоковое чтение/запись.<br>
Можно сказать, что работа с файлами является наследником класса Потоки.<br>
Потоком также может быть поток байтов из сети (битовые потоки).<br>
И вот как раз, для таких вот поточных файлов параметр `seekable` может быть **`False`**.<br>
Т.е. мы в потоке байт, который нам льётся из сети (микрофона, камеры, контроллера ... etc.), позиционироваться не можем.<br>
А вот в файлах, которые уже записаны в памяти или на диске, - мы можем делать поиск (`seekable=`**`True`**).<br>
Но, в общем случае, файлы - это стримы, т.е. потоки.<br>
Почитать про стримы можно [здесь](https://docs.python.org/3/library/io.html)

*Итак, мы изучили то, как можно читать* ***файлы*** *кусочками, как по ним двигаться, ну и познакомились с теоретическими основами* ***потоков (стримов)***

## **9.5** *Оператор withh*

### Простые формы работы с файлами

In [60]:
# Чтение построчно - символ окончания строки - \n
file_name = '../../Основы Python/python_homeworks/lesson_009/python_snippets/pushkin.txt'
file = open(file_name, mode='r', encoding='utf8')
for line in file:  # если файл огромный - будет читать только строку
    print(line)
# file.close()

Зимнее утро



Мороз и солнце; день чудесный!

Еще ты дремлешь, друг прелестный —

Пора, красавица, проснись:

Открой сомкнуты негой взоры

Навстречу северной Авроры,

Звездою севера явись!



Вечор, ты помнишь, вьюга злилась,

На мутном небе мгла носилась;

Луна, как бледное пятно,

Сквозь тучи мрачные желтела,

И ты печальная сидела —

А нынче... погляди в окно:



Под голубыми небесами

Великолепными коврами,

Блестя на солнце, снег лежит;

Прозрачный лес один чернеет,

И ель сквозь иней зеленеет,

И речка подо льдом блестит.



Вся комната янтарным блеском

Озарена. Веселым треском

Трещит затопленная печь.

Приятно думать у лежанки.

Но знаешь: не велеть ли в санки

Кобылку бурую запречь?



Скользя по утреннему снегу,

Друг милый, предадимся бегу

Нетерпеливого коня

И навестим поля пустые,

Леса, недавно столь густые,

И берег, милый для меня.



1829 г.


Почему текст при таком выводе получается разреженным? Потому что функция `print` по умолчанию в конце добавляет симво конца строки (`\n`). Чтобы этого избежать, достаточно задать в параметр `end=''` (пустую строку) функции `print`

In [62]:
file.seek(0, io.SEEK_SET) # вернёмся к началу файла
for line in file:
    print(line, end='') # изменяем конец строки
file.close()

Зимнее утро

Мороз и солнце; день чудесный!
Еще ты дремлешь, друг прелестный —
Пора, красавица, проснись:
Открой сомкнуты негой взоры
Навстречу северной Авроры,
Звездою севера явись!

Вечор, ты помнишь, вьюга злилась,
На мутном небе мгла носилась;
Луна, как бледное пятно,
Сквозь тучи мрачные желтела,
И ты печальная сидела —
А нынче... погляди в окно:

Под голубыми небесами
Великолепными коврами,
Блестя на солнце, снег лежит;
Прозрачный лес один чернеет,
И ель сквозь иней зеленеет,
И речка подо льдом блестит.

Вся комната янтарным блеском
Озарена. Веселым треском
Трещит затопленная печь.
Приятно думать у лежанки.
Но знаешь: не велеть ли в санки
Кобылку бурую запречь?

Скользя по утреннему снегу,
Друг милый, предадимся бегу
Нетерпеливого коня
И навестим поля пустые,
Леса, недавно столь густые,
И берег, милый для меня.

1829 г.

Во многих случая используется построчное чтение файлов т.к. это очень удобно - не надо читать фесь файл целиком, а можно двигаться построчно в цикле. Под капотом просиходит буферизация при чтении файла с диска (загружается сразу большой кусок в размере 4КБ (в зависимости от ОС) - и далее происходит чтение из этого буфера из памяти).

In [63]:
# еще вариант
file_name = '../../Основы Python/python_homeworks/lesson_009/python_snippets/pushkin.txt'
file = open(file_name, mode='r', encoding='utf8')
for line in file.readlines():  # если файл огромный - все прочитает в память, не делайте так!
    print(line)
file.close()

Зимнее утро



Мороз и солнце; день чудесный!

Еще ты дремлешь, друг прелестный —

Пора, красавица, проснись:

Открой сомкнуты негой взоры

Навстречу северной Авроры,

Звездою севера явись!



Вечор, ты помнишь, вьюга злилась,

На мутном небе мгла носилась;

Луна, как бледное пятно,

Сквозь тучи мрачные желтела,

И ты печальная сидела —

А нынче... погляди в окно:



Под голубыми небесами

Великолепными коврами,

Блестя на солнце, снег лежит;

Прозрачный лес один чернеет,

И ель сквозь иней зеленеет,

И речка подо льдом блестит.



Вся комната янтарным блеском

Озарена. Веселым треском

Трещит затопленная печь.

Приятно думать у лежанки.

Но знаешь: не велеть ли в санки

Кобылку бурую запречь?



Скользя по утреннему снегу,

Друг милый, предадимся бегу

Нетерпеливого коня

И навестим поля пустые,

Леса, недавно столь густые,

И берег, милый для меня.



1829 г.


Метод `readlines` возвращает **класс** **`list`**, т.е. это список, состоящий из строк всего файла. Мы загружаем в память массив, содержащий в себе весь файл. Если файл большой, то лучше так не делать, т.к. может переполниться память. Но этот метод ускоряет доступ и мы можем работать с объектом как с обычным списком (удалять, добавлять в него объекты и т.д.). Если файл небольшой, то этот метод использовать полезно.

In [65]:
# еще вариант - алгоритм поиска фрагмента в тексте
file_name = '../../Основы Python/python_homeworks/lesson_009/python_snippets/pushkin.txt'
file = open(file_name, mode='r', encoding='utf8')
line = True
while line:
    line = file.readline()
    if 'красавица' in line:
        print('Красавица найдена в строке:', line)
        break
else:
    print('Тут красавиц нет')
file.close()

Красавица найдена в строке: Пора, красавица, проснись:



Во всех вышеприведённых вариантах всегда надо следить за тем, чтобы файл был закрыт при выходе из программы. И всё время не забывать про метод `close` после завершения работы с файлом. В этом есть недостаток, т.к. мы можем забыть закрыть файл. А это плохо. И нам не видно, закрыт ли уже файл или ещё нет (но есть метод `closed`).

### Работа с файлами при помощи оператора **with**
Но есть и другой способ открытия файлов: - при помощи оператора **`with`**. Он позволяет контролировать вход в блок кода и выход из него. И он автоматически закрывает файл.

Блок кода `with`:

    with open(file_name, mode='r') as file:
        for line in file:
            print(line)

In [66]:
file_name = '../../Основы Python/python_homeworks/lesson_009/python_snippets/pushkin.txt'
with open(file_name, mode='r', encoding='utf8') as file:
    for line in file:
        print(line)
print(file.closed)

Зимнее утро



Мороз и солнце; день чудесный!

Еще ты дремлешь, друг прелестный —

Пора, красавица, проснись:

Открой сомкнуты негой взоры

Навстречу северной Авроры,

Звездою севера явись!



Вечор, ты помнишь, вьюга злилась,

На мутном небе мгла носилась;

Луна, как бледное пятно,

Сквозь тучи мрачные желтела,

И ты печальная сидела —

А нынче... погляди в окно:



Под голубыми небесами

Великолепными коврами,

Блестя на солнце, снег лежит;

Прозрачный лес один чернеет,

И ель сквозь иней зеленеет,

И речка подо льдом блестит.



Вся комната янтарным блеском

Озарена. Веселым треском

Трещит затопленная печь.

Приятно думать у лежанки.

Но знаешь: не велеть ли в санки

Кобылку бурую запречь?



Скользя по утреннему снегу,

Друг милый, предадимся бегу

Нетерпеливого коня

И навестим поля пустые,

Леса, недавно столь густые,

И берег, милый для меня.



1829 г.
True


Мы видим, что в конце файл был закрыт автоматически (метод `file.closed` вернул `True`). И что бы ни произошло внутри файла (например, ошибка, или если сработает исключение и произойдёт выход из блока оператора `with`, - файл тут же будет автоматически закрыт. И это очень удобно и полезно.

**`with`** в общем случае работает с [**контекстными менеджерами**](https://goo.gl/J2TZRq)

Что такое **контекстные менеджеры**?\
Поднимемся на уровень абстракций. Предположим, у нас есть какой-то *класс*, у которого определы два *спецметода*: `__enter__` и `__exit__`. И тогда этот *класс* будет **контекстным менеджером** - и его можно будет использовать с оператором `with`.\
Когда мы входим в блок кода, - автоматически вызывается интерпретатором python'а определнный в этом *классе* метод `__enter__` (метод входа), а когда мы выходим из блока кода, - вызывается метод `__exit__` (метод выхода).\
У метода `__exit__` есть параметры, которые интерпретатор подставляет сам, если внутри блока кода оператора **`with`** возникло ***исключение***. И мы можем обрабатывать ***исключения*** благодаря этому.


In [72]:
class InOutBlock: # создаём класс для работы с контекстным менеджером

    def __enter__(self):
        print('Входим в блок кода')
        # TODO обратите внимание что тут надо вернуть обьект - в видео это пропущено
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        print('Выходим из блока кода')

    def some_method(self):
        print('Выполяем метод обьекта InOutBlock')


with InOutBlock() as in_out: # работает с классом как с объектом контекстного менеджера
    # in_out = InOutBlock() # присвоили имя in_out для работы внутри блока кода оператора with
    print('Некоторый код')
    in_out.some_method()

Входим в блок кода
Некоторый код
Выполяем метод обьекта InOutBlock
Выходим из блока кода


То есть обьект файла реализует интерфейс **контекстного менеджера** и закрывает файл при выходе из блока кода.

Работа с **менеджерами контекста** очень удобна когда мы работаем с такими ресусами как *сетевые соединения* или *базы данных*, где нам необходимо следить всё рвемя за тем, чтобы ресурс всё время освобождался после обращения к нему. В этом случае **менеджер контекста** очень помогает. А при работе с файлами - оператор **`with`** наиболее часто применим и удобен.

*Итак, мы изучили основные способы работы с файлами. Рассмотрели несколько способов. Но самый классный способ - это с помощью оператора **`with`**. А также разобрались с тем, что из себя представляет этот оператор. Оператор **`with`** работает с **контекстными менеджерами**.*

## **9.6** *Форматирование строк*
### Форматирование вывода на консоль
Рассмотрим несколько способов форматирования (оформления) строк:
* Старый стиль: `'строка с %-форматом' % (значение)`
* Новый стиль: `'строка с {}-форматом'.format(значение)`
* Новейший стиль: `f'строка с {значение}'`

#### Старый стиль: **%**. Аналог С-форматирования функции printf()

In [73]:
print('Мы — те %s, что говорят "%s!"' % ('рыцари', 'Ха'))
print('Вывод числа %d' % 34)

Мы — те рыцари, что говорят "Ха!"
Вывод числа 34


>* Плюсы: программистам на С проще :)
>* Минусы: негибкий, мало возможностей.

#### Более продвинутый способ - через метод строки **.format()**

In [75]:
print('Мы — те {}, что говорят "{}!"'.format('рыцари', 'Ха'))

Мы — те рыцари, что говорят "Ха!"


In [76]:
# Можно указывать номер выводимого параметра
a = 'рыцари'
b = 'Ого'
print('Мы — те {0}, что говорят "{1}!"'.format(a, b))
# и менять местами
print('Мы — те {1}, что говорят "{0}!"'.format(a, b))

Мы — те рыцари, что говорят "Ого!"
Мы — те Ого, что говорят "рыцари!"


In [77]:
# вывод целых чисел
a = 27
print('Вывод числа {0}'.format(a)) # число преобразуется к строке
print('Вывод числа {0:d}'.format(a)) # выводим число, если переменная будет не число, тогда выбросится исключение ValueError

# сколько символов выводить - указываем после двоеточия (дополняется пробелами сначала)
print('Вывод числа "{0:3d}" '.format(a))
for x in range(1, 11):
    print('{0:2d} {1:3d} {2:4d} '.format(x, x**2, x**3))

Вывод числа 27
Вывод числа 27
Вывод числа " 27" 
 1   1    1 
 2   4    8 
 3   9   27 
 4  16   64 
 5  25  125 
 6  36  216 
 7  49  343 
 8  64  512 
 9  81  729 
10 100 1000 


In [106]:
# у объектов класса int и float есть спец-метод __str__ для перевода в строку
a = 1
a.__str__()

'1'

In [81]:
# вывод дробного числа с заданной точностью
# :8.4f - 8 знаков всего, 4 знака после запятой, дробное число
import math
print('Вывод числа "{0:5f}" '.format(math.pi))
print('Вывод числа "{0:5.2f}" '.format(math.pi))
print('Вывод числа "{0:8.2f}" '.format(math.pi))

Вывод числа "3.141593" 
Вывод числа " 3.14" 
Вывод числа "    3.14" 


In [82]:
# именованные аргументы
print('Этот {food} — {adjective}.'.format(
    food='фарш', adjective='непередаваемо ужасен'
))

Этот фарш — непередаваемо ужасен.


In [83]:
# можно также заполнить пробелами
print('Этот {food:20} — {adjective}.'.format(
    food='фарш', adjective='непередаваемо ужасен'
))

Этот фарш                 — непередаваемо ужасен.


>Стоит отметить, что для строк выравнивание идёт слева (а пробелы добавляются справа), а для чисел - наоборот, выравнивание справа, а слева добавляются пробелы

In [85]:
# можно совмещать
print('История о {0}е, {1}е, и {other}е.'.format('Билл', 'Манфред', other='Георг'))

История о Билле, Манфреде, и Георге.


In [86]:
# форматирование вывода строк - минимальная ширина поля {xxx:10}
phones = {'Bill': 4127, 'Jameson': 4098, 'Abraham': 7678}
for name, phone in phones.items():
    print('{name:10} ==> {phone:10d}'.format(name=name, phone=phone))

Bill       ==>       4127
Jameson    ==>       4098
Abraham    ==>       7678


In [87]:
# выравнивания строк
print('|{txt:<30}|'.format(txt='left aligned')) # знак < указывает направление выравнивания - влево
# 'left aligned                  '
print('|{txt:>30}|'.format(txt='right aligned')) # знак < указывает направление выравнивания - вправо
# '                 right aligned'
print('|{txt:^30}|'.format(txt='centered')) # знак ^ указывает направление выравнивания - по центру
# '           centered           '
print('|{txt:*^30}|'.format(txt='centered'))  # use '*' as a fill char
# '***********centered***********'

|left aligned                  |
|                 right aligned|
|           centered           |
|***********centered***********|


In [94]:
print('|{txt:0=+30}|'.format(txt=10)) 

|+00000000000000000000000000010|


Полное описание мини-языка форматирования [тут](https://docs.python.org/3/library/string.html#formatspec)

#### Новейший метод **f-строки**
В версии 3.6 ввели **f-строки** - такие строки, в которых можно указывать переменные пайтона или даже пайтон выражения.\
Описание [тут](https://docs.python.org/3.6/reference/lexical_analysis.html#formatted-string-literals)

**f-строки** очень похожи на `.format()`, но только сначала вычисляется python-выражение, а потом применяется форматирование\
тут `txt` - это имя переменной

In [96]:
# перед строкой добавляется спецификатор форматирования f
txt = 'строка'
print(f'{txt:*^30}')

************строка************


Можно так - писать код внутри строки

In [100]:
var_1 = 34
print(f'Удвоенное значение переменной - {var_1 * 2:10d}')

Удвоенное значение переменной -         68


In [101]:
# можно даже делать операции индексирования
my_list = [1, 2, 3, 4]
print(f'Третий элемент списка - {my_list[2]:10d}')
my_dict = {'a': 1, 'b': 2}
print(f"Значение словаря - {my_dict['a']:10d}")
# или вызывать функции... но лучше так не делать :)

Третий элемент списка -          3
Значение словаря -          1


Т.е. внутри f-строки может вычисляться любой python-код. И это круто! HO...\
Не надо усложнять и заставлять читающего код читать сложные перл-подобные выражение при выводе.\
Один из постулатов пайтона - чем проще тем лучше. И поэтому вместо

In [102]:
print('Значение переменной var_1 - {}'.format(var_1))

Значение переменной var_1 - 34


проще использовать

In [103]:
print(f'Значение переменной var_1 - {var_1}')

Значение переменной var_1 - 34


In [104]:
# для разрешения имен используются стандартный алгоритм поиска по области видимости
def f1():
    print(f'{var_2:*^30}')


var_2 = 'строка'
f1()

************строка************


Форматирование вывода в файл ничем не отличается от форматирования вывода на консоль\
Мы так же формируем строку удобным способом и пишем её в файл

In [109]:
file_name = '../../Основы Python/python_homeworks/lesson_009/python_snippets/out.txt'
var_1 = 42
with open(file_name, mode='w', encoding='utf8') as file:
    file.write('Вывод числа %d' % 34)
    file.write('\n')
    file.write('Мы — те {}, что говорят "{}!"'.format('рыцари', 'Ха'))
    file.write('\n')
    file.write(f'Значение переменной var_1 - {var_1:10}')
    file.write('\n')

*Итак, мы посмотрели как можно форматировать строки. Наконец-то узнали что такое `.format`, чем отличается от `%`. А также познакомились с* ***`f-строками`***.\
*И как с помощью этих нововведений можно выстрелить себе в ногу. И рассмотрели как можно форматированные строки не только выводить на консоль, но и записывать в файл.*

## **9.7** *Файлы в операционной системе*

Продолжаем изучать файлы

### Файлы в операционной системе
* Файлы живут в файловой системе: папка, путь, права
* В Python есть модули для работы с файлами в ОС: **`os`**, **`os.paht`**, **`sys`**

Все файлы лежат на диске и имеют путь в файловой системе. Как работать с файлами на уровне ОС?\
Есть встроенные модули для этого: **os**, **os.path**, **shutil**\
Пригодятся они для написания скриптов-аналогов bash (.bat файлов в Windows).\
Т.е. мы можем делать на Python автоматизацию каких-нибудь действий с ОС.

#### Самая удобная функция для прохода по всем файлам - это функция **`os.walk`**

In [5]:
import os

path = 'C:\\Windows\\help' # обратные слэши необходимо экранировать \

# Пройтись по всем файлам в директории.
for dirpath, dirnames, filenames in os.walk(path): # os.walk возвращает кортеж из трёх элементов
    print(dirpath, dirnames, filenames)

C:\Windows\help ['Corporate', 'en-US', 'Help', 'mui', 'OEM', 'Windows'] []
C:\Windows\help\Corporate [] []
C:\Windows\help\en-US [] ['credits.rtf']
C:\Windows\help\Help [] []
C:\Windows\help\mui ['0409', '0419'] []
C:\Windows\help\mui\0409 [] ['cliconf.chm', 'mmc.CHM', 'msdasc.chm', 'msorcl32.chm', 'odbcinst.chm', 'odbcjet.chm', 'sqlsodbc.chm', 'sqlsoldb.chm']
C:\Windows\help\mui\0419 [] ['cliconf.chm', 'mmc.CHM', 'msdasc.chm', 'msorcl32.chm', 'odbcinst.chm', 'odbcjet.chm', 'sqlsodbc.chm', 'sqlsoldb.chm']
C:\Windows\help\OEM ['ContentStore', 'IndexStore'] []
C:\Windows\help\OEM\ContentStore [] []
C:\Windows\help\OEM\IndexStore [] []
C:\Windows\help\Windows ['ContentStore', 'IndexStore'] []
C:\Windows\help\Windows\ContentStore ['en-US'] []
C:\Windows\help\Windows\ContentStore\en-US [] []
C:\Windows\help\Windows\IndexStore ['en-US'] []
C:\Windows\help\Windows\IndexStore\en-US [] []


In [9]:
# Посчитаем количество файлов, найденных в директории по пути path
count = 0
for dirpath, dirnames, filenames in os.walk(path): # os.walk возвращает кортеж из трёх элементов
    print(dirpath, dirnames, filenames)
    count += len(filenames)
print(count)

C:\Windows\help ['Corporate', 'en-US', 'Help', 'mui', 'OEM', 'Windows'] []
C:\Windows\help\Corporate [] []
C:\Windows\help\en-US [] ['credits.rtf']
C:\Windows\help\Help [] []
C:\Windows\help\mui ['0409', '0419'] []
C:\Windows\help\mui\0409 [] ['cliconf.chm', 'mmc.CHM', 'msdasc.chm', 'msorcl32.chm', 'odbcinst.chm', 'odbcjet.chm', 'sqlsodbc.chm', 'sqlsoldb.chm']
C:\Windows\help\mui\0419 [] ['cliconf.chm', 'mmc.CHM', 'msdasc.chm', 'msorcl32.chm', 'odbcinst.chm', 'odbcjet.chm', 'sqlsodbc.chm', 'sqlsoldb.chm']
C:\Windows\help\OEM ['ContentStore', 'IndexStore'] []
C:\Windows\help\OEM\ContentStore [] []
C:\Windows\help\OEM\IndexStore [] []
C:\Windows\help\Windows ['ContentStore', 'IndexStore'] []
C:\Windows\help\Windows\ContentStore ['en-US'] []
C:\Windows\help\Windows\ContentStore\en-US [] []
C:\Windows\help\Windows\IndexStore ['en-US'] []
C:\Windows\help\Windows\IndexStore\en-US [] []
17


Т.е. мы можем в каждой директории ОС искать файлы, читать эти файлы, а также писать в них при помощи функции `open`

In [12]:
# В разных ОС путь записывается по разному: привести к нужному в этой ОС виду
path = 'C:/Windows/help'
path_normalized = os.path.normpath(path)
print(path_normalized)

C:\Windows\help


In [13]:
count = 0
for dirpath, dirnames, filenames in os.walk(path_normalized):
    print(dirpath, dirnames, filenames)
    count += len(filenames)
print(count)

C:\Windows\help ['Corporate', 'en-US', 'Help', 'mui', 'OEM', 'Windows'] []
C:\Windows\help\Corporate [] []
C:\Windows\help\en-US [] ['credits.rtf']
C:\Windows\help\Help [] []
C:\Windows\help\mui ['0409', '0419'] []
C:\Windows\help\mui\0409 [] ['cliconf.chm', 'mmc.CHM', 'msdasc.chm', 'msorcl32.chm', 'odbcinst.chm', 'odbcjet.chm', 'sqlsodbc.chm', 'sqlsoldb.chm']
C:\Windows\help\mui\0419 [] ['cliconf.chm', 'mmc.CHM', 'msdasc.chm', 'msorcl32.chm', 'odbcinst.chm', 'odbcjet.chm', 'sqlsodbc.chm', 'sqlsoldb.chm']
C:\Windows\help\OEM ['ContentStore', 'IndexStore'] []
C:\Windows\help\OEM\ContentStore [] []
C:\Windows\help\OEM\IndexStore [] []
C:\Windows\help\Windows ['ContentStore', 'IndexStore'] []
C:\Windows\help\Windows\ContentStore ['en-US'] []
C:\Windows\help\Windows\ContentStore\en-US [] []
C:\Windows\help\Windows\IndexStore ['en-US'] []
C:\Windows\help\Windows\IndexStore\en-US [] []
17


Это очень удобный инструмент при портировании кода на другие ОС, отличные от той, где мы пишем свой

#### Ещё одна полезная фунция для получения размера файла **`getsize`**

In [19]:
# Получить размер файла
os.path.getsize(path)

0

In [30]:
# Пример
print('file', '\t\t', 'size', '\n-----------------------')
for dirpath, dirnames, filenames in os.walk(path_normalized):
    if filenames:
        for file in filenames:
            filesize = os.path.getsize(dirpath + '\\' + file)            
            print(file, '\t', filesize)

file 		 size 
-----------------------
credits.rtf 	 351960
cliconf.chm 	 94637
mmc.CHM 	 19113
msdasc.chm 	 76837
msorcl32.chm 	 75209
odbcinst.chm 	 78636
odbcjet.chm 	 87270
sqlsodbc.chm 	 73848
sqlsoldb.chm 	 63938
cliconf.chm 	 96810
mmc.CHM 	 50113
msdasc.chm 	 77767
msorcl32.chm 	 75622
odbcinst.chm 	 81037
odbcjet.chm 	 93892
sqlsodbc.chm 	 74238
sqlsoldb.chm 	 64205


#### Следующая функция позволяет получить дату модификации файла **`getmtime`**

In [35]:
# Получить дату coздания файла.
os.path.getctime(path)

1552971164.5801115

In [36]:
# Получить дату модификации файла.
os.path.getmtime(path)

1552995266.7996798

In [44]:
count = 0
print('file', '\t\t', 'datetime', '\n-----------------------------------')
for dirpath, dirnames, filenames in os.walk(path_normalized):
    count += len(filenames)
    for file in filenames:
        filedate = os.path.getctime(dirpath + '\\' + file)            
        print(file, '\t', filedate)
print('-----------------------------------\nfiles count:\t', count)

file 		 datetime 
-----------------------------------
credits.rtf 	 1552995242.1947381
cliconf.chm 	 1560595617.5641735
mmc.CHM 	 1560595692.3439052
msdasc.chm 	 1560595621.9385831
msorcl32.chm 	 1560595659.10198
odbcinst.chm 	 1560595618.42368
odbcjet.chm 	 1560595659.0863328
sqlsodbc.chm 	 1560595617.6895752
sqlsoldb.chm 	 1560595617.595855
cliconf.chm 	 1552995235.1432874
mmc.CHM 	 1552995242.2151158
msdasc.chm 	 1552995235.1432874
msorcl32.chm 	 1552995237.8180714
odbcinst.chm 	 1552995235.1432874
odbcjet.chm 	 1552995237.8180714
sqlsodbc.chm 	 1552995235.1432874
sqlsoldb.chm 	 1552995235.1432874
-----------------------------------
files count:	 17


Но что это за странные числа выводятся? Это **количество секунд которые прошли с начала Эпохи**.\
В компьютерных системах есть понятие **Эпох**. Было решено хранить время в секундах от начала **Эпохи** (компьютерной эпохи имеется ввиду).\
Началом Эпохи был выбран момент **1 января 1970 года**.\
Т.е. получается, функция **`getctime`** возвращает количество секунд прошедших с начала Эпохи до момента когда был создан этот файл.

Но это неочень удобно для восприятия.\
Чтобы вернуть значение преобразованное в удобную дату, потребууется модуль **`time`**\
В нём есть функция `gmtime`, которая возвращает кортеж со временем. (Подробнее см. [тут](https://docs.python.org/3/library/time.html#time.struct_time))

In [46]:
# Вернет кол-во секунд с начала эпохи. преобразовать в года/месяца можно так
import time

secs = filedate
time.gmtime(secs)  # вернет кортеж со временем

time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=55, tm_wday=1, tm_yday=78, tm_isdst=0)

In [54]:
count = 0
print('file', '\t\t', 'datetime', '\n' + '-' * 138)
for dirpath, dirnames, filenames in os.walk(path_normalized):
    count += len(filenames)
    for file in filenames:
        secs = os.path.getctime(dirpath + '\\' + file)
        filedate = time.gmtime(secs)
        print(file, '\t', filedate)
print('-' * 138 + '\nfiles count:\t', count)

file 		 datetime 
------------------------------------------------------------------------------------------------------------------------------------------
credits.rtf 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=34, tm_sec=2, tm_wday=1, tm_yday=78, tm_isdst=0)
cliconf.chm 	 time.struct_time(tm_year=2019, tm_mon=6, tm_mday=15, tm_hour=10, tm_min=46, tm_sec=57, tm_wday=5, tm_yday=166, tm_isdst=0)
mmc.CHM 	 time.struct_time(tm_year=2019, tm_mon=6, tm_mday=15, tm_hour=10, tm_min=48, tm_sec=12, tm_wday=5, tm_yday=166, tm_isdst=0)
msdasc.chm 	 time.struct_time(tm_year=2019, tm_mon=6, tm_mday=15, tm_hour=10, tm_min=47, tm_sec=1, tm_wday=5, tm_yday=166, tm_isdst=0)
msorcl32.chm 	 time.struct_time(tm_year=2019, tm_mon=6, tm_mday=15, tm_hour=10, tm_min=47, tm_sec=39, tm_wday=5, tm_yday=166, tm_isdst=0)
odbcinst.chm 	 time.struct_time(tm_year=2019, tm_mon=6, tm_mday=15, tm_hour=10, tm_min=46, tm_sec=58, tm_wday=5, tm_yday=166, tm_isdst=0)
odbcjet.chm 	 time.struct_t

In [60]:
# Отфильтруем только те файлы, которые были созданы в матре 2019 года
count = 0
print('file', '\t\t', 'datetime', '\n' + '-' * 138)
for dirpath, dirnames, filenames in os.walk(path_normalized):
    for file in filenames:
        secs = os.path.getctime(dirpath + '\\' + file)
        filedate = time.gmtime(secs)
        if filedate.tm_year == 2019 and filedate.tm_mon == 3:
            print(file, '\t', filedate)
            count += 1
print('-' * 138 + '\nfiles count:\t', count)

file 		 datetime 
------------------------------------------------------------------------------------------------------------------------------------------
credits.rtf 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=34, tm_sec=2, tm_wday=1, tm_yday=78, tm_isdst=0)
cliconf.chm 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=55, tm_wday=1, tm_yday=78, tm_isdst=0)
mmc.CHM 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=34, tm_sec=2, tm_wday=1, tm_yday=78, tm_isdst=0)
msdasc.chm 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=55, tm_wday=1, tm_yday=78, tm_isdst=0)
msorcl32.chm 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=57, tm_wday=1, tm_yday=78, tm_isdst=0)
odbcinst.chm 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=55, tm_wday=1, tm_yday=78, tm_isdst=0)
odbcjet.chm 	 time.struct_time(t

>Функции работы с файлами достаточно низкоуровневые, поэтому мы работаем с *секундами*

#### Как сформировать правильный путь к файлу или директории с учётом особенностей ОС

До этого мы использовали *убогий* метод: `путь к директории, в которой лежит файл + '\\' + название файла`.\
Это *костыль*. Есть более лаконичный и красивый сбособ это сделать.\
Для этого используем функцию `path.join` из модуля `os`:

    os.path.join(path1[, path2[, ...]])

In [72]:
# Перепишем код без костылей для задания путей к файлам
count = 0
print('file', '\t\t', 'datetime', '\n' + '-' * 138)
for dirpath, dirnames, filenames in os.walk(path_normalized):
    for file in filenames:
        full_path = os.path.join(dirpath, file) # функция join сама подставляет нужны слеши объединяя файл и путь к нему
        secs = os.path.getctime(full_path)
        filedate = time.gmtime(secs)
        if filedate.tm_year == 2019 and filedate.tm_mon == 3:
            print(file, '\t', filedate)
            count += 1
print('-' * 138 + '\nfiles count:\t', count)

file 		 datetime 
------------------------------------------------------------------------------------------------------------------------------------------
credits.rtf 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=34, tm_sec=2, tm_wday=1, tm_yday=78, tm_isdst=0)
cliconf.chm 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=55, tm_wday=1, tm_yday=78, tm_isdst=0)
mmc.CHM 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=34, tm_sec=2, tm_wday=1, tm_yday=78, tm_isdst=0)
msdasc.chm 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=55, tm_wday=1, tm_yday=78, tm_isdst=0)
msorcl32.chm 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=57, tm_wday=1, tm_yday=78, tm_isdst=0)
odbcinst.chm 	 time.struct_time(tm_year=2019, tm_mon=3, tm_mday=19, tm_hour=11, tm_min=33, tm_sec=55, tm_wday=1, tm_yday=78, tm_isdst=0)
odbcjet.chm 	 time.struct_time(t

#### Ещё какие полезняшки есть

In [71]:
# получить родительскую директорию
os.path.dirname(path)

'C:/Windows'

In [None]:
# получить родительскую директорию текущего модуля
os.path.dirname(__file__)

>***Примечание***: спецметод `__file__` не работает в среде **Jupyter Notebook**\

Вместо этого, можно использовать следующий способ

In [86]:
current_path = os.getcwd()
print(current_path, '\t', os.path.dirname(current_path))

D:\Курсы\Skillbox\Data Science\03-09. Основы Python 	 D:\Курсы\Skillbox\Data Science


Все директории, которые охватывает область видимости (*scope*) Python'a можно вывести при помощи модуля **'sys'**

In [88]:
import sys

sys.path

['D:\\Курсы\\Skillbox\\Data Science\\03-09. Основы Python',
 'C:\\Users\\greym\\anaconda3\\python38.zip',
 'C:\\Users\\greym\\anaconda3\\DLLs',
 'C:\\Users\\greym\\anaconda3\\lib',
 'C:\\Users\\greym\\anaconda3',
 '',
 'C:\\Users\\greym\\anaconda3\\lib\\site-packages',
 'C:\\Users\\greym\\anaconda3\\lib\\site-packages\\win32',
 'C:\\Users\\greym\\anaconda3\\lib\\site-packages\\win32\\lib',
 'C:\\Users\\greym\\anaconda3\\lib\\site-packages\\Pythonwin',
 'C:\\Users\\greym\\anaconda3\\lib\\site-packages\\IPython\\extensions',
 'C:\\Users\\greym\\.ipython']

Мы рассмотрели самые основные функции работы с файлами в ОС. Остальные можно посмотерть [тут](https://goo.gl/AB6aDQ)

*Итак, мы познакомились в этом уроке с тем, как работать с файлами в ОС и какие функции нам помогают в этом.\
Теперь мы умеем "гулять" по каталогам файловой системы, открывать файлы, читать у них атрибуты (имя, размер, время создания, ... можно ещё права доступа).\
И теперь у нас вся ОС как на ладони. ***Но при условии, если у нас есть права(!)***. (Перед тем как выполнить операцию ОС проверяет, есть ли у нас права на эту операцию).*

## **9.8 - 9.9** *Практика. Часть 1 - Часть 2*

* Разберём работу с файлом на примере генератора текста
* Посмотрим, как работать с файлами в ОС

**Задание**: Сделать генератор текста на основе статистики
>Идея проста: подсчитаем какие буквы наиболее часто стоят рядом\
>Точнее, подсчитаем как часто за буковой Х идет буква У, на основе некоего текста.\
>После этого начнем с произвольной буквы и каждую следующую будем выбирать в зависимости от частоты её появления в статистике.

In [6]:
import os
import zipfile
from random import randint


class Chatterer:  # чат-болтальщик
    analize_count = 4  # задаём количество символов в анализируемой последовательности в статистике символов

    def __init__(self, file_name):
        self.file_name = file_name
        self.stat = {}

    def unzip(self):
        # раззиповка файла, запуск построчного цикла
        zfile = zipfile.ZipFile(self.file_name, 'r')
        for filename in zfile.namelist():
            zfile.extract(filename)
        self.file_name = filename

    def collect(self):
        # сбор статистики
        if self.file_name.endswith('.zip'):  # если файл заканчивается на '.zip'
            self.unzip()  # то раззиповываем его
        self.sequence = ' ' * self.analize_count  # длина строки из пробелов
        with open(self.file_name, 'r', encoding='cp1251') as file:
            for line in file:
                self._collect_for_line(line=line[:-1])  # берём строку без возврата каретки ('\n')

    def _collect_for_line(self, line):
        # в каждой строчке файлов по каждому символу считаем статистику
        for char in line:
            if self.sequence in self.stat:
                if char in self.stat[self.sequence]:
                    self.stat[self.sequence][char] += 1
                else:
                    self.stat[self.sequence][char] = 1
            else:
                self.stat[self.sequence] = {char: 1}
            self.sequence = self.sequence[1:] + char

    def prepare(self):
        # сбор статисткики в два словаря
        self.totals = {}
        self.stat_for_generate = {}
        for sequence, char_stat in self.stat.items():
            self.totals[sequence] = 0
            self.stat_for_generate[sequence] = []
            for char, count in char_stat.items():
                self.totals[sequence] += count
                self.stat_for_generate[sequence].append([count, char])
                self.stat_for_generate[sequence].sort(reverse=True)

    def chat(self, N=1000, out_file_name=None):
        # генератор символов
        if out_file_name is not None:  # если имя файла задано
            file = open(out_file_name, 'w', encoding='utf8')
        else:
            file = None

        self._chars_operator(N, file)
        if file:
            file.close()

    def _chars_operator(self, N, file):
        # метод для оценки символов и записи их в файл или на консоль
        printed = 0
        sequence = ' ' * self.analize_count  # задаём последовательность символов, предшествующих текущему символу
        spaces_printed = 0
        while printed < N:
            char = self._get_char(char_stat=self.stat_for_generate[sequence], total=self.totals[sequence])
            if file:
                file.write(char)  # если задан файл, то пишем в файл
            else:
                print(char, end='')  # иначе, выводим на консоль
            if char == ' ':
                spaces_printed += 1  # подсчёт количества пробелов, которые встретились
                if spaces_printed >= 10:  # если пробелов в строке более 10
                    if file:
                        file.write('\n')  # тогда пишем в файл вовзрат каретки
                    else:
                        print()  # иначе, перенос строки при выводе на консоль
                    spaces_printed = 0
            printed += 1
            sequence = sequence[1:] + char

    @staticmethod
    def _get_char(char_stat, total):
        # генерация случайного выбора символа
        dice = randint(1, total)
        pos = 0
        for count, char in char_stat:
            pos += count
            if dice <= pos: # если выпавшее значение меньше текущей позиции, то у нас выпал этот char
                break # и тогда выходим из цикла
        return char


file_path = '../../Основы Python/python_homeworks/lesson_009/python_snippets'  # путь к директории с файлом
chatterer = Chatterer(file_name=os.path.join(file_path, 'voyna-i-mir.txt.zip'))  # создаём класс с параметрами
chatterer.collect()  # собрать статистику
chatterer.prepare()  # подготовить
chatterer.chat(N=10000, out_file_name=os.path.join(file_path, 'out.txt'))  # запуск генератора текста с заданным количеством символов и запись
# реультата в файл out.txt

## **9.10** *Итоги модуля*

### Итак, мы изучили
* Кодировку символов (узначи что такое *UTF-8* (Unicode), *ASCII*)
* Отличие строк от последовательности байтов
* Как можно читать и писать файлы в разных режимах
* Позиционирование в файле
* Оператор **`with`** (оператор работы с **контекстным менеджером**)
* Форматирование строк (старый стиль с **`%`**, новый стиль с **`format`** и новеший стиль **`f-строки`**)
* Управление файлами на уровне ОС (работа с путями файлов в ОС, атрибутами файлов и т.д.)