<h2 style="text-align: center;">Представление строк в памяти компьютера</h2>

<p>Любой набор данных в <a href="https://ru.wikipedia.org/wiki/%D0%9E%D0%BF%D0%B5%D1%80%D0%B0%D1%82%D0%B8%D0%B2%D0%BD%D0%B0%D1%8F_%D0%BF%D0%B0%D0%BC%D1%8F%D1%82%D1%8C" rel="noopener noreferrer nofollow" target="_blank">оперативной памяти</a> компьютера должен&nbsp;храниться в виде&nbsp;двоичного&nbsp;числа. Это относится и к строкам, которые состоят из символов (буквы, знаки препинания и т.д.). Когда символ сохраняется в памяти, он сначала преобразуется в цифровой код. И затем этот цифровой код сохраняется в памяти как двоичное число.</p>

<p>За прошедшие годы для представления символов в памяти компьютера были разработаны различные схемы кодирования. Исторически самой важной из этих схем кодирования является схема кодирования ASCII (American Standard Code for Information Interchange –&nbsp;американский стандартный код обмена информацией).</p>

<h3 style="text-align: center;">Таблица символов&nbsp;ASCII</h3>

<p>ASCII представляет собой набор из 128 цифровых кодов, которые обозначают английские буквы, различные знаки препинания и другие символы. Например, код ASCII для прописной английской буквы «А» (латинской) равняется 65. Когда на компьютерной клавиатуре вы набираете букву «А» в верхнем регистре, в памяти сохраняется число 65 (как двоичное число, разумеется).</p>

<p style="text-align: center;"><img alt="" height="112" src="https://ucarecdn.com/0e7a9757-5bae-4d65-a241-8910e1bf4e0f/" width="819"></p>

<p>Код ASCII для английской «В» в верхнем регистре равняется 66, для «С» в верхнем регистре –&nbsp;67 и т. д. <strong>На один символ в&nbsp;ASCII отводится ровно&nbsp;7&nbsp;бит.</strong><br>

<h3 style="text-align: center;">ASCII table</h3>

<p style="text-align: center;"><img alt="" height="507" src="https://ucarecdn.com/8a6ce363-1e0c-4593-8c1b-f22da0dda956/" width="854"></p>

<p>Набор символов ASCII был разработан в начале 1960-х годов и в конечном счете принят почти всеми производителями компьютеров. Однако схема кодирования ASCII имеет ограничения, потому что она определяет коды только для 128 символов. Для того чтобы это исправить, в начале 1990-х годов был разработан набор символов Юникода (Unicode). Это широкая схема кодирования, совместимая с ASCII, которая может также представлять символы многих языков мира. Сегодня Юникод быстро становится стандартным набором символов, используемым в компьютерной индустрии.</p>

<h3 style="text-align: center;">Таблица символов&nbsp;Unicode</h3>

<p>Таблица символов Юникод представляет собой набор цифровых символов, которые&nbsp;включают&nbsp;в себя знаки почти всех письменных&nbsp;языков&nbsp;мира. Стандарт предложен в&nbsp;1991 году&nbsp;некоммерческой организацией «Консорциум Юникода». Применение этого стандарта позволяет закодировать очень большое число символов из разных систем письменности: в документах, закодированных по стандарту Юникод, могут соседствовать китайские&nbsp;иероглифы, математические символы, буквы&nbsp;греческого алфавита,&nbsp;латиницы&nbsp;и&nbsp;кириллицы, символы музыкальной нотации.</p>

<p>Стандарт состоит из двух основных частей: универсального набора символов и семейства кодировок (Unicode transformation format, UTF). Универсальный набор символов перечисляет допустимые по стандарту Юникод символы и присваивает каждому символу код в виде неотрицательного целого числа. Семейство кодировок определяет способы преобразования кодов символов для хранения на компьютере и передачи.</p>

<p>В&nbsp;Юникод все время добавляются новые символы, а&nbsp;сам размер этой таблицы не&nbsp;ограничен и&nbsp;будет только расти, поэтому сейчас при хранении в&nbsp;памяти одного юникод-символа может потребоваться от&nbsp;1&nbsp;до&nbsp;8&nbsp;байт. Отсутствие ограничений привело к&nbsp;тому, что стали появляться символы на&nbsp;все случаи жизни.<br>
<img alt="" name="1 копия.png" src="https://sch1998u.mskobr.ru/files/NOVOSTI/30.12.22/20211010105318.png" width="150">&nbsp; &nbsp; В Python строки хранятся в виде последовательности юникод символов.</p>


<p>Юникод&nbsp;— это не&nbsp;кодировка. Это именно таблица символов.&nbsp;То, как символы с&nbsp;соответствующими кодами будут храниться в&nbsp;памяти компьютера, зависит от&nbsp;конкретной кодировки, базирующейся на&nbsp;Юникоде,&nbsp; например UTF-8.</p>

<p>Первые 128 кодов таблицы символов&nbsp;Unicode совпадают с ASCII.</p>


In [None]:
'''
Функция ord() позволяет определить код некоторого символа в таблице символов Unicode. Аргументом данной функции является одиночный символ.
'''

num1 = ord('A')
num2 = ord('B')
num3 = ord('a') 
print(num1, num2, num3)

In [None]:
'''
Функция chr() позволяет определить по коду символа сам символ. Аргументом данной функции является численный код.
'''

for i in range(26):
    print(chr(ord('A') + i))

In [None]:
print(ord('a'))     # английская буква «a»
print(ord('а'))     # русская буква «а»

<h2 style="text-align: center;">Работа с файлами</h2>

<p>Когда в программе используется файл, как правило требуется выполнить три шага:</p>

<ol>
	<li><strong>Открыть файл</strong>. В процессе открытия файла создается связь между файлом и программой. Открытие файла вывода обычно создает файл на диске и позволяет программе записать в него данные. Открытие файла ввода позволяет программе прочитать данные из файла.</li>
	<li><strong>Обработать файл.</strong> На этом шаге данные либо записываются в файл (если это файл вывода), либо считываются из файла (если это файл ввода).</li>
	<li><strong>Закрыть файл.</strong>&nbsp;После&nbsp;использования&nbsp;файла программой&nbsp;<span style="color: #a03881;"><strong>его нужно закрыть</strong></span>, тем самым освободить ресурс и разорвать связь файла с программой.</li>
</ol>



<h2 style="text-align: center;">Типы файлов</h2>

<p>Существует два типа файлов: <strong>текстовые</strong> и <strong>двоичные (бинарные)</strong>. Текстовый файл содержит данные, которые были закодированы в виде текста при помощи такой схемы кодирования, как ASCII или Юникод. Даже если файл содержит числа, эти числа в файле хранятся как набор символов. В результате файл можно открыть и просмотреть в текстовом редакторе, таком как Блокнот.</p>

<p>Двоичный файл содержит данные, которые не были преобразованы в текст. Данные, которые помещены в двоичный файл, предназначены только для чтения программой, и такой файл невозможно просмотреть в текстовом редакторе.</p>

<p>Python позволяет работать и с текстовыми, и с двоичными файлами.</p>

<p><img alt="" name="1 копия.png" src="https://sch1998u.mskobr.ru/files/NOVOSTI/30.12.22/20211010105318.png" width="150">&nbsp; &nbsp;Разделение файлов на текстовые и бинарные&nbsp;искусственное, так как любой текстовый файл&nbsp;бинарен.</p>

<h2 style="text-align: center;">Методы доступа к файлам</h2>

<p>Большинство языков программирования обеспечивает два&nbsp;способа получения доступа к данным в файле:</p>

<ul>
	<li><strong>последовательный</strong><strong>,</strong></li>
	<li><strong>прямой&nbsp;</strong>или&nbsp;<strong>произвольный</strong>.</li>
</ul>

<p>Последовательный, как при проигрывании кассет с записью на пленке, выдает порции информации одну за другой.&nbsp;При работе с таким файлом&nbsp;не получится перескочить сразу к нужной части данных, сначала придется&nbsp;прочитать все предыдущие.&nbsp;</p>

<p>При работе с файлом с прямым или&nbsp;произвольным доступом&nbsp;можно перескочить непосредственно к любой порции данных, не читая предыдущие. Как&nbsp;проигрыватель компакт-дисков или МР3-плеер перескакивает сразу к любой песне.</p>

<h2 style="text-align: center;">Имена файлов</h2>

<p>Большинство пользователей компьютеров привыкли, что файлы определяются по имени. Когда создаете документ с помощью текстового редактора&nbsp;и сохраняете его в файле, указываете имя файла. Если исследуете&nbsp;содержимое&nbsp;диска&nbsp;с помощью <strong>проводника Windows</strong>, видите список имен файлов.</p>

<p>На рисунке&nbsp;показано, как в Windows могут выглядеть значки файлов с именами <code>Python.jpg</code>,&nbsp;<code>Записки.tхt</code>&nbsp;и <code>Резюме.dосх</code>.</p>

<p style="text-align: center;"><img alt="" height="152" src="https://ucarecdn.com/280c3cb4-508f-4267-a025-a97fd3dc28c0/" width="393"></p>

<p>У каждой операционной системы собственные правила именования файлов. Многие системы поддерживают использование расширений файлов, т.е. коротких последовательностей символов, которые расположены в конце имени файла и предваряются точкой. Файлы, изображенные на рисунке, имеют расширения <code>jpg</code>, <code>txt</code> и <code>docx</code>. Расширение обычно говорит о типе данных в файле. Например, расширение <code>jpg</code> сообщает, что файл содержит графическое изображение, сжатое согласно стандарту JPEG. Расширение <code>txt</code> свидетельствует, что в файле текст. Расширение <code>docx</code> информирует о наличии в&nbsp;файле&nbsp;документа Microsoft Word.</p>



<h2 style="text-align: center;">Кодировка&nbsp;файлов</h2>

<p>Итак, мы говорили о том, как строки текста хранятся в памяти компьютера, таблицах символов ASCII и Юникод, а также о кодировке UTF-8.&nbsp;</p>

<p>Кодировка UTF-8&nbsp;самая распространенная,&nbsp;рекомендуем использовать именно ее в качестве кодировки по умолчанию для текстовых файлов.</p>

<p><img alt="" height="49" src="https://ucarecdn.com/92da9643-a502-4622-b09e-6454d3d18119/" style="float: left;" width="49">UTF-8&nbsp;— сложная кодировка, на обозначение одного&nbsp;символа в ней может использоваться от одного до&nbsp;четырех байт (раньше было 6, но 5 и 6 запретили кодировать для совместимости с UTF-16). Подробнее про эту кодировку можно почитать в <a href="https://ru.wikipedia.org/wiki/UTF-8" rel="noopener noreferrer nofollow" target="_blank">википедии</a>.</p>

<p>В операционной системе Windows до сих пор используется однобайтовая кодировка&nbsp;Windows-1251 (😨). Чтобы избежать&nbsp;проблем при работе с текстовыми&nbsp;файлами в Windows нужно явно указывать кодировку. В&nbsp;редакторе Notepad («Блокнот») можно указывать&nbsp;кодировку при сохранении файла.</p>

<p>Если после такого сохранения открыть файл, то справа внизу мы увидим нужную кодировку при условии, что вы используете блокнот для чтения текстового файла.</p>

<p><img alt="" height="49" src="https://ucarecdn.com/ba922535-23ce-4063-b1ce-9075f41e4fc2/" style="float: left;" width="49">При работе с&nbsp;ОС&nbsp;Linux и&nbsp;MacOS таких проблем не&nbsp;возникает вовсе, поскольку в&nbsp;них кодировка UTF-8 применяется по&nbsp;умолчанию.</p>



<h2 style="text-align: center;">Относительные и абсолютные пути</h2>

<p>Путь файла (или путь к&nbsp;файлу)&nbsp;— последовательное указание имен папок, через которые надо пройти, чтобы добраться до&nbsp;объекта.</p>

<p>Пути к файлу бывают двух типов:</p>

<ul>
	<li>абсолютные;</li>
	<li>относительные.</li>
</ul>

<p><strong>Абсолютный путь</strong> –&nbsp;полный путь к файлу,&nbsp;показывающий&nbsp;<strong>точное место</strong>&nbsp;его расположения. Он всегда один и тот же, пока&nbsp;файл не&nbsp;перемещен.</p>

<p>Примеры абсолютного пути:</p>

<ul>
	<li><code>D:\Data\MyFiles\picture.png</code>;</li>
	<li><code>С:\MyPrograms\Python\script.py</code>;</li>
	<li><code>C:\Users\romka\YandexDisk\Work\Python\book.pdf</code>.</li>
</ul>

<p>Указывая абсолютный путь на компьютере, обязательно нужно указывать диск, а также использовать <code>\</code>&nbsp;(для Windows) в качестве разделителя имен папок.</p>

<p><img alt="" name="1 копия.png" src="https://sch1998u.mskobr.ru/files/NOVOSTI/30.12.22/20211010105318.png" width="150">В&nbsp;unix-подобных ОС, например, в Linux и Mac OS&nbsp;для отделения имен папок используется прямой слеш <code>/</code>, а&nbsp;не&nbsp;обратный, как в&nbsp;Windows.</p>

<p><strong>Относительный путь</strong>&nbsp;– привязан к какой-либо "отправной точке" и указан по отношению к ней.</p>

<p>Например,&nbsp;у нас есть картинка <code>picture.png</code>, которая хранится на диске <code>D</code>. Абсолютный путь к ней будет <code>D:\Data\MyFiles\picture.png</code>, а относительно папки <code>Data</code>&nbsp;можно указывать <code>MyFiles\picture.png</code>.</p>

<p><img alt="" name="1 копия.png" src="https://sch1998u.mskobr.ru/files/NOVOSTI/30.12.22/20211010105318.png" width="150">Абсолютный путь показывает точное местонахождение файла, а относительный показывает путь к файлу от какой-либо "отправной точки".</p>

<p>Конкретная физическая организация файлов, их&nbsp;группировка по&nbsp;папкам, устройство процедур доступа к&nbsp;информации, механизмы кеширования очень сильно зависят от&nbsp;операционной системы и&nbsp;применяемой в&nbsp;ней файловой системы. Как правило, при работе с&nbsp;файлами прикладные программисты работают на&nbsp;верхнем уровне&nbsp;<strong style="font-size: inherit;">абстракции</strong>.</p>

<p>Файлы обычно располагаются на&nbsp;носителях,&nbsp;работающих медленнее, чем оперативная память. Поэтому работа с&nbsp;ними идет в&nbsp;буферизированном режиме. Даже если вы&nbsp;запросите один байт из&nbsp;файла,&nbsp;считается целый блок (до&nbsp;нескольких килобайт). Он&nbsp;переместится в&nbsp;буфер оперативной памяти. Дальше файл читается оттуда, поскольку это быстрее&nbsp;и&nbsp;экономит ресурсы чтения/записи внешних носителей.</p>

<p> Примеры однобайтовых&nbsp;кодировок:</p>

<ul>
	<li><a href="https://ru.wikipedia.org/wiki/Windows-1251" rel="noopener noreferrer nofollow" target="_blank">Windows-1251</a>;</li>
	<li><a href="https://ru.wikipedia.org/wiki/CP866" rel="noopener noreferrer nofollow" target="_blank">cp-866</a>;</li>
	<li><a href="https://ru.wikipedia.org/wiki/%D0%9A%D0%9E%D0%98-8" rel="noopener noreferrer nofollow" target="_blank">КОИ-8</a>.</li>
</ul>



<h3 style="text-align: center;">Открытие файла</h3>

<p>Для открытия файлов в Python существует функция <code>open()</code>.&nbsp;Она создает файловый объект и связывает его с файлом на диске. Общий формат применения функции <code>open()</code>:</p>

<pre><code class="language-python hljs" data-highlighted="yes">файловая_переменная = <span class="hljs-built_in">open</span>(имя_файла, режим_доступа)</code></pre>

<p>Здесь</p>

<ul>
	<li><code>файловая переменная</code> – имя переменной, которая ссылается на файловый объект;</li>
	<li><code>имя_файла</code> – строковый литерал, задающий имя файла;</li>
	<li><code>режим_доступа&nbsp;</code>– строковый литерал, задающий режим доступа (чтение, запись, и т.д.), в котором файл будет открыт.</li>
</ul>

<p>Ниже представлены&nbsp;строковые&nbsp;литералы (символы), используемые&nbsp;для задания режима доступа.</p>

<table align="center" border="1" cellpadding="1" cellspacing="1">
	<thead>
		<tr>
			<th>
			<p>Стр.&nbsp;литерал</p>
			</th>
			<th>Режим</th>
			<th>Описание</th>
		</tr>
	</thead>
	<tbody>
		<tr>
			<td style="text-align: center;"><code>'r'</code></td>
			<td>
			<p>Read (чтение)</p>
			</td>
			<td>Открыть файл только для чтения. Такой файл не может быть изменен.</td>
		</tr>
		<tr>
			<td style="text-align: center;"><code>'w'</code></td>
			<td>Write (запись)</td>
			<td>Открыть файл для записи. Если файл уже существует, стереть его содержимое.<br>
			Если файл не существует, он будет создан.</td>
		</tr>
		<tr>
			<td style="text-align: center;"><code>'a'</code></td>
			<td>Append (добавление)</td>
			<td>Открыть файл для записи. Данные будут добавлены в конец файла. Если файл не существует, он будет создан.</td>
		</tr>
		<tr>
			<td style="text-align: center;"><code>'r+'</code></td>
			<td>Read + Write</td>
			<td>Открыть файл для чтения и записи. В этом режиме&nbsp;происходит частичная перезапись содержимого файла.</td>
		</tr>
		<tr>
			<td style="text-align: center;"><code>'x'</code></td>
			<td>Create (создание)</td>
			<td>Создать новый файл.&nbsp;Если файл существует, произойдет ошибка.</td>
		</tr>
	</tbody>
</table>

<p>Предположим, файл <code>students.txt</code> содержит данные о студентах, и мы хотим открыть его для чтения.</p>

<p>Это можно сделать с помощью строки кода:</p>

<pre><code class="language-python hljs" data-highlighted="yes">student_file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'students.txt'</span>, <span class="hljs-string">'r'</span>)</code></pre>

<p>По умолчанию режим доступа (второй аргумент функции <code>open()</code>) определен для чтения (литерал <code>'r'</code>), поэтому файл <code>students.txt</code> можно открыть для чтения так:</p>

<pre><code class="language-python hljs" data-highlighted="yes">student_file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'students.txt'</span>)   <span class="hljs-comment"># по умолчанию режим доступа для чтения ('r')</span></code></pre>

<p>В результате исполнения этой инструкции будет открыт файл <code>students.txt</code> и переменная <code>student_file</code> будет ссылаться на файловый объект, который можно использовать для чтения данных из файла.</p>

<p><img alt="" height="49" src="https://ucarecdn.com/a8436a48-1fea-46fa-b4a0-975830ec43e7/" style="float: left;" width="49">Обратите внимание, что в переменную <code>student_file</code>&nbsp;в примере выше не попадает содержимое файла <code>students.txt</code>.&nbsp;Фактически это ссылка&nbsp;на файл, ее&nbsp;еще называют <strong>дескриптор файла</strong>.</p>

<p>Предположим, надо создать файл с именем <code>sales.txt</code> и записать в него данные о продажах. Это можно сделать с помощью строки кода:</p>

<pre><code class="language-python hljs" data-highlighted="yes">sales_file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'sales.txt'</span>, <span class="hljs-string">'w'</span>)</code></pre>

<p>После исполнения этого кода будет создан файл <code>sales.txt</code> и переменная <code>sales_file</code> будет ссылаться на файловый объект, который можно использовать для записи в него данных.</p>



In [None]:
student_file = open('students.txt', 'r')
print(student_file)


<h3 style="text-align: center;">Указание места расположения файла</h3>

<p>Когда в функцию <code>open()</code> передается имя файла без указания пути, интерпретатор Python исходит из предположения, что место расположения файла то же, что&nbsp;у исполняемой программы. Например, программа расположена в папке <code>C:\Users\Documents\Python</code>. Если программа выполняется&nbsp;и&nbsp;исполняет инструкцию:</p>

<pre><code class="language-python hljs" data-highlighted="yes">customer_file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'customers.txt'</span>, <span class="hljs-string">'r'</span>)</code></pre>

<p>то файл <code>customers.txt</code> программа станет&nbsp;искать&nbsp;в папке&nbsp;<code>C:\Users\Documents\Python</code>.</p>

<p>Аналогично, если программа выполняется, и она исполняет инструкцию:</p>

<pre><code class="language-python hljs" data-highlighted="yes">sales_file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'sales.txt'</span>, <span class="hljs-string">'w'</span>)</code></pre>

<p>то файл <code>sales.txt</code> создается в той же папке.</p>

<p><img alt="" height="49" src="https://ucarecdn.com/305d2788-56e0-4be6-b0eb-a69287cc5dc4/" style="float: left;" width="49">Если имя файла не содержит путь, то используется относительный путь, относительно папки, где находится исполняемая программа.</p>

<p>Если требуется открыть файл, расположенный в другом месте,&nbsp;нужно указать путь и имя файла в аргументе,&nbsp;передаваемом в функцию <code>open()</code>.</p>

<p>Приведенный ниже код&nbsp;создает файл <code>test.txt</code> в папке <code>C:\Users\temp</code>:</p>

<pre><code class="language-python hljs" data-highlighted="yes">test_file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'C:\\Users\\temp\\test.txt'</span>, <span class="hljs-string">'w'</span>)</code></pre>

<p>Обратите внимание: символ <code>\</code> является специальным&nbsp;символом в Python и его нужно экранировать (<code>\\</code>), чтобы интерпретатор Python&nbsp;рассматривал&nbsp;обратную косую черту как обычный символ.</p>

<p>Вместо экранирования символов можно использовать сырые строки (raw strings). Для этого следует снабдить строковый литерал префиксом в виде буквы <code>r</code>.</p>

<pre><code class="language-python hljs" data-highlighted="yes">test_file = <span class="hljs-built_in">open</span>(<span class="hljs-string">r'C:\Users\temp\test.txt'</span>, <span class="hljs-string">'w'</span>)</code></pre>

<p>Приведенный выше код создает файл <code>test.txt</code> в папке <code>C:\Users\temp</code>. Префикс <code>r</code> указывает на то, что строковый литерал является сырым (неформатированным).</p>

<p>Механизм сырых строк очень удобен не только при работе с файлами.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">path = <span class="hljs-string">'C:\new\text.txt'</span>
<span class="hljs-built_in">print</span>(path)</code></pre>

<p>выводит:</p>

<pre><code class="language-no-highlight hljs">C:
ew	ext.txt</code></pre>

<p>поскольку символы <code>\n</code> и <code>\t</code> интерпретируются как перенос строки и табуляция.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">path = <span class="hljs-string">r'C:\new\text.txt'</span>
<span class="hljs-built_in">print</span>(path)</code></pre>

<p>выводит содержимое строки <code>path</code>:</p>

<pre><code class="language-no-highlight hljs">C:\new\text.txt</code></pre>

<p>Чтобы сделать работу с&nbsp;файлами универсальнее, в&nbsp;путях файлов в&nbsp;Windows в Python-программах рекомендуется ставить прямой слеш (<code>/</code>). В&nbsp;наших примерах мы&nbsp;так и&nbsp;будем делать:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file1 = <span class="hljs-built_in">open</span>(<span class="hljs-string">r'C:/Users/temp/test.txt'</span>)    <span class="hljs-comment"># используем прямой слеш / (абсолютный путь)</span>
file2 = <span class="hljs-built_in">open</span>(<span class="hljs-string">r'temp/data.txt'</span>)             <span class="hljs-comment"># используем прямой слеш / (относительный путь)</span></code></pre>



In [None]:
student_file = open('files_dir/students.txt', 'r')
print(student_file)


<h3 style="text-align: center;">Кодировка</h3>

<p>Открыть файл, содержащий только латиницу и цифры,&nbsp;можно&nbsp;так:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'info.txt'</span>, <span class="hljs-string">'r'</span>)</code></pre>

<p>При работе&nbsp;с текстом на русском языке нужно указать кодировку, для этого служит параметр <code>encoding</code>:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'info.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)</code></pre>

<p><img alt="" height="49" src="https://ucarecdn.com/c816dc73-7195-4547-b88d-8b1c7a9fc05d/" width="49">&nbsp; &nbsp;Указание кодировки при открытии файла – хороший тон. Рекомендуем&nbsp;придерживаться этого правила.</p>

<p>Чтобы получить кодировку открытого файла, используют&nbsp;файловое свойство <code>encoding</code>.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file1 = <span class="hljs-built_in">open</span>(<span class="hljs-string">'students.txt'</span>, <span class="hljs-string">'w'</span>)
file2 = <span class="hljs-built_in">open</span>(<span class="hljs-string">'customers.txt'</span>, <span class="hljs-string">'w'</span>, encoding=<span class="hljs-string">'utf-8'</span>)

<span class="hljs-built_in">print</span>(file1.encoding)
<span class="hljs-built_in">print</span>(file2.encoding)

file1.close()
file2.close()</code></pre>

<p>выводит на компьютере с операционной системой Windows:</p>

<pre><code class="language-no-highlight hljs">cp1252
utf-8</code></pre>



In [None]:
student_file = open('students.txt', 'w')
print(student_file.encoding)


<h3 style="text-align: center;">Закрытие файлов</h3>

<p>После окончания работы с файлом его необходимо закрыть. Для этого есть несколько причин:</p>

<ul>
	<li>если файл изменялся,&nbsp;это позволит корректно его сохранить;</li>
	<li>если открытый файл&nbsp;потребуется другим программам,&nbsp;ваша программа&nbsp;может его блокировать;</li>
	<li>не стоит держать в памяти лишние,&nbsp;уже не нужные&nbsp;данные;</li>
	<li>удалить открытый кем-то файл проблематично.</li>
</ul>

<p>Для закрытия файла используется файловый метод <code>close()</code>:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'info.txt'</span>, <span class="hljs-string">'r'</span>)    <span class="hljs-comment"># открываем файл с именем info.txt для чтения</span>

                                <span class="hljs-comment"># работаем с содержимым файла info.txt</span>

file.close()                    <span class="hljs-comment"># закрываем файл после окончания работы</span></code></pre>

<p>Чтобы проверить открыт файл или закрыт можно использовать файловое свойство (атрибут)&nbsp;<code>closed</code>.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file1 = <span class="hljs-built_in">open</span>(<span class="hljs-string">'students.txt'</span>, <span class="hljs-string">'w'</span>)
file2 = <span class="hljs-built_in">open</span>(<span class="hljs-string">'customers.txt'</span>, <span class="hljs-string">'w'</span>)

file1.close()

<span class="hljs-built_in">print</span>(file1.closed)
<span class="hljs-built_in">print</span>(file2.closed)

file2.close()                    </code></pre>

<p>выводит:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-literal">True</span>
<span class="hljs-literal">False</span></code></pre>

<p><img alt="" height="49" src="https://ucarecdn.com/fc4a1116-147b-4b71-9b64-2f90f5b30395/" style="float: left;" width="49">Обратите внимание на то, что при вызове метода мы используем скобки: <code>close()</code>, а при вызове свойства (атрибута) скобок нет <code>closed</code>. Методы совершают действия, а свойства возвращают информацию об объекте.</p>



<h2 style="text-align: center;">Чтение содержимого файла</h2>

<p>Как уже сказано, при открытии файла с помощью функции <code>open()</code> в файловую переменную попадает не содержимое файла, а ссылка на файл (дескриптор&nbsp;файла).</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'info.txt'</span>, <span class="hljs-string">'w'</span>, encoding=<span class="hljs-string">'utf-8'</span>)    <span class="hljs-comment"># открываем файл для записи</span>

<span class="hljs-built_in">print</span>(file)</code></pre>

<p>выводит:</p>

<pre><code class="language-1c hljs" data-highlighted="yes">&lt;_io.TextIOWrapper name<span class="hljs-punctuation">=</span>'info.txt' mode<span class="hljs-punctuation">=</span>'w' encoding<span class="hljs-punctuation">=</span>'utf-8'&gt;</code></pre>

<p>Для чтения содержимого открытого для чтения файла&nbsp;используются три файловых метода:</p>

<ul>
	<li><code>read()</code> –&nbsp;читает все содержимое файла;</li>
	<li><code>readline()</code> –&nbsp;читает одну&nbsp;строку из файла;</li>
	<li><code>readlines()</code> –&nbsp;читает все содержимое файла и возвращает список строк.</li>
</ul>

<p>Предположим, в папке с исполняемой программой есть текстовый файл <code>languages.txt</code> с содержимым:</p>

<pre><code class="language-no-highlight hljs">Python
Java
Javascript
C#
C
C++
PHP
R
Objective-C</code></pre>



<h3 style="text-align: center;">Метод read()</h3>

<p>Файловый метод&nbsp;<code>read()</code>&nbsp;считывает все содержимое из файла и возвращает строку, которая может содержать символы перехода на новую строку&nbsp;<code>'\n'</code>.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)

content = file.read()

file.close()</code></pre>

<p>считывает содержимое файла <code>languages.txt</code> в переменную <code>content</code>. В переменной <code>content</code> будет содержаться строка&nbsp;<code>'Python\nJava\nJavascript\nC#\nC\nC++\nPHP\nR\nObjective-C'</code>.</p>

<p>Таким образом, метод <code>read()</code> считывает все содержимое файла, <strong>включая переносы строк</strong>:</p>

<p><img alt="" height="49" src="https://ucarecdn.com/93a9e9ad-1e53-4de1-b130-b613159d620e/" style="float: left;" width="49">Если методу&nbsp;<code>read()</code>&nbsp;передать целочисленный параметр, то будет считано не более заданного количества символов. Например, считывать файл&nbsp;посимвольно можно при помощи метода&nbsp;<code>read(1)</code>.</p>



In [None]:
student_file = open('files_dir/students.txt', 'r', encoding='utf-8')
print(student_file.read(10))


<h3 style="text-align: center;">Метод readline()</h3>

<p>Файловый метод&nbsp;<code>readline()</code>&nbsp;считывает одну строку из файла (до символа конца строки <code>'\n'</code>), при этом&nbsp;возвращается&nbsp;считанная строка вместе с символом&nbsp;<code>'\n'</code>. Если считать строку&nbsp;не удалось –&nbsp;достигнут конец файла и больше строк в нем нет, возвращается пустая строка.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)

language = file.readline()

file.close()</code></pre>

<p>считывает содержимое первой строки файла&nbsp;<code>languages.txt</code> в переменную <code>language</code>.&nbsp;В переменной <code>language</code> будет содержаться строка&nbsp;<code>'Python\n'</code>.</p>

<p>Для удаления символа&nbsp;<code>'\n'</code>&nbsp;из конца считанной строки&nbsp;удобно использовать строковый метод&nbsp;<code>rstrip()</code>.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">line = <span class="hljs-string">'Python\n'</span>
line = line.rstrip()</code></pre>

<p>удаляет символ <code>\n</code> из содержимого строки&nbsp;<code>line</code>, в результате чего в переменной&nbsp;<code>line</code> содержится строка <code>'Python'</code>.</p>

<p>Прочитать содержимое всего&nbsp;файла построчно можно двумя способами.</p>

<p><strong>С помощью цикла </strong><code>while</code><strong>:</strong></p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)

line = file.readline()         <span class="hljs-comment"># считываем первую строку</span>

<span class="hljs-keyword">while</span> line != <span class="hljs-string">''</span>:              <span class="hljs-comment"># пока не конец файла</span>
    <span class="hljs-built_in">print</span>(line.strip())        <span class="hljs-comment"># обрабатываем считанную строку</span>
    line = file.readline()     <span class="hljs-comment"># читаем новую строку</span>

file.close()</code></pre>

<p><strong>С помощью цикла </strong><code>for</code><strong> (предпочтительный вариант):</strong></p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)

<span class="hljs-keyword">for</span> line <span class="hljs-keyword">in</span> file:
    <span class="hljs-built_in">print</span>(line.strip())
    
file.close()</code></pre>

<p><img alt="" height="49" src="https://ucarecdn.com/670a1ab6-2be7-4199-9d3e-b423471fa328/" style="float: left;" width="49">Метод&nbsp;<code>readline()</code>&nbsp;довольно удобен, когда мы хотим управлять процессом чтения из файла, особенно если файл очень большой и его полное считывание может привести к нехватке памяти.</p>



In [None]:
student_file = open('files_dir/students.txt', 'r', encoding='utf-8')
name = student_file.readline()
print(name)
print(f'Hello, {name}!')

In [None]:
student_file = open('files_dir/students.txt', 'r', encoding='utf-8')
name = student_file.readline().strip()
print(name)
print(f'Hello, {name}!')

<h3 style="text-align: center;">Метод readlines()</h3>

<p>Файловый метод&nbsp;<code>readlines()</code>&nbsp;считывает все строки из файла и возвращает список из всех считанных строк (одна строка&nbsp;— один элемент списка). При этом, каждая строка в списке&nbsp;заканчивается символом переноса строки&nbsp;&nbsp;<code>'\n'</code>😅.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)

languages = file.readlines()

file.close()</code></pre>

<p>считывает содержимое&nbsp;файла&nbsp;<code>languages.txt</code>&nbsp;в переменную <code>languages</code>.&nbsp;В переменной <code>languages</code> будет содержаться список:</p>

<pre><code class="language-1c hljs" data-highlighted="yes">['Python\n'<span class="hljs-punctuation">,</span> 'Java\n'<span class="hljs-punctuation">,</span> 'Javascript\n'<span class="hljs-punctuation">,</span> 'C#\n'<span class="hljs-punctuation">,</span> 'C\n'<span class="hljs-punctuation">,</span> 'C++\n'<span class="hljs-punctuation">,</span> 'PHP\n'<span class="hljs-punctuation">,</span> 'R\n'<span class="hljs-punctuation">,</span> 'Objective-C']</code></pre>

<p>Чтобы удалить символ <code>'\n'</code>&nbsp;можно использовать списочное выражение:</p>

<pre><code class="language-python hljs" data-highlighted="yes">languages = [line.strip() <span class="hljs-keyword">for</span> line <span class="hljs-keyword">in</span> file.readlines()]</code></pre>

<p><img alt="" height="49" src="https://ucarecdn.com/6080b46d-ba8e-43d3-95f5-22ecfe43b0fe/" style="float: left;" width="49">Если передать в функцию <code>list()</code> ссылку на файловый объект&nbsp;<code>list(file)</code>&nbsp;, получим тот же результат, что при вызове метода&nbsp;<code>file.readlines()</code>.</p>



<h2 style="text-align: center;">Примечания</h2>

<p><strong>Примечание 1.</strong> Python позволяет работать не только с текстовыми, но и с бинарными файлами.&nbsp;Ниже представлены&nbsp;строковые&nbsp;литералы, которые можно использовать для задания режима обработки файла.</p>

<table align="center" border="1" cellpadding="1" cellspacing="1">
	<thead>
		<tr>
			<th>&nbsp; &nbsp; Символ&nbsp; &nbsp;</th>
			<th>Режим</th>
			<th>Описание</th>
		</tr>
	</thead>
	<tbody>
		<tr>
			<td style="text-align: center;"><code>'t'</code></td>
			<td>Текстовый режим (значение по умолчанию)</td>
			<td>Работа с текстовым файлом</td>
		</tr>
		<tr>
			<td style="text-align: center;"><code>'b'</code></td>
			<td>Бинарный режим</td>
			<td>Работа с бинарными файлами (картинки, звук и т.д.)</td>
		</tr>
	</tbody>
</table>

<p>Режим обработки файла указывается <strong>после</strong> режима доступа к файлу.</p>

<p>Приведенный ниже код открывает файл <code>file.dat</code> в режиме чтения как бинарный файл.</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'file.dat'</span>, <span class="hljs-string">'rb'</span>)</code></pre>

<p>По умолчанию функция <code>open()</code> использует литерал <code>'rt'</code>, то есть файл открывается для чтения в текстовом&nbsp; режиме.</p>

<p>Таким образом, открыть текстовый файл для чтения можно так&nbsp;<code>open('info.txt')</code>, или так&nbsp;<code>open('info.txt', 'r')</code>, или так&nbsp;<code>open('info.txt', 'rt')</code>.</p>

<p><strong>Примечание 2.</strong> Так как&nbsp;Python — язык с автоматическим управлением памятью,&nbsp;все файлы закрываются автоматически&nbsp;после успешного завершения программы или&nbsp;когда удаляется последняя ссылка на файловый объект. Но&nbsp;важно все равно закрывать файл, как только он&nbsp;перестает быть нужным. Это помогает избегать конфликтов совместного доступа и риска получить испорченный&nbsp;файл, если программа завершится аварийно.</p>

<p>Файл&nbsp;должен&nbsp;быть закрыт&nbsp;сразу&nbsp;после того, как все нужное&nbsp;из него прочитано или в него записано.</p>

<p><strong>Примечание 3.</strong> Еще раз обратите внимание на&nbsp;то, что в&nbsp;путях до&nbsp;файла используются прямые слеши <code>/</code>. Можно использовать и&nbsp;обратные, но&nbsp;тогда их&nbsp;придется экранировать либо применять модификатор сырой строки <code>r</code>. Кроме того, в&nbsp;unix-подобных операционных системах&nbsp;принято использовать именно прямой слеш.</p>

<p><strong>Примечание 4.</strong>&nbsp;Существуют&nbsp;специальные символы:</p>

<ul>
	<li><code>\n</code>&nbsp;– перемещает позицию печати на одну строку вниз;</li>
	<li><code>\r</code>&nbsp;– перемещает позицию печати в крайнее левое положение строки.</li>
</ul>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-built_in">print</span>(<span class="hljs-string">'aaaaaa\nbb'</span>)</code></pre>

<p>выводит:</p>

<pre><code class="language-no-highlight hljs">aaaaaa
bb</code></pre>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-built_in">print</span>(<span class="hljs-string">'aaaaaa\rbb'</span>)</code></pre>

<p>выводит:</p>

<pre><code class="language-no-highlight hljs">bbaaaa</code></pre>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-built_in">print</span>(<span class="hljs-built_in">ord</span>(<span class="hljs-string">'\n'</span>))
<span class="hljs-built_in">print</span>(<span class="hljs-built_in">ord</span>(<span class="hljs-string">'\r'</span>))
</code></pre>

<pre>выводит:</pre>

<pre><code class="language-no-highlight hljs">10
13</code></pre>

<p><strong>Примечание 5.</strong>&nbsp;После того как файл (<code>file</code>) открыт, можно получить различную относящуюся к нему информацию. Три полезных атрибута (свойства):</p>

<table align="center" border="1" cellpadding="1" cellspacing="1">
	<thead>
		<tr>
			<th>Атрибут (свойство)</th>
			<th>Описание</th>
		</tr>
	</thead>
	<tbody>
		<tr>
			<td style="text-align: center;"><code>file.closed</code></td>
			<td>возвращает истину (<code>True</code>), если файл закрыт, иначе возвращает ложь (<code>False</code>)</td>
		</tr>
		<tr>
			<td style="text-align: center;"><code>file.mode</code></td>
			<td>возвращает режим доступа, с помощью которого был открыт файл</td>
		</tr>
		<tr>
			<td style="text-align: center;"><code>file.name</code></td>
			<td>возвращает имя файла</td>
		</tr>
	</tbody>
</table>

<h2 style="text-align: center;">Позиция в файле</h2>

<p>Когда мы читаем текст из файла с помощью методов <code>read()</code> или <code>readlines()</code> происходит перемещение&nbsp;<strong>текущей позиции</strong> в конец файла. При использовании метода&nbsp;<code>readline()</code> текущая позиция перемещается на следующую строку файла.</p>

<p>При открытии файла текущая позиция всегда&nbsp;равна нулю&nbsp;– указывает на первый символ текста. При прочтении файла до конца с помощью вызова методов&nbsp;<code>read(), readlines()</code>&nbsp;позиция перемещается в конец файла и последующие чтения ничего не дают.</p>

<p><img alt="" name="1 копия.png" src="https://sch1998u.mskobr.ru/files/NOVOSTI/30.12.22/20211010105318.png" width="150">Вызов методов&nbsp;<code>read(), readlines(), readline()</code>&nbsp;перемещает текущую позицию туда, где завершилось чтение. Для методов <code>read()</code> и <code>readlines()</code> это конец файла, для метода <code>readline()</code>&nbsp;– следующая строка после прочитанной.</p>

<p>Текущую&nbsp;позицию&nbsp;обычно называют&nbsp;"<strong>курсор"</strong>.&nbsp;</p>

<p>Предположим, у нас есть файл <code>languages.txt</code>. Когда мы его открываем,&nbsp;курсор находится в начале файла, в нулевой позиции, это выглядит примерно так:</p>

<p style="text-align: center;"><img alt="" height="404" src="https://ucarecdn.com/448f886e-cc06-470f-9cd5-6ba571341214/" width="554"></p>

<p>Если мы считаем две&nbsp;строки с помощью метода <code>readline()</code>:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)
line1 = file.readline()
line2 = file.readline()

file.close()</code></pre>

<p>курсор переместится в начало&nbsp;третьей&nbsp;строки:</p>

<p style="text-align: center;"><img alt="" height="404" src="https://ucarecdn.com/b0362a51-bf99-469c-b306-8a831479b1e0/" width="551"></p>

<p>Чтение всегда происходит слева направо от&nbsp;курсора. Таким образом, если после двух вызовов метода <code>readline()</code> вызвать метод&nbsp;<code>read()</code>,&nbsp;он&nbsp;считает не весь файл, а только оставшиеся строки:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)
line1 = file.readline()
line2 = file.readline()
remaining_lines = file.read()    <span class="hljs-comment"># считывание начинается с 3 строки до конца файла</span>

file.close()</code></pre>

<p>После того, как мы считали все строки файла, курсор находится в конце.</p>

<p style="text-align: center;"><img alt="" height="404" src="https://ucarecdn.com/95f1fee4-011b-4286-a5c7-62dddab0e54c/" width="549"></p>

<p>После завершения чтения мы больше не можем считать ни одного символа из файла. Все последующие вызовы методов&nbsp;<code>read()</code> или <code>readline()</code> будут приводить к считыванию пустой строки.</p>

<p>Для повторного чтения данных из файла, можно:</p>

<ul>
	<li>переоткрыть файл, тогда курсор снова попадёт в начало;</li>
	<li>переместить курсор с помощью файлового метода <code>seek()</code>.</li>
</ul>



<h3 style="text-align: center;">Файловый метод&nbsp;seek()</h3>

<p>Файловый метод <code>seek()</code> задаёт позицию курсора в байтах от начала файла. Чтобы перевести курсор в самое начало файла необходимо вызвать метод <code>seek()</code>, передав ему в качестве аргумента значение <span><span class="katex"><span class="katex-mathml"><math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mn>0</mn></mrow><annotation encoding="application/x-tex">0</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height: 0.64444em; vertical-align: 0em;"></span><span class="mord">0</span></span></span></span></span>.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)
line1 = file.readline()
file.seek(<span class="hljs-number">0</span>)               <span class="hljs-comment"># переводим курсор в самое начало</span>
line2 = file.readline()

<span class="hljs-built_in">print</span>(line1, line2)

file.close()</code></pre>

<p>выводит:</p>

<pre><code data-highlighted="yes" class="hljs language-nginx"><span class="hljs-attribute">Python</span>
Python</code></pre>

<p>Метод <code>seek()</code> <strong>не очень</strong> полезен при работе с текстовыми файлами, так как не учитывает разделение текста на строки. А вот при работе с файлами в двоичном режиме умение работать с позицией и смещениями очень важно!</p>

<p><img alt="" name="1 копия.png" src="https://sch1998u.mskobr.ru/files/NOVOSTI/30.12.22/20211010105318.png" width="150"> Будьте аккуратны с символами, использующими более <span><span class="katex"><span class="katex-mathml"><math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mn>1</mn></mrow><annotation encoding="application/x-tex">1</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height: 0.64444em; vertical-align: 0em;"></span><span class="mord">1</span></span></span></span></span> байта (кириллица&nbsp;в кодировке&nbsp;<code>utf-8</code>), обращение к "промежуточному" байту может вызвать ошибку.</p>

<p>Если метод <code>seek()</code> устанавливает курсор (текущую позицию), то метод&nbsp;<code>tell()</code> получает ее.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)
<span class="hljs-built_in">print</span>(file.tell())
line1 = file.readline()
<span class="hljs-built_in">print</span>(file.tell())

file.close()</code></pre>

<p>выводит:</p>

<pre><code class="language-no-highlight hljs">0
8</code></pre>

<p>В самом начале курсор (текущая позиция) равен&nbsp;нулю, после считывания первой строки, курсор смещается на <span><span class="katex"><span class="katex-mathml"><math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mn>8</mn></mrow><annotation encoding="application/x-tex">8</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height: 0.64444em; vertical-align: 0em;"></span><span class="mord">8</span></span></span></span></span> байт (по байту на каждый из символов <code>'P', 'y', 't', 'h', 'o', 'n'</code> и&nbsp;два&nbsp;байта на символ перевода строки <code>'\n'</code>).</p>



<h2 style="text-align: center;">Менеджер&nbsp;контекста</h2>

<p>Как уже сказано, важно своевременно&nbsp;закрывать файлы&nbsp;с помощью метода <code>close()</code>.&nbsp;Закрытие файлов вручную, а также отдача закрытия на откуп среде исполнения, обладают&nbsp;существенным недостатком: если между открытием файла&nbsp;и его закрытием произойдёт ошибка,&nbsp;в лучшем случае файл окажется открыт слишком долго, а в худшем случае часть данных не сохранится.</p>

<p>Хочется иметь возможность автоматически закрывать файл сразу после окончания работы с ним и осуществлять закрытие даже при возникновении ошибки. Файловые объекты уже умеют работать в таком режиме, но для этого их нужно использовать как&nbsp;<strong>менеджеры контекста</strong>.</p>

<p>Менеджер контекста<em> </em>— объект, реализующий одноименный протокол. Объекты, реализующие этот протокол, позволяют использовать следующий специальный синтаксис:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">object</span> <span class="hljs-keyword">as</span> name:
    <span class="hljs-comment"># Здесь нам доступен ресурс name.</span>
    <span class="hljs-comment"># Это тело with-блока.</span>
<span class="hljs-comment"># А здесь ресурс name уже освобождён, даже если в теле with-блока произошла ошибка.</span>
</code></pre>

<p>Весь код в теле&nbsp;<code>with</code>-блока работает "в контексте". Чаще всего контекст подразумевает выделение некоего ресурса, например, файла. По выходу из контекста ресурс автоматически освобождается, даже если при выполнении блока возникло исключение.</p>

<p>Как только закончится код, оформленный с отступами в <code>with</code> (аналогичные отступы в циклах или функциях), это будет означать, что контекст закончился, и Python автоматически закроет файл.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes">file = <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>)

<span class="hljs-keyword">for</span> line <span class="hljs-keyword">in</span> file:
    <span class="hljs-built_in">print</span>(line)

file.close()              <span class="hljs-comment"># ручное закрытие файла</span>

<span class="hljs-built_in">print</span>(<span class="hljs-string">'Файл закрыт'</span>)</code></pre>

<p>можно переписать в виде:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'languages.txt'</span>, <span class="hljs-string">'r'</span>, encoding=<span class="hljs-string">'utf-8'</span>) <span class="hljs-keyword">as</span> file:
    <span class="hljs-keyword">for</span> line <span class="hljs-keyword">in</span> file:
        <span class="hljs-built_in">print</span>(line)
                          <span class="hljs-comment"># автоматическое закрытие файла</span>
<span class="hljs-built_in">print</span>(<span class="hljs-string">'Файл закрыт'</span>)</code></pre>

<p>Обратите внимание: при использовании менеджера контекста&nbsp;не требуется использовать метод <code>close()</code>.</p>

<p>При работе с файлами желательно всегда использовать менеджер&nbsp;контекста. Это&nbsp;делает&nbsp;программу надежнее.</p>

<p>В современных операционных системах файловый ввод-вывод устроен достаточно сложно. Для обеспечения максимального быстродействия чтения и записи в файлы, а также контроля&nbsp;безопасности&nbsp;этого процесса, большинство операционных систем&nbsp;не позволяют программам напрямую работать с диском.&nbsp;Операционная система предоставляет программам специальные объекты —&nbsp;файловые дескрипторы (функция <code>open()</code> возвращает как раз файловый дескриптор). Имея файловый дескриптор, можно записывать&nbsp;и читать&nbsp;данные, не задумываясь о файловой системе. Файловые дескрипторы удобны, но на создание каждого расходуется достаточно большое&nbsp;количество ресурсов. Поэтому у операционной системы есть общий лимит на количество&nbsp;одновременно использующихся&nbsp;файловых дескрипторов. И при этом каждая программа имеет свой собственный лимит. Как только программа исчерпает доступное ей количество дескрипторов, следующая попытка открыть очередной файл закончится с ошибкой.&nbsp;Программисту важно следить за тем, сколько файлов программа открывает в каждый момент и закрывает ли она их своевременно.&nbsp;Используйте менеджер контекста <code>with</code>&nbsp;и жизнь станет проще.</p>

<p> С помощью менеджера&nbsp;контекста можно работать с несколькими файлами.</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'input.txt'</span>, <span class="hljs-string">'r'</span>) <span class="hljs-keyword">as</span> input_file, <span class="hljs-built_in">open</span>(<span class="hljs-string">'output.txt'</span>, <span class="hljs-string">'w'</span>) <span class="hljs-keyword">as</span> output_file:
    <span class="hljs-comment"># обработка файлов</span></code></pre>


In [None]:
with open('files_dir/numbers.txt', encoding='utf-8') as file:
    line1 = file.readline()
    line2 = file.read()
    print(line2)

In [None]:
with open('files_dir/words.txt', encoding='utf-8') as file:
    line1 = file.readline().split()
    print(line1)
    file.seek(0)
    line2 = file.readline().split()
    print(line2)

    print(max(line2))


In [None]:
with open('files_dir/words.txt', encoding='utf-8') as file:
    print('Повторяй!', file.readline().strip())
    file.seek(0)
    for line in file:
        print('то', line[5:-2] + '.')
        break


<h2 style="text-align: center;">Запись данных в файлы</h2>

<p>Файлы могут быть открыты для чтения, а могут для записи данных. 
<p>Для записи&nbsp;используются два&nbsp;файловых метода:</p>

<ul>
	<li><code>write()</code>&nbsp;– записывает переданную строку в файл;</li>
	<li><code>writelines()</code>&nbsp;– записывает переданный список строк в файл.</li>
</ul>



<h3 style="text-align: center;">Метод write()</h3>

<p>Общий формат применения файлового метода <code>write()</code>:</p>

<pre><code data-highlighted="yes" class="hljs language-scss">файловая_переменная<span class="hljs-selector-class">.writ</span>е(строковое_значение)</code></pre>

<p>Здесь</p>

<ul>
	<li><code>файловая переменная</code>&nbsp;–&nbsp;это имя переменной, которая ссылается на файловый объект;</li>
	<li><code>строковое значение</code>&nbsp;–&nbsp;это символьная последовательность, которая будет записана в файл.</li>
</ul>

<p><img alt="" name="1 копия.png" src="https://sch1998u.mskobr.ru/files/NOVOSTI/30.12.22/20211010105318.png" width="150">&nbsp; &nbsp;Для записи данных в файл&nbsp;он&nbsp;должен быть открыт для записи (режимы&nbsp;<code>'w', 'а', 'r+'</code>), иначе произойдет ошибка.</p>

<p>Рассмотрим текcтовый файл <code>myfile.txt</code>, содержащий следующие строки:</p>

<pre><code class="language-no-highlight hljs">First line of the file.
Second line of the file.
Third line of the file.</code></pre>

<p>Если файл открыт в режиме <code>'w'</code>, то его содержимое сначала полностью стирается, а уже затем в него добавляются данные.</p>

<p>После выполнения следующего кода:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'myfile.txt'</span>, <span class="hljs-string">'w'</span>, encoding=<span class="hljs-string">'utf-8'</span>) <span class="hljs-keyword">as</span> file:
    file.write(<span class="hljs-string">'Python is snake, not language!\n'</span>)
    file.write(<span class="hljs-string">'We love it &lt;3'</span>)</code></pre>

<p>файл <code>myfile.txt</code> будет содержать:</p>

<pre><code class="language-no-highlight hljs">Python is snake, not language!
We love it &lt;3</code></pre>

<p>Если файл открыт в режиме <code>'a'</code>, то&nbsp;запись происходит в самый конец файла.</p>

<p>После выполнения следующего кода:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'myfile.txt'</span>, <span class="hljs-string">'a'</span>, encoding=<span class="hljs-string">'utf-8'</span>) <span class="hljs-keyword">as</span> file:
    file.write(<span class="hljs-string">'Python is snake, not language!\n'</span>)
    file.write(<span class="hljs-string">'We love it &lt;3'</span>)</code></pre>

<p>файл <code>myfile.txt</code> будет содержать:</p>

<pre><code class="language-no-highlight hljs">First line of the file.
Second line of the file.
Third line of the file.Python is snake, not language!
We love it &lt;3</code></pre>

<p>Если файл открыт в режиме <code>'r+'</code>, то происходит частичная перезапись его содержимого.</p>

<p>После выполнения следующего кода:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'myfile.txt'</span>, <span class="hljs-string">'r+'</span>, encoding=<span class="hljs-string">'utf-8'</span>) <span class="hljs-keyword">as</span> file:
    file.write(<span class="hljs-string">'Python is snake, not language!\n'</span>)
    file.write(<span class="hljs-string">'We love it!'</span>)</code></pre>

<p>файл <code>myfile.txt</code> будет содержать:</p>

<pre><code class="language-no-highlight hljs">Python is a snake, not language!
We love it!ile.
Third line of the file.</code></pre>



<h3 style="text-align: center;">Метод writelines()</h3>

<p>Последовательные вызовы метода&nbsp;<code>write()</code>&nbsp;дописывают текст в конец файла.</p>

<p>Приведенный ниже код создает файл <code>philosophers.txt</code> и записывает в него три строки текста:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'philosophers.txt'</span>, <span class="hljs-string">'w'</span>, encoding=<span class="hljs-string">'utf-8'</span>) <span class="hljs-keyword">as</span> file:
    file.write(<span class="hljs-string">'Джoн Локк\n'</span>)
    file.write(<span class="hljs-string">'Дэвид Хьюм\n'</span>)
    file.write(<span class="hljs-string">'Эдмyнд Берк\n'</span>)</code></pre>

<p>На практике&nbsp;часто приходится записывать в файл содержимое целого списка. Это можно сделать с помощью цикла или метода&nbsp;<code>writelines()</code>, что удобнее. Метод <code>writelines()</code> принимает в качестве аргумента список строк и записывает его в файл.</p>

<p>Приведенный ниже&nbsp;код создает файл <code>philosophers.txt</code> и записывает в него содержимое списка&nbsp;<code>philosophers</code>:</p>

<pre><code class="language-python hljs" data-highlighted="yes">philosophers = [<span class="hljs-string">'Джoн Локк\n'</span>, <span class="hljs-string">'Дэвид Хьюм\n'</span>, <span class="hljs-string">'Эдмyнд Берк\n'</span>]

<span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'philosophers.txt'</span>, <span class="hljs-string">'w'</span>, encoding=<span class="hljs-string">'utf-8'</span>) <span class="hljs-keyword">as</span> file:
    file.writelines(philosophers)</code></pre>

<p>Обратите внимание, что все записанные в файл строковые значения оканчиваются символом <code>'\n'</code>,&nbsp;экранированной последовательностью новой строки. Символ <code>'\n'</code> не только отделяет находящиеся в файле значения друг от друга, но и обеспечивает появление каждого из них на отдельной строке во время просмотра данных в текстовом редакторе.</p>

<p>Такой вариант записи предпочтителен, когда нужно записать большой объем текста, который вы получаете и обрабатываете строчка за строчкой. Можно предварительно накопить весь текст в одну большую строку, однако для этого может потребоваться большой объём памяти. Гораздо лучше записывать строчки по мере готовности и&nbsp;<code>writelines</code>&nbsp;для этого подходит идеально!</p>



<h3 style="text-align: center;">Запись в файл с помощью функции print()</h3>

<p>Для записи данных в файл можно также использовать встроенную функцию <code>print()</code>. Для этого нужно передать ей еще один именованный аргумент&nbsp;<code>file</code>, указывающий на открытый файл. При этом функция <code>print()</code> автоматически&nbsp;добавляет переход на новую строку.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'philosophers.txt'</span>, <span class="hljs-string">'w'</span>, encoding=<span class="hljs-string">'utf-8'</span>) <span class="hljs-keyword">as</span> output:
    <span class="hljs-built_in">print</span>(<span class="hljs-string">'Джoн Локк'</span>, file=output)
    <span class="hljs-built_in">print</span>(<span class="hljs-string">'Дэвид Хьюм'</span>, file=output)
    <span class="hljs-built_in">print</span>(<span class="hljs-string">'Эдмyнд Берк'</span>, file=output)</code></pre>

<p>создает файл <code>philosophers.txt</code> с содержимым:</p>

<pre><code class="language-python hljs" data-highlighted="yes">Джoн Локк
Дэвид Хьюм
Эдмyнд Берк</code></pre>

<p>Мы можем использовать всю мощность встроенной&nbsp;функции <code>print()</code> для форматирования выводимого текста.</p>

<p>Приведенный ниже код:</p>

<pre><code class="language-python hljs" data-highlighted="yes"><span class="hljs-keyword">with</span> <span class="hljs-built_in">open</span>(<span class="hljs-string">'philosophers.txt'</span>, <span class="hljs-string">'w'</span>, encoding=<span class="hljs-string">'utf-8'</span>) <span class="hljs-keyword">as</span> output:
    <span class="hljs-built_in">print</span>(<span class="hljs-string">'Джoн Локк'</span>, <span class="hljs-string">'Дэвид Хьюм'</span>, <span class="hljs-string">'Эдмyнд Берк'</span>, sep=<span class="hljs-string">'***'</span>, file=output)</code></pre>

<p>создает файл <code>philosophers.txt</code> с содержимым:</p>

<pre><code class="language-no-highlight hljs">Джoн Локк***Дэвид Хьюм***Эдмyнд Берк</code></pre>

<p><img alt="" name="1 копия.png" src="https://sch1998u.mskobr.ru/files/NOVOSTI/30.12.22/20211010105318.png" width="150"> Не забывайте, что файловые методы <code>write()</code> и <code>writelines()</code> не добавляют переход на новую строку, поэтому для перехода на новую строку в файле необходимо явно добавить символ&nbsp;<code>'\n'</code>.</p>



<h2 style="text-align: center;">Примечания</h2>

<p><strong>Примечание 1.</strong>&nbsp;В некоторых операционных системах невыполнение операции закрытия файла может привести к потере данных. Данные сначала пишутся в буфер – небольшую область временного хранения&nbsp;в оперативной памяти. Когда буфер заполняется, система записывает его содержимое&nbsp;в файл. Это увеличивает производительность системы,&nbsp;потому&nbsp;что запись данных в оперативную память быстрее&nbsp;записи на диск. Процесс закрытия файла записывает любые несохраненные данные из буфера в файл. Чтобы принудительно записать содержимое буфера в файл, используется файловый метод <code>flush()</code>.</p>

<p><strong>Примечание 2.</strong> Используйте конструкцию <code>with</code> для чтения и записи файлов. Закрывать файлы — полезная привычка, и если вы используете команду <code>with</code> при работе с файлами, вам не придется беспокоиться об их закрытии. Команда <code>with</code> автоматически закрывает файл за вас.</p>
