<h2>Работа с файлами</h2>

Чтобы прочитать текстовый файл с помощью Python, нужно проделать следующие шаги:

Шаг 1: Файл необходимо открыть для чтения с помощью метода open() и передать путь к файлу.

Шаг 2: Следующий шаг — чтение файла, с помощью нескольких встроенных методов, таких как read(), readline(), readlines().

Шаг 3: После выполнения операции чтения, текстовый файл необходимо закрыть с помощью функции close().

Альтернативой использования open() - close() является конструкция with open()

Пример:

In [26]:
!wget https://raw.githubusercontent.com/annashell/LSTM_task/refs/heads/main/data/shakespear.txt

--2025-04-10 12:21:44--  https://raw.githubusercontent.com/annashell/LSTM_task/refs/heads/main/data/shakespear.txt
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 99993 (98K) [text/plain]
Saving to: ‘shakespear.txt’


2025-04-10 12:21:44 (5.16 MB/s) - ‘shakespear.txt’ saved [99993/99993]



In [2]:
with open("shakespear.txt", "r", encoding="utf-8") as file:
    lines = file.readlines()

for i, line in enumerate(lines[:8]):
    print(f"{i}\t{line.strip()}")

0	That, poor contempt, or claim'd thou slept so faithful,
1	I may contrive our father; and, in their defeated queen,
2	Her flesh broke me and puttance of expedition house,
3	And in that same that ever I lament this stomach,
4	And he, nor Butly and my fury, knowing everything
5	Grew daily ever, his great strength and thought
6	The bright buds of mine own.
7	


In [None]:
lines[289]

'And in their heart shall break thy bloody load with over\n'

Второй аргумент функции open() - режим работы с файлом. 'r' - четние, 'w' - запись, 'a' - запись, но если файл еще не существует, он создается.

Сама функция open() возвращает непосредственно объект потока ввода-вывода файла, с которым мы дальше можем работать в выбранном режиме:

In [None]:
file = open("shakespear.txt",'r')
file

<_io.TextIOWrapper name='shakespear.txt' mode='r' encoding='utf-8'>

<h2>Методы чтения:<h2/>

read() : Функция read() возвращает прочитанные символы в виде строки. Этот метод хорош, когда у вас небольшой файл, и вы хотите прочитать определенное количество символов или весь файл и сохранить их в строковой переменной.

readline() : Функция readline() возвращает одну строку из текстового файла в виде строки.

readlines(): Функция readlines() считывает все строки из текстового файла и возвращает каждую строку как строковый элемент в списке.

In [3]:
file = open("shakespear.txt", "r")
content = file.read()
print(content[:100])
file.close()

That, poor contempt, or claim'd thou slept so faithful,
I may contrive our father; and, in their def


In [None]:
file = open("shakespear.txt", "r")
content = file.readline()
print(content)
file.close()

That, poor contempt, or claim'd thou slept so faithful,



Можно прочитать файл построчно в цикле:

In [None]:
file = open("shakespear.txt", "r")
while True:
	content=file.readline()
	if not content:
		break
	print(content)
file.close()

Запись в файл:

In [4]:
file = open("hello.txt", "w")
file.write("Hello world!")
file.close()

Аналогичная конструкция с with open():

In [5]:
with open("hello2.txt", "w") as file:
    file.write("Hello world!")

Символ перевода строки - \n:

In [6]:
lines = ["раз", "два", "три"]
with open(r"count.txt", "w") as file:
    for  line in lines:
        file.write(line + '\n')

<h2>Пути к файлам</h2>

В ОС Windows имена папок и файлов разделяются обратным слешем \. В Unix и Max - прямым слешем /.

Способы задать путь в Python:

In [None]:
r"C:\Folder_1\file1.txt"
"C:\\Folder_1\\file1.txt"
"C:/Folder_1/file1.txt"  # будет автоматически переформатировано под формат Windows

'C:/Folder_1/file1.txt'

В примере выше приведены абсолютные пути (т.е. полные пути от корневой папки). Также бывают отосительные пути - пути относительно текущей папки. Например, выше мы открывали файл shakespear.txt без указания папки - это и был относительный путь, т.к файл находится в текущем каталоге.

Если мы создадим в текущем каталоге папку sample и скопируем туда файл shakespear.txt, путь к нему будет sample\shakespear.txt

In [9]:
with open(r"/content/Folder_1/shakespear.txt", "r", encoding="utf-8") as file:
    lines = file.readlines()

for i, line in enumerate(lines[:8]):
    print(f"{i}\t{line.strip()}")

0	That, poor contempt, or claim'd thou slept so faithful,
1	I may contrive our father; and, in their defeated queen,
2	Her flesh broke me and puttance of expedition house,
3	And in that same that ever I lament this stomach,
4	And he, nor Butly and my fury, knowing everything
5	Grew daily ever, his great strength and thought
6	The bright buds of mine own.
7	


<h2>Модуль os и os.path</h2>

In [10]:
import os

filepath = os.path.join("Folder_1", "file1.txt")
print(filepath)

Folder_1/file1.txt


In [11]:
path, file = os.path.split("C:/Folder_1/file1.txt")
print(path)
print(file)

C:/Folder_1
file1.txt


In [12]:
print(os.sep)

/


In [13]:
file, ext = os.path.splitext("file1.txt")
print(file)
print(ext)

file1
.txt


In [15]:
os.path.exists("drive")

True

In [16]:
os.makedirs("Folder_1")

In [17]:
os.path.exists("Folder_1")

True

In [18]:
with open("Folder_1/hello.txt", "w") as file:
    file.write("Hello world!")

In [21]:
os.listdir("sample_data")

['anscombe.json',
 'README.md',
 'mnist_train_small.csv',
 'mnist_test.csv',
 'california_housing_train.csv',
 'california_housing_test.csv']

In [None]:
import os
for root, dirs, files in os.walk("."):  # текущая директория; сюда можно передавать относительный или абсолютный путь к любой папке
    print(root, dirs, files)

. ['.config', 'Folder_1', 'sample_data'] ['count.txt', 'Folder_1\\hello.txt', 'hello2.txt', 'shakespear.txt', 'hello.txt']
./.config ['logs', 'configurations'] ['active_config', 'hidden_gcloud_config_universe_descriptor_data_cache_configs.db', 'gce', 'config_sentinel', '.last_update_check.json', '.last_opt_in_prompt.yaml', 'default_configs.db', '.last_survey_prompt.yaml']
./.config/logs ['2025.04.07'] []
./.config/logs/2025.04.07 [] ['13.42.24.146310.log', '13.42.34.302585.log', '13.42.43.503346.log', '13.42.44.251076.log', '13.42.02.070730.log', '13.42.32.824024.log']
./.config/configurations [] ['config_default']
./Folder_1 [] ['hello.txt']
./sample_data [] ['anscombe.json', 'README.md', 'mnist_train_small.csv', 'mnist_test.csv', 'california_housing_train.csv', 'california_housing_test.csv']


<h2>Модуль glob</h2>

In [22]:
import glob

In [23]:
glob.glob("sample_data/*.csv")

['sample_data/mnist_train_small.csv',
 'sample_data/mnist_test.csv',
 'sample_data/california_housing_train.csv',
 'sample_data/california_housing_test.csv']

In [24]:
glob.glob("*.txt")

['count.txt', 'hello2.txt', 'hello.txt']

Задача. Выведите информацию о текстовом файле - название, сколько в нем строк, слов и символов.

In [30]:
filename = input("Введите имя файла:")

with open(filename, 'r') as file:
  content = file.read()
  lines = content.split('\n')
  words = content.split()

  print(f"Анализ файла {filename}")
  print(f"Строк: {len(lines)}")
  print(f"Слов: {len(words)}")
  print(f"Символов: {len(content)}")

Введите имя файла:/content/hello.txt
Анализ файла /content/hello.txt
Строк: 1
Слов: 2
Символов: 12
