In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
path = '/content/drive/MyDrive/Foxford/Софья Тентлер/Война и мир.txt'

## Открытие и работа с файлами на Python

```python
open(path) # позволяет открыть файл по пути path

```

```python
open(path, mode) # позволяет открыть файл по пути path, mode - способ открытия файла

```

mode может принимать значения:

__r__ - чтение из файла

__t__ - открытие как обычный текстовый файл

__w__ - запись в файл, или его создание если его нет

__x__ - запись в файл, или вывод ошибки если файла нет

__b__ - открытие как двоичный файл

__a__ - запись в виде добавления нового в конец

__+__ - работа с чтением и записью

In [None]:
file = open(path, 'r')

Если сталкиваемся с проблемой кодировки файла, то используем универсальный детектор для определения кодировки файла

In [None]:
from chardet.universaldetector import UniversalDetector

detector = UniversalDetector()
with open(path, 'rb') as fh:
    for line in fh:
        detector.feed(line)
        if detector.done:
            break
    detector.close()
print(detector.result)

{'encoding': 'windows-1251', 'confidence': 0.99, 'language': 'Russian'}


In [None]:
file = open(path, 'r', encoding='windows-1251')
print(file.readline())

Спасибо, что скачали книгу в бесплатной электронной библиотеке Royallib.ru: http://royallib.ru



Если мы хотим прекратить работу с файлом, то используем


```python
file.close()
```

Нельзя работать с закрытым файлом

In [None]:
file.close()

## Способы чтения текста в файле


1. Чтение всего файла сразу

```python
file = open(path, 'r')
print(file.read())
```

2. Вывод некоторого количества символов

```python
file = open(path, 'r')
print(file.read(6))
```

3. Считывание файла по линиям, до перехода на следующую строку - разделителя "\n"

```python
file = open(path, 'r')
print(file.readline())
```



In [None]:
file = open(path, 'r', encoding='windows-1251')
print(file.readline())

Спасибо, что скачали книгу в бесплатной электронной библиотеке Royallib.ru: http://royallib.ru



## Стандартный способ чтения файлов в Python


```python
with open(path, 'r', encoding='utf-8') as file:
  file.read()
file.close()
```

In [None]:
with open(path, 'r', encoding='windows-1251') as file:
  print(file.readline())

Спасибо, что скачали книгу в бесплатной электронной библиотеке Royallib.ru: http://royallib.ru



ДЗ на 18.08.24

1. Сделать копию файла себе на диск
2. Запустить весь код (считать файл, вывести 10 строк текста, отдельно вывести первые 1000 символов)
3. Скачать самостоятельно файлы txt из интернета и попробовать провести те же операции (для 2 других файлов)

In [None]:
from chardet.universaldetector import UniversalDetector

detector = UniversalDetector()
with open('/content/Сказки братьев Гримм.txt', 'rb') as fh:
    for line in fh:
        detector.feed(line)
        if detector.done:
            break
    detector.close()
print(detector.result)

{'encoding': 'windows-1251', 'confidence': 0.99, 'language': 'Russian'}


In [None]:
path_to_file = '/content/Сказки братьев Гримм.txt'
with open(path_to_file, 'r', encoding='windows-1251') as f:
  for i in range(1000):
    print(f.readline())

Спасибо, что скачали книгу в бесплатной электронной библиотеке Royallib.com: https://royallib.com



Все книги автора: https://royallib.com/author/grimm_yakob.html



Эта же книга в других форматах: https://royallib.com/book/grimm_yakob/nastoyashchie_skazki_bratev_grimm_polnoe_sobranie.html



Приятного чтения!









Братья Гримм



Настоящие сказки братьев Гримм. Полная версия







Предисловие



Братья Гримм и их сказки



Минуло много лет с той поры, как «Детские и домашние сказки» братьев Гримм впервые вышли в свет. Издание было самое скромное и по внешности, и по объему: в книжке было всего 83 сказки вместо 200, печатаемых в настоящее время. Предисловие, предпосланное сборнику братьями Гримм, было подписано 18 октября приснопамятного 1812 года. Книжка была оценена по достоинству в эту эпоху немецкого самосознания, в эту эпоху пробуждения горячих националистических стремлений и пышного расцвета романтики. Еще при жизни братьев Гримм их сборник, постоянно ими дополняемый, выдер

# Занятие 23


Дозапись текста в файл

```python
path='path/file.txt'
with open(path, 'w', encoding='utf-8') as f:


```

In [2]:
path = '/content/drive/MyDrive/Foxford/Софья Тентлер/Сказки братьев Гримм.txt'

In [8]:
with open(path, 'r+', encoding='windows-1251') as f:
  text = 'Текст для финала файла'
  f.write(text)
file.close()

In [9]:
with open(path, 'r+', encoding='windows-1251') as f:
  for i in range(100):
    print(f.readline())

Текст для финала файланигу в бесплатной электронной библиотеке Royallib.com: https://royallib.com



Все книги автора: https://royallib.com/author/grimm_yakob.html



Эта же книга в других форматах: https://royallib.com/book/grimm_yakob/nastoyashchie_skazki_bratev_grimm_polnoe_sobranie.html



Приятного чтения!









Братья Гримм



Настоящие сказки братьев Гримм. Полная версия







Предисловие



Братья Гримм и их сказки



Минуло много лет с той поры, как «Детские и домашние сказки» братьев Гримм впервые вышли в свет. Издание было самое скромное и по внешности, и по объему: в книжке было всего 83 сказки вместо 200, печатаемых в настоящее время. Предисловие, предпосланное сборнику братьями Гримм, было подписано 18 октября приснопамятного 1812 года. Книжка была оценена по достоинству в эту эпоху немецкого самосознания, в эту эпоху пробуждения горячих националистических стремлений и пышного расцвета романтики. Еще при жизни братьев Гримм их сборник, постоянно ими дополняемый, выдер

## Дозапись со стиранием данных из файла

Ести мы открываем файл на дозапись с помощью указателя 'w', то все данные из файла удаляются, а новый текст добавляется в пустой файл. Если файла по данному пути не существует, то данный файл создается и текст записывается в него.

In [11]:
path = '/content/drive/MyDrive/Foxford/Софья Тентлер/Копия Сказки братьев Гримм.txt'
with open(path, 'w', encoding='windows-1251') as f:
  f.write('Текст в конце файла')
f.close()

with open(path, 'r', encoding='windows-1251') as f:
    print(f.read())
f.close()

Текст в конце файла


In [12]:
path = '/content/drive/MyDrive/Foxford/Софья Тентлер/Новые сказки Барда Бигля.txt'
with open(path, 'w', encoding='windows-1251') as f:
  f.write('История о трех братьях')
f.close()

In [13]:
path = '/content/drive/MyDrive/Foxford/Софья Тентлер/Новые сказки Барда Бигля.txt'
with open(path, 'r', encoding='windows-1251') as f:
  print(f.read())
f.close()

История о трех братьях


Дозапись с помощью указателя 'a'

In [16]:
path = '/content/drive/MyDrive/Foxford/Софья Тентлер/Новые сказки Барда Бигля.txt'
with open(path, 'a', encoding='windows-1251') as f:
  f.write('\nТекст в конец нового файла')
f.close()

with open(path, 'r', encoding='windows-1251') as f:
  print(f.read())
f.close()

История о трех братьяхТекст в конец нового файла
Текст в конец нового файла


Открытие файла с указателем 'x'

In [21]:
path = '/content/drive/MyDrive/Foxford/Софья Тентлер/Руслан и Людмила.txt'
with open(path, 'x') as f:
    f.write('\nТекст в конец нового файла')
f.close()

with open(path, 'r') as f:
  print(f.read())
f.close()

FileExistsError: [Errno 17] File exists: '/content/drive/MyDrive/Foxford/Софья Тентлер/Руслан и Людмила.txt'

In [28]:
path = '/content/drive/MyDrive/Foxford/Софья Тентлер/Новые сказки Барда Бигля.txt'
with open(path, 'r+', encoding='windows-1251') as f:
  f.writelines(['Строка 1', '\nСтрока 2', '\nСтрока 3', '\nСтрока 4', '\nСтрока 5'])
f.close()

with open(path, 'r', encoding='windows-1251') as f:
  print(f.read())
f.close()

Строка 1
Строка 2
Строка 3
Строка 4
Строка 5

ла
Текст в конец нового файла


## Работа с файловой системой

In [29]:
import os

Получим путь к папке в которой находимся сейчас

In [30]:
print(os.getcwd())

/content


Получим содержимое каталога в виде списка

In [32]:
print(os.listdir())

print(os.listdir('/content/drive/MyDrive/Foxford/Софья Тентлер'))

['.config', 'drive', 'sample_data']
['Занятие 21-23. 11-25.08.24.ipynb', 'Занятие 12. 26.05.24.ipynb', 'Занятие 13. 02.06.24.ipynb', 'Занятие 9. 05.05.24.ipynb', 'Код для определения существования даты.py', 'Занятие 20. 04.08.24.ipynb', 'Война и мир.txt', 'Сказки братьев Гримм.txt', 'Копия Сказки братьев Гримм.txt', 'Новые сказки Барда Бигля.txt', 'Руслан и Людмила.txt']


Получим список файлов, которые оканчиваюься на __.txt__

In [33]:
txt_files = []

for file in os.listdir('/content/drive/MyDrive/Foxford/Софья Тентлер'):
  if file.endswith('.txt'):
    txt_files.append(file)
print(txt_files)

['Война и мир.txt', 'Сказки братьев Гримм.txt', 'Копия Сказки братьев Гримм.txt', 'Новые сказки Барда Бигля.txt', 'Руслан и Людмила.txt']


Чтение файлов, если их кодировка неизвестна

In [35]:
from chardet.universaldetector import UniversalDetector

for file in txt_files:
  path = '/content/drive/MyDrive/Foxford/Софья Тентлер' + '/' + file

  detector = UniversalDetector()
  with open(path, 'rb') as fh:
    for line in fh:
      detector.feed(line)
      if detector.done:
        break
    detector.close()

  encoding = detector.result['encoding']

  with open(path, 'r', encoding=encoding) as f:
    print(f.read(100))
  f.close()

Спасибо, что скачали книгу в бесплатной электронной библиотеке Royallib.ru: http://royallib.ru

Все 
Текст для финала файланигу в бесплатной электронной библиотеке Royallib.com: https://royallib.com

В
Текст в конце файла
Строка 1
Строка 2
Строка 3
Строка 4
Строка 5

ла
Текст в конец нового файла

Текст в конец нового файла


ДЗ на 01.09.24
1. Создать новый текстовый файл, используя открытие файлов через указатель 'w'
2. Записать в текст 1 строку стандартным способом
3. Записать в текст 10 предложений с помощью записи в виде списка
4. Создать еще 2 пустых файла в формате txt
5. С помощью кода выше дозаписать в конец каждого из 3 файлов идентичный текст по твоему выборку (одно предложение, можно больше)