### Работа с файлами в Python
  * Чтение и запись текстовых файлов
  * Чтение и запись бинарных файлов
  * Обработка данных в формате JSON
  * Сериализация объектов pickle
  * Чтение и запись сжатых файлов
  * Библиотеки os и shutil
  * Проверка существования файлов
#### Чтение и запись текстовых файлов

In [2]:
%%writefile somefile.txt
some text

Overwriting somefile.txt


In [4]:
# Чтение файлов
f = open('somefile.txt', 'r')
data = f.read()
f.close()
data

'some text\n'

In [5]:
# Запись файлов с помощью write 
# write принимает на вход строку
text1 = 'Blah-Blah-Blah'
f = open('somefile_new.txt', 'w')
f.write(text1)
f.close()

In [6]:
#  Запись файлов с помощью writelines
# writelines принимает список
text1 = 'Blah-Blah-Blah'
text2 = 'Blah-Blah-Blah'
texts = [text1,text2]
f = open('somefile_new.txt', 'w')
f.writelines(texts)
f.close()

In [7]:
!cat somefile_new.txt

"cat" �� ���� ����७��� ��� ���譥�
��������, �ᯮ��塞�� �ணࠬ��� ��� ������ 䠩���.


In [8]:
# Важно! Разделители нужно ставить самостоятельно :)
texts = [text1,text2]
f = open('somefile_new.txt', 'w')
f.writelines([t + '\n' for  t in texts])
f.close()

In [9]:
# проверим что внутри somefile_new.txt
!cat somefile_new.txt

"cat" �� ���� ����७��� ��� ���譥�
��������, �ᯮ��塞�� �ணࠬ��� ��� ������ 䠩���.


In [10]:
lines = []
with open('somefile.txt', 'rt') as f: 
    for line in f:
        lines.append(line)
lines

['some text\n']

In [11]:
# Пишем кусочки текстовых данных
text1 = 'Blah-Blah-Blah'
text2 = text1 * 2
with open('somefile_new.txt', 'wt') as f:
    f.write(text1)
    f.write(text2)

In [12]:
# Добавляем текст в файл
with open('somefile_new.txt', 'a') as f:
    f.write(text1)
    f.write(text2)

In [13]:
# Записываем текст в файл
with open('somefile_new.txt', 'wt') as f:
    f.write(text1)
    f.write(text2)

In [14]:
# Перенаправленная инструкция print для записи в файл
line1 = text1 
line2 = text2 
with open('somefile_new.txt', 'wt') as f:
    print(line1, file=f)
    print(line2, file=f)

In [15]:
# Перенаправленная инструкция print с разделителем
with open('somefile_new.txt', 'wt') as f:
    print(line1, 90, 20, sep=',', file=f)
    print(line1, 90, 20, sep=',', file=f)

In [16]:
!cat somefile_new.txt

"cat" �� ���� ����७��� ��� ���譥�
��������, �ᯮ��塞�� �ணࠬ��� ��� ������ 䠩���.


In [17]:
# В print можно менять знаки окончания строки
for i in range(5): 
    print(i)
#     print(i , end='\n')

0
1
2
3
4


In [18]:
for i in range(5): 
    print(i, end=' ')

0 1 2 3 4 

### Чтение и запись бинарных файлов

In [19]:
# Записать бинарные данные в файл
with open('somefile.bin', 'wb') as f:
    f.write(b'Hello World')

In [20]:
# Прочесть весь файл как одну байтовую строку
with open('somefile.bin', 'rb') as f: 
    data = f.read()
for el in data:
    print(el)

72
101
108
108
111
32
87
111
114
108
100


### Pickle

In [21]:

# пикл сериализует объекты python в бинарные файлы
import pickle
very_important_list = [1,3,4,5,6]
fpath = 'vil.pkl'
with open(fpath, 'wb') as f:
    pickle.dump(very_important_list,f)

In [22]:
!ls

"ls" �� ���� ����७��� ��� ���譥�
��������, �ᯮ��塞�� �ணࠬ��� ��� ������ 䠩���.


In [23]:
with open(fpath, 'rb') as f:
    new_very_important_list = pickle.load(f)
new_very_important_list

[1, 3, 4, 5, 6]

### Чтение и запись сжатых файлов

In [24]:
import gzip
import bz2
# Сжатие с помощью gzip
text = 'bla-bla-bla ' * 5
with gzip.open('somefile.gz', 'wt') as f:
    f.write(text)
# Распаковка
with gzip.open('somefile.gz', 'rt') as f:
    newtext = f.read()
newtext

'bla-bla-bla bla-bla-bla bla-bla-bla bla-bla-bla bla-bla-bla '

In [25]:
# Сжатие с помощью bz2
text = 'bla-bla-bla ' * 3
with bz2.open('somefile.bz2', 'wt') as f:
    f.write(text)

In [26]:
# Распаковка
with bz2.open('somefile.bz2', 'rt') as f:
    new_text = f.read()
new_text

'bla-bla-bla bla-bla-bla bla-bla-bla '

In [27]:
# Для ZIP архивов можно использовать библиотеку zipfile

import zipfile
zf = zipfile.ZipFile('somefile.zip', 'w')
zf.write('somefile.txt')
zf.close()

In [28]:
# Архивируем
with zipfile.ZipFile('somefile2.zip', 'w') as zf:
    zf.write('somefile.txt')

In [29]:
# Извлекаем из архива
fzip = zipfile.ZipFile('somefile2.zip')
fzip.extract(fzip.namelist()[0])
fzip.close()

### JSON
  * сын Джея
  * java script object notation

In [31]:
# JSON - это формат для передачи данных из разных систем
import json
data = {
    'name' : 'Vasya',
    'age' : 50,
    'sex' : 'M',
    'status':True
    }
json_str = json.dumps(data)
json_str

'{"name": "Vasya", "age": 50, "sex": "M", "status": true}'

In [32]:
# Запись JSON-данных
with open('data.json', 'w') as f:
    json.dump(data, f)

In [36]:
!ls

"ls" �� ���� ����७��� ��� ���譥�
��������, �ᯮ��塞�� �ணࠬ��� ��� ������ 䠩���.


In [34]:
# Чтение данных
with open('data.json', 'r') as f:
    data = json.load(f)

In [None]:
# Синтаксис JSON очень похож синтаксис в Python
# True при отображении меняется на true, False – на false,а None – на null.

### os и shutil

In [35]:
import os
# Выдает список содержимого директории
os.listdir()

['1.intro.ipynb',
 '2.loops.ipynb',
 '3.files.ipynb',
 'data.json',
 'somefile.bin',
 'somefile.bz2',
 'somefile.gz',
 'somefile.txt',
 'somefile.zip',
 'somefile2.zip',
 'somefile_new.txt',
 'vil.pkl']

In [37]:
# Создает директорию
os.mkdir('test')

In [38]:
# Удаляет директорию
os.rmdir('test')

In [None]:
# Если нужно пройтись по дереву каталога можно использовать os.walk
# for el in os.walk('test'):
#     print(el)

In [39]:

# Если нужно склеить путь к файлу или директории
os.path.join('..','img','file.txt')

'..\\img\\file.txt'

In [40]:
# Используйте os.path, чтобы проверить, существует ли файл или каталог. Например:
os.path.exists('img') 
os.path.exists('img/spam')

False

In [41]:
# Вы можете выполнить дополнительные тесты, чтобы проверить тип файла. Эти проверки возвращают False, если файл не существует:
# Это обычный файл?
os.path.isfile('img')

False

In [42]:
# Это каталог?
os.path.isdir('img')

False

In [43]:
# Если вам нужно получить метаданные (например, размер или дату изменения файла)
# это тоже можно сделать с помощью модуля os.path:
os.path.getsize('img/jay.jpeg')

FileNotFoundError: [WinError 3] Системе не удается найти указанный путь: 'img/jay.jpeg'

In [44]:
os.path.getmtime('img')

FileNotFoundError: [WinError 2] Не удается найти указанный файл: 'img'

In [45]:
import time
time.ctime(os.path.getmtime('img'))

FileNotFoundError: [WinError 2] Не удается найти указанный файл: 'img'

### shutil

In [49]:
import shutil
# Для премещения файлов можно использовать shutil.move
# shutil.move(src, dst)
# Для компирования можно воспользоваться одной из нескольких функций
# shutil.copy(src, dst)  - копирует содержимое файла
# shutil.copytree(src, dst)  - копирует содержимое директории
# Если директория не пуста, то для ее удаления лучше использовать rmtree из shutil
# shutil.rmtree('test')

In [50]:
!ls

"ls" �� ���� ����७��� ��� ���譥�
��������, �ᯮ��塞�� �ணࠬ��� ��� ������ 䠩���.


In [51]:
# Создадим директории
os.mkdir('test_dir1')
os.mkdir('test_dir2')
# Перенесем файл
shutil.move('somefile_new.txt', 'test_dir1/somefile_new.txt')

FileExistsError: [WinError 183] Невозможно создать файл, так как он уже существует: 'test_dir1'

In [52]:

# Скопируем файл
shutil.copy('test_dir1/somefile_new.txt', 'test_dir2/somefile_new.txt') 

FileNotFoundError: [Errno 2] No such file or directory: 'test_dir1/somefile_new.txt'

In [53]:
# Скопируем директорию и ее содержимое
shutil.copytree('test_dir2', 'test_dir3') 

'test_dir3'

In [54]:
# Удалим то, что мы создали
shutil.rmtree('test_dir1')
shutil.rmtree('test_dir2')
shutil.rmtree('test_dir3')

### Практическая часть

In [59]:
# 1. Создайте директорию poems
os.mkdir('poems')

In [61]:
%%writefile poems/pushkin.txt


Writing poems/pushkin.txt


In [63]:
# 2. Создайте в ней файл pushkin.txt, в который запишите text_task
text_task = """
Я помню чудное мгновенье:
Передо мной явилась ты,
Как мимолетное виденье,
Как гений чистой красоты.
"""
f = open('poems/pushkin.txt', 'w')
f.write(text_task)
f.close()


In [None]:
# 3. Удалите директорию poems
shutil.rmtree('poems')