[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/4vel/python-intro/blob/main/Lesson2/notebooks/3.files.ipynb)

# Работа с файлами в Python

* Чтение и запись текстовых файлов
* Чтение и запись бинарных файлов
* Обработка данных в формате JSON
* Сериализация объектов pickle
* Чтение и запись сжатых файлов
* Библиотеки os и shutil 
* Проверка существования файлов

### Чтение и запись текстовых файлов

In [None]:
%%writefile somefile.txt
some text

In [2]:
# Чтение файлов
f = open('somefile.txt', 'r')
data = f.read()
f.close()

In [4]:
# Запись файлов с помощью write 
# write принимает на вход строку
text1 = 'Blah-Blah-Blah'
f = open('somefile_new.txt', 'w')
f.write(text1)
f.close()

In [6]:
#  Запись файлов с помощью writelines
# writelines принимает список
text1 = 'Blah-Blah-Blah'
text2 = 'Blah-Blah-Blah'
texts = [text1,text2]
f = open('somefile_new.txt', 'w')
f.writelines(texts)
f.close()

In [7]:
!cat somefile_new.txt

Blah-Blah-BlahBlah-Blah-Blah

In [68]:
# Важно! Разделители нужно ставить самостоятельно :)
texts = [text1,text2]
f = open('somefile_new.txt', 'w')
f.writelines([t + '\n' for  t in texts])
f.close()

In [69]:
# проверим что внутри somefile_new.txt
!cat somefile_new.txt

Blah-Blah-Blah
Blah-Blah-BlahBlah-Blah-Blah


In [34]:
lines = []
with open('somefile.txt', 'rt') as f: 
    for line in f:
        lines.append(line)
lines

In [36]:
# Пишем кусочки текстовых данных
text1 = 'Blah-Blah-Blah'
text2 = text1 * 2
with open('somefile_new.txt', 'wt') as f:
    f.write(text1)
    f.write(text2)

In [37]:
# Добавляем текст в файл
with open('somefile_new.txt', 'a') as f:
    f.write(text1)
    f.write(text2)

In [None]:
# Записываем текст в файл
with open('somefile_new.txt', 'wt') as f:
    f.write(text1)
    f.write(text2)

In [39]:
# Перенаправленная инструкция print для записи в файл
line1 = text1 
line2 = text2 
with open('somefile_new.txt', 'wt') as f:
    print(line1, file=f)
    print(line2, file=f)

In [116]:
# Перенаправленная инструкция print с разделителем
with open('somefile_new.txt', 'wt') as f:
    print(line1, 90, 20, sep=',', file=f)
    print(line1, 90, 20, sep=',', file=f)

In [104]:
!cat somefile_new.txt

Blah-Blah-Blah,90,20
Blah-Blah-Blah,90,20


In [105]:
# В print можно менять знаки окончания строки
for i in range(5): 
    print(i)
#     print(i , end='\n')


0
1
2
3
4


In [106]:
for i in range(5): 
    print(i, end=' ')

0 1 2 3 4 

# Чтение и запись бинарных файлов

In [141]:
# Записать бинарные данные в файл
with open('somefile.bin', 'wb') as f:
    f.write(b'Hello World')

In [142]:
# Прочесть весь файл как одну байтовую строку
with open('somefile.bin', 'rb') as f: 
    data = f.read()

In [146]:
for el in data:
    print(el)

72
101
108
108
111
32
87
111
114
108
100


# Pickle

In [8]:
# пикл сериализует объекты python в бинарные файлы
import pickle
very_important_list = [1,3,4,5,6]

In [9]:
fpath = 'vil.pkl'
with open(fpath, 'wb') as f:
    pickle.dump(very_important_list,f)

In [11]:
!ls

[31m1.intro.ipynb[m[m      [31m5.modul.ipynb[m[m      [31msomefile.bz2[m[m       [31msomefile2.zip[m[m
[31m2.loops.ipynb[m[m      [31m6.decorator.ipynb[m[m  [31msomefile.gz[m[m        somefile_new.txt
[31m3.files.ipynb[m[m      [31mdata.json[m[m          [31msomefile.txt[m[m       [31mvil.pkl[m[m
[31m4.exceptions.ipynb[m[m [31msomefile.bin[m[m       [31msomefile.zip[m[m


In [12]:
with open(fpath, 'rb') as f:
    new_very_important_list = pickle.load(f)

In [13]:
new_very_important_list

[1, 3, 4, 5, 6]

# Чтение и запись сжатых файлов

In [150]:
import gzip
import bz2

In [165]:
# Сжатие с помощью gzip
text = 'bla-bla-bla ' * 5
with gzip.open('somefile.gz', 'wt') as f:
    f.write(text)

In [166]:
# Распаковка
with gzip.open('somefile.gz', 'rt') as f:
    newtext = f.read()
newtext

'bla-bla-bla bla-bla-bla bla-bla-bla bla-bla-bla bla-bla-bla '

In [162]:
# Сжатие с помощью bz2
text = 'bla-bla-bla ' * 3
with bz2.open('somefile.bz2', 'wt') as f:
    f.write(text)

In [163]:
# Распаковка
with bz2.open('somefile.bz2', 'rt') as f:
    new_text = f.read()
new_text

In [185]:
# Для ZIP архивов можно использовать библиотеку zipfile

import zipfile
zf = zipfile.ZipFile('somefile.zip', 'w')
zf.write('somefile.txt')
zf.close()

In [186]:
# Архивируем
with zipfile.ZipFile('somefile2.zip', 'w') as zf:
    zf.write('somefile.txt')

In [183]:
# Извлекаем из архива
fzip = zipfile.ZipFile('somefile2.zip')
fzip.extract(fzip.namelist()[0])
fzip.close()

# JSON
* сын Джея
* java script object notation

In [15]:
# JSON - это формат для передачи данных из разных систем
import json
data = {
    'name' : 'Vasya',
    'age' : 50,
    'sex' : 'M',
    'status':True
    }
json_str = json.dumps(data)

In [16]:
json_str

'{"name": "Vasya", "age": 50, "sex": "M", "status": true}'

In [17]:
# Запись JSON-данных
with open('data.json', 'w') as f:
    json.dump(data, f)

In [18]:
!ls

[31m1.intro.ipynb[m[m      [31m5.modul.ipynb[m[m      [31msomefile.bz2[m[m       [31msomefile2.zip[m[m
[31m2.loops.ipynb[m[m      [31m6.decorator.ipynb[m[m  [31msomefile.gz[m[m        somefile_new.txt
[31m3.files.ipynb[m[m      [31mdata.json[m[m          [31msomefile.txt[m[m       [31mvil.pkl[m[m
[31m4.exceptions.ipynb[m[m [31msomefile.bin[m[m       [31msomefile.zip[m[m


In [19]:
# Чтение данных
with open('data.json', 'r') as f:
    data = json.load(f)

In [193]:
# Синтаксис JSON очень похож синтаксис в Python
# True при отображении меняется на true, False – на false,а None – на null.

# os и shutil

In [22]:
import os

In [24]:
# Выдает список содержимого директории
os.listdir()

['vil.pkl',
 'somefile2.zip',
 '4.exceptions.ipynb',
 'somefile_new.txt',
 'somefile.bin',
 '.DS_Store',
 'somefile.txt',
 'somefile.bz2',
 'data.json',
 '1.intro.ipynb',
 'somefile.zip',
 '6.decorator.ipynb',
 '3.files.ipynb',
 '.ipynb_checkpoints',
 '5.modul.ipynb',
 'somefile.gz',
 '2.loops.ipynb']

In [25]:
# Создает директорию
os.mkdir('test')

In [26]:
# Удаляет директорию
os.rmdir('test')

In [53]:
# Если нужно пройтись по дереву каталога можно использовать os.walk
# for el in os.walk('test'):
#     print(el)

In [27]:
# Если нужно склеить путь к файлу или директории
os.path.join('..','img','file.txt')

'../img/file.txt'

In [14]:
# Используйте os.path, чтобы проверить, существует ли файл или каталог. Напри- мер:
os.path.exists('img') 
os.path.exists('img/spam')


False

In [15]:
# Вы можете выполнить дополнительные тесты, чтобы проверить тип файла. Эти проверки возвращают False, если файл не существует:
# Это обычный файл?
os.path.isfile('img')


False

In [16]:
# Это каталог?
os.path.isdir('img')


True

In [22]:
# Если вам нужно получить метаданные (например, размер или дату изменения файла)
# это тоже можно сделать с помощью модуля os.path:
os.path.getsize('img/jay.jpeg')

91132

In [23]:
os.path.getmtime('img')

1567432372.2145486

In [24]:
import time
time.ctime(os.path.getmtime('img'))

'Mon Sep  2 16:52:52 2019'

# shutil

In [87]:
import shutil

In [None]:
# Для премещения файлов можно использовать shutil.move
# shutil.move(src, dst)

In [None]:
# Для компирования можно воспользоваться одной из нескольких функций
# shutil.copy(src, dst)  - копирует содержимое файла
# shutil.copytree(src, dst)  - копирует содержимое директории

In [46]:
# Если директория не пуста, то для ее удаления лучше использовать rmtree из shutil
# shutil.rmtree('test')

In [112]:
!ls

Lesson_3.ipynb       [34mimg[m[m                  somefile.txt
[34mdata[m[m                 medal_on_sheets.xlsx vil.pkl
data.json            medals.xlsx


In [113]:
# Создадим директории
os.mkdir('test_dir1')
os.mkdir('test_dir2')

In [117]:
# Перенесем файл
shutil.move('somefile_new.txt', 'test_dir1/somefile_new.txt')

'test_dir1/somefile_new.txt'

In [118]:
# Скопируем файл
shutil.copy('test_dir1/somefile_new.txt', 'test_dir2/somefile_new.txt') 

'test_dir2/somefile_new.txt'

In [119]:
# Скопируем директорию и ее содержимое
shutil.copytree('test_dir2', 'test_dir3') 

'test_dir3'

In [120]:
# Удалим то, что мы создали
shutil.rmtree('test_dir1')
shutil.rmtree('test_dir2')
shutil.rmtree('test_dir3')

# Практическая часть

In [None]:
# 1. Создайте директорию poems
#----- Ваш код здесь ----

In [222]:
# 2. Создайте в ней файл pushkin.txt, в который запишите text_task
text_task = """
Я помню чудное мгновенье:
Передо мной явилась ты,
Как мимолетное виденье,
Как гений чистой красоты.
"""
#----- Ваш код здесь ----

In [None]:
# 3. Удалите директорию poems
#----- Ваш код здесь ----