# Файлы

## Открытие файла

open(name[, mode[, buffering]])

Функция возвращает файловый объект. Обязателен только первый аргумент. Если остальные параметры отсутствуют, файл будет доступен на чтение. 

Таблица режимов (mode) функции open:
* 'r' – чтение.
* 'w' – запись.
* 'a' – добавление.
* 'b' – бинарный режим.
* '+' – чтение/запись.

Режим '+' может быть добавлен к остальным режимам. По умолчанию питон открывает файлы в текстовом режиме. Для открытия файла в бинарном режиме на чтение можно добавить 'rb'. Третий параметр устанавливает размер буферизации при работе с файлом. По умолчанию он выключен, и чтение/запись идет напрямую с диска на диск. Для включения буфера третий параметр должен быть отличным от нуля.

## Базовые файловые методы

In [27]:
f = open('file.txt', 'w')
f.write('Hello, ')
f.write('World!')
f.close() # !!!

In [28]:
f = open('file.txt')#, 'r')
print(f.read(3))
print(f.read())

Hel
lo, World!


## Произвольный доступ

seek(offset [, whence])
    
    offset – смещение в байтах относительно начала файла
    whence – по умолчанию равен нулю, указывает на то, что смещение берется относительно начала файла
  
tell() возвращает текущую позицию файла

In [32]:
f = open(r'my_file_2.txt', 'w')
f.write('01234567890123456789')
print(f.tell())
f.seek(5)
f.write('Hello, World!')
print(f.tell())

f.close()
f = open(r'my_file_2.txt')
f.read()

20


ValueError: negative seek position -1

In [None]:
print(r'C:\nanay.txt')

## Построчная работа с файлами

file.readline()
     
     без параметра читает всю строку
     параметр указывает максимальное число символов строки, которое будет прочитано

file.readlines()     
     
     Прочитать все строки и вернуть список строк

file.writelines()
    
    Записать строки в файл



In [33]:
f = open(r'my_file2.txt')
lines = f.readlines()
f.close()
lines[2] = "This is my_file2 \n" # изменяем 1-ю строку
f = open(r'my_file2.txt','w')
f.writelines(lines)
f.close()

In [34]:
lines

['This is my_file2 \n',
 '565 56 45\n',
 'This is my_file2 \n',
 'The world is beautiful...']

In [35]:
lines = list(map(str.strip, lines))
print(lines)

['This is my_file2', '565 56 45', 'This is my_file2', 'The world is beautiful...']


In [36]:
new_lines=[]
for el in lines:
    new_lines.append(el.strip())

In [37]:
new_lines

['This is my_file2',
 '565 56 45',
 'This is my_file2',
 'The world is beautiful...']

In [38]:
s= '  dfgdfg\n'
s = s.strip()
s

'dfgdfg'

In [39]:
lines

['This is my_file2',
 '565 56 45',
 'This is my_file2',
 'The world is beautiful...']

## Закрытие файла

close()

Обычно файл закрывается сам по окончании работы программы, но их нужно закрывать вручную по нескольким причинам:
1.	Питон может буферизировать запись в файл ваших данных, что может привести к неожиданным эффектам и возникновению ошибок.
2.	У операционной системы есть ограничение на число одновременно открытых файлов.
3.	При доступе к файлу из разных мест одновременно и на чтение, и на запись необходимо синхронизировать файловые операции. Буферизация записи может привести к тому, что запись уже произошла, а данных в файле еще нет.

Для полной уверенности в закрытии файла можно использовать блок try/finally:

    try:
   
       Тут идет запись в файл
   
    finally:

       file.close()

Можно также использовать менеджер контекста, который в любом случае закроет файл:

    with open("my_file") as somefile:
        do_something(somefile)

Если вы все же не хотите закрывать файл, то синхронизировать многопользовательский доступ к файлу на чтение/запись можно с помощью функции flush(), которая актуализирует все операции записи на диск. При этом возможна блокировка файла на чтение.


In [40]:
with open('file.txt', 'w') as f:
    f.write('Hello, ')
    f.write('World!')

## Итерация

In [41]:
filename = 'my_file.txt'
f = open(filename)
while True:
    c = f.read(3)
    if not c: break
    print(c, end='***')
f.close()

Hel***lo,*** Wo***rld***!
5***65 ***56 ***45
***Hel***lo,*** he***llo***, h***ell***o, ***my ***Wor***ld!***
Th***e w***orl***d i***s b***eau***tif***ul.***..***

In [44]:
f = open(filename)
while True:
    l = f.readline()
    if not l: break
    print(l, end='')
f.close()    

Hello, World!
565 56 45
Hello, hello, hello, my World!
The world is beautiful...

In [45]:
for line in open(filename):
    print(line)

Hello, World!

565 56 45

Hello, hello, hello, my World!

The world is beautiful...


## Работа с файловой системой

In [46]:
import os
cwd = os.getcwd()
print(cwd)

c:\programs\Магистры\Лекция 4. Словари. Файлы. Исключения


In [48]:
os.path.exists('my_file.txt')

True

In [49]:
#os.listdir(os.getcwd())
os.listdir("1")

['11', '123', 'Документ Microsoft Word.docx', 'Текстовый документ.txt']

In [50]:
import os
import time


def walk(dir):
    for name in os.listdir(dir):
        path = os.path.join(dir, name)
        if os.path.isfile(path):
            print(path, '\n\tCreation time =', time.ctime(os.path.getctime(path)))
        else:
            walk(path)
walk('1')

1\11\123\Текстовый документ.txt 
	Creation time = Sun Sep 15 16:39:02 2024
1\11\Текстовый документ.txt 
	Creation time = Sun Sep 15 16:39:02 2024
1\123\33\Презентация Microsoft PowerPoint.pptx 
	Creation time = Sun Sep 15 16:39:02 2024
1\Документ Microsoft Word.docx 
	Creation time = Sun Sep 15 16:39:02 2024
1\Текстовый документ.txt 
	Creation time = Sun Sep 15 16:39:02 2024


In [52]:
name=r'1\Текстовый документ.txt'
for line in open(name):
    print(line)

In [None]:
def del_empty_dirs(path):
    for dir_ in os.listdir(path):
        d = os.path.join(path, dir_)
        if os.path.isdir(d):
            del_empty_dirs(d)
            if not os.listdir(d):
                os.rmdir(d)
del_empty_dirs('1')

In [53]:
input_path = '1\\'
output_path = '2\\'

for dirpath, dirnames, filenames in os.walk(input_path):
    
    print('dirpath', dirpath)
    print('dirnames', dirnames)
    print('filenames', filenames)
    
    structure = output_path + dirpath[len(input_path):]
    print(structure)    
    if not os.path.isdir(structure):
        os.mkdir(structure)
        print('!!!!!!!!!!!!!')
    for file in filenames:
        print('\t',file)       

dirpath 1\
dirnames ['11', '123']
filenames ['Документ Microsoft Word.docx', 'Текстовый документ.txt']
2\
!!!!!!!!!!!!!
	 Документ Microsoft Word.docx
	 Текстовый документ.txt
dirpath 1\11
dirnames ['123']
filenames ['Текстовый документ.txt']
2\11
!!!!!!!!!!!!!
	 Текстовый документ.txt
dirpath 1\11\123
dirnames []
filenames ['Текстовый документ.txt']
2\11\123
!!!!!!!!!!!!!
	 Текстовый документ.txt
dirpath 1\123
dirnames ['33']
filenames []
2\123
!!!!!!!!!!!!!
dirpath 1\123\33
dirnames []
filenames ['Презентация Microsoft PowerPoint.pptx']
2\123\33
!!!!!!!!!!!!!
	 Презентация Microsoft PowerPoint.pptx


In [54]:
import json
import io

In [55]:
res = dict()
for i in range(100):
    res[i]=dict()
    res[i]['list'] = [i] * 5
    res[i]['i']=i
    res[i]['str']=str(i) + 'ё'
res   

{0: {'list': [0, 0, 0, 0, 0], 'i': 0, 'str': '0ё'},
 1: {'list': [1, 1, 1, 1, 1], 'i': 1, 'str': '1ё'},
 2: {'list': [2, 2, 2, 2, 2], 'i': 2, 'str': '2ё'},
 3: {'list': [3, 3, 3, 3, 3], 'i': 3, 'str': '3ё'},
 4: {'list': [4, 4, 4, 4, 4], 'i': 4, 'str': '4ё'},
 5: {'list': [5, 5, 5, 5, 5], 'i': 5, 'str': '5ё'},
 6: {'list': [6, 6, 6, 6, 6], 'i': 6, 'str': '6ё'},
 7: {'list': [7, 7, 7, 7, 7], 'i': 7, 'str': '7ё'},
 8: {'list': [8, 8, 8, 8, 8], 'i': 8, 'str': '8ё'},
 9: {'list': [9, 9, 9, 9, 9], 'i': 9, 'str': '9ё'},
 10: {'list': [10, 10, 10, 10, 10], 'i': 10, 'str': '10ё'},
 11: {'list': [11, 11, 11, 11, 11], 'i': 11, 'str': '11ё'},
 12: {'list': [12, 12, 12, 12, 12], 'i': 12, 'str': '12ё'},
 13: {'list': [13, 13, 13, 13, 13], 'i': 13, 'str': '13ё'},
 14: {'list': [14, 14, 14, 14, 14], 'i': 14, 'str': '14ё'},
 15: {'list': [15, 15, 15, 15, 15], 'i': 15, 'str': '15ё'},
 16: {'list': [16, 16, 16, 16, 16], 'i': 16, 'str': '16ё'},
 17: {'list': [17, 17, 17, 17, 17], 'i': 17, 'str': '17ё'},


In [59]:
with io.open('json_file.json', 'w', encoding='utf-8') as f:   
    json.dump(res, f, ensure_ascii=False, indent=1)

In [62]:
with io.open('json_file.json', 'r', encoding='utf-8') as f:   
    res_from_file = json.load(f)

JSONDecodeError: Expecting ',' delimiter: line 9 column 5 (char 60)

In [61]:
res_from_file

{'04553': {'list': [0, 0, 0, 0, 0], 'i': 0, 'str': '0ёtyhthh'},
 '1': {'list': [1, 1, 1, 1, 1], 'i': 1, 'str': '1ё'},
 '2': {'list': [2, 2, 2, 2, 2], 'i': 2, 'str': '2ё'},
 '3': {'list': [3, 3, 3, 3, 3], 'i': 3, 'str': '3ё'},
 '4': {'list': [4, 4, 4, 4, 4], 'i': 4, 'str': '4ё'},
 '5': {'list': [5, 5, 5, 5, 5], 'i': 5, 'str': '5ё'},
 '6': {'list': [6, 6, 6, 6, 6], 'i': 6, 'str': '6ё'},
 '7': {'list': [7, 7, 7, 7, 7], 'i': 7, 'str': '7ё'},
 '8': {'list': [8, 8, 8, 8, 8], 'i': 8, 'str': '8ё'},
 '9': {'list': [9, 9, 9, 9, 9], 'i': 9, 'str': '9ё'},
 '10': {'list': [10, 10, 10, 10, 10], 'i': 10, 'str': '10ё'},
 '11': {'list': [11, 11, 11, 11, 11], 'i': 11, 'str': '11ё'},
 '12': {'list': [12, 12, 12, 12, 12], 'i': 12, 'str': '12ё'},
 '13': {'list': [13, 13, 13, 13, 13], 'i': 13, 'str': '13ё'},
 '14': {'list': [14, 14, 14, 14, 14], 'i': 14, 'str': '14ё'},
 '15': {'list': [15, 15, 15, 15, 15], 'i': 15, 'str': '15ё'},
 '16': {'list': [16, 16, 16, 16, 16], 'i': 16, 'str': '16ё'},
 '17': {'list': 