# Работа с файловой системой и файлами

## Работа с текстовыми файлами

#### Чтение из файла

##### open - функция для работы с файлами

In [10]:
# r (read)   - открыть для ччтения (по умолчанию)
# w (write)  - открыть для записи, содержимое файла стирается
# a (append) - открыть для записи, запись ведется в конец
# b (binary) - открыть в бинарном режиме
# t (text)   - открыть в текстовом режиме (по умолчанию)

# r+ - открыть для чтения и записи
# w+ - открыть для чтения и записи, содержимое файла стирается

f = open("D:\\test.txt")
x = f.read()
x = x.splitlines() # Метод splitlines возвращает список строк
print(repr(x)) # Функция repr позволяет вывести не просто строку, а ее представление (т.е. со всякими \n)


f.close()

['First line', 'Second line', 'Third line']


##### Файл может оказаться слишком большим и тогда лучше считывать его построчно

In [14]:
f = open("D:\\test.txt")
x = f.readline()
print(repr(x))

x = f.readline().rstrip() # метод rstrip убирает справа все пробельные символы
print(repr(x))

f.close()

'First line\n'
'Second line'


##### У file object есть интеретор, который удобно использовать для чтения строк, т.к. он "по умному" расходует оперативную память.

In [17]:
f = open("D:\\test.txt")
for line in f:
    line = line.rstrip()
    print(repr(line))
    
f.close()

'First line'
'Second line'
'Third line'


#### Запись в файл

In [19]:
f = open("D:\\test1.txt", "w")
f.write("Hello")
f.write(" world!")

f.close()

##### Метод write не делает переносов и необходимо всегда добавлять символ переноса строки. Чтобы это упростить часто использует метод join.

In [24]:
f = open("D:\\test1.txt", "w")
lines = ["Line 1", "Line 2", "Line 3"]
contents = "\n".join(lines) # Добавляем после каждой строки \n, кроме последней
f.write(contents)

f.close()

#### Конструкция with

##### Для того, чтобы не писать всяких try - finally (для 100%-ого закрытия файла), используется конструкция with:

In [26]:
with open("D:\\test.txt") as f:
    for line in f:
        line = line.rstrip()
        print(line)

First line
Second line
Third line


##### В одной конструкции with можно открыть несколько файлов

In [28]:
# Копирование текста из одного файла в другой
with open("D:\\test.txt") as f, open("D:\\test_copy.txt", "w") as w:
    for line in f:
        w.write(line)

#### Задачa 1

In [45]:
with open("D:\\dataset_24465_4.txt") as f, open("D:\\back_copy.txt", "w") as w:
    lines = list()
    for line in f:
        lines += [line.rstrip()]
    
    lines = lines[::-1]
    lines = "\n".join(lines)
    
    for line in lines:
        w.write(line)

## Работа с файловой системой

#### Самые используемые библиотеки для работы с файловой системой:

##### 1. os

##### 2.os.path

In [None]:
import os
import os.path

print(os.getcwd()) # getcwd - узнать текущую директорию
# os.chdir("..\\") # chdir (change dir) - позволяет сменить текущую директорию, надо быть осторожным с этим методом. 
                   # Эффект от него сохраняет даже при перезапуске скрипта 
print(os.getcwd())

print(os.listdir()) # listdir - файлы в текущей директории
print(os.listdir("Videos")) # listdir можно принимать в качестве аргумента относительный путь к какой-либо папке

print(os.path.exists(".jssc"))  # exists проверяет текущую директорию на наличие файла 
print(os.path.exists("Videos")) # или другой директории
print(os.path.exists("ThereIsNoSuchFile"))

print(os.path.abspath(".jssc")) # функция path позволяет узнать полный путь до файла

##### Одной из ключевых функций библиотеки os является функция os.walk, которая возвращает итератор со всеми каталогами и подкаталогами текущей директории. Каждый вызов итератора возвращает кортеж из 3-х элементов. 

###### 1. Строковое представления текущей директории, которую он осматривает.

###### 2. Список всех подпапок данной директории.

###### 3. Список всех файлов в данной директории

###### Пример использования

In [1]:
import os.path

# Список всех папок, попдпапок и файлов, начиная с текущей директории
# for current_dir, dirs, files in os.walk("."):
#     print(current_dir, dirs, files)

### Для  копирования файлов используются библиотека shutil

In [7]:
import shutil

def showPyDir():
    print('\n\nResult:')
    for current_dir, dirs, files in os.walk("D:\\pytest\\"):
        print(current_dir, dirs, files) 

showPyDir()
        
# Функция copy копирует файлы
shutil.copy("D:\\pytest\\testdir1\\test1.txt", "D:\\pytest\\testdir1\\test2.txt")
showPyDir()

# Функция copytree копирует директории
shutil.copytree("D:\\pytest\\testdir1", "D:\\pytest\\testdir2")
showPyDir()



Result:
D:\pytest\ ['testdir1'] []
D:\pytest\testdir1 [] ['test1.txt']


Result:
D:\pytest\ ['testdir1'] []
D:\pytest\testdir1 [] ['test1.txt', 'test2.txt']


Result:
D:\pytest\ ['testdir1', 'testdir2'] []
D:\pytest\testdir1 [] ['test1.txt', 'test2.txt']
D:\pytest\testdir2 [] ['test1.txt', 'test2.txt']


#### Задача

In [23]:
import os
import os.path
import shutil

list_of_paths = list()

for current_dir, dirs, files in os.walk("D:\\pytest\\main\\"):
    for file in files:
        filename, file_extension = os.path.splitext(file)
        if file_extension == ".py" and current_dir not in list_of_paths:
            list_of_paths += [current_dir]
        
list_of_paths.sort()
with open("D:\\pytest\\task.txt", 'w') as f:
    f.write('\n'.join(list_of_paths))


None
