In [2]:
import pathlib

Модуль pathlib упрощает работу с путями и файлами. Позволяет создавать, изменять, удалять и переименововать файлы. Проводить различные операции с путями и получать инофрмацию о них. Проводить проверки на наличие файлов и директорий и т.д. 

# Создание путей

In [2]:
current_dir = pathlib.Path.cwd() # Возвращает путь объекта директории в которой мы сейчас находимся
home_dir = pathlib.Path.home() # Возвращает путь объекта домашней директории

print(current_dir)
print(home_dir)

c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17
C:\Users\mryab


In [3]:
outpath = pathlib.Path.cwd() / 'output' / 'output.xlsx' # / оператор объединения частей пути в составной путь
print(outpath)

c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\output\output.xlsx


Засчет перегрузки оператора / код становится понятным и читабельным.

Пример такой же операции в другой python библиотеке.

In [3]:
import os
outpath_file = os.path.join(os.path.join(os.getcwd(), 'output'), "out.xlsx")
print(outpath_file)

c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\output\out.xlsx


Также важная особенность библиотеки pathlib, то что вместо представлении пути в виде обычной строки он создает отдельный объект Path, что позволяет использовать различные методы заранее прописанные в объекте Path и перегрузку оператора. 

In [5]:
type(outpath)

pathlib.WindowsPath

Способы инициализации класса Path.

In [6]:
animal = pathlib.Path('shelter', 'dog') # При помощи строк
print(animal)

animal = pathlib.Path(animal, 'doberman') # При помощи строк и объектов Path
print(animal)

animal = pathlib.Path(pathlib.Path.home(), 'animals', animal)
print(animal)

shelter\dog
shelter\dog\doberman
C:\Users\mryab\animals\shelter\dog\doberman


# Параметры пути.

In [7]:
python_path = pathlib.Path(pathlib.Path().cwd(), 'apps', 'python.exe')
print(python_path)
print(python_path.name) # Возвращает имя файла
print(python_path.suffix) # Возвращяет тип файла

c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\apps\python.exe
python.exe
.exe


In [9]:
java_path = python_path.with_name('java.exe') # Изменяет название файла
apk_path = python_path.with_suffix('.apk') # Изменяет тип файла
print(python_path)
print(java_path)
print(apk_path)

c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\apps\python.exe
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\apps\java.exe
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\apps\python.apk


In [10]:
print(python_path.parent) # Возвращает родителя файла или директории (Поднимается на уровень выше)
print(python_path.parent.parent)

c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\apps
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17


# Работа с файлами и директориями

In [12]:
import zipfile
with zipfile.ZipFile('tasks.zip', 'r') as zip_ref:
    zip_ref.extractall('')

In [12]:
for child in pathlib.Path().cwd().iterdir(): #Создает генератор, который возвращает пути всех файлов и директорий содержашихся в конкретной директории
  print(child)

c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\ocean
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\ocean.zip
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\pathlib.ipynb
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks.zip


In [13]:
print(pathlib.Path('ocean', 'tides.txt').exists()) # Проверка содержится ли файл в директории 
print(pathlib.Path('ocean', 'tide.txt').exists())

True
False


In [14]:
cur_path = pathlib.Path().cwd()
new_dir = cur_path / 'ocean' / 'plants'
new_dir.mkdir() # Создает пустую папку

FileExistsError: [WinError 183] Невозможно создать файл, так как он уже существует: 'c:\\UniversityProgramming\\MIPT\\Term-1\\MIPT_Python\\seminars\\sem 17\\ocean\\plants'

In [20]:
new_file = new_dir / 'laminaria.txt'
new_file.touch() # Создает пустой файл

In [15]:
old_name = pathlib.Path().cwd() / 'ocean' / 'animal' / 'fish' / 'shark.txt'
new_name = pathlib.Path().cwd() / 'ocean' / 'animal' / 'fish' / 'dolphin.txt'
old_name.rename(new_name) # Меняет название файла

FileNotFoundError: [WinError 2] Не удается найти указанный файл: 'c:\\UniversityProgramming\\MIPT\\Term-1\\MIPT_Python\\seminars\\sem 17\\ocean\\animal\\fish\\shark.txt' -> 'c:\\UniversityProgramming\\MIPT\\Term-1\\MIPT_Python\\seminars\\sem 17\\ocean\\animal\\fish\\dolphin.txt'

In [16]:
trash_dir = pathlib.Path().cwd() / 'trash'
trash_dir.mkdir()
trash_file = trash_dir /'trash.txt'
trash_file.touch()

In [17]:
trash_dir.rmdir()

OSError: [WinError 145] Папка не пуста: 'c:\\UniversityProgramming\\MIPT\\Term-1\\MIPT_Python\\seminars\\sem 17\\trash'

In [18]:
trash_file.unlink()

In [19]:
trash_dir.rmdir()

In [5]:
import shutil

In [21]:
shutil.copy(pathlib.Path('ocean', 'plants', 'laminaria.txt'), pathlib.Path('ocean'))

'ocean\\laminaria.txt'

# Методы glob и rglob

In [22]:
for txt_path in pathlib.Path("ocean").glob("*.txt"):
    print(txt_path)

ocean\laminaria.txt
ocean\tides.txt
ocean\wave.txt


In [23]:
for txt_path in pathlib.Path("ocean").glob("**/*.txt"):
    print(txt_path)

ocean\laminaria.txt
ocean\tides.txt
ocean\wave.txt
ocean\animal\fish\dolphin.txt
ocean\plants\laminaria.txt


In [31]:
for txt_path in pathlib.Path("ocean").rglob("*.txt"):
    print(txt_path)

ocean\laminaria.txt
ocean\tides.txt
ocean\wave.txt
ocean\animal\fish\dolphin.txt
ocean\plants\laminaria.txt


# Задачи

1.Рассортировать все файлы по типу.

2.Удалить папку и все элементы содержащиеся в ней.

3.Произвести копирование папки.


In [24]:
pathlib.Path("tasks").cwd()


WindowsPath('c:/UniversityProgramming/MIPT/Term-1/MIPT_Python/seminars/sem 17')

In [13]:
for child in pathlib.Path("tasks/task1/all").iterdir(): #Создает генератор, который возвращает пути всех файлов и директорий содержашихся в конкретной директории
  if child.suffix in ['.png', '.jpeg']:
    shutil.copy(child, pathlib.Path('tasks', 'task1', 'images(png, jpeg)'))
    child.unlink()
  if child.suffix in ['.xls', '.xlsx', '.csv']:
    shutil.copy(child, pathlib.Path('tasks', 'task1', 'sheets(xls, xlsx, csv)'))
    child.unlink()
  if child.suffix in ['.txt', '.doc', '.docx']:
    shutil.copy(child, pathlib.Path('tasks', 'task1', 'texts(txt, doc, docx)'))
    child.unlink()

In [15]:
def remove_folder(path):
    print(path)
    for child in path.iterdir():
        print(child)
        if child.is_file():
            child.unlink()
        else:
            remove_folder(child)
    path.rmdir()
remove_folder(pathlib.Path.cwd() / 'tasks' / 'task2' / 'home')


c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\0ZWYPL13
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\0ZWYPL13
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\30S63W9CEY
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\5XA6RM
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\985XJ
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\9A2356O1
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\AJCC5
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\F56YGU
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\F56YGU
c:\UniversityProgramming\MIPT\Term-1\MIPT_Python\seminars\sem 17\tasks\task2\home\F56YGU\2ERW6VJVLO
c:\Univer

In [14]:
def copy_folder(source, dest):
    dest.mkdir(parents=True, exist_ok=True)
    for item in os.listdir(source):
        s = source / item
        d = dest / item
        if s.is_dir():
            copy_folder(s, d)
        else:
            shutil.copy(s, d)
copy_folder(pathlib.Path.cwd() / 'tasks' / 'task3' / 'home', pathlib.Path.cwd() / 'tasks' / 'task3' / 'home2')

In [16]:
parhs1 = [x.name for x in pathlib.Path('tasks/0ask3/home').rglob("*")]
parhs2 = [x.name for x in pathlib.Path('tasks/0ask3/home2').rglob("*")]

In [18]:
parhs1 == parhs2

True