# Работа с файлами и папками в Python; модуль os

Другими словами: где хранятся файлы, открыть, создать, изменить и т.д.

Часто, чтобы поработать над какой-то задачей, нам нужно работать с файлами, в которых хранятся данные, перемещаться среди папок и тд. Для решениях этих задач, в питоне существует [модуль os](https://pythonworld.ru/moduli/modul-os.html).


1. Содержание папки
1. Работа с путями к файлам и папкам
1. Манипуляции с файлами и папками
1. Простой способ загрузки файла
1. Загрузка на Google Диск
1. Практика

В блокноте использованы материалы курса "Программирование и лингвистические данные", "Программирование на Python для Digital Humanities" и тетрадка А. Хорошевой

# 1. Содержание папки


In [1]:
import os

In [None]:
print(os.listdir()) # список файлов и папок в директории, где запущена программа

In [None]:
print(os.listdir('sample_data'))  # список имен файлов и папок в конкретной папке
# напишите вместо sample_data какую-нибудь папку из предыдущей команды: venv для PyCharm и др.

Порядок элементов можно отсортировать:

In [None]:
unsorted_file_list = os.listdir('sample_data') # аналогично для вашей папки
sortetd_file_list = sorted(unsorted_file_list) # функция сортировки
print(sortetd_file_list)

# 2. Работа с путями к файлам и папкам

## Проверка типа файла
Модуль `os.path` содержит функции для проверки существования файла и для определения его типа:


In [None]:
path = 'sample_data' # ваша папка
# path = 'simple_data'

if os.path.exists(path):
    print(path, 'существует')
    if os.path.isfile(path):
        print(path, '— это файл')
    elif os.path.isdir(path):
        print(path, '— это папка')
    else:
        print(path, '— это не файл и не папка')
else:
    print(path, 'не существует')

#  3. Манипуляции с файлами и папками
Производите все манипуляции с файлами с осторожностью

## Создание файла
Для создания пустого файла достаточно открыть несуществующий файл с флагом `'x'`:

In [21]:
with open('empty.txt', 'x'): # есть и другие режимы, но о них позднее: 'r', 'w', 'a' 
    pass # не делает ничего

In [None]:
print(os.listdir()) # проверим, что файл появился

## Создание папки
Для создания новой папки используйте `os.mkdir(name)`. Эта функция выдаст ошибку, если по указанному пути уже существует файл или папка. 

In [22]:
os.mkdir('nice new folder')

In [None]:
print(os.path.isdir('nice new folder'))

Если вам нужно создать сразу несколько вложенных папок, то смотрите функцию [`os.makedirs()`](https://docs.python.org/3/library/os.html#os.makedirs).

In [40]:
os.makedirs(os.path.join('some_folder_2','subfolder','subfolder', 'subdolder'))

In [None]:
print(os.listdir()) # проверим, что папки появились

In [None]:
print(os.listdir("some_folder_2")) # проверим, что папки появились
print(list(os.walk("some_folder_2"))) # перечисляет все папки от топа вниз, в виде кортежа

## Перемещение и переименование
Для удобной манипуляции с файлами и папками в стандартной библиотеке Python существует специальный модуль [`shutil`](https://pythonworld.ru/moduli/modul-shutil.html).

In [5]:
import shutil

In [None]:
print(os.listdir('nice new folder'))

Функция `shutil.move(source, destination)` позволяет вам переместить любой файл или папку (даже непустую). Обратите внимание, что если `destination` — это уже существующая папка, то файл/папка будет перемещена внутрь неё, в остальных случаях файл/папка будут скопированы точно по нужному адресу. В случае успеха, функция вернёт новое местоположение файла. Если `destination` существует и не является папкой, то будет выброшена ошибка.

In [None]:
shutil.move('empty.txt', 'nice new folder')

In [None]:
print(os.listdir()) # проверим, что файл появился
print(os.listdir('nice new folder'))

Перенесем файл обратно

In [None]:
shutil.move(os.path.join('nice new folder', 'empty.txt'), '.') # '.' - помести на уровень выше
# '..' - помести на 2 уровня выше

In [None]:
print(os.listdir()) # проверим, что файл появился

### Переименовать файл 

In [None]:
shutil.move('empty.txt', 'full.txt') # такое перемещение - и есть переименование
print(os.listdir()) # проверим

In [None]:
os.rename('full.txt', 'empty.txt') # то же самое другим способом
print(os.listdir()) # проверим

## Копирование
Скопировать файл можно с помощью функции `shutil.copy(source, destination)`.

In [None]:
shutil.copy('empty.txt', 'nice new folder/empty.txt')

Скопировать папку для операционной системы сложнее, ведь мы всегда хотим скопировать не только папку, но и её содержимое. Для копирования папок используйте `shutil.copytree(source, destination)`. Обратите внимание, что для этой функции `destination` всегда должно быть путём конечного расположения файлов и не может быть уже существующей папкой.

In [None]:
shutil.copytree('nice new folder', 'nicer newer folder')

In [None]:
print(os.listdir('nicer newer folder'))

In [None]:
shutil.move('nice new folder/empty.txt',  'nicer newer folder/empty.txt')

In [29]:
with open('nicer newer folder/empty.txt', 'w') as openfile: # самый важный синтаксис на сегодня! 
    openfile.write('Hello!')

# openfile = open('nicer newer folder/empty.txt', 'w')

In [None]:
with open('nicer newer folder/empty.txt', 'r') as f:
    print(f.read())

In [None]:
shutil.move('empty.txt', 'nicer newer folder/empty.txt')

## Удаление
Удалить файл можно с помощью функции `os.remove`, а пустую папку с помощью функции `os.rmdir`.

А вот для удаления папки с содержимым вновь понадобится `shutil`. Для удаления такой папки используйте `shutil.rmtree`.

Будьте осторожны, команды удаления стирают файл, а не перемещают его в корзину, вне зависимости от операционной системы! После такого удаления восстановить файл может быть сложно или вовсе невозможно.



In [32]:
os.remove('nicer newer folder/empty.txt')

In [None]:
print(os.listdir('nicer newer folder'))

In [None]:
os.remove('nice new folder') # не сработает

In [35]:
os.rmdir('nice new folder')

In [None]:
print(os.listdir())

## Смена рабочей папки

Посмотреть путь к папке, где сейчас работает наш питон: 

In [56]:
print(os.getcwd())

/content


Поменять ее на другую можно с помощью 

In [None]:
print(os.chdir('some_folder_2')) # сменим

In [None]:
print(os.listdir())

In [55]:
os.chdir('/content') # сменим обратно
print(os.getcwd())

In [None]:
print(os.listdir())

## Подключить папки со своего Google Диск

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
os.listdir('drive/MyDrive') # посмотрим на Google Диск!

In [None]:
# менять название папки можно
FOLDER = "Ваша папка" # Соединить Python и конретную папку
PATH = "drive/MyDrive/" + FOLDER  + "/"
from google.colab import drive
drive.mount('/content/drive')
import sys
sys.path.append(PATH)

In [None]:
# Можно не указывать папку, путь - весь Диск
PATH = "/content/drive/MyDrive/"
from google.colab import drive
drive.mount('/content/drive')

In [None]:
# бонус для колаба
from google.colab import files #строка импорта
files.upload() # откроется окно загрузки

# Работа с файлами

In [60]:
with open("city_smells.txt", "r") as file: # воспользуемся встроенной функцией open()
    pass

давайте посмотрим на аргументы функции: 
* первый = путь к файлу, который хотим открыть.

* второй аргумент - необязательный, это режим открытия файла: для чтения, записи, дозаписи, все вместе и тд. (по умолчанию - чтение, 'r')


<div class="table-wrapper"><table border="1" class="docutils"><tbody valign="top"><tr><td>Режим</td><td>Обозначение</td></tr><tr><td>'r'</td><td>открытие на чтение (является значением по умолчанию).</td></tr><tr><td>'w'</td><td>открытие на запись, содержимое файла удаляется, если файла не существует, создается новый.</td></tr><tr><td>'x'</td><td>открытие на запись, если файла не существует, иначе исключение.</td></tr><tr><td>'a'</td><td>открытие на дозапись, информация добавляется в конец файла.</td></tr><tr><td>'b'</td><td>открытие в двоичном режиме.</td></tr><tr><td>'t'</td><td>открытие в текстовом режиме (является значением по умолчанию).</td></tr><tr><td>'+'</td><td>открытие на чтение и запись</td></tr></tbody></table></div>


Режимы могут быть объединены: например,'ra' - открытие для чтения и  дозаписи.

Последний аргумент (опциональный, его можно не указывать), encoding, нужен только в текстовом режиме чтения файла. Этот аргумент задает кодировку. Чтобы стандантные .txt-файлы читались без проблем, ставим ```encoding = utf-8```


Мы открыли файл с режимом для чтения (пока еще не читали его), сохранили в переменную значение. Давайте прочтем содержимое. Читать тоже можно несколькими методами: 
* .read()
* .readline()
* .readlines()




In [72]:
with open("city_smells.txt", "r", encoding='utf-8') as file:
    file.read()
    # file.readline()
    # file.readlines()

In [73]:
print(file) # мы создали текстовое представление файла, но вывести его на экран нужно другим способом через print

<_io.TextIOWrapper name='city_smells.txt' mode='r' encoding='utf-8'>


In [None]:
# 2 вариант:
with open("city_smells.txt", "r", encoding='utf-8') as file:
    for i in file:
      print(i.strip())

In [None]:
with open("city_smells.txt", "r", encoding='utf-8') as file:
    print(file.read())
    # print(file.readline())
    # print(file.readlines())

Теперь попробуем создать файл и записать в него что-то:

In [94]:
with open('new_text.txt', 'w') as file: 
    file.write("hi this is a test\n")
    
# если такого файла не существовало, но создастся автоматически

Чтобы предыдущая информация не стиралась из файла при записи, откроем с режимом "а" 


In [95]:
with open("new_text.txt",'a') as file:
    file.write("new line\n")

In [96]:
with open("new_text.txt",'r') as file: # читаем
    print(file.read())

hi this is a test
new line



# Примеры

В файле result.txt - список участников олимпиады


In [None]:
my_list = []
with open('result.txt', 'r', encoding='utf-8') as f: 
  for line in f:
    my_list.append(line.strip().split())

In [None]:
print(my_list)

In [None]:
new_list = sorted(my_list, key=lambda i: int(i[3]), reverse=True)
print(new_list)

In [None]:
new_list = sorted(my_list) # сортируем строки в списке по алфавиту, сохраняем отсортированный список в новую переменную
with open('result_2.txt', 'w', encoding='utf-8') as f2:
  for i in new_list:
    print(*i, file=f2)

In [None]:
# проверим, что в новом файле все есть:
with open('result_2.txt', 'r', encoding='utf-8') as f:
  for line in f:
    print(line.strip())

Задача про анкету с занятия 2

In [None]:
name = input('Введите ваше имя: ').strip()
age = int(input('Введите ваш возраст: ').strip())
gender = input('Введите ваш гендер: ').strip()
city = input('Введите ваш город: ').strip()
work = input('Введите ваше место работы: ').strip()
position = input('Введите вашу должность: ').strip()

In [None]:
def survey():
  name = input('Введите ваше имя: ').strip()
  age = input('Введите ваш возраст: ').strip()
  gender = input('Введите ваш гендер: ').strip()
  city = input('Введите ваш город: ').strip()
  work = input('Введите ваше место работы: ').strip()
  position = input('Введите вашу должность: ').strip()
  return name, age, gender, city, work, position

n = int(input('Сколько людей будет заполнять анкету? '))
with open('survey.csv', 'a', encoding='utf-8') as f2:
  for i in range(n):
    print(*survey(), file=f2)

Забегая вперед, быстрый способ:

In [None]:
# !!! только для PyCharm - в терминале PyCharm запускаем сначала
pip install pandas
pip install openpyxl

In [None]:
import pandas as pd # pandas позволяет работать с таблицами (датафреймами)

In [None]:
num = [[1, 2], [3, 4]]

In [None]:
df = pd.DataFrame(num)

In [None]:
df.to_excel('new_list.xlsx')