# Работа с файлами

## Функция open(name, regime, encoding)

Функция open позволяет открывать/создавать различные файлы

Режимы доступа:
- 'r' - только для чтения
- 'w' - для записи (СОТРЕТ ФАЙЛ ЕСЛИ ОН УЖЕ ЕСТЬ!)
- 'a' - для записи, добавляет новые данные в конец файла
- 'r+' - чтение и запись, для перезаписи части содержимого файла
- 'x' - создать новый файл (ВЫЗОВЕТ ОШИБКУ ЕСЛИ ФАЙЛ УЖЕ ЕСТЬ)

По умолчанию (без второй переменной) файл будет открыт для чтения

Когда мы открываем некий файл, переменная не станет содержимым файла, но ссылкой на него:

In [18]:
std = open('C:\\Users\\Пользователь\\Desktop\\std.txt', 'w')

Мы используем двойной слэш чтобы подчеркнуть, что нам нужен именно слэш, а не какая-то другая команда.

Можно обойтись и без него с помощью r-выражения:

In [12]:
alpha1 = open(r'C:\Users\Пользователь\Desktop\alpha.txt')

Также в raw-выражениях можно обойтись и прямым слешэм:

In [21]:
alpha2 = open(r'C:/Users/Пользователь/Desktop/alpha.txt')

Такой простой способ сработает, только если в файле латиница и цифры.

Чтобы кодировка не поехала, нужно дополнительно указывать параметр encoding в функции open():

In [16]:
alpha = open(r'C:/Users/Пользователь/Desktop/alpha.txt', encoding='utf-8')

In [19]:
print(std.encoding)
print(alpha.encoding)

cp1251
utf-8


## Чтение файлов

Для чтения файлов используются 3 файловых метода:
- read() - читает все содержимое
- readline() - читает одну строку из файла
- readlines() - читает все содержимое файла и возвращает список строк

## Метод read()

Метод read() считывает все содержимое из файла и возвращает строку с символами перехода на новую:

In [56]:
lang = open('languages.txt')

In [54]:
lang_content = lang.read()
print(lang_content)

a
Javascript
C#
C
C++
PHP
R
Objective-C


А если передать методу целочисленный параметр - можно ограничить кол-во считываемых символов

In [63]:
lang_head = lang.read(10)
print(lang_head)




## Метод readline()

Метод readline() считывает одну строку из файла (всю строку до символа \n):

In [82]:
lang = open('languages.txt')

In [83]:
print(lang.readline())
lang.close()

Python



In [88]:
lang = open('languages.txt')

In [89]:
for line in lang:
    print(line)

Python

Java

Javascript

C#

C

C++

PHP

R

Objective-C


## Метод readlines()

Метод readlines() считывает все строки из файла и возвращает список из строк файла:

In [2]:
lang = open('languages.txt')

In [3]:
langs = lang.readlines()
print(langs)

['Python\n', 'Java\n', 'Javascript\n', 'C#\n', 'C\n', 'C++\n', 'PHP\n', 'R\n', 'Objective-C']


Избавимся от символа переноса строки:

In [4]:
langs = [el.strip() for el in langs]
print(langs)

['Python', 'Java', 'Javascript', 'C#', 'C', 'C++', 'PHP', 'R', 'Objective-C']


## Метод splitlines()

А еще можно воспользоваться методом __read()__ в связке с __splitlines()__ чтобы разбить текст на строки без символа переноса строки:

In [5]:
lang.close()
lang = open('languages.txt')
langs = lang.read().splitlines()
langs

['Python', 'Java', 'Javascript', 'C#', 'C', 'C++', 'PHP', 'R', 'Objective-C']

## Метод .close()

Метод .close() позволяет сохранить и закрыть файл для завершения работы с ним:

In [22]:
alpha.close()

Для проверки закрыт ли файл можно использовать атрибут .closed:

In [23]:
print(alpha.closed)
print(std.closed)

True
False


А еще можно получить режим доступа и имя файла:

In [93]:
print(std.mode)
print(std.name)

w
C:\Users\Пользователь\Desktop\std.txt


## Текущая позиция в файле (курсор/каретка)

При чтении файла целиком происходит следующее: курсор пробегает по всем символам и из начала файла (стандартная позиция 0) "добегает" до конца.
При этом повторный вызов методов read/readlines уже ничего не сделает - поскольку курсору некуда бежать

Для повторного чтения данных можно переоткрыть файл, либо переместить курсор с помощью метода seek()


## Метод seek()

Метод seek() принимает в качестве аргумента кол-во байт от начала файла, на которое нужно поставить курсор.

Для перехода в начало файла методу надо передать аргумент "0":

In [94]:
file = open('prices.txt', encoding='utf-8')
print(file.read())

телефон	4	12500
бургер	1	500
курс	1	1400
подписка	40	9500
наушники	2	22450
телефон	2	2500
ноутбук	5	155000
диван	100	300



In [96]:
file.seek(0)
print(file.readline())
file.seek(8)
print(file.readline())

телефон	4	12500

фон	4	12500



## Метод tell()

Метод tell() возвращает текущее местоположение каретки:

In [100]:
print(file.tell())
file.seek(0)
print(file.tell())

24
0


## Менеджер контекста

Важно своевременно закрывать файлы с помощью метода close(). Закрытие файлов вручную, а также отдача закрытия на откуп среде исполнения, обладают существенным недостатком: если между открытием файла и его закрытием произойдёт ошибка, в лучшем случае файл окажется открыт слишком долго, а в худшем случае часть данных не сохранится.

Для того чтобы иметь возможность автоматически закрывать файл сразу после окончания работы с ним файл нужно использовать как менеджер контекста:

In [102]:
with object as name:
    # Здесь нам доступен ресурс name.
    # Это тело with-блока.
# А здесь ресурс name уже освобождён, даже если в теле with-блока произошла ошибка.

IndentationError: expected an indented block (Temp/ipykernel_35628/811538803.py, line 4)

Синтаксис - выше

В целом же работает это так: как только закончится код, оформленный с отступами в *with* "контекст" закончится и Питон закроет файл

Код по чтению файла 'prices.txt' можно переписать так:

In [104]:
with open('prices.txt', encoding='utf-8') as file:
    for line in file:
        print(line)


телефон	4	12500

бургер	1	500

курс	1	1400

подписка	40	9500

наушники	2	22450

телефон	2	2500

ноутбук	5	155000

диван	100	300



In [137]:
with open('numbers.txt', encoding='utf-8') as file:
    lst = [l.split() for l in file.readlines()]
    file.seek(0)
    s = file.read()
    print(s)
    print(type(s))

  67 89         100    
78
  90 7 8 9
 1 2 3 4   5
    90 0       999

<class 'str'>


# Запись данных в файлы

Для записи используются 2 файловых метода:
- write() - записывает переданную строку в файл
- writelines() - записывает переданный список строк в файл

## write()

Общий формат применения файлового метода write():

файловая_переменная.writе(строковое_значение)

Вид записи зависит от режима открытия файла

Если файл открыт для записи - прочитать его нельзя:

In [144]:
with open('std.txt','w', encoding='utf-8') as file:
    s = file.read()
    print(s)

UnsupportedOperation: not readable

In [158]:
with open('std.txt','w', encoding='utf-8') as file:
    file.write('Я богатый\n')
    file.write('Я красивый\n')
    print(s)

Я богатый
Я красивый



In [160]:
with open('std.txt','a', encoding='utf-8') as file:
    file.write('Я крутой\n')

In [161]:
with open('std.txt','r', encoding='utf-8') as file:
    s = file.read()
    print(s)

Я богатый
Я красивый
Я крутой
Я крутой



## writelines()

В метод writelines() нужно передавать список строк, который необходимо записать:

In [167]:
with open('philosophers.txt','w', encoding='utf-8') as file:
    file.writelines(['Серен Кьеркегор\n', 'Фридрих Ницше\n'])

In [168]:
with open('philosophers.txt', encoding='utf-8') as file:
    s = file.read()
    print(s)

Серен Кьеркегор
Фридрих Ницше



## Запись при помощи print()

Для записи данных можно использовать функцию print(), но для этого ей надо передать именованный аргумент *file*:

In [169]:
with open('philosophers.txt', 'a', encoding='utf-8') as file1:
    print('Зигмунд Фрейд\n', file=file1)

In [170]:
with open('philosophers.txt', encoding='utf-8') as file:
    s = file.read()
    print(s)

Серен Кьеркегор
Фридрих Ницше
Зигмунд Фрейд




## Библиотека os

Библиотека os предлагает набор инструментов для работы с файловой системой ОС

### listdir()

__listdir()__ позволяет вывести на экран имена объектов в той или иной папке.
Если не передать аргумент - выведет все имеющиеся объекты

In [6]:
import os
import os.path
print(os.listdir())

['.ipynb_checkpoints', 'answer.txt', 'class_scores.txt', 'data.txt', 'dataset_24465_4.txt', 'encrypted.bin', 'file.txt', 'forbidden_words.txt', 'goats.txt', 'input.txt', 'languages.txt', 'loggable.py', 'loggable_Copy1.py', 'new_scores.txt', 'numbers.txt', 'nums.txt', 'output.txt', 'passwords.txt', 'philosophers.txt', 'population.txt', 'prices.txt', 'res.txt', 'sentences.txt', 'std.txt', 'stepik.txt', 'words.txt', '__pycache__', 'Итераторы и генераторы.ipynb', 'Классы - конспект.ipynb', 'Машинное обучение - общее.ipynb', 'Методы множеств - конспект.ipynb', 'Модули decimal и fractions.ipynb', 'Модули и импорт.ipynb', 'Модуль random - конспект.ipynb', 'Модуль time - конспект.ipynb', 'Отладочная.ipynb', 'Ошибки и исключения.ipynb', 'Работа с файлами - конспект.ipynb', 'Работа со списками - конспект.ipynb', 'Словари - конспект.ipynb', 'Строки - конспект.ipynb', 'Тип complex, модули complex и cmath.ipynb', 'Функции.ipynb']


In [11]:
print(os.listdir('C:\\Users\\Пользователь\\Desktop\\Статистика по подбору'))

['Воронка по подбору hh 2018(новая) .xlsx', 'Воронка по подбору hh 2018.xlsx', 'Воронка по подбору hh 2019(новая).xlsx', 'Воронка по подбору hh 2019.xlsx', 'Воронка по подбору Активный поиск 2018.xlsx', 'Воронка по подбору Активный поиск 2019 (yjdfz).xlsx', 'Воронка по подбору Активный поиск 2019.xlsx', 'Клиентская база.xlsx', 'Конверсия по первичным собеседованиям (дни недели) 2018.xlsx', 'Конверсия по первичным собеседованиям (дни недели) 2019.xlsx', 'Март.xlsx', 'Направления на работу 2013-2019.xlsx', 'Отказы СБ.xlsx', 'Отчет по вакансиям hh.ru', 'Отчет по отказам 2018-2019.xlsx', 'Подбор 2017-2019.xlsx', 'Просмотры и отклики hh.ru по дням недели 2018.xlsx', 'Просмотры и отклики hh.ru по дням недели 2019.xlsx', 'Результаты работы за полгода.xlsx', 'Увольнения 2018-2019.xlsx', 'Янв-Фев.xlsx']


### getcwd()

__getcwd()__ позволяет получить путь до текущей директории, в которой исполняется код:

In [12]:
print(os.getcwd())

C:\Users\Пользователь\Конспекты


### getcwd()

__getcwd()__ позволяет получить путь до текущей директории, в которой исполняется код:

In [12]:
print(os.getcwd())

C:\Users\Пользователь\Конспекты


### exists()

__os.path.exists('filename.py')__ позволяет проверить, существует ли файл или папка в текущей директории:

In [14]:
print(os.path.exists('res.txt'))
print(os.path.exists('Pitonist'))

True
False


### isfile() и isdir()

Методы __os.path__ isfile() и isdir() позволяет проверить, является ли файлом или папкой некий объект:

In [15]:
print(os.path.isdir('C:\\Users\\Пользователь\\Конспекты'))
print(os.path.isfile('Работа с файлами - конспект.ipynb'))

True
True


### abspath()

Метод __os.path.abspath()__ возвращает полный путь к файлу:

In [17]:
print(os.path.abspath('Работа с файлами - конспект.ipynb'))

C:\Users\Пользователь\Конспекты\Работа с файлами - конспект.ipynb


In [57]:
print(os.path.basename('Работа с файлами - конспект.ipynb'))

Работа с файлами - конспект.ipynb


### chdir()

Метод __chdir()__ позволяет сменить текущую папку для интерпретатора

In [28]:
os.chdir('C:\\Users\\Пользователь\\Конспекты')
print(os.getcwd())
os.chdir('C:\\Program Files')
print(os.getcwd())

C:\Users\Пользователь\Конспекты
C:\Program Files


### walk()

Метод __walk()__ позволяет рекурсивно пройти по всем папкам в текущей директории, и вывести список всех их подфайлов и подпапок:

In [35]:
os.chdir('C:\\Users\\Пользователь\\Desktop')
print(os.getcwd())
for current_dir, dirs, files in os.walk('.'):   # точку передаем в качестве аргумента, чтобы начать с текущей директории
    print(current_dir, dirs, files, sep = '\n')
    print()
    print()

C:\Users\Пользователь\Desktop
.
['.ipynb_checkpoints', '9785977567312add1', 'bluescreenview', 'Coursera', 'data-science-from-scratch-master', 'DRAM-Calculator-for-Ryzen-1.7.3', 'drive-download-20190126T214701Z-001', 'HR', 'hr connect', 'Know-How', 'Python', 'Setup', 'thphn163', 'Victoria528', '_17e8313e80520da7c04cfe8307d468f1_vector_operations', 'Архив (2)', 'Казань', 'Статистика по подбору', 'Творчество']
['525.jpg', 'ABBYY FineReader 14.lnk', 'Age of Gladiators.url', 'AIDA64 Extreme.lnk', 'alpha.txt', 'AnyDesk.exe', 'Assassins Creed Odyssey.lnk', 'cc_20211107_173237.reg', 'Cemu — ярлык.lnk', 'Core Temp.lnk', 'Days Gone.lnk', 'desktop.ini', 'Dying Light.url', 'Gears Tactics.url', 'Hades.url', 'Hardspace Shipbreaker.url', 'Immortals Fenyx Rising.lnk', 'Kingdom Come Deliverance.url', 'Microsoft Teams.lnk', 'Middle-earth™ Shadow of War™.url', 'Minecraft.lnk', 'Mount & Blade II Bannerlord.url', 'Nioh Complete Edition.url', 'rvn-pool — ярлык.lnk', 'SAVEDATA.BIN', 'Sekiro Shadows Die Twice

.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Оценка и развитие персонала\Адаптация\wb\1
[]
['book_person16.pdf', 'hbook-RU.pdf', 'kniga_novichka.pdf']


.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Оценка и развитие персонала\Адаптация\wb\Путеводитель
['Дц', 'Юг-Авто - это не только про работу']
['Справочник нового сотрудника.docx']


.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Оценка и развитие персонала\Адаптация\wb\Путеводитель\Дц
['Новороссийск', 'Селезнева', 'Энка', 'Яблоновский']
[]


.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Оценка и развитие персонала\Адаптация\wb\Путеводитель\Дц\Новороссийск
['Hyundai', 'Mitsubishi', 'Volkswagen', 'Эксперт']
[]


.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Оценка и развитие персонала\Адаптация\wb\Путеводитель\Дц\Новороссийск\Hyundai
[]
['0010.jpg', '0016.jpg']


.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Оценка и развитие персонала\Адаптация\wb\Путеводитель\Дц\Новороссийск\Mitsubishi
[]
['Foto-27.jpg', 'Q87mSsZ3Y

.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Подбор персонала\HR отдел\ОТЧЕТЫ\2011\Отчеты\Заявки на подбор\Июль
[]
['Заявка на подбор  №123.1 Кладовщик.jpg', 'Заявка на подбор персонала Автоэлектрик № 122.doc', 'Заявка на подбор персонала механик № 123.doc', 'Заявка на подбор персонала №  124.1 ученик автомеханика.jpg', 'Заявка на подбор персонала № 124Механик по установке доп.оборудования  1.doc', 'Заявка на подбор персонала № 126 Кредитный специалист.doc', 'Заявка на подбор персонала № 127 Администратор ресепшн.doc', 'Заявка на подбор персонала № 128Оператор контактного ценктра.doc', 'Заявка на подбор персонала №125 Администратор ресепшн.doc', 'Заявка на подбор персонала №129 Администратор ресепшн.dot', 'Заявка на подбор персонала №130 Помощник руководителя .doc', 'Заявка на подбор персонала №131 оператор контактного центра.doc', 'Заявка на подбор персонала №132 Оператор контактного центра.doc', 'Заявка на подбор персонала №134 Продавец-консультант.doc', 'Заявка на подбор персона

.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Подбор персонала\ТЕСТЫ\Тесты на ПК\Data
[]
['Arch.arc', 'data.ref']


.\HR\Юг-Авто\Югавка\Отдел по работе с персоналом\Подбор персонала\ТЕСТЫ\Тесты на ПК\Тестовые программы
['lovetest', 'Айзенка(IQ)', 'Айзенка(Оценка личности)', 'Безумие', 'Бизнес-тесты', 'Внимание', 'Вопросник КОС', 'Депрессивное состояние', 'Дом-Дерево-Человек', 'Дуромер', 'Интересы, способности', 'Интраверт-Экстраверт', 'Кейрси', 'Келлермана-Плутчика', 'Кеттэла(Опросник)', 'Кеттэла(Оценка личности)', 'Коммуникабельность', 'Контурный САТ-Н', 'Коэффициент интеллекта(IQ)', 'Креативность', 'Леонгарда', 'Механизмы психологической защиты', 'Мехрабиана', 'О любви', 'Определение IQ(Модификация)', 'Определение характера', 'Определите Вашу сексуальность', 'Оптимист.Писсимист', 'Оценки фотопортретов', 'Про счастье', 'Профориентация и работа', 'Психологический портрет человека', 'Психофизиологическое состояние', 'Равена(Оценка интеллекта)', 'Сборник тестов', 'Семья есть семья', '

## Библиотека shutil и копирование файлов

Библиотека os предлагает набор инструментов для работы с файлами

### copy('откуда_копируем/что_копируем', 'куда_копируем/как_обзовем_копию')

__copy()__ библиотеки shutil позволяет копировать целые файлы:

In [36]:
import shutil

In [45]:
shutil.copy('C:\\Users\\Пользователь\\Desktop\\Кассир.txt','C:\\Users\\Пользователь\\Конспекты\\КассирШутил.txt')

'C:\\Users\\Пользователь\\Конспекты\\КассирШутил.txt'

In [46]:
shutil.copy('C:\\Users\\Пользователь\\Desktop\\525.jpg','C:\\Users\\Пользователь\\Конспекты\\Shutil.jpg')

'C:\\Users\\Пользователь\\Конспекты\\Shutil.jpg'

In [56]:
print(os.urandom(5))

b'\xefGn\xcf\xcd'
