# Работа с файлами

'r' 	открытие на чтение (является значением по умолчанию).\
'w' 	открытие на запись, содержимое файла удаляется, если файла не существует, создается новый. \
'x' 	открытие на запись, если файла не существует, иначе исключение. \
'a' 	открытие на дозапись, информация добавляется в конец файла. \
'b' 	открытие в двоичном режиме. \
't' 	открытие в текстовом режиме (является значением по умолчанию). \
'+' 	открытие на чтение и запись

Атрибут 	Значение \
file.closed 	Возвращает True если файл был закрыт. \
file.mode 	Возвращает режим доступа, с которым был открыт файл. \
file.name 	Возвращает имя файла. \

Через конструкцию with можно открывать сразу несколько файлов:

In [None]:
with open("input.txt", "r") as input, open("output.txt", "w") as output:
    output.write(input.read()) #скопировали содержимое input в output

Чтобы считать из файла целую строку, используется метод readline(max_len). Если указать параметр max_len, то будут считаны максимум max_len символов

In [None]:
with open("text.txt", "r") as file:
    print(file.readline()) #считали и вывели первую строку файла

На самом деле у нашего объекта файла есть итератор, поэтому перебирать строки внутри файла можно с его помощью:

In [None]:
with open("text.txt", "r") as file:
    for line in file:
        print(line)

**Упражнение 1:** создайте произвольный текстовый файл с несколькими строками произвольного текста. Выведите в консоль строки файла, удалив лишние пробелы в начале и конце строк, если они есть. \

In [None]:
with open("file_1task", "w") as file:
    file.write("dfddfdsfs\n" + "fdfdfdf")
with open("file_1task", "r") as file:
    for line in file:
        print(line.strip())

**Упражнение 2:** запишите в новый файл содержимое списка строк (каждую строку с новой строки) без использования цикла.


In [None]:
def write_array(arr, file_name):
    arr = map(lambda x : x+'\n', arr)
    file_name.writelines(arr)
    
list1 = ["abc", "bca", "cda"]
with open("file_2task", "w") as file:
    write_array(list1, file)
with open("file_2task", "r") as file:
    for line in file:
        print(line.strip())

# Работа с файловой системой

In [None]:
import os

In [None]:
os.listdir() # os.listdir(dir) перечисялет файлы и папки в указанной директории dir.

#### Текущая папка

Относительные пути строятся относительно текущей папки. Чтобы получить абсолютный путь файла из относительного, используется функция **os.path.abspath(file_path)**. Чтобы узнать, какая папка является текущей, можно вызвать функцию **os.getcwd()**. Для смены текущей папки используется **os.chdir(new_dir)**.

#### Проверка существования файла или папки и определение, является ли имя файлом или папкой

**os.path.exists(file_name)** проверяет, существует ли указанный файл (или директория) file_name.

Чтобы проверить, является ли данное имя name файлом или папкой, можно воспользоваться функциями **os.isdir(name)** или **os.isfile(name)**, которые возвращают True или False.

#### Рекурсивный обход папок
Одной из самых интересных и мощных функций является функция os.walk(dir) - она позволяет рекурсивно пройтись по всем папкам, подпапкам, их подпапкам и так далее. На самом деле она возвращает генератор (последовательность элементов). Каждый элемент представляеьт собой кортеж из 3х элементов. Первый элемнт - строковое представление директории текущей директории, которую просматривает функция. Вторым элементом - список всех подпапок данной директории, а третьим - список всех файлов этой директории.

In [None]:
for current_dir, dirs, files in os.walk("."): #передаем в качестве аргумента текущую директорию
                                              #("." - означает именно ее)
    print(current_dir, dirs, files)           #выведем, что получается

#### Копирование файлов
Копировать файлы можно при помощи функции copy из модуля shutil

In [None]:
import shutil
shutil.copy("input.txt", "output.txt")

Копировать папки можно с помощью copytree из того же модуля:

In [None]:
shutil.copytree("test", "test/test2") #Скопирует папку test внутрь неё самой же в подпапку test2

**Упражнение 3:** Вам дана в архиве **main.zip** файловая структура, состоящая из директорий и файлов.

Вам необходимо распаковать этот архив (средствами языка python), и затем найти в данной в файловой структуре все директории, в которых есть хотя бы один файл с расширением “.py”.

Ответом на данную задачу будет являться файл со списком таких директорий, отсортированных в лексикографическом порядке.

In [None]:
import zipfile
with zipfile.ZipFile("main.zip", 'r') as zip_ref:
    zip_ref.extractall("main_contents")

In [30]:
import os
out = []
for current_dir, dirs, files in os.walk("main_contents"):
    for fl in files:
        if (fl[-3:] == ".py"):
            out.append(str(current_dir))
out = set(out)
with open("file_3task", "w") as file3:
    write_array(out, file3)
with open("file_3task", "r") as file3:
    for line in file3:
        print(line.strip())

main_contents\main\olmhl\mmtsz\nujko\ywjka\pxjip\wthmo\wtgrc\mgplg\rbyav\ppeir\subdi\zljoz\kgdme\jhhbu\dufxr\xroxl\rgunj\bdcjg\xpmcm
main_contents\main\olmhl\mmtsz\nujko\ywjka\pxjip\wthmo\wtgrc\mgplg\rbyav\ppeir\subdi\zljoz\kgdme\jhhbu\rnqwd\purto\bkfog\rvsfo\rpnzm\ilogc
main_contents\main\ksuvk\xjrqt\qdbqt\hotgx
main_contents\main\olmhl\mmtsz\nujko\ywjka\pxjip\wthmo\wtgrc\zfukg\jvmme\vynzv
main_contents\main\olmhl\mmtsz\nujko\ywjka\pxjip\wthmo\wtgrc\mgplg\rbyav\ppeir\subdi\afrqp\iaujh\jqjsg\xriod
main_contents\main\olmhl\mmtsz\nujko\ywjka\pxjip\wthmo\wtgrc\mgplg\rbyav\uaodv
main_contents\main\olmhl\mmtsz\nujko\ywjka\pxjip\wthmo\wtgrc\mgplg\rbyav\ppeir\subdi\zljoz\kgdme\evnvn\axqur\itkcz
main_contents\main\taivr\yptwa\xsbzr\hcasz\ilitr\urguw\sjmeg\ddnaa\jxhbl\lradw\iglcm
main_contents\main\olmhl\mmtsz\nujko\ywjka\pxjip\wthmo\wtgrc\mgplg\rbyav\ppeir\subdi\zljoz\kgdme\jhhbu\rnqwd\purto\bkfog\rvsfo\rpnzm\ilogc\reshp
main_contents\main\olmhl\mmtsz\nujko\ywjka\pxjip\wthmo\wtgrc\zfukg\jvmme\

# Распространенные форматы текстовых данных

### csv

csv является табличным форматом. В нем содержатся значения разделенные запятой (Comma-Separated Values). Например,

In [None]:
first name,last name,module1,module2,module3
Nikolay,Neznaev,0,20,10
Stepan,Sharyashiy,100,99.5,100

Для работы с csv файлами можно воспользоваться библиотекой csv:

In [None]:
import csv
with open("example.csv", "r") as file:
    reader = csv.reader(file) #На основе открытого файла получаем объект из библиотеки csv
    for row in reader:
        print(row)            #Каждая строка - список значений


В csv.reader параметром delimeter можно передать разделитель значений, таким образом разделяющим символом в файле csv может быть не только запятая.
Для изолирования некоторых значений можно пользоваться двойными кавычками. Библиотека csv учитывает различные мелочи, такие как строки с содержащимися в ней запятыми и переносами строки, различные разделители, поэтому ее использование целесообразнее splitа по разделителю.
Для записи значений в csv формате используется csv.writer:


In [None]:
import csv
students = [
            ["Greg", "Lebovskiy", 70, 80, 90, "Good job, Greg!"],
            ["Nick", "Shalopaev", 10, 50, 45, "Shalopaev, you should study better!"]
            ]
with open("example.csv", "a") as file:
    writer = csv.writer(file)            #На основе открытого файла получаем объект из библиотеки csv
    for student in students:
        writer.writerow(student)         #Записываем строку
    #Вместо цикла выше мы могли сразу записать все через writer.writerows(students)

### JSON


JSON (JavaScript Object Notation) - простой формат обмена данными, удобный для чтения и написания как человеком, так и компьютером. Впервые он был придуман и использован в JavaScript для хранения структур и классов, но быстро обео свою популярность и вышел за пределы своего родителя.
JSON основан на двух структурах данных: * Коллекция пар ключ/значение. В разных языках, эта концепция реализована как объект, запись, структура, словарь, хэш, именованный список или ассоциативный массив. * Упорядоченный список значений. В большинстве языков это реализовано как массив, вектор, список или последовательность.

Это универсальные структуры данных. Почти все современные языки программирования поддерживают их в какой-либо форме. Логично предположить, что формат данных, независимый от языка программирования, должен быть основан на этих структурах.

Объекты в формате JSON хранятся как словари в Python, но с некоторыми деталями: во первых, ключом в json-объекте может быть только строка, значения True и False пишутся с маленькой буквы, значению None соответствует значение null, строки хранятся только внутри двойных кавычек.

Для удобной работы с json файлами в языке python можно использовать библиотеку json

Например:

In [None]:
import json

student1 = {
    "full_name" : "Greg Martin",
    "scores" : [100, 85, 94],
    "certificate" : True,
    "comment": "Great job, Greg!"
}

student2 = {
    "full_name" : "John Price",
    "scores" : [0, 10, 0],
    "certificate" : False,
    "comment": "Guns aren't gonna help you here, captain!"
}

data = [student1, student2]

print(json.dumps(data, indent=4, sort_keys=True)) 
#Делаем отступы в 4 пробела, сортируем ключи в алфавитном порядке


Для получения строкового представления объекта в формате json можно использовать **json.dumps(data, \*\*parrams)** с различными вспомогательными настройками (пробелы, сортировка и др.)
Для записи в файл можно воспользоваться **json.dump(data, file_obj, \*\*params)**:


In [None]:
with open("output.json", "w") as out:
    json.dump(data, out, indent=4, sort_keys=True)

Для получения объекта python на основе его срокового представления можно воспользоваться функцией **json.loads** или **json.load** для считывания из файла:

In [None]:
json_str = json.dumps(data, indent=4, sort_keys=True) #получение строкового представления json
data_again = json.loads(json_str)                     #получаем объект python
print(sum(data_again[0]["scores"]))                   #убедимся в кореектном считывании:
                                                      #посчитаем сумму баллов у первого студента

with open("output.json") as file:
   data_from_file = json.load(file)                   #считаем объект из файла
   print(sum(data_from_file[0]["scores"]))            #аналогично посчитаем сумму баллов

# Исключения

Исключения (exceptions) - ещё один тип данных в python. Исключения необходимы для того, чтобы сообщать программисту об ошибках.

Самый простейший пример исключения - деление на ноль:

In [None]:
100 / 0
Traceback (most recent call last):
  File "", line 1, in
    100 / 0
ZeroDivisionError: division by zero