# Распространенные форматы текстовых файлов: CSV, JSON

## CSV(comma separated values) - табличный формат хранения данных

### Чтение данных из файла

In [5]:
import csv

with open("D:\\pytest\example.csv") as f:
    reader = csv.reader(f, delimiter=",")
    for row in reader:
        print(row)

['first name', 'last name', 'module1', 'module2', 'module3', 'description']
['student', 'best', '100', '100', '100', 'Excellent score']
['student', 'good', '90', '90,2', '100', 'Good score\nbut could do better']


### Запись данных в файл

In [1]:
import csv

students = [
    ["Greg", "Dean", 70, 80, 90, "Good job, Greg"],
    ["Wirt", "Wood", 80, 80.2, 80, "Nicely done"]
]

with open("D:\\pytest\example.csv", "a") as f:
    writer = csv.writer(f)
    for student in students:
        writer.writerow(student)

##### Для того, чтобы сказать writer'у о том, чтобы все значения были помещены в кавычки используется параметр конструктора quoting

In [None]:
import csv

students = [
    ["Greg", "Dean", 70, 80, 90, "Good job, Greg"],
    ["Wirt", "Wood", 80, 80.2, 80, "Nicely done"]
]

with open("D:\\pytest\example.csv", "a") as f:
    writer = csv.writer(f, quoting=csv.QUOTE_ALL) # или QUOTE_MINIMAL, QUOTE_NONE, QUOTE_NONNUMERIC
    for student in students:
        writer.writerow(student)

#### Задача 1

Вам дана частичная выборка из датасета зафиксированных преступлений, совершенных в городе Чикаго с 2001 года по настоящее время.

Одним из атрибутов преступления является его тип – Primary Type.

Вам необходимо узнать тип преступления, которое было зафиксировано максимальное число раз в 2015 году.

Файл с данными:
Crimes.csv

In [21]:
import csv

dict_pr_type = dict()
is_header = True

with open("D:\\pytest\Crimes.csv") as f:
    reader = csv.reader(f)
    for row in reader:
        if is_header:
            is_header = False
        else:
            if row[5] in dict_pr_type:
                dict_pr_type[row[5]] += 1
            else:
                dict_pr_type[row[5]] = 1

sorted_types = sorted(dict_pr_type.items(), key=lambda x: x[1], reverse=True) 

print(sorted_types[0][0])

THEFT


## JSON - изначальной использовался для представления объектов в JavaScript, сейчас используется повсеместно

##### Некоторые особенности Json

1. Ключем может быть только строка

2. Значения true и false с маленькой буквы

3. Значение null из json соответствует значению None из Python

4. Строки могут быть написаны только в двойных кавычках

##### Для работы с форматом json в Python есть одноименная библиотека

##### Для преобразования данных в формат json используется функция dumps со следующими аргументами:

Первый аргумент - данные для добавления

indent - количество отступов в списках и словарях

sort_keys - сортировка ключей каждого словаря, который попадается в каждом объекте

In [22]:
import json
student1 = {
    'first_name': 'Greg',
    'last_name': 'Dean',
    'scores': [70, 80, 90],
    'description': 'Good job, Greg',
    'certificate': True
}

student2 = {
    'first_name': 'Wirt',
    'last_name': 'Wood',
    'scores': [80, 80.2, 80],
    'description': 'Nicely Done',
    'certificate': True
}

data = [student1, student2]
print(json.dumps(data, indent = 4, sort_keys=True))

[
    {
        "certificate": true,
        "description": "Good job, Greg",
        "first_name": "Greg",
        "last_name": "Dean",
        "scores": [
            70,
            80,
            90
        ]
    },
    {
        "certificate": true,
        "description": "Nicely Done",
        "first_name": "Wirt",
        "last_name": "Wood",
        "scores": [
            80,
            80.2,
            80
        ]
    }
]


##### Для записи информации в формате json в файл используется функция dump

In [24]:
import json
student1 = {
    'first_name': 'Greg',
    'last_name': 'Dean',
    'scores': [70, 80, 90],
    'description': 'Good job, Greg',
    'certificate': True
}

student2 = {
    'first_name': 'Wirt',
    'last_name': 'Wood',
    'scores': [80, 80.2, 80],
    'description': 'Nicely Done',
    'certificate': True
}

data = [student1, student2]
with open("D:\\pytest\students.json", "w") as f:
    json.dump(data, f, indent=4, sort_keys=True)

#### Для получения объекта Python, соответствующим формату json используется функция loads

In [27]:
import json
student1 = {
    'first_name': 'Greg',
    'last_name': 'Dean',
    'scores': [70, 80, 90],
    'description': 'Good job, Greg',
    'certificate': True
}

student2 = {
    'first_name': 'Wirt',
    'last_name': 'Wood',
    'scores': [80, 80.2, 80],
    'description': 'Nicely Done',
    'certificate': True
}

data = [student1, student2]
data_json = json.dumps(data, indent=4, sort_keys=True)
data_again = json.loads(data_json)
print(sum(data_again[0]["scores"]))

240


#### Для чтения данных из файла в формате json используется функция load

In [30]:
with open("D:\\pytest\students.json", "r") as f:
    data_again = json.load(f)
    print(sum(data_again[1]["scores"]))

240.2


#### Задача 2

Вам дано описание наследования классов в формате JSON. 
Описание представляет из себя массив JSON-объектов, которые соответствуют классам. У каждого JSON-объекта есть поле name, которое содержит имя класса, и поле parents, которое содержит список имен прямых предков.

Пример:
[{"name": "A", "parents": []}, {"name": "B", "parents": ["A", "C"]}, {"name": "C", "parents": ["A"]}]

Эквивалент на Python:

class A:
    pass

class B(A, C):
    pass

class C(A):
    pass

Гарантируется, что никакой класс не наследуется от себя явно или косвенно, и что никакой класс не наследуется явно от одного класса более одного раза.

Для каждого класса вычислите предком скольких классов он является и выведите эту информацию в следующем формате.

<имя класса> : <количество потомков>

Выводить классы следует в лексикографическом порядке.