<a href="https://colab.research.google.com/github/serggtech/Courses/blob/main/%D0%9B%D0%B5%D0%BA%D1%86%D0%B8%D1%8F_9_%D0%A4%D0%B0%D0%B9%D0%BB%D1%8B_CSV%2C_JSON.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Работа с библиотеками (модулями) в Python


Библиотеки представляют собой совокупность готового кода, который можно использовать для решения различных задач в Python. В Python существует огромное количество библиотек, предназначенных для различных целей, таких как работа с файлом, веб-разработка и многое другое.

## Установка библиотек

Для использования библиотек в Python их необходимо установить с помощью менеджера пакетов `pip` введя команду:
```python
pip install <library_name>
```

После установки библиотеки, ее можно импортировать в свои программы с помощью ключевого слова `import`:

```python
import <library_name>
```


## Использование библиотек

В Python существует несколько способов импорта библиотек, каждый из которых имеет свои особенности. В этой лекции мы рассмотрим основные способы импорта библиотек и обсудим их использование на примере библиотеки csv.

### Импорт всей библиотеки

```python
import csv
```

Этот способ импорта загружает всю библиотеку csv целиком в текущее пространство имен. Для доступа к функциям и классам библиотеки используется синтаксис csv.object.

### Импорт всей библиотеки с псевдонимом

```python
import csv as c
```

Этот способ импорта аналогичен предыдущему, но позволяет задать псевдоним для импортируемой библиотеки. Это может быть удобно, если имя библиотеки слишком длинное или может вызвать конфликт с другими именами.

### Импорт конкретных объектов из библиотеки

```python
from csv import reader, writer
```

Этот способ импорта позволяет загрузить только определенные объекты из библиотеки. В данном примере импортируются функции reader и writer для работы с файлами CSV. После использования этого способа импорта, для доступа к импортированным объектам не нужно указывать имя библиотеки.

### Импорт всех объектов из библиотеки

```python
from csv import *
```

Этот способ импорта загружает все объекты из библиотеки в текущее пространство имен. Однако его использование не рекомендуется из-за возможных конфликтов имен и потери ясности кода.





# Работа с файлами CSV

Файлы CSV (Comma-Separated Values) являются одним из наиболее распространенных форматов для хранения табличных данных. В Python существует множество библиотек для работы с файлами CSV, которые упрощают чтение, запись и обработку данных.

Формат .csv – один из самых распространенных форматов для импорта и
экспорта электронных таблиц .xls.








## Модуль `csv`

Модуль `csv` предоставляет инструменты для работы с файлами в формате CSV (Comma-Separated Values). Одни из основных компонентов этого модуля - классы `csv.writer` и `csv.reader`, которые позволяют записывать и читать данные с файла CSV. В этой лекции мы рассмотрим примеры их использования.

## Чтение данных из файла CSV (`csv.reader`)


Для чтения данных из файла CSV в Python используется `csv.reader` из модуля csv.

`csv.reader` - это класс из стандартной библиотеки Python csv, который предоставляет возможность чтения данных из файла в формате CSV.

С помощью `csv.reader` можно создать объект, который будет читать данные из файла CSV построчно. Этот объект позволяет читать каждую строку данных как список значений, разделенных заданным разделителем (по умолчанию это запятая).

Объект `csv.reader` имеет метод `__next__()` (метод итерируемого объекта), который возвращает следующую строку данных из файла.

Использование `csv.reader` делает чтение данных из файлов CSV простым и удобным, что делает его полезным инструментом при обработке табличных данных в Python.

Вот пример чтения данных из файла 'data.csv':

```python
import csv

# Открытие файла CSV для чтения
with open('data.csv', 'r') as file:
    # Создание объекта reader
    reader = csv.reader(file)
    # Чтение данных построчно
    for row in reader:
        print(row)
```

В этом примере файл 'data.csv' открывается для чтения, а затем данные читаются построчно с использованием объекта csv.reader.

Если в файле CSV используется другой разделитель, а не запятая, вы можете указать этот разделитель при создании объекта csv.reader. Вот пример:

```python
import csv

# Откройте файл CSV для чтения, указав другой разделитель
with open('data_with_delimiter.csv', 'r') as file:
    # Создайте объект reader с указанием другого разделителя (например, точка с запятой)
    reader = csv.reader(file, delimiter=':')
    # Прочитайте данные из файла CSV
    for row in reader:
        print(row)
```




## Запись данных в файл CSV (`csv.writer`)

Для записи данных в файл CSV в Python используется `csv.writer` из модуля csv.

`csv.writer` - это класс, который предоставляет возможность записывать данные в файл в формате CSV.

С помощью csv.writer можно создать объект, который будет записывать данные в файл CSV построчно. Этот объект позволяет записывать каждую строку данных в виде списка значений, которые будут разделены заданным разделителем (по умолчанию это запятая).

Объект csv.writer имеет метод writerow(), который принимает один аргумент - список значений для записи в текущую строку файла CSV. После записи всех строк данных, файл должен быть закрыт, чтобы сохранить изменения.

## Пример использования csv.writer

```python
import csv

# Данные для записи
columns = ['Name', 'Age', 'City']
data = [
    ['John', 30, 'New York'],
    ['Alice', 25, 'Los Angeles'],
    ['Bob', 35, 'Chicago']
]

# Открытие файла CSV для записи
with open('output.csv', 'w', newline='') as file:
    # Создание объекта writer
    writer = csv.writer(file)
    # Запись данных построчно
    writer.writerow(columns)
    # Запись всего словаря
    writer.writerows(data)
```

В этом примере создается объект `csv.writer`, который позволяет записывать данные в файл CSV. Затем происходит запись данных из списка data, используя список columns в качестве заголовков столбцов.



### Параметр `newline`

Когда вы используете метод writerows модуля csv в Python и видите пустую строку между строками данных,
это обычно происходит из-за различий в обработке символов новой строки между операционными системами.

В Windows символы новой строки представлены как `\r\n` (возврат каретки и перевод строки),
в то время как в Unix-подобных системах (включая Linux и macOS) используется только `\n` (перевод строки).
Python, работая на Windows, может иногда добавлять дополнительный `\r`,
в результате чего между строками появляются пустые строки.

Чтобы исправить это, вы можете указать способ обработки новых строк при открытии файла для записи.
Для этого используйте параметр `newline=''`

## Объект `csv.DictWriter`

Для записи данных в `csv` файл, можно также использовать словари. Для этого необходимо создать список, в котором будут названия столбцов.
Далее создать словарь, в котором ключ - это название столбца, а значение - то, что нужно записать в этот столбец.

Для этого используем объект `csv.DictWriter`. Это обеспечивает удобный способ записи структурированных данных, особенно если данные хорошо представлены в форме словаря.

Обязательные параметры:
* `csvfile`: файловый объект или любой объект, который поддерживает метод `write`.
* `fieldnames`: список строк для использования в качестве заголовка.

Необязательные параметры:
`restval`, `extrasaction`, `dialect`, `**kwds`

Часто используемые необязательные параметры:
* `restval`: значение, которое следует присвоить отсутствующим полям (по умолчанию "").
* `extrasaction`: определяет действие, которое следует выполнить, если словарь, переданный методу `writerow()`, содержит ключи, не входящие в `fieldnames`. Может принимать значения `raise` (вызывать ошибку) или `ignore` (игнорировать лишние ключи).

```python
films_list = [
    {"id": 1, "name": "Avangers", "release": 2012, "genre": "Fantasy", "length": "2:10", "rating": "16+"},
    {"id": 2, "name": "Avangers2", "release": 2016, "genre": "Fantasy", "length": "2:30", "rating": "16+"},
    {"id": 3, "name": "Avangers3", "release": 2020, "genre": "Fantasy", "length": "2:45", "rating": "18+"},
    {"id": 4, "name": "Avangers4", "release": 2022, "genre": "Fantasy", "length": "3:15", "rating": "18+"},
]

with open('output_dict.csv', 'w', newline='') as data:
    fieldnames = ["id", "name", "release", "genre", "length", "rating"]
    writer = csv.DictWriter(data, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerows(films_list)
    # Или можно записать построчно
    # for film in films_list:
    #     writer.writerow(film)
```

Так же, чтобы прочитать данные из файла по именам колонок можно использовать класс `DictReader()`

`csv.DictReader()` – это другой полезный инструмент в модуле `csv` стандартной библиотеки `Python`. Вместо того чтобы возвращать каждую строку файла в виде списка, как это делает `csv.reader()`, `csv.DictReader()` возвращает строки в виде словарей.
Ключи словаря соответствуют именам полей, которые либо берутся из первой
строки файла (если заголовок присутствует), либо предоставляются вручную
через параметр `fieldnames`.


```python
with open("output_dict.csv", "r", newline="") as data:
    reader = csv.DictReader(data)

    for row in reader:
        print(row)
        print(row['name'], row['rating'], sep='|')
```

# Работа с файлами JSON

`JSON` (JavaScript Object Notation) - это формат обмена данными, который широко используется в современном программировании для передачи и хранения данных.

JSON представляет собой текстовый формат, состоящий из пар "ключ: значение", разделенных запятыми, и заключенных в фигурные скобки {}. При этом как элементы словаря могут храниться различные типы данных. Пример объекта JSON:

```json
{
  "name": "John",
  "age": 30,
  "city": "New York"
}
```


Json написан на JavaScript, поэтому и типы в таком формате отличаются
от типов Python. Python и JSON (JavaScript Object Notation) - это два различных языка и формата обмена данными со своими уникальными типами данных. Ниже представлена таблица, отображающая сравнение типов данных Python и их эквивалентов в формате JSON.

| Python                | JSON             |
|-----------------------|------------------|
| str                   | String |
| int, float            | Number |
| bool                  | Boolean (true/false) |
| list, tuple           | Array |
| dict                  | Object |
| None                  | null |




## Сериализаторы и десериализаторы

Сериализация и десериализация - это процессы преобразования данных из одного формата в другой. В контексте программирования, особенно при работе с файлами, эти термины относятся к преобразованию объектов Python в объект JSON для сохранения на диске или передачи по сети, а затем обратно в объекты Python. Давайте рассмотрим подробнее эти процессы:

* Сериализация - это процесс преобразования объекта Python в формат, который можно сохранить или передать.
<!-- Для сериализации объектов в формат JSON используется функция `json.dumps()` -->

* Десериализация - это процесс преобразования данных из сериализованного формата обратно в объекты Python.
<!-- Для десериализации объектов из JSON используются функция `json.loads()`. -->

Сериализация и десериализация являются важными процессами при работе с данными в Python. Они позволяют сохранять состояние объектов Python в файлы или передавать их по сети, а затем восстанавливать эти объекты из сохраненных данных.








## Модуль `json`

В Python для работы с JSON предоставляется встроенный модуль json, который позволяет легко работать с данными в этом формате. Давайте рассмотрим основные операции с файлами JSON.

Модуль json в Python предоставляет инструменты для работы с данными в формате JSON. Модуль json включает в себя функции для сериализации (из Python в JSON) и десериализации (из JSON в Python).

Основные функции модуля json
- `json.dumps()`: Преобразует объект Python в строку формата JSON.
- `json.dump()`: Записывает объект Python в файл в формате JSON.
- `json.loads()`: Преобразует строку формата JSON в объект Python.
- `json.load()`: Читает данные из файла JSON и преобразует их в объект Python.


### Работа с JSON строкой

Модуль json в Python позволяет легко сериализовать и десериализовать JSON строки с помощью методов `dumps()` и `loads()`.

Пример преобразования строки формата JSON в Python словарь и обратно:

```python
import json

# Пример JSON строки
json_string = '{"name": "John", "age": 30, "city": "New York"}'

# Десериализация JSON строки в объект Python
data_dict = json.loads(json_string)
print(type(data_dict))
print(data_dict)

# Сериализация объекта Python в JSON строку
json_string_from_dict = json.dumps(data_dict)
print(type(json_string_from_dict))
print(json_string_from_dict)
```

### Работа с JSON файлом

Модуль json в Python позволяет легко сериализовать и десериализовать JSON файлы с помощью методов `dump()` и `load()`.

Пример преобразования JSON файла в Python словарь и обратно:
```python
import json

# Загрузка данных из файла JSON
with open('data.json', 'r') as file:
    data_from_json = json.load(file)
    print(data_from_json)
    # Или более красивый вывод
    for i in data_from_json['users']:
        print(i)

# Запись данных в файл JSON
data_to_write = {'name': 'John', 'age': 30, "city": "New York", "is_active": True, "interests": ["tennis", "swimming", "football"]}

with open('output.json', 'w') as file:
    json.dump(data_to_write, file)
```


### Необязательные параметры методов из модуля json

Методы модуля json предоставляют необязательные параметры для более гибкой работы с данными. ниже представлены самые популярные из них:

#### dump() и dumps()

- `indent`: Устанавливает количество прибелов (или другие символы), которые используются для отступов в JSON. Он определяет, каким образом будут выведены вложенные структуры данных для улучшения читаемости. К примеру `indent=4` означает, что каждый уровень вложенности будет отступать на 4 пробела.

```python
# Запись данных в файл JSON
data_to_write = {'name': 'John', 'age': 30, "city": "New York", "is_active": True, "interests": ["tennis", "swimming", "football"]}

with open('output.json', 'w') as file:
    json.dump(data_to_write, file, indent=4)
```

- `sort_keys`: Если установлено в `True`, ключи в словаре будут отсортированы перед сериализацией.


# Задачи

## Задача CSV

В файле titanic.csv подсчитать общее кол-во мужчин, женщин и детей(до 15 лет включительно)

Найти средний возраст пассажиров в зависимости от класса билетов.

Определить процент выживших мужчин, женщин и детей (ребёнком                    
считается пассажир до 15-ти лет включительно)

Распределить всех пассажиров по портам посадки:
Значения могут быть:
"S" (Southampton),
"C" (Cherbourg)
"Q" (Queenstown)

Этих пассажиров распределить по:
мужчинам
женщинам
детям (до 15 лет включительно)

Выходные данные записать в новый csv файл


## Задача JSON

Есть файл с данными о пассажирах Титаника.
Выведите общее количество пассажиров, представленных в данных.

Из этого же файла нужно забрать информацию:
1. Всех пассажиров
2. Количество выживших и их имена
3. Количество умерших пассажиров и их имена.

Найти самого пожилого пассажира. Вывести его имя, возраст и класс каюты.

Выведите список имен всех пассажиров, чей возраст в диапазоне от 20 до 50 лет и класс пассажира - 2-ой.

Задача: Разработать программу для игры "Угадай число".

- Программа должна случайным образом выбирать число в определенном диапазоне (например, от 1 до 100).
- Затем программа предлагает пользователю угадать это число, выводя подсказки (больше/меньше) при каждой попытке.
- Пользователю дается несколько попыток (например, 5).
- Если пользователь угадывает число за отведенное количество попыток, программа выводит сообщение о победе и количество попыток, которое потребовалось для угадывания.
- Если пользователь не угадывает число за отведенное количество попыток, программа сообщает о поражении и выводит загаданное число.

In [None]:
import random

num = random.randint(1, 100)
# num = random.randrange(1, 100 + 1)
# print(num)

# count = 1
# while count < 5:
#   pass
#   count += 1

tries = 7

for i in range(1, tries + 1):
  n = int(input("Введите число: "))
  if n == num:
    print(f"Вы угадали, число = {num}")
    break
  elif n < num:
    print("Ваше число меньше загаданного")
  else:
    print("Ваше число больше загаданного")
  print(f"У вас осталось {tries - i} попыток")
else:
  print(f"Вы не угадали, загаданное число = {num}")


Введите число: 50
Ваше число меньше загаданного
У вас осталось 6 попыток
Введите число: 75
Ваше число меньше загаданного
У вас осталось 5 попыток
Введите число: 87
Ваше число больше загаданного
У вас осталось 4 попыток
Введите число: 81
Вы угадали, число = 81


Задача: Напишите программу для симуляции игры "Камень, ножницы, бумага" против компьютера.

- Программа должна предложить пользователю выбрать один из вариантов: "камень", "ножницы" или "бумага".
- Компьютер должен случайным образом выбирать один из этих вариантов.
- После выбора пользователем и компьютером, программа должна вывести результат игры (победа, поражение или ничья) и показать, что выбрал компьютер.
- Игра должна продолжаться до тех пор, пока пользователь не решит завершить ее.

Задача: Факториал числа — это произведение всех целых чисел от 1 до искомого числа. К примере, факториал числа 6 равен `1*2*3*4*5*6 = 720`.



Дано натуральное число n. Напишите программу, которая печатает численный треугольник в соответствии с примером:
```
1
22
333
4444
55555
...
```