# Вебинар «Файлы и структуры данных (JSON, XML, YAML)»

## Проверка связи

**Поставьте в чат:**<br>
\+ если меня видно и слышно<br>
 – если нет

**Если у вас нет звука:**

* убедитесь, что на вашем устройстве и колонках включён звук

* обновите страницу вебинара или закройте её и переподключитесь

* откройте вебинар в другом браузере

* перезагрузите ваше устройство и войдите снова

## О преподавателе

**Владимир Хомутов**
- Ведущий бэкенд-разработчик на Python в Ростелеком Информационные Технологии

## Правила участия

1. Продолжительность вебинара — 80 минут
2. Запустите Jupyter Notebook, Google Colab или IDE, чтобы выполнять практические задания вебинара. Во время демонстрации работы повторяйте за спикером: это помогает лучше понять материал
3. Создайте копию этого блокнота, чтобы фиксировать вопросы и важную информацию во время занятия
4. Вы можете писать вопросы в чате во время вебинара или задавать их вслух в блоке «Ваши вопросы»
5. Запись вебинара будет доступна в личном кабинете

## Цели занятия

- На практике научиться работать с файлами в Python
- Разобраться в основных форматах файлов: JSON, XML, YAML и т. д.

## План

1. Какие бывают форматы файлов
2. Формат JSON
3. Формат YAML
4. Формат XML
5. Формат TOML
6. Формат CSV
7. Как работать с файлами в Python
8. Контекстный менеджер
9. Пакетный менеджер pip
10. Виртуальное окружение virtualenv
11. Линтеры и форматтеры для работы с кодом и импортами

## Ваши вопросы

## 1. Какие бывают форматы файлов

• JSON (JavaScript Object Notation) — текстовый формат обмена данными, основанный на JavaScript (.json)

• XML (eXtensible Markup Language) — расширяемый язык разметки (.xml)

• YAML (YAML Ain't Markup Language – не язык разметки) — популярный язык для конфигурационных файлов (.yml) 

• TOML (Tom's Obvious, Minimal Language) — формат сериализации данных (.toml)

## Ваши вопросы

## 2. Формат JSON

###Что такое JSON

Примеры:

```json
{
  "first_name": "Иван",
  "second_name": "Иванов"
}


{
    "first_name": "Глеб",
    "age": 26
}
```



Неупорядоченное количество пар вида «ключ: значение».

Формат независим от JavaScript и может использоваться в любом языке программирования.

### Где используется JSON

Чаще всего используется в REST- и JRPC-запросах.




In [None]:
from fastapi import FastAPI
from fastapi.responses import ORJSONResponse

app = FastAPI()


@app.get("/")
async def root() -> ORJSONResponse:
    return {"message": "Hello World"}


# uvicorn examples:app --reload

1. INFO:     127.0.0.1:56908 - "GET /openapi.json HTTP/1.1" 200 OK
2. INFO:     127.0.0.1:56908 - "GET / HTTP/1.1" 200 OK


- Code	Details
- 200
- Response body
{
  "message": "Hello World" # Этот объект - JSON
}

## Ваши вопросы

## 3. Формат YAML



**YAML** — язык для сериализации данных, который отличается простым синтаксисом и позволяет хранить сложноорганизованные данные в компактном и читаемом формате.
Конфиги DevOps часто представлены именно в этом формате.

```yaml
---
player: playerOne
action: attack (miss)
---
player: playerTwo
action: attack (hit)
---
```




```yaml
 author: Charles R. Saunders
 language: English
 publication-year: 1981
 pages: 22
```



## Ваши вопросы

## 4. Формат XML

**XML** — язык разметки, подобный HTML. Расшифровывается с английского языка как Extensible Markup Language — расширяемый язык разметки.

Раньше часто использовался для SOAP (англ. Simple Object Access Protocol — протокол обмена сообщениями).

Пример:
```xml
<req>
<first_name>Иван</first_name>
<last_name>Иванов</last_name>
</req>

```



## Ваши вопросы

## 5. Формат TOML

```title = "TOML Example"

[owner]
name = "Tom Preston-Werner"
dob = 1979-05-27T07:32:00-08:00

[database]
enabled = true
ports = [ 8000, 8001, 8002 ]
data = [ ["delta", "phi"], [3.14] ]
temp_targets = { cpu = 79.5, case = 72.0 }

[servers]

[servers.alpha]
ip = "10.0.0.1"
role = "frontend"

[servers.beta]
ip = "10.0.0.2"
role = "backend"

```


## Ваши вопросы

## 6. Формат CSV

CSV — текстовый формат, предназначенный для представления табличных данных.

Можно открыть в Excel, но также можно с лёгкостью работать внутри Python.

```
Имя,Возраст,Город
Иван,30,Москва
Мария,25,Санкт-Петербург
Петр,42,Новосибирск
```

## Ваши вопросы

## 7. Как работать с файлами в Python

* 'r' — открывает файл на чтение
* 'w' — открывает файл на запись. Если файла нет, будет создан новый.
    Если файл существует, данные в нём будут перезаписаны
* 't' — открывает файл как текстовый
* 'b' — открывает файл в бинарном режиме
* 'a' — открывает файл и дозаписывает в него данные, не стирая предыдущие.
    Создаёт новый файл, если он не существует

In [None]:
file = open(file="hello_world.txt", mode="r")
print(file.name)  # Выведет название файла
print(file.mode)  # Выведет режим работы с файлом
# print(file.read())
print(file.readline())
print(
    file.read(5)
)  # Принимает int, выведет определённое количество символов. Важно: начиная с 1
file.close()  # Устаревший вариант

hello_world.txt
r
hello world




In [7]:
big_file = open(file="hello_world_some_times.txt", mode="r")
print(big_file.readlines())
for line in big_file.readlines():
    print(line)

# print(type(big_file))
# TextIOWrapper - и так хранит внутри себя все строки. Нет необходимости считывать файл целиком. Можно переходить к генератору. (!)

# for line in big_file:
#     print(line)

['Hello world!!!\n', 'Hello world!!!\n', 'Hello world!!!\n', 'Hello world!!!\n', 'Hello world!!!']


In [8]:
import os

# Чтение файлов и папок
for file in os.listdir("/home/ortariot/Netology/МФТИ/lession2/demo/"):
    print(file)

hello_world_some_times.txt
README.md
env
.git
Тема_4_Вебинар_4_Файлы_и_структуры_данных.ipynb
.ipynb_checkpoints
hello_world.txt


## Ваши вопросы

## 8. Контекстный менеджер

Контекстные менеджеры нужны, чтобы выполнять некоторые обязательные действия после того, как мы что-то сделали.

Примеры назначения контекстного менеджера:

- закрывать файл после записи, иначе данные не сохранятся
- закрывать соединение, чтобы не потерять данные

Контекстный менеджер — целевое решение для работы с файлами. Сейчас всю работу с файлами выполняют с помощью контекстных менеджеров.

К примеру, если файл не закрыть, то изменения не будут внесены. Контекстный менеджер делает это за нас.


Перепишем всю предыдущую логику при помощи контекстного менеджера.

In [4]:
with open(file="hello_world.txt") as file:
    for line in file:
        print(line)
    print("информация из файла hello_world.txt\n")

with open(file="hello_world_some_times.txt") as file:
    for line in file:
        print(line)
    print("информация из файла hello_world_some_times.txt\n")

Hello world!!!
информация из файла hello_world.txt

Hello world!!!

Hello world!!!

Hello world!!!

Hello world!!!

Hello world!!!
информация из файла hello_world_some_times.txt



Рассмотрим запись в файл

In [5]:
some_items = ["Привет", "Hello World", "Сегодня суббота"]

with open(
    file="something.txt", mode="w", encoding="utf-8"
) as file:  # Использовали mode='w', чтобы записать в файл (и создать его)
    # file.write('Hello_world!') # Передаём здесь только строку

    for i in some_items:
        file.write(f"{i}\n")

In [None]:
import json

with open(file="example.json", mode="r", encoding="utf-8") as file:
    pyresponse = json.loads(file.read())
    print(pyresponse)
    print(type(pyresponse))

{'user_id': 123, 'category': 'some1'}
<class 'dict'>


In [None]:
import csv

with open("example.csv", newline="") as csvfile:
    spamreader = csv.reader(csvfile, delimiter=" ", quotechar="|")
    for row in spamreader:
        print(",".join(row))

Privet	Hello_world	Something


## Ваши вопросы

## 9. Пакетный менеджер pip

Pip — пакетный менеджер.
- Доступен из «коробки»
- Помогает установить любые общедоступные библиотеки

Основные команды:
- pip help — помощь по доступным командам

- pip install package_name — установка пакета(ов)

- pip uninstall package_name — удаление пакета(ов)

- pip list — отображение списка установленных пакетов

- pip show package_name — отображение информации об установленном пакете

- pip search — поиск пакетов по имени

## Ваши вопросы

## 10. Виртуальное окружение virtualenv

Virtualenv — сторонняя библиотека.

[Ссылка на документацию](https://virtualenv.pypa.io/en/latest/)

Команды:
- virtualenv myenv — создание виртуальной среды
-  .\my_env\Scripts\activate — активация

## Ваши вопросы

## 11. Линтеры и форматтеры для работы с кодом и импортами

In [None]:
ruff, flake8, black

### Демонстрация работы

## Ваши вопросы

## Итоги занятия

- Научились работать с файлами в Python
- Разобрались в основных форматах файлов: JSON, XML, YAML и т. д.

## Анонс следующего занятия

Вебинар по теме 5 «Классы и объекты (ООП)»

## Ваши вопросы