## JSON

JSON (JavaScript Object Notation) - це текстовий формат обміну даними. Він бере початок з мови JavaScript, але є незалежним від конкретної мови програмування і часто використовується для обміну даними.

У Python для роботи з JSON-файлами використовується модуль `json`, який надає методи для зчитування та запису даних у форматі JSON. Основні функції цього модуля - `json.load()` для зчитування JSON з файлу та `json.loads()` для розбору JSON-рядка.

### Читання

Ось приклад відкриття JSON-файлу у Python:

```python
import json

# Відкриття JSON-файлу для зчитування
with open('data.json', 'r') as file:
    data = json.load(file)

# Виведення зчитаних даних
print(data)

```

У цьому прикладі ми використовуємо `json.load()` для зчитування даних з файлу `data.json`. Файл повинен бути в поточній робочій директорії або вказаному шляху. Зчитані дані зберігаються у змінній `data`, яка стає словником або списком (залежно від структури JSON-файлу).

Якщо ви маєте JSON-рядок замість файлу, (ця ситуація може виникнути наприклад при читані бази данних або мережевих ресурсів) ви можете використати `json.loads()`:

```python
import json

# JSON-рядок
json_string = '{"name": "John", "age": 30, "city": "New York"}'

# Розбір JSON-рядка
data = json.loads(json_string)

# Виведення розібраних даних
print(data)

```

Цей код розбирає JSON-рядок `json_string` і зберігає його у змінній `data`. Зверніть увагу, що `data` буде словником Python, який відображає об'єкт JSON.

### Запис

Для запису даних використовується модуль `json`,  і функції цього модуля - `json.dump()` для запису JSON у файл та `json.dumps()` для перетворення об'єктів Python у JSON-рядок.

Ось приклад запису даних у JSON-файл у Python:

```python
import json
# Дані для запису у JSON-файл
data = {
    "name": "John",
    "age": 30,
    "city": "New York"
}

# Запис JSON-даних у файл
with open('data.json', 'w') as file:
    json.dump(data, file, indent=4)
```

У цьому прикладі ми використовуємо `json.dump()` для запису словника `data` у файл `data.json`. Аргумент `indent=4` вказує, що JSON-дані повинні бути відформатовані з використанням чотирьох пробілів для кожного рівня вкладеності.

Якщо вам потрібно перетворити об'єкти Python у JSON-рядок, ви можете використати `json.dumps()`:

```python
import json

# Дані для перетворення у JSON-рядок
data = {
    "name": "John",
    "age": 30,
    "city": "New York"
}

# Перетворення об'єктів Python у JSON-рядок
json_string = json.dumps(data, indent=4)

# Виведення JSON-рядка
print(json_string)

```

Цей код перетворює словник `data` у JSON-рядок `json_string`. Зверніть увагу, що `indent=4` так само використовується тут для форматування JSON-рядка.

### Помилки при розборі JSON

При роботі з JSON у Python можуть виникати різні помилки, зазвичай пов'язані з некоректним форматом JSON-даних або проблемами зі зчитуванням або записом файлів. Ось деякі типові помилки та способи їх обробки:

1. **JSONDecodeError**: Ця помилка виникає, коли JSON-дані мають неправильний формат і не можуть бути розібрані. Щоб уникнути цієї помилки, слід перевірити правильність формату JSON-даних перед їх розбором.
    
    ```python
    import json
    
    json_string = '{"name": "John", "age": 30, "city": "New York"'
    
    try:
        data = json.loads(json_string)
        print(data)
    except json.JSONDecodeError as e:
        print("Помилка розбору JSON:", e)
    ```
    
2. **PermissionError**: Ця помилка виникає, коли програма не має необхідних прав доступу для читання або запису в файл. Перевірте права доступу до файлу та відповідність прав на доступ.
    
    ```python
    import json
    
    try:
        with open('data.json', 'w') as file:
            json.dump(data, file)
            print("Дані записані у файл")
    except PermissionError:
        print("Немає прав доступу до файлу")
    ```
    
3. **FileNotFoundError**: Ця помилка виникає, коли програма не може знайти файл JSON, який ви намагаєтеся відкрити. Вам слід переконатися, що шлях до файлу вказаний правильно і файл існує.
    
    ```python
    import json
    
    try:
        with open('data.json', 'r') as file:
            data = json.load(file)
            print(data)
    except FileNotFoundError:
        print("Файл не знайдено")
    ```
    

Ці блоки коду показують, як можна обробити різні типи помилок, що можуть виникати при роботі з JSON у Python. У всіх випадках використовується конструкція `try-except`, щоб перехопити та обробити помилку, аби програма не припиняла своє виконання в разі виникнення проблеми.

## CSV

CSV-файл містить данні, розділені комами, що можуть бути сконверновані в двовимірнийй масив (таблицю). CSV є одним із найпоширеніших форматів імпорту та експорту електронних таблиць та баз даних. CSV використовувався протягом багатьох років до того, як був стандартизований [RFC 4180](https://www.rfc-editor.org/rfc/rfc4180.html). Тривала відсутність стандарту означає, що в даних, створюваних різними додатками, часто існують незначні відмінності. Ці відмінності можуть викликати проблеми при обробці CSV-файлів з декількох джерел. Тим не менш, хоча роздільники, символи лапок та деякі інші властивості відрізняються, загальний формат є досить універсальним.

Приклад файлу CSV-формату:
```
Name,Age,City
John,30,New York
Alice,25,Los Angeles
Bob,35,Chicago
```

У Python для роботи з CSV-файлами використовується вбудований модуль `csv`. Цей модуль надає зручні функції для читання та запису даних у форматі CSV. Ось деякі приклади використання.

### Читання даних з CSV-файлу:

```python
import csv

# Відкриття CSV-файлу для читання
with open('data.csv', newline='', encoding="utf-8") as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        print(', '.join(row))

```

У цьому прикладі ми відкриваємо файл `data.csv` для читання та використовуємо метод `csv.DictReader()` для створення читача. Потім ми ітеруємося по кожному рядку у файлі та виводимо його на екран.

### Запис даних у CSV-файл:

```python
import csv

# Дані для запису у CSV-файл
fieldnames = ['Name', 'Age', 'City']
data_dict = [
    {'Name': 'John', 'Age': 30, 'City': 'New York'},
    {'Name': 'Alice', 'Age': 25, 'City': 'Los Angeles'},
    {'Name': 'Bob', 'Age': 35, 'City': 'Chicago'}
]

just_out_file = my_dir / "just_out.csv"

with just_out_file.open("w", newline='', encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=fieldnames)
    writer.writerows(data_dict)
```

У цьому прикладі ми відкриваємо файл `output.csv` для запису та використовуємо метод `csv.DictWriter()` для створення данних у вірному форматі. Потім ми використовуємо метод `writerows()` для запису підготованих даних у файл.

У CSV-файлах розділювачі та використання лапок можуть впливати на правильність читання та запису даних. Ось деякі особливості використання розділювачів та лапок:

### Розділювачі:

У стандартному використанні CSV-файлів кома (`,`) використовується як розділювач. Однак можна використовувати інші символи, такі як крапка з комою (`;`), табуляція (`\\t`) та інші. При читанні та запису файлу ви можете вказати відповідний розділювач.

```python
import csv

# Вказуємо розділювач як крапка з комою
with open('data.csv', newline='') as csvfile:
    reader = csv.reader(csvfile, delimiter=';')
    for row in reader:
        print(', '.join(row))
```

### Використання лапок:

Лапки використовуються для обгортання текстових даних, особливо коли вони містять спеціальні символи, такі як розділювачі. У таких випадках лапки дозволяють програмі коректно розпізнати дані, як окремий елемент. При читанні та запису файлу слід вказувати використання лапок.

```python
import csv

# Вказуємо використання лапок
data = [
    ['Name', 'Age', 'City'],
    ['John', 30, 'New York'],
    ['"Alice"', 25, 'Los Angeles'],  # лапки використовуються для текстового значення
    ['Bob', 35, 'Chicago']
]

# Запис даних у CSV-файл з використанням лапок
with open('output.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile, quoting=csv.QUOTE_ALL)
    writer.writerows(data)

```

У цьому прикладі використовується `csv.QUOTE_ALL`, щоб обгорнути всі значення у лапки. Існують також інші параметри, які можна використовувати для більш гнучкого контролю над використанням лапок, такі як `csv.QUOTE_MINIMAL`, `csv.QUOTE_NONNUMERIC`, `csv.QUOTE_NONE`.

### Діалекти

В модулі `csv` в Python існують поняття діалектів, які дозволяють налаштувати різні параметри для читання та запису CSV-файлів. Діалекти визначають такі характеристики, як розділювачі, символи відкриття та закриття лапок, символи екранування тощо. Використання діалектів дозволяє коректно читати та записувати дані навіть у випадку, коли формат CSV-файлу не дотримується стандартних правил.

В модулі `csv` вже визначено кілька стандартних діалектів, таких як `'excel'`, `'excel-tab'`, `'unix'` та інші. Ви також можете визначити власний діалект, встановивши відповідні значення параметрів.

Ось приклад використання діалекту при читанні CSV-файлу:

```python
import csv

# Визначення діалекту
csv.register_dialect('my_dialect', delimiter=';', quoting=csv.QUOTE_MINIMAL)

# Відкриття CSV-файлу з використанням визначеного діалекту
with open('data.csv', newline='') as csvfile:
    reader = csv.reader(csvfile, dialect='my_dialect')
    for row in reader:
        print(', '.join(row))

```

У цьому прикладі ми спочатку визначаємо власний діалект за допомогою `csv.register_dialect()`, а потім використовуємо цей діалект при відкритті CSV-файлу за допомогою параметру `dialect='my_dialect'`.

Використання діалектів дозволяє легко налаштувати параметри читання та запису CSV-файлів відповідно до конкретних потреб вашого додатка.

### Параметри, що можна використовувати у діалектах:
- `delimiter`: Символ, який використовується для розділення полів у рядку (наприклад, кома, крапка з комою, табуляція).
- `quotechar`: Символ, який використовується для обгортання текстових даних (наприклад, лапки).
- `escapechar`: Символ, який використовується для екранування спеціальних символів (наприклад, зворотний слеш).
- `doublequote`: Якщо встановлено в `True`, то подвійні лапки використовуються для екранування лапок у текстових даних.
- `skipinitialspace`: Якщо встановлено в `True`, пропускає пробіли після розділювача.

Приклад створення діалекту:

```python
csv.register_dialect('my_dialect', delimiter=';', quotechar='"', escapechar='\\', doublequote=True, skipinitialspace=True)
```

## XML

XML (Extensible Markup Language) - це розширювана мова розмітки, яка використовується для представлення та обміну даними у вигляді текстових файлів.

У Python для роботи з XML-файлами можна використовувати різні бібліотеки, але однією з найпоширеніших і зручних є `xml.etree.ElementTree`. Ця бібліотека дозволяє читати, записувати та обробляти XML-документи у вигляді дерева елементів.

### Приклад XML-файлу:

```xml
<?xml version="1.0" encoding="UTF-8"?>
<library>
    <book id="1">
        <title>Python для початківців</title>
        <author>Іван Петренко</author>
        <content>Ця книга є вступом до програмування на Python.
            <chapter id="1">Основи синтаксису</chapter>
            <chapter id="2">Типи даних</chapter>
        </content>
        <year>2023</year>
        <price>350</price>
        <available>true</available>
    </book>
    <book id="2">
        <title>Алгоритми та структури даних</title>
        <author>Марія Коваленко</author>
        <content>Ця книга є вступом до програмування на Python.
            <chapter id="1">Основи синтаксису</chapter>
            <chapter id="2">Типи даних</chapter>
        </content>
        <year>2022</year>
        <price>420</price>
        <available>false</available>
    </book>
</library>
```

XML має ієрархічну структуру, для прикладу, вище наведений XML-документ представляє бібліотеку з двома книгами. Кожна книга має атрибути та нащадків, які містять інформацію про назву, автора, рік видання, ціну та доступність. Ось приклад ієрархії елементів:

```
library (корінь)
├── book (дочірній елемент)
    ├── title (нащадок)
    ├── author (нащадок)
    ├── year (нащадок)
    ├── price (нащадок)
    └── available (нащадок)
└── book (ще один дочірній)
```
**Ключові поняття**

tag - назва XML елемента:
```python
root.tag  # "library"
```
text - текстовий вміст елемента:
```python
title.text  # "Python для початківців"
```
attrib - атрибути елемента, представлені як словник:
```python
book.attrib  # {'id': '1'}
```

### Читання з XML-файлу:

```python
import xml.etree.ElementTree as ET

# Завантаження XML-файлу
tree = ET.parse('data.xml')
root = tree.getroot()

# Читання та виведення даних з елементів XML-документу
for child in root:
    print(child.tag, child.attrib)
    for subchild in child:
        print(subchild.tag, subchild.text)

```

У цьому прикладі ми завантажуємо XML-файл `data.xml`, а потім використовуємо методи `parse()` та `getroot()` для отримання кореневого елемента дерева. Потім ми ітеруємося по елементам та їх атрибутам для виведення даних.

### Запис у XML-файл:

```python
import xml.etree.ElementTree as ET

# Створення кореневого елемента
root = ET.Element('data')

# Створення під-елементів та додавання їх до кореневого елемента
child1 = ET.SubElement(root, 'child1')
child1.text = 'Data 1'
child2 = ET.SubElement(root, 'child2')
child2.text = 'Data 2'

# Запис у XML-файл
tree = ET.ElementTree(root)
tree.write('output.xml')

```

У цьому прикладі ми створюємо новий XML-документ, створюємо кореневий елемент та додаємо до нього під-елементи. Потім ми використовуємо метод `write()` для запису дерева елементів у файл `output.xml`.

### Приклад пошуку значень в xml

Дано xml:

```xml
<?xml version="1.0"?>
<groups>
  <group>
    <number>0</number>
    <name>Equity</name>
    <isEquity/>
    <populatesUnderlyings/>
    <hasLmeData/>
    <calculatesIndexVolumes/>
    <timingExbytes>
      <micro>0xFFFF</micro>
      <bbo>0xBTLS</bbo>
      <incoming>0xQUIN</incoming>
    </timingExbytes>
  </group>
</groups>
```

**Завдання:** знайти у `timingExbytes` певне значення парамеру `bbo`

**Вирішення:**

Щоб здійснити пошук по елементу `bbo` в `timingExbytes`, можна скористатися бібліотекою `xml.etree.ElementTree`. Ось приклад, як це можна зробити:

```python
import xml.etree.ElementTree as ET

# Завантаження XML-файлу
tree = ET.parse('data.xml')
root = tree.getroot()

# Пошук елементу bbo у timingExbytes для кожної групи
for group in root.findall('group'):
    timing_exbytes = group.find('timingExbytes')
    if timing_exbytes is not None:
        bbo = timing_exbytes.find('bbo')
        if bbo is not None:
            print(f"Group: {group.find('name').text}, bbo: {bbo.text}")
        else:
            print(f"Group: {group.find('name').text}, bbo: Не знайдено")

```

У цьому коді ми перебираємо всі групи у кореневому елементі `groups`, потім для кожної групи шукаємо елемент `timingExbytes`. Якщо такий елемент існує, ми знаходимо елемент `bbo` всередині нього. Якщо елемент `bbo` існує, виводимо його значення разом з назвою групи. Якщо елемент `bbo` відсутній, виводимо повідомлення про відсутність значення.

Ці приклади показують базовий підхід до читання та запису XML-файлів у Python за допомогою бібліотеки `xml.etree.ElementTree`.