# Загрузка данных в Python


Работа с экспериментальными данными часто начинается с их загрузки. Данные могут храниться в различных форматах, таких как текстовые файлы, CSV, Excel, базы данных или веб-ресурсы. 
Python предоставляет множество инструментов для обработки данных, включая библиотеки `pandas`, `numpy` и стандартные модули, такие как `csv` и `json`.

В этом разделе мы рассмотрим:
1. Загрузку данных из CSV.
2. Загрузку данных из текстовых файлов.
3. Чтение данных из Excel.
4. Загрузку данных с веб-ресурсов.
5. Загрузку данных из формата JSON.


## 1. Загрузка данных из CSV-файлов


CSV (Comma Separated Values) — это один из самых распространённых форматов для хранения таблиц. Для работы с ним обычно используется библиотека `pandas`.

### Пример загрузки данных из CSV


In [None]:

import pandas as pd

# Загрузка данных из CSV
data = pd.read_csv('experiment_data.csv')

# Просмотр первых пяти строк
print(data.head())



### Пояснение
- `pd.read_csv()` — функция для загрузки CSV-файлов.
- `data.head()` — метод для отображения первых пяти строк таблицы, чтобы проверить корректность загрузки данных.

### Дополнительные параметры
`read_csv()` поддерживает множество параметров, например:
- `sep=','` — позволяет указать разделитель (например, табуляция или точка с запятой).
- `header=None` — если у таблицы нет заголовка.
- `usecols=['col1', 'col2']` — позволяет загрузить только определённые столбцы.
- `dtype={'col1': float}` — задаёт типы данных для колонок.


## 2. Загрузка данных из текстового файла


Текстовые файлы часто имеют произвольный формат. Их можно загружать с помощью стандартных инструментов Python или с использованием `numpy`.

### Пример с использованием `numpy`


In [None]:

import numpy as np

# Загрузка данных из текстового файла
data = np.loadtxt('experiment_data.txt', delimiter=',')

print(data)



### Пояснение
- `np.loadtxt()` — функция для загрузки числовых данных из текстового файла.
- `delimiter=','` — разделитель между значениями.

### Ограничения
Если файл содержит смешанные типы данных (например, текст и числа), используйте `pandas` или стандартный модуль `csv`.


## 3. Чтение данных из Excel


Excel — популярный формат для хранения таблиц. Библиотека `pandas` позволяет читать данные из Excel-файлов.

### Пример загрузки данных


In [None]:

# Загрузка данных из Excel
data = pd.read_excel('experiment_data.xlsx', sheet_name='Sheet1')

# Просмотр первых строк
print(data.head())



### Пояснение
- `sheet_name` — позволяет указать имя листа для загрузки данных.
- Для работы с Excel требуется установка дополнительной библиотеки, например, `openpyxl` или `xlrd`.


## 4. Загрузка данных с веб-ресурсов


Данные могут быть получены из сети, например, с помощью URL-адреса.

### Пример загрузки CSV с URL


In [None]:

# Загрузка данных из URL
url = 'https://example.com/data.csv'
data = pd.read_csv(url)

print(data.head())



### Пояснение
- `pd.read_csv()` может загружать данные напрямую по URL.

### Дополнительные библиотеки
Для работы с данными из сложных веб-страниц можно использовать `requests` или `beautifulsoup4`.


## 5. Загрузка данных из JSON


JSON (JavaScript Object Notation) — формат, широко используемый для передачи данных.

### Пример загрузки JSON с использованием `pandas`


In [None]:

# Загрузка данных из JSON
data = pd.read_json('experiment_data.json')

print(data.head())



### Пояснение
- JSON данные удобно читать, если они имеют структуру таблицы.
- Для сложных иерархий можно использовать модуль `json`.

### Пример с использованием модуля `json`


In [None]:

import json

# Чтение JSON
with open('experiment_data.json', 'r') as file:
    data = json.load(file)

print(data)
