# Изучаем Pandas: Руководство для Начинающих

**🇷🇺 (RU)**: Добро пожаловать в мир Pandas! Pandas — это как Excel, только намного мощнее и управляется с помощью кода. В этом ноутбуке мы познакомимся с двумя главными "деталями" Pandas: **Series** (один столбец данных) и **DataFrame** (целая таблица). Мы научимся их создавать, выбирать нужные данные и даже рисовать простые графики.

---

**🇬🇧 (EN)**: Welcome to the world of Pandas! Think of Pandas like Excel, but much more powerful and controlled by code. In this notebook, we'll get to know the two main 'pieces' of Pandas: the **Series** (a single column of data) and the **DataFrame** (a whole table). We will learn how to create them, select the data we need, and even draw simple plots.

### 1. Подготовка: Импорт библиотек

**🇷🇺 (RU)**: Сначала давайте импортируем `pandas` и `numpy`. `numpy` — это библиотека для работы с числами, и Pandas часто использует ее "под капотом".

---

**🇬🇧 (EN)**: First, let's import `pandas` and `numpy`. `numpy` is a library for working with numbers, and Pandas often uses it "under the hood".

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline

### 2. Pandas Series: Один столбец данных

**🇷🇺 (RU)**: `Series` — это как один столбец в таблице. У каждой записи есть свой **индекс** (метка). Если мы не зададим индексы сами, Pandas пронумерует их с нуля.

---

**🇬🇧 (EN)**: A `Series` is like a single column in a table. Each entry has its own **index** (a label). If we don't provide indexes ourselves, Pandas will number them starting from 0.

In [None]:
simple_series = pd.Series([1, 3, 5, np.nan, 6, 8])
print("Простой Series с индексами по умолчанию:")
print(simple_series)

**🇷🇺 (RU)**: Мы можем создавать `Series` с нашими собственными метками-индексами. Например, давайте использовать даты.

---

**🇬🇧 (EN)**: We can create a `Series` with our own custom index labels. For example, let's use dates.

In [None]:
dates_index = pd.date_range('20240101', periods=6)
series_with_dates = pd.Series(np.random.randn(6), index=dates_index)
print("\nSeries с датами в качестве индексов:")
print(series_with_dates)

### 3. Pandas DataFrame: Целая таблица

**🇷🇺 (RU)**: `DataFrame` — это полноценная таблица со строками и столбцами. Ее можно создать из словаря, где ключи — это названия столбцов, а значения — списки данных для этих столбцов.

---

**🇬🇧 (EN)**: A `DataFrame` is a full table with rows and columns. You can create one from a dictionary, where the keys are the column names and the values are the lists of data for those columns.

In [None]:
# Используем даты, которые мы создали ранее, в качестве индекса
df = pd.DataFrame(np.random.randn(6, 4), index=dates_index, columns=['A', 'B', 'C', 'D'])
print("Наш DataFrame:")
df

### 4. Выбор данных

**🇷🇺 (RU)**: Выбирать нужные данные из таблицы — одна из самых частых задач. В Pandas это делается очень удобно. **Лучшая практика** — использовать специальные методы `.loc` и `.iloc`.

---

**🇬🇧 (EN)**: Selecting the data you need from a table is one of the most common tasks. In Pandas, this is very convenient. The **best practice** is to use the special accessors `.loc` and `.iloc`.

#### Выбор столбцов
**🇷🇺 (RU)**: Чтобы выбрать один столбец, используйте `df['ИмяСтолбца']`. Чтобы выбрать несколько, передайте список имен: `df[['Имя1', 'Имя2']]`.

---

**🇬🇧 (EN)**: To select a single column, use `df['ColumnName']`. To select multiple columns, pass a list of names: `df[['Name1', 'Name2']]`.

In [None]:
print("Столбец 'A':")
print(df['A'])

#### Выбор строк и столбцов по меткам с помощью `.loc`

**🇷🇺 (RU)**: `.loc` используется для выбора данных по **меткам** (названиям строк и столбцов).

---

**🇬🇧 (EN)**: `.loc` is used to select data by **labels** (the names of rows and columns).

In [None]:
# Выбрать одну строку по ее метке (в нашем случае, по дате)
print("Строка за '2024-01-02':")
print(df.loc[dates_index[1]])

In [None]:
# Выбрать несколько столбцов для всех строк
print("\nСтолбцы 'A' и 'B':")
print(df.loc[:, ['A', 'B']])

#### Условный выбор (Boolean Indexing)

**🇷🇺 (RU)**: Мы можем выбирать строки на основе условий. Например, найдем все строки, где значения в столбце 'A' больше нуля.

---

**🇬🇧 (EN)**: We can select rows based on conditions. For example, let's find all rows where the values in column 'A' are greater than zero.

In [None]:
print("Строки, где A > 0:")
print(df[df['A'] > 0])

### 5. Построение графиков

**🇷🇺 (RU)**: Pandas позволяет легко строить графики на основе данных из таблицы. Это очень полезно для быстрой визуализации.

---

**🇬🇧 (EN)**: Pandas makes it easy to create plots based on the data in a table. This is very useful for quick visualizations.

In [None]:
# Создадим Series с 1000 случайных чисел как временной ряд
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
# Чтобы получить нарастающий итог, используем .cumsum()
ts = ts.cumsum()

# Строим график
print("График временного ряда:")
ts.plot(figsize=(10, 5), title='Накопительная сумма случайных чисел')
plt.xlabel("Дата")
plt.ylabel("Значение")
plt.grid(True)
plt.show()