# 10 минут pandas

Это краткое введение в pandas, предназначенное в основном для новых пользователей. Более сложные рецепты вы можете посмотреть в "Cookbook".

In [1]:
import numpy as np
import pandas as pd

## Создание объекта
См. раздел Введение в структуры данных.

Создание `Series` путем передачи списка значений. Cоздается целочисленный индекс по умолчанию.

In [2]:
s = pd.Series([1, 3, 5, np.nan, 6, 8])
s

0    1.0
1    3.0
2    5.0
3    NaN
4    6.0
5    8.0
dtype: float64

Создание `DataFrame` путем передачи массива NumPy с индексом даты и времени с использованием `date_range()` и именованных столбцов:

In [4]:
dates = pd.date_range("20130101", periods=6)
dates

DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',
               '2013-01-05', '2013-01-06'],
              dtype='datetime64[ns]', freq='D')

In [6]:
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list("ABCD"))
df

Unnamed: 0,A,B,C,D
2013-01-01,0.197977,0.593401,1.313295,-1.122718
2013-01-02,1.877799,-1.617867,0.198817,-0.135931
2013-01-03,-1.303537,0.538405,-0.527212,-0.396428
2013-01-04,-1.360243,0.514902,-1.197276,-0.285594
2013-01-05,-1.018777,-0.743083,0.127291,-0.553889
2013-01-06,-0.151185,0.060508,-0.382855,-1.516038


Создание `DataFrame` путем передачи словаря объектов, которые можно преобразовать в структуру, подобную серии:

In [7]:
df2 = pd.DataFrame(
    {
        "A": 1.0,
        "B": pd.Timestamp("20130102"),
        "C": pd.Series(1, index=list(range(4)), dtype="float32"),
        "D": np.array([3] * 4, dtype="int32"),
        "E": pd.Categorical(["test", "train", "test", "train"]),
        "F": "foo",
    }
)
df2

Unnamed: 0,A,B,C,D,E,F
0,1.0,2013-01-02,1.0,3,test,foo
1,1.0,2013-01-02,1.0,3,train,foo
2,1.0,2013-01-02,1.0,3,test,foo
3,1.0,2013-01-02,1.0,3,train,foo


The columns of the resulting `DataFrame` have different `dtypes`:

In [8]:
df2.dtypes

A           float64
B    datetime64[ns]
C           float32
D             int32
E          category
F            object
dtype: object

Если вы используете IPython, автодополнение табуляции для имен столбцов (а также общедоступных атрибутов) включается автоматически. Вот подмножество атрибутов, которые будут заполнены:
```
>>> df2.<TAB>  # noqa: E225, E999
df2.A                  df2.bool
df2.abs                df2.boxplot
df2.add                df2.C
df2.add_prefix         df2.clip
df2.add_suffix         df2.columns
df2.align              df2.copy
df2.all                df2.count
df2.any                df2.combine
df2.append             df2.D
df2.apply              df2.describe
df2.applymap           df2.diff
df2.B                  df2.duplicated
```
Как видите, столбцы `A`, `B`, `C` и `D` автоматически заполняются табуляцией. `E` и `F` тоже присутствуют; остальные атрибуты были усечены для краткости.