In [3]:
import pandas as pd
import numpy as np

План:
- Создание Series
- Просмотр данных
- Изменение элементов
- Добавление данных
- Запись и чтение данных из файла

#### Создание Series

**Series** - одна из структур данных библиотеки Pandas. Похожа на словарь, но является упорядоченной.

Создадим список с данными (также можно создать массив numpy)

In [4]:
a = [2, 5, 7, 8, 3]

Создадим на основе этих данных объект Series

In [5]:
b = pd.Series(a)

Справа располагаются данные, слева - индексы

In [7]:
b

0    2
1    5
2    7
3    8
4    3
dtype: int64

Можно задать индексы явно. Это могут быть числа:

In [9]:
b = pd.Series(a, index = [0, 1, 2, 3, 4])
b

0    2
1    5
2    7
3    8
4    3
dtype: int64

Либо символы:

In [10]:
b = pd.Series(a, index = ['a', 'b', 'c', 'd', 'e'])
b

a    2
b    5
c    7
d    8
e    3
dtype: int64

Можно также использовать вместо индексов даты:

In [12]:
from datetime import date

In [13]:
ind = [date(y, m, d) for y, m, d in [(2020, 1, 1), (2020, 1, 2), (2020, 1, 3), (2020, 1, 4), (2020, 1, 5)]]

In [15]:
b = pd.Series(a, index = ind)
b

2020-01-01    2
2020-01-02    5
2020-01-03    7
2020-01-04    8
2020-01-05    3
dtype: int64

In [16]:
b.index

Index([2020-01-01, 2020-01-02, 2020-01-03, 2020-01-04, 2020-01-05], dtype='object')

In [17]:
b.index[0].year

2020

In [18]:
b.index[0].month

1

In [19]:
b.index[0].day

1

In [20]:
b.index = pd.to_datetime(b.index, format='%Y-%m-%d')

In [21]:
b.index

DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-04',
               '2020-01-05'],
              dtype='datetime64[ns]', freq=None)

In [22]:
b.index.year

Int64Index([2020, 2020, 2020, 2020, 2020], dtype='int64')

In [23]:
b.index.month

Int64Index([1, 1, 1, 1, 1], dtype='int64')

In [24]:
b.index.day

Int64Index([1, 2, 3, 4, 5], dtype='int64')

Индексы могут быть неуникальными

In [25]:
b = pd.Series(a, index=[0, 1, 0, 2, 1])
b

0    2
1    5
0    7
2    8
1    3
dtype: int64

In [27]:
b.index = [10, 11, 12, 13, 14]
b

10    2
11    5
12    7
13    8
14    3
dtype: int64

При создании Series можно задать тип данных

In [29]:
b = pd.Series(a, dtype=np.float64)
b

0    2.0
1    5.0
2    7.0
3    8.0
4    3.0
dtype: float64

Или поменять тип данных позже с помощью astype:

In [31]:
b = pd.Series(a)
b = b.astype(np.float64)
b

0    2.0
1    5.0
2    7.0
3    8.0
4    3.0
dtype: float64

Series можно создать не только из списка, но и из словаря 

In [33]:
d = {'1st':'a', '2nd':'b', '3rd':'c', '4th':'d', '5th':'e'}
b = pd.Series(d)
b

1st    a
2nd    b
3rd    c
4th    d
5th    e
dtype: object

#### Просмотр данных

In [34]:
b = pd.Series([5, 2, 6, 1, 6, 8, 7])

Просмотреть индексы

In [35]:
b.index

RangeIndex(start=0, stop=7, step=1)

Просмотреть данные в виде массива numpy (ndarray)

In [36]:
b.values

array([5, 2, 6, 1, 6, 8, 7])

Доступ к данным по индексам аналогичен доступу к данным словаря

In [37]:
b

0    5
1    2
2    6
3    1
4    6
5    8
6    7
dtype: int64

In [38]:
b[0]

5