## Series как структура данных

Начнём наше знакомство с библиотекой **Pandas** со структуры данных **pandas.Series** (серия, ряд). 

Эту структуру можно сравнить со списком: каждому элементу ставится в соответствие индекс, однако, в отличие от списка, индексами могут быть не только порядковые номера — фактически что угодно, например названия компаний, даты, идентификаторы, наименования продуктов.

Также для каждой Series присваивается тип данных её элементов (например int64) и может быть определено имя всего массива. В итоге мы получаем некоторый гибрид списка и словаря.

Пример объекта Series:                              
![image.png](attachment:image.png)

Series в какой-то степени является единицей хранения информации в Pandas. Её можно рассматривать как именованный столбец таблицы с индексами строк

In [2]:
import pandas as pd

## Создание Series

Для создания объекта Series используется команда **pd.Series()**

создания Series на примере со списком названий стран.

In [3]:
#Способ 1 — из списка с использованием параметров функции pd.Series()
countries = pd.Series(
    data = ['Англия', 'Канада', 'США', 'Россия', 'Украина', 'Беларусь', 'Казахстан'],
    index = ['UK', 'CA', 'US', 'RU', 'UA', 'BY', 'KZ'],
    name = 'countries'
)
display(countries)


UK       Англия
CA       Канада
US          США
RU       Россия
UA      Украина
BY     Беларусь
KZ    Казахстан
Name: countries, dtype: object

In [4]:
# Способ 2 — из словаря, в котором ключами являются будущие метки, а значениями — будущие значения Series, 
# при этом использование параметра name также возможно:

countries = pd.Series({
    'UK': 'Англия',
    'CA': 'Канада',
    'US' : 'США',
    'RU': 'Россия',
    'UA': 'Украина',
    'BY': 'Беларусь',
    'KZ': 'Казахстан'},
    name = 'countries'
)
display(countries)


UK       Англия
CA       Канада
US          США
RU       Россия
UA      Украина
BY     Беларусь
KZ    Казахстан
Name: countries, dtype: object

## Доступ к данным в Series

Доступ к элементам осуществляется с использованием loc или iloc


In [None]:
# .loc вызывается с квадратными скобками, в которые передаются метки. В него можно передать как один индекс, 
# так и список, чтобы получилось несколько элементов

print(countries.loc['US'])

# Для того чтобы достать информацию по нескольким индексам, необходимо обернуть интересующие индексы в список:

print(countries.loc[['US', 'RU', 'UK']])

# Обратите внимание, что в случае обращения по одному индексу возвращается строка. 
# Если же обратиться по нескольким элементам, возвращается объект Series.

США
US       США
RU    Россия
UK    Англия
Name: countries, dtype: object


In [None]:
# .iloc также вызывается с квадратными скобками и принимает на вход порядковые номера элементов Series 
# (нумерация начинаются с 0). В него можно так же передавать как один индекс, так и диапазон чисел

print(countries.iloc[6])

# Получим срез из исходной Series с первого по третий элемент:

print(countries.iloc[1:4])

# Важно, что в последнем примере конечное значение диапазона не включается в результат 
# (берутся элементы с порядковыми номерами от 1 до 4, не включая последний).

Казахстан
CA    Канада
US       США
RU    Россия
Name: countries, dtype: object


На самом деле loc и iloc можно опустить и обращаться к элементам Series напрямую по индексам, например countries[['UK', 'US', 'UA']] или countries[[0, 2, 4]]. Оба варианта являются равноправными для Series