# Series (структура данных)

In [1]:
import pandas as pd

<b>Series</b> — это упорядоченная изменяемая коллекция объектов, имеющая так называемые ассоциативные метки (индексы). 

Эту структуру можно сравнить со списком: каждому элементу ставится в соответствие индекс, однако, в отличие от списка, индексами могут быть не только порядковые номера — фактически что угодно, например названия компаний, даты, идентификаторы, наименования продуктов.

Также для каждой Series присваивается тип данных её элементов (например int64) и может быть определено имя всего массива. В итоге мы получаем некоторый гибрид списка и словаря

Series в какой-то степени является единицей хранения информации в Pandas. Её можно рассматривать как именованный столбец таблицы с индексами строк.

## СОЗДАНИЕ SERIES

<b>Способ 1</b> — из списка с использованием параметров функции pd.Series():

In [3]:
countries = pd.Series(
    data=["Англия", "Канада", "США", "Россия", "Украина", "Беларусь", "Казахстан"],
    index=["UK", "CA", "US", "RU", "UA", "BY", "KZ"],
    name="countries",
)
countries

UK       Англия
CA       Канада
US          США
RU       Россия
UA      Украина
BY     Беларусь
KZ    Казахстан
Name: countries, dtype: object

<b>Способ 2</b> — из словаря, в котором ключами являются будущие метки, а значениями — будущие значения Series, при этом использование параметра name также возможно:

In [4]:
countries = pd.Series(
    {
        "UK": "Англия",
        "CA": "Канада",
        "US": "США",
        "RU": "Россия",
        "UA": "Украина",
        "BY": "Беларусь",
        "KZ": "Казахстан",
    },
    name="countries",
)
countries

UK       Англия
CA       Канада
US          США
RU       Россия
UA      Украина
BY     Беларусь
KZ    Казахстан
Name: countries, dtype: object

## ДОСТУП К ДАННЫМ В SERIES

### Доступ к элементам осуществляется с использованием loc или iloc.

.loc вызывается с квадратными скобками, в которые передаются метки. В него можно передать как один индекс, так и список, чтобы получилось несколько элементов. 

In [5]:
countries.loc['US']

'США'

In [6]:
countries.loc[['US', 'RU', 'UK']]

US       США
RU    Россия
UK    Англия
Name: countries, dtype: object

.iloc также вызывается с квадратными скобками и принимает на вход порядковые номера элементов Series (нумерация начинаются с 0). В него можно так же передавать как один индекс, так и диапазон чисел. 

In [7]:
countries.iloc[6]

'Казахстан'

In [8]:
countries.iloc[1:4]

CA    Канада
US       США
RU    Россия
Name: countries, dtype: object

In [10]:
names=['chlorhexidine', 'cyntomycin', 'afobazol']
counts=[15, 18, 7]

def create_medications(names, counts):
	return pd.Series(counts, index=names)

medications = create_medications(names, counts)

def get_percent(medications, name):
	total = medications.sum()
	percent = medications[name] / total * 100
	return percent

print(get_percent(medications, "chlorhexidine")) #37.5


37.5
