In [3]:

import pandas as pd
pd.__version__
print(pd.__name__)

pandas


In [None]:
# Series — это упорядоченная изменяемая коллекция объектов,
# имеющая так называемые ассоциативные метки (индексы). 

In [6]:
# Эту структуру можно сравнить со списком:
# каждому элементу ставится в соответствие индекс,
# однако, в отличие от списка, индексами могут
# быть не только порядковые номера — фактически что угодно,
# например названия компаний, даты, идентификаторы,
# наименования продуктов.

# Также для каждой Series присваивается тип данных её элементов
# (например int64) и может быть определено имя всего массива.
# В итоге мы получаем некоторый гибрид списка и словаря.

# Пример объекта Series:

In [7]:
# СОЗДАНИЕ SERIES 
# Для создания объекта Series используется команда pd.Series().
# 
# Способ 1 — из списка с использованием параметров функции pd.Series():

countries = pd.Series(
    data = ['Англия', 'Канада', 'США', 'Россия', 'Украина', 'Беларусь', 'Казахстан'],
    index = ['UK', 'CA', 'US', 'RU', 'UA', 'BY', 'KZ'],
    name = 'countries'
)
display(countries)
#В результате выполнения кода выше мы получаем объект Series.
# При его выводе на экран можно увидеть заданные
# в параметре index метки — коды стран, соответствующие им значения
# (названия стран), которые мы задали в параметре data.
# Также с помощью аргумента name мы явно задали имя для Series.
# Внизу, под выводом содержимого, можно увидеть тип данных объектов,
# хранимых в Series. Типом данных object в Pandas обозначаются 
# строки и смешанные типы данных 
# (кортежи, списки, текст, смешанный с числами, и т. д.).

UK       Англия
CA       Канада
US          США
RU       Россия
UA      Украина
BY     Беларусь
KZ    Казахстан
Name: countries, dtype: object

In [8]:
# Примечание. Если оставить параметр index пустым,
# то метки будут присвоены автоматически
# в виде порядковых номеров элементов, например:

countries = pd.Series(
    ['Англия', 'Канада', 'США', 'Россия', 'Украина', 'Беларусь', 'Казахстан']
)
display(countries)

0       Англия
1       Канада
2          США
3       Россия
4      Украина
5     Беларусь
6    Казахстан
dtype: object

In [9]:
#Способ 2 — из словаря,
# в котором ключами являются будущие метки,
# а значениями — будущие значения Series,
# при этом использование параметра name также возможно:

countries = pd.Series({
    'UK': 'Англия',
    'CA': 'Канада',
    'US' : 'США',
    'RU': 'Россия',
    'UA': 'Украина',
    'BY': 'Беларусь',
    'KZ': 'Казахстан'},
    name = 'countries'
)
display(countries)

UK       Англия
CA       Канада
US          США
RU       Россия
UA      Украина
BY     Беларусь
KZ    Казахстан
Name: countries, dtype: object

In [None]:
# ДОСТУП К ДАННЫМ В SERIES 
# Доступ к элементам осуществляется с использованием loc или iloc.

In [10]:
#.loc вызывается с квадратными скобками,
# в которые передаются метки. 
# В него можно передать как один индекс,
# так и список, чтобы получилось несколько элементов. 

# Например, для получения названия страны по коду "US"
# можно выполнить следующий код:

print(countries.loc['US'])
# США
#Для того чтобы достать информацию по нескольким индексам,
# необходимо обернуть интересующие индексы в список:

print(countries.loc[['US', 'RU', 'UK']])

США
US       США
RU    Россия
UK    Англия
Name: countries, dtype: object


In [None]:
# Примечание.
# Обратите внимание, что в случае обращения по одному индексу
# возвращается строка.
# Если же обратиться по нескольким элементам,
# возвращается объект Series.

In [6]:
#.iloc также вызывается с квадратными скобками и
# принимает на вход порядковые номера элементов Series
# (нумерация начинаются с 0). 
# В него можно так же передавать как один индекс, так и диапазон чисел. 

# Например, для получения элемента по индексу "KZ"
# нужно обратиться через .iloc по номеру 6:

print(countries.iloc[6])
# Казахстан
# Получим срез из исходной Series с первого по третий элемент:

print(countries.iloc[1:4])

Казахстан
CA    Канада
US       США
RU    Россия
Name: countries, dtype: object


In [None]:
#Примечание.
# Важно, что в последнем примере
# конечное значение диапазона не включается в результат
# (берутся элементы с порядковыми номерами от 1 до 4, не включая последний).

In [None]:
#На самом деле loc и iloc можно опустить
# и обращаться к элементам Series напрямую по индексам,
# например countries[‘UK’, 'US', ‘UA’] или countries[0, 2, 4].
# 
# Оба варианта являются равноправными для Series,
# однако в дальнейшем мы будем использовать эти операции
# при обращении к более сложной структуре — DataFrame,
# а в контексте этой структуры эти варианты уже неравноправны.

In [4]:
# ЗАДАНИЕ 2.4 

# В аптеку поступают партии лекарств.
# Их названия находятся в списке names,
# количество единиц товара находится в списке counts.

# Например:

names=['chlorhexidine', 'cyntomycin', 'afobazol']
counts=[15, 18, 7]

# Напишите функцию create_medications(names, counts),
# создающую Series medications,
# индексами которого являются названия лекарств names,
# а значениями — их количество в партии counts.

def create_medications(names, counts):
    medications = pd.Series(index = names, data = counts, name = 'Series medications')
    return medications
print(create_medications(names, counts))

medications = create_medications(names, counts)

def get_percent(medications, name):
    percent = medications[name]/ sum(medications[:])*100
    return percent 
print(get_percent(medications, "chlorhexidine"))
# Также напишите функцию get_percent(medications, name),
# которая возвращает долю товара с именем name от общего
# количества товаров в партии в процентах.

chlorhexidine    15
cyntomycin       18
afobazol          7
Name: Series medications, dtype: int64
37.5
