In [16]:
import pandas as pd
import numpy as np

In [25]:
s = pd.Series([4,3,7,5], index = ['a','b','c','d'])
s

a    4
b    3
c    7
d    5
dtype: int64

In [26]:
#Получим элементы >4
s[s>4]

c    7
d    5
dtype: int64

In [29]:
s3 = s[s>4]
s3

c    7
d    5
dtype: int64

In [30]:
s3[0]

7

In [28]:
#Умножение каждого элемента
s * 10

a    40
b    30
c    70
d    50
dtype: int64

#### Важно запомнить! 
- При фильтрации серии индексы остаются, а не пересоздаются.

- Арифметические операции не распространяются на индексы

In [31]:
#Создадим словарь
d = {'a':1, 'b':2, 'c':3}

In [32]:
#Проверим наличие индексов
'a' in d

True

In [33]:
'a' in s

True

In [34]:
'z' in s

False

In [36]:
#Проведем сложение словаря
#У нас это не получается
d + d

TypeError: unsupported operand type(s) for +: 'dict' and 'dict'

In [38]:
#Проведем сложение серии
#Все работает! Серия это не словарь, хоть она и похожа
s + s

a     8
b     6
c    14
d    10
dtype: int64

- Серию можно создавать не только на основе списка. Еще один распространённый сценарий это создание серии из словаря. В этом случае ключи словаря перейдут в индексы серии.

In [82]:
#создадим новый словарь с информацией просмотров видео по городам
d1 = {'Moscow': 1400,'Murmansk':900,'Kazan':200,'Yakutsk':400,'Ufa':300}
d1

{'Moscow': 1400, 'Murmansk': 900, 'Kazan': 200, 'Yakutsk': 400, 'Ufa': 300}

In [45]:
#Поскольку серия очень похожа на словарь, мы можем серию создавать на основе словаря
#Серия поняла, что ей на вход передали ключи и значения сгенерировала словарь
s1 = pd.Series(d1)
s1

Moscow      1400
Murmansk     900
Kazan        200
Yakutsk      400
Ufa          300
dtype: int64

In [50]:
#Допустим мы хотим создать словарь, но изменить индексы
#Для этого мы так же создаем индексы, но перечисляем ключи строго сами
s2 = pd.Series(d1, index = ['Ufa','Yakutsk','Murmansk','Moscow','Kazan'] )
s2

Ufa          300
Yakutsk      400
Murmansk     900
Moscow      1400
Kazan        200
dtype: int64

In [53]:
#Допустим в индексе ошибку
#Серия создается, но в индекс, где допущена ошибка, проставляется Nan
s3 = pd.Series(d1, index = ['Ufa','Yakutsk','Murmansk','Moscow','Kaz1an'] )
s3

Ufa          300.0
Yakutsk      400.0
Murmansk     900.0
Moscow      1400.0
Kaz1an         NaN
dtype: float64

In [55]:
#Аналогично можно создавать только частичные серии
s4 = pd.Series(d1, index = ['Ufa','Yakutsk'] )
s4

Ufa        300
Yakutsk    400
dtype: int64

#### Важно запомнить!
- Вы можете задавать индексы на этапе создания серии

- Не обязательно чтобы индексы шли по порядку

- Если вы создаёте серию на основе словаря и указали индекс, которого не существует в словаре, то pandas добавит в серию такой индекс, но значение будет равно NaN (пропуск)

- Если вы создаете серию на основе словаря и не передали все индексы, то никакой ошибки не будет. Пандас добавит в серию только те значения, которые вы указали в индексе

In [57]:
#Проверим наши данные на наличие в них NaNов
s5 = pd.Series(d1, index = ['Ufa','Yakutsk','Murmansk','Moscow','Kaz1an','Pushkino'] )
s5

Ufa          300.0
Yakutsk      400.0
Murmansk     900.0
Moscow      1400.0
Kaz1an         NaN
Pushkino       NaN
dtype: float64

In [63]:
pd.isnull(s5)

Ufa         False
Yakutsk     False
Murmansk    False
Moscow      False
Kaz1an       True
Pushkino     True
dtype: bool

In [69]:
#Аналогичный способ записи
rez = pd.isna(s5)
rez.values

array([False, False, False, False,  True,  True])

In [72]:
#Еще один способ которые проверяет, что значение не пустое!
rez2 = pd.notnull(s5)
rez2.values

array([ True,  True,  True,  True, False, False])

- s1.isnull().any()   <--- вернет только одно значение, которое будет отвечать на главный вопрос: а есть ли в серии пропуски? 

- s1.notnull().all() <--- ответит на вопрос: а все ли значения в серии заполнены?

In [89]:
#Создадим две серии допустим с результатами просмотров но уже за 2 дня
#В первой серии у нас стандартные наши варианты
#Во второй серии у нас ключи в другом порядке, части ключей нет, и один новый NaN
s1 = pd.Series(d1, index=['Ufa','Yakutsk','Murmansk','Moscow','Kazan'])
s1

Ufa          300
Yakutsk      400
Murmansk     900
Moscow      1400
Kazan        200
dtype: int64

In [90]:
s2 = pd.Series(d1, index=['Kazan','Murmansk','Moscow','Pushkino'])
s2

Kazan        200.0
Murmansk     900.0
Moscow      1400.0
Pushkino       NaN
dtype: float64

In [91]:
#Посмотрим как у нас Словари сложатся
s1 + s2

Kazan        400.0
Moscow      2800.0
Murmansk    1800.0
Pushkino       NaN
Ufa            NaN
Yakutsk        NaN
dtype: float64

#### Важно запомнить, что при сложении серий:

- не обязательно чтобы они были одинаковой длины

- сложение будет происходить по индексам

- если в одной из серий есть индекс, которого нет в другой серии, то индекс добавляется в результирующую серию, но значение присваивается NaN

In [92]:
#Рассмотрим переприсвоение индексов:
s = pd.Series([4,3,7,5])
s

0    4
1    3
2    7
3    5
dtype: int64

In [95]:
s.index

RangeIndex(start=0, stop=4, step=1)

In [97]:
#переприсвоим значения
s.index=['a','b','c','d']

In [99]:
#Индексы изменились, а значения остались прежние
#Это ползено, если нам надо сложить два массива, а у нас разные индексы.
#Сложение происходит именно по индексам
s

a    4
b    3
c    7
d    5
dtype: int64

- У каждой серии есть своё имя. 
- Задать или прочитать имя можно через свойство name. Имя используется при работе с хранилищем серий - DataFrame (рассматривается дальше)

Step_3.3.14 - На вход функции подаётся серия из 7 значений. Известно, что она хранит количество посещенных сайтов некоторого пользователя за первую неделю:
![Картинка испарилась(((](https://ucarecdn.com/624e853b-0065-4f4d-977c-5173040f0168/)
Известно, что за вторую неделю пользователь посетил в два раза больше сайтов
![Картинка испарилась(((](https://ucarecdn.com/1985976f-ed26-4bf9-bdb8-6ce2fb1a93c9/)
Определите сколько сайтов посетил пользователь в сумме за две недели в разрезе по дням недели. Функция должна вернуть только те дни, где количество посещенных сайтов больше 20:
![Картинка испарилась(((](https://ucarecdn.com/c89026ec-0080-4671-a61e-2e47f4cf314a/)

In [100]:
#Создам для начала словари, чтобы мне удобнее было
week1 = {'Понедельник':6,'Вторник':5,'Среда':4,'Четверг':3,'Пятница':7,'Суббота':10,'Воскресенье':14}
week2 = {'Понедельник':12,'Вторник':10,'Среда':8,'Четверг':6,'Пятница':14,'Суббота':20,'Воскресенье':28}

In [104]:
#Создам серию 1
sw1 = pd.Series(week1)
sw1

Понедельник     6
Вторник         5
Среда           4
Четверг         3
Пятница         7
Суббота        10
Воскресенье    14
dtype: int64

In [105]:
#Создам серию 2
sw2 = pd.Series(week2)
sw2

Понедельник    12
Вторник        10
Среда           8
Четверг         6
Пятница        14
Суббота        20
Воскресенье    28
dtype: int64

In [106]:
#Теперь создадим необходимую функцию
def weekcounter(sw1,sw2):
    sw = sw1 + sw2
    return sw[sw>20]

In [107]:
weekcounter(sw1,sw2)

Пятница        21
Суббота        30
Воскресенье    42
dtype: int64

На самом деле я чот береборщил и невнимательно прочел условие, естественно необходимо было умножить на 3 количество посещений первой недели, которая подавалась в функию. Отобрать значения больше 20. Но мне было самому интересно расписать руками все.

In [109]:
#Функция для корректного ответа на платформе Stepik
import pandas as pd

def solution(ser1):
    result = ser1 * 3
    return result[result>20]

Step_3.3.15 - На вход поступает некоторая серия. Проверьте, есть ли в ней индекс 'Пятница'. Верните True если есть иначе False.

In [110]:
def solution(ser1):
    result = 'Пятница' in ser1.index 
    return result

Step_3.4.1 - На вход функции подаётся словарь. Постройте из него серию и умножьте каждое значение серии на 2. Функция должна вернуть серию. 

In [None]:
import pandas as pd

def solution(d):
    result = pd.Series(d)
    return result * 2

Step_3.4.3 - На вход функции подаётся словарь. Постройте из него серию так чтобы индексы были расположены в порядке: e, a, c, b, d

In [112]:
def solution(d):
    result = pd.Series(d, index = ['e', 'a', 'c', 'b', 'd'])
    return result

Step_3.4.4 - На вход функции подаётся словарь. Постройте из него серию и добавьте еще один индекс g. Индексу g присвойте значение 10. Функция должна вернуть серию.

In [113]:
import pandas as pd

def solution(d):
    result = pd.Series(d)
    result['g'] = 10
    return result

Step_3.4.6 - Проверьте, все ли значения серии заполнены? Верните одно значение False - если не все; True - если все заполнены

In [114]:
import pandas as pd

def solution(s1):
    result = s1.notnull().all()
    return result

Step_3.4.6 - На вход вам подаётся серия. Разверните индексы в обратном направлении:
![Картинка испарилась(((](https://ucarecdn.com/618e5198-6834-43fd-b4c5-c8b8eaad97c0/)
Значения оставьте на своих местах)

In [None]:
import pandas as pd

def solution(s1):
    s1.index = [::-1]
    return s1