# Настройка pandas

In [1]:
# импортируем numpy и pandas
import numpy as np
import pandas as pd

# импортируем datetime
import datetime
from datetime import datetime, date

# задаем некоторые настройки pandas, регулирующие
# формат вывода
pd.set_option('display.notebook_repr_html', False)
pd.set_option('display.max_columns', 8)
pd.set_option('display.max_rows', 10)
pd.set_option('display.width', 80)

# импортируем matplotlib для построения графиков
import matplotlib.pyplot as plt
%matplotlib inline

### Свойства .index и .values

In [None]:
# получаем значения в объекте Series
s = pd.Series([1, 2, 3])
s.values

In [None]:
# показываем, что результат - это массив NumPy
type(s.values)

In [None]:
# получаем индекс объекта Series
s.index

### Размер и форма объекта Series

In [None]:
# создаем серию
s = pd.Series([0, 1, 2, 3])
len(s)

In [None]:
# .size также позволяет узнать о количестве 
# элементов в объекте Series
s.size

In [None]:
# .shape - это кортеж с одним значением
s.shape

### Использование методов .head(), .tail() и .take() для вывода значений

In [None]:
# cоздаем объект Series из 9 элементов
s = pd.Series(np.arange(1, 10), 
              index=list('abcdefghi'))

In [None]:
# выводим первые 5 строк
s.head()

In [None]:
# выводим первые 3 строки
s.head(n = 3) # еще можно применить s.head(3)

In [None]:
# выводим последние 5 строк
s.tail()

In [None]:
# выводим последние 3 строки
s.tail(n = 3) # еще можно применить s.tail(3)

In [None]:
# отобрать строки, соответствующие
# позициям 1, 5 и 8
s.take([1, 5, 8])

### Явный поиск по позиции с помощью свойства .iloc[]

In [None]:
# создадим серию для проверки 
# различных способов поиска
s1 = pd.Series(np.arange(10, 15), index=list('abcde'))
s1

In [None]:
# ищем явно по позиции
s1.iloc[[0, 2]]

In [None]:
# ищем явно по позиции
s1.iloc[[3, 2]]

### Явный поиск по меткам с помощью свойства .loc[]¶

In [None]:
# ищем явно по меткам
s1.loc[['a', 'd']]

### Переиндексация объекта Series

In [None]:
# создаем случайную серию из 5 элементов
np.random.seed(123456)
s = pd.Series(np.random.randn(5))
s

In [None]:
# изменяем индекс
s.index = ['a', 'b', 'c', 'd', 'e']
s

In [None]:
# индексируем заново, используя другое количество меток
# в итоге некоторые строки удалены и/или получены значения NaN
s2 = s.reindex(['a', 'c', 'g'])
s2

In [None]:
# создаем пример, чтобы продемонстрировать
# варианты заполнения
s3 = pd.Series(['red', 'green', 'blue'], index=[0, 3, 5])
s3

In [None]:
# пример прямого заполнения
s3.reindex(np.arange(0,7), method='ffill')

In [None]:
# пример обратного заполнения
s3.reindex(np.arange(0,7), method='bfill')