# Индексация и выборка данных

In [None]:
import pandas as pd
data = pd.Series([0.25, 0.5, 0.75, 1.0],
                 index=['a', 'b', 'c', 'd'])
data

In [None]:
data['b']

In [None]:
'a' in data

In [None]:
data.keys()

In [None]:
list(data.items())

In [None]:
data['e'] = 1.25
data

In [None]:
# срез по индексу
data['a':'c']

In [None]:
# срез по целочисленному значению
data[0:2]

In [None]:
# маскирование
data[(data > 0.3) & (data < 0.8)]

In [None]:
# fancy indexing
data[['a', 'e']]

``data['a':'c']`` правая граница входит в срез, ``data[0:2]`` - правая граница не входит в срез!

### Индексаторы: loc, iloc

Позволяют избежать путаницы.

In [None]:
data = pd.Series(['a', 'b', 'c'], index=[1, 3, 5])
data

In [None]:
# explicit index when indexing
data[1]

In [None]:
# implicit index when slicing
data[1:3]

In [None]:
data.loc[5]

In [None]:
data.loc[1:3]

In [None]:
data.iloc[1]

In [None]:
data.iloc[1:3]

## Выборка данных в DataFrame

In [None]:
area = pd.Series({'California': 423967, 'Texas': 695662,
                  'New York': 141297, 'Florida': 170312,
                  'Illinois': 149995})
pop = pd.Series({'California': 38332521, 'Texas': 26448193,
                 'New York': 19651127, 'Florida': 19552860,
                 'Illinois': 12882135})
data = pd.DataFrame({'area':area, 'pop':pop})
data

In [None]:
data['area']

In [None]:
data.area

In [None]:
data.area is data['area']

Если имена столбцов конфликтуют с методами, то так не работает:

In [None]:
data.pop is data['pop']

In [None]:
data['density'] = data['pop'] / data['area']
data

In [None]:
data.values

Доступны многие операции как с массивами, например, транспонирование:

In [None]:
data.T

In [None]:
data.values[0]

In [None]:
data['area']

In [None]:
data.iloc[:3, :2]

In [None]:
data.loc[:'Illinois', :'pop']

In [None]:
data.loc[data.density > 100, ['pop', 'density']]

Модифицирование значений в стиле NumPy:

In [None]:
data.iloc[0, 2] = 90
data

In [None]:
data['Florida':'Illinois']

In [None]:
data[1:3]

In [None]:
data[data.density > 100]