<a href="https://colab.research.google.com/github/Sinrez/PythonProjects/blob/main/Pandas2_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---

# Основные структуры в Pandas

---

## 1 | Series (Серии)

---

Импортируем библиотеки $\mathsf{numpy}$, $\mathsf{pandas}$, а также класс $\mathsf{Series}$:

In [1]:
import pandas as pd
import numpy as np
from pandas import Series, DataFrame

---

### 1.1 | Способы инициализации

---

С помощью списков:

In [2]:
arr = [1, 3, 5]
Series(arr)

0    1
1    3
2    5
dtype: int64

Индексы:

In [3]:
Series(arr).index

RangeIndex(start=0, stop=3, step=1)

---

С помощью словарей:

In [4]:
d = {'a': 3, 'f': 5, 'e': 9}
Series(d)

a    3
f    5
e    9
dtype: int64

---

Задаем явно с помощью списков значения, а также их метки:

In [None]:
Series([1, 3, 5, 7], index=['a', 'c', 't', 'h'])

a    1
c    3
t    5
h    7
dtype: int64

---

При задании серии с помощью словаря можно явно указывать, элементы по каким меткам считывать:

In [None]:
s = Series(d, index=['a', 'e', 'g', 'p'])
s

a    3.0
e    9.0
g    NaN
p    NaN
dtype: float64

Значения, которые были не найдены по указанным меткам заменяются на специальное значение $\mathsf{NaN}$, а все остальные непропущенные элементы преобразуются к типу $\mathsf{float64}$.


---

Тип данных можно получить, обратившись к полю $\mathsf{dtype}$:

In [None]:
s.dtype

dtype('float64')

Можно явно указать, к какому типу преобразовывать численные значения:

In [None]:
s_float = Series(d, index=['a', 'e'], dtype=np.float64)
s_float

a    3.0
e    9.0
dtype: float64

In [None]:
s_int = Series(d, index=['a', 'e'], dtype=np.int64)
s_int

a    3
e    9
dtype: int64

---

### 1.2 | Индексация серий

---

Как мы уже сказали, серии — аналог словаря, поэтому к элементам можно обращаться по ключу:

In [None]:
arr = [1, 3, 5, 7]
s_arr = Series(arr)
s_arr[1]

3

In [None]:
d = {'a': 3, 'f': 5, 'e': 9}
s_dict = Series(d)
s_dict['f']

5

Обращаться можно сразу по нескольким индексам:

In [None]:
s_arr[[0, 2, 3]]

0    1
2    5
3    7
dtype: int64

In [None]:
s_dict[['a', 'e']]

a    3
e    9
dtype: int64

Или даже брать элементы по срезам, но не по ключам, а по индексам:

In [None]:
s_arr[0:3]

0    1
1    3
2    5
dtype: int64

In [None]:
s_dict[1:3]

f    5
e    9
dtype: int64

---

Для взятия элемента по ассоциативной метке и по индексу существуют методы $\mathsf{loc}$ и $\mathsf{iloc}$ соответственно:

In [None]:
s_arr

0    1
1    3
2    5
3    7
dtype: int64

In [None]:
s_arr.loc[[0, 2]]  # Аналог s_arr[[0, 2]]

0    1
2    5
dtype: int64

In [None]:
s_arr.iloc[[0, 2]]

0    1
2    5
dtype: int64

In [None]:
s_dict

a    3
f    5
e    9
dtype: int64

In [None]:
s_dict.loc[['a', 'e']]

a    3
e    9
dtype: int64

In [None]:
s_dict.iloc[[0, 2]]

a    3
e    9
dtype: int64

---

Обращаясь к элементу, можно не только получить его значение, но и поменять его:

In [None]:
arr = [1, 3, 5, 7]
s_arr = Series(arr)
s_arr

0    1
1    3
2    5
3    7
dtype: int64

In [None]:
s_arr[1] = 11
s_arr

0     1
1    11
2     5
3     7
dtype: int64

In [None]:
d = {'a': 3, 'f': 5, 'e': 9}
s_dict = Series(d)
s_dict

a    3
f    5
e    9
dtype: int64

In [None]:
s_dict['f'] = 14
s_dict

a     3
f    14
e     9
dtype: int64

Можно менять значения сразу у нескольких элементов, обращаясь по множественному индексу:

In [None]:
s_arr

0     1
1    11
2     5
3     7
dtype: int64

In [None]:
s_arr[[1, 2, 3]] = 15
s_arr

0     1
1    15
2    15
3    15
dtype: int64

In [None]:
s_dict

a     3
f    14
e     9
dtype: int64

In [None]:
s_dict[['f', 'e']] = 20
s_dict

a     3
f    20
e    20
dtype: int64

---

Если необходимо проитерироваться по всем значениям или меткам в цикле, то нужно обратиться при создании цикла к самой серии и к методу $\mathsf{keys}$ соответственно:

In [None]:
for value in s_dict:
    print(f'value : {value}')

value : 3
value : 20
value : 20


In [None]:
for col_name in s_dict.keys():
    print(f'col_name : {col_name}')

col_name : a
col_name : f
col_name : e


А если нужно одновременно и по значениям, и по ключам пройти циклом, то есть метод $\mathsf{items}$:

In [None]:
for col_name, value in s_dict.items():
    print(f'key : {col_name} \t value : {value}')

key : a 	 value : 3
key : f 	 value : 20
key : e 	 value : 20


In [1]:
x = 5
print('x=', x+3)

x= 8


In [6]:
import re

str = '3 товара за 209.99'
pat = r'\d+.\d'
match = re.search(pat,str)
print(match.group())

209.9
