**Объект DataFrame и его создание**
=
DataFrame - это одна из основных структур данных в Python, используемых для работы с табличными данными. Он представляет собой таблицу, состоящую из строк и столбцов, где каждый столбец может иметь разные типы данных. DataFrame очень похож на SQL-таблицу или электронную таблицу Excel.

Основные характеристики DataFrame:

1. Он содержит две оси, ось строк и ось столбцов, которые могут быть маркированы именами или целочисленными индексами.
2. Каждый столбец может содержать данные различных типов, таких как числа, строки, булевы значения и т. д.
3. DataFrame поддерживает множество операций с данными, включая выборку, фильтрацию, группировку, агрегацию, слияние и т. д.
4. Он может быть создан из различных источников данных, таких как CSV, Excel, SQL-запросы, массивы NumPy и т. д.
5. DataFrame предоставляет множество методов для работы с данными, включая сортировку, замену значений, преобразование данных и т. д.
6. Он имеет много параметров, которые могут быть использованы для настройки поведения и функциональности.
7. DataFrame может содержать отсутствующие значения (NaN или None), которые могут быть обработаны с помощью специальных методов.
8. Он может быть сохранен в различных форматах, таких как CSV, Excel, JSON, SQL-таблицы и т. д.

In [None]:
#cоздание DataFrame из списка списков
import pandas as pd

data = [['John', 28, 'New York'],
        ['Kate', 23, 'Chicago'],
        ['Mike', 32, 'San Francisco']]

df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])

print(df)

#   Name  Age           City
#0  John   28       New York
#1  Kate   23        Chicago
#2  Mike   32  San Francisco

In [None]:
#создание DataFrame из словаря

import pandas as pd

data = {'Name': ['John', 'Kate', 'Mike'],
        'Age': [28, 23, 32],
        'City': ['New York', 'Chicago', 'San Francisco']}

df = pd.DataFrame(data)

print(df)

#вывод тот же, что и в примере выше

In [None]:
#создание DataFrame из списка словарей

import pandas as pd

data = [{'Name': 'John', 'Age': 28, 'City': 'New York'},
        {'Name': 'Kate', 'Age': 23, 'City': 'Chicago'},
        {'Name': 'Mike', 'Age': 32, 'City': 'San Francisco'}]

df = pd.DataFrame(data)

print(df)

#вывод тот же, что и в примере выше

In [None]:
#создание DataFrame из массива numpy
import pandas as pd
import numpy as np

data = np.array([['John', 28, 'New York'],
                 ['Kate', 23, 'Chicago'],
                 ['Mike', 32, 'San Francisco']])

df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])

print(df)

#вывод тот же, что и в примере выше

In [None]:
#создание пустого DataFrame
import pandas as pd

df = pd.DataFrame(columns=['Name', 'Age', 'City'])

print(df)

#Empty DataFrame
#Columns: [Name, Age, City]
#Index: []

Параметр columns используется для указания имен столбцов DataFrame при его создании. В примерах выше мы передавали имена столбцов в параметре columns, чтобы DataFrame знал, как называются столбцы. Если не указывать этот параметр, то DataFrame автоматически назначит имена столбцам в порядке их появления в данных (0, 1, 2…).

Имена столбцов можно изменить после создания DataFrame с помощью атрибута columns. Это может быть полезно, если мы заметили ошибку в именах столбцов или просто хотим изменить их в процессе работы с DataFrame.

In [None]:
#для изменения имен столбцов нужно просто присвоить новые имена списку, который передается в атрибут columns
import pandas as pd

data = [['John', 28, 'New York'],
        ['Kate', 23, 'Chicago'],
        ['Mike', 32, 'San Francisco']]

df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])

print(df)

#   Name  Age           City
#0  John   28       New York
#1  Kate   23        Chicago
#2  Mike   32  San Francisco

df.columns = ['Full Name', 'Age', 'Location'] #переименовываем

print(df)

#  Full Name  Age       Location
#0      John   28       New York
#1      Kate   23        Chicago
#2      Mike   32  San Francisco

**Основы работы со столбцами DataFrame**
=
**Методы head и tail**

Например, если есть DataFrame с именем df, можно использовать метод head для просмотра первых 5 строк следующим образом:

df.head()

Также можно указать количество строк, которые нужно отобразить, используя параметр n:

df.head(n=10)

Метод tail работает аналогично, только выводит последние строки DataFrame.

In [None]:
#пример работы df.head() и df.tail()
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12],
        [60, 13],
        [81, 94],
        [23, 15],
        [32, 71],
        [11, 21],
        [53, 76],
        [23, 52],
        [32, 23]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])

print(df.head())

#   Age1  Age2
#0    27    82
#1    16    24
#2    50    71
#3    45    12
#4    60    13

print(df.head(3))

#   Age1  Age2
#0    27    82
#1    16    24
#2    50    71

print(df.tail())

#    Age1  Age2
#7     32    71
#8     11    21
#9     53    76
#10    23    52
#11    32    23

**Извлечение столбцов DataFrame**

Например, если есть DataFrame с именем df нужно извлечь столбец с именем 'column1', можно использовать следующий код:

column1 = df['column1']

В Pandas DataFrame каждый столбец представлен объектом Series, который имеет имя, соответствующее названию столбца. Имя столбца является ключом для доступа к объекту Series внутри DataFrame.

Существует также альтернативный способ обращения к колонкам в pandas: df.column1,  где column1 - имя колонки в DataFrame df.


In [None]:
#пример извлечения колонки из датасета
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])

print(df['Age1']) #выведет первую колонку в формате Series
print(df.Age2) # выведет вторую колонку в формате Series

**Создание нового столбца в DataFrame**

Иногда может потребоваться создать новый столбец в DataFrame на основе данных из других столбцов. Для этого можно использовать синтаксис: 

DataFrame['new_column'] = value

В этой строчке "value" – это значения для нового столбца, которые могут быть скалярами или массивами (или столбцами из уже существующего DataFrame).

In [None]:
#пример создания нового столбца - суммы двух предыдущих
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])
df['Total_age'] = df['Age1'] + df['Age2']

print(df)

#   Age1  Age2  Total_age
#0    27    82        109
#1    16    24         40
#2    50    71        121
#3    45    12         57

Если есть DataFrame с именем df и нужно изменить значения столбца с именем 'column1', можно использовать следующий код:

df['column1'] = [1, 2, 3, 4, 5]


In [None]:
#пример изменения значений в колонке
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])

print(df)

#   Age1  Age2
#0    27    82
#1    16    24
#2    50    71
#3    45    12

df['Age1'] = [7, 12, 31, 21]

print(df)

#   Age1  Age2
#0     7    82
#1    12    24
#2    31    71
#3    21    12

**Изменение имени столбца DataFrame**

Иногда может потребоваться изменить имя столбца DataFrame. Для этого можно использовать метод rename(), который позволяет изменить имя одного или нескольких столбцов DataFrame.

Например, если  есть DataFrame с именем df и нужно изменить имя столбца 'column1' на 'new_column1', можно использовать следующий код:

df.rename(columns={'column1': 'new_column1'}, inplace=True)

Если установить inplace=False при использовании метода df.rename(), то изменения не будут сохранены в исходном DataFrame, а возвращаемый новый DataFrame будет содержать переименованные столбцы. По умолчанию параметр inplace установлен именно в это значение.

Вот пример кода, который переименовывает столбец 'column1' в 'new_column1' и возвращает новый DataFrame, не изменяя исходный DataFrame:

new_df = df.rename(columns={'column1': 'new_column1'}, inplace=False)

Этот код создаст новый DataFrame new_df с тем же набором данных, что и df, но с измененным именем столбца 'column1' на 'new_column1'.


In [None]:
#пример изменения значений в колонке
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])

print(df)

#   Age1  Age2
#0    27    82
#1    16    24
#2    50    71
#3    45    12

df = df.rename(columns={'Age1' : 'Age2', 'Age2' : 'Age1'})
#или df.rename(columns={'Age1' : 'Age2', 'Age2' : 'Age1'}, inplace=True)
#лучше перезаписывать df - разработчики Pandas советуют отказываться от inplace

print(df)

#   Age2  Age1
#0    27    82
#1    16    24
#2    50    71
#3    45    12

**Удаление столбца DataFrame**

Чтобы удалить столбец DataFrame, вы можете использовать метод drop(), указав имя столбца и параметр axis=1. Это удалит указанный столбец из DataFrame.

Например, если у вас есть DataFrame с именем df и вы хотите удалить столбец с именем 'column1', вы можете использовать следующий код:

df.drop('column1', axis=1, inplace=True)

либо

df = df.drop('column1', axis=1)


In [None]:
#пример удаления колонок
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])

print(df)

#   Age1  Age2
#0    27    82
#1    16    24
#2    50    71
#3    45    12

df = df.drop('Age1', axis=1)
#или df.drop('Age1', axis=1, inplace=True)

print(df)

#   Age2
#0    82
#1    24
#2    71
#3    12

**Изменение имен столбцов DataFrame с помощью атрибута columns**

Для изменения имен столбцов в Pandas DataFrame можно использовать атрибут columns. Для этого следует переопределить этот атрибут, передав в качестве нового значения список имен столбцов с желаемыми именами.

Пусть имеется DataFrame df с колонками 'column1', 'column2', нам нужно переименовать колонки на 'new_column1', 'new_column2'. Вот пример кода, который делает это:

df.columns = ['new_column2', 'new_column1']

Этот код переопределит имена столбцов DataFrame df на новые.


In [None]:
#пример переименования колонок с помощью атрибута columns
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])

print(df)

#   Age1  Age2
#0    27    82
#1    16    24
#2    50    71
#3    45    12

df.columns = ['Wins', 'Losses']

print(df)

#   Wins  Losses
#0    27      82
#1    16      24
#2    50      71
#3    45      12

**Перестановка порядка следования колонок в DataFrame**

Иногда вам может потребоваться переставить колонки в существующем DataFrame. Предположим, у вас есть DataFrame с колонками 'column1', 'column2' и вы хотите поменять их местами, так чтобы сначала шла колонка 'column2', а потом 'column1'. Это можно сделать так:

df = df[['column2', 'column1']]


In [None]:
#пример перестановки колонок местами
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])

print(df)

#   Age1  Age2
#0    27    82
#1    16    24
#2    50    71
#3    45    12

df = df[['Age2', 'Age1']]

print(df)

#   Age2  Age1
#0    82    27
#1    24    16
#2    71    50
#3    12    45

**Изменение типа данных в колонке в DataFrame**

Атрибут astype позволяет задавать отдельным колонкам конкретный тип данных. Пусть есть DataFrame с колонками 'column1' и 'column2', которым нужно задать тип данных int. Это можно сделать следующим образом:

df = df.astype({'column1':'int64', 'column2': 'int64'})

In [None]:
#пример смены типа данных c int на float
import pandas as pd

data = [[27, 82],
        [16, 24],
        [50, 71],
        [45, 12]]

df = pd.DataFrame(data, columns=['Age1', 'Age2'])
df = df.astype({'Age1' : 'float64', 'Age2' : 'float64'})

print(df)

#   Age1  Age2
#0  27.0  82.0
#1  16.0  24.0
#2  50.0  71.0
#3  45.0  12.0

**Атрибуты index, values, name DataFrame, извлечение строк**
=
**Извлечение строк**

В DataFrame есть несколько способов извлечения строк. Один из самых распространенных – это использование метода loc или iloc.
loc позволяет извлекать строки по их меткам, а iloc - по их индексам.

Методы loc и iloc возвращают объект DataFrame или объект Series, в зависимости от того, сколько строк было выбрано. Если используется loc для выбора одной строки, то он вернет объект Series.

In [None]:
#пример извлечения строк с помощью методов loc и iloc
import pandas as pd

data = {'name': ['John', 'Jane', 'Bill'], 
        'age': [25, 30, 35],
        'country': ['USA', 'Canada', 'UK']}

df = pd.DataFrame(data, index=['a', 'b', 'c']) #присваиваем метки для дальнейшего использования loc

print(df)

#   name  age country
#a  John   25     USA
#b  Jane   30  Canada
#c  Bill   35      UK

print(df.loc['a']) #извлечение одной строки по её метке

#name       John
#age          25
#country     USA
#Name: a, dtype: object

print(df.loc[['a', 'c']]) #извлечение нескольких строк по их меткам

#   name  age country
#a  John   25     USA
#c  Bill   35      UK

print(df.iloc[1]) #извлечение одной строки по её индексу

#name         Jane
#age            30
#country    Canada
#Name: b, dtype: object

print(df.iloc[[0, 2]]) #извлечение нескольких строк по их меткам

#   name  age country
#a  John   25     USA
#c  Bill   35      UK

**Присваивание колонкам df объекта Series**

Чтобы присвоить объект Series в качестве колонки DataFrame, можно использовать квадратные скобки и имя колонки (пример ниже).

Это добавит новую колонку gender в DataFrame и заполнит ее значениями из объекта new_column.

Если мы попытаемся присвоить объект Series, длина которого меньше длины колонки, то в оставшейся части колонки будут значения NaN, а не возникнет ошибка. Это происходит потому, что Pandas автоматически расширяет объект Series до размера колонки DataFrame и заполняет оставшуюся часть значениями NaN. Таким образом, мы можем без ошибок присваивать колонке DataFrame объекты Series, длина которых меньше длины колонки, и Pandas будет автоматически заполнять оставшуюся часть значений NaN.

При попытке присвоить объект Series, длина которого больше, чем длина колонки DataFrame, объект Series будет обрезан до размера колонки DataFrame.

Если же мы попытаемся присвоить колонке DataFrame список или словарь отличной длины, то возникнет ошибка.


In [None]:
#пример добавления объекта Series в качестве колонки
import pandas as pd

data = {'name': ['John', 'Jane', 'Bill'],
        'age': [25, 30, 35],
        'country': ['USA', 'Canada', 'UK']}

df = pd.DataFrame(data)

new_column = pd.Series(['male', 'female', 'male'], name='gender')
df['gender'] = new_column

print(df)

#   name  age country  gender
#0  John   25     USA    male
#1  Jane   30  Canada  female
#2  Bill   35      UK    male

**Метод del**

Метод del позволяет удалять колонки из DataFrame и, таким образом, является альтернативой более общему методу drop. Для этого нужно указать имя колонки после del.


In [None]:
#пример использования del для удаления колонки
import pandas as pd

data = {'name': ['John', 'Jane', 'Bill'],
        'age': [25, 30, 35],
        'country': ['USA', 'Canada', 'UK']}

df = pd.DataFrame(data)

print(df)

#   name  age country
#0  John   25     USA
#1  Jane   30  Canada
#2  Bill   35      UK

del df['country']

print(df)

#   name  age
#0  John   25
#1  Jane   30
#2  Bill   35

**Задание index**

Атрибут index позволяет задавать индексы строк DataFrame. Например, можно использовать атрибут index при создании объекта DataFrame в Pandas.

Индексы задаются в виде списка, передаваемого атрибутом index при создании DataFrame. Если длина списка индексов не совпадает с количеством строк в DataFrame, будет сгенерировано исключение ValueError. Если атрибут index не задан при создании DataFrame, Pandas автоматически создаст числовой индекс по умолчанию от 0 до n-1, где n - количество строк в DataFrame.

In [None]:
#пример задания меток

import pandas as pd

data = {'name': ['John', 'Jane', 'Bill'],
        'age': [25, 30, 35],
        'country': ['USA', 'Canada', 'UK']}
index = ['a', 'b', 'c']

df = pd.DataFrame(data, index=index)

print(df)

#   name  age country
#a  John   25     USA
#b  Jane   30  Canada
#c  Bill   35      UK

Также можно после создания DataFrame переопределить его атрибут index. Для этого используется метод set_index.

In [None]:
#пример назначения меток из колонки датафрейма
import pandas as pd

data = {'name': ['John', 'Jane', 'Bill'],
        'age': [25, 30, 35],
        'country': ['USA', 'Canada', 'UK']}

df = pd.DataFrame(data)
df = df.set_index('name')

print(df)

#      age country
#name             
#John   25     USA
#Jane   30  Canada
#Bill   35      UK

**Атрибут values**

Атрибут values позволяет получить массив значений DataFrame в виде объекта – массива NumPy.

In [None]:
#пример использования атрибута values
import pandas as pd

data = {'name': ['John', 'Jane', 'Bill'],
        'age': [25, 30, 35],
        'country': ['USA', 'Canada', 'UK']}

df = pd.DataFrame(data)

print(df.values)

#[['John' 25 'USA']
# ['Jane' 30 'Canada']
# ['Bill' 35 'UK']]

**Индексные объекты Pandas**
=
Индексные объекты – это объекты, которые используются для доступа к данным в Pandas. Они представляют собой особый тип структуры данных, который помогает определять порядок, доступ и обработку данных в Pandas. Index в Pandas – это одномерный массив меток (labels), который используется для индексации осей DataFrame или Series. Он может быть рассмотрен как неизменяемый массив меток.

В Pandas существует два типа индексных объектов: индексы строк и индексы столбцов. Индексы строк используются для доступа к данным в строках, а индексы столбцов – для доступа к данным в столбцах.

**Индексы строк**

Индексы строк используются для доступа к данным в строках. Они могут быть созданы из различных типов данных, таких как списки, массивы, кортежи, словари и т.д. Однако, наиболее распространенным типом индекса является RangeIndex, который создается по умолчанию при создании объекта DataFrame.


In [None]:
#выводим индекс строки
import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [25, 30, 35]})

print(df.index)

#RangeIndex(start=0, stop=3, step=1)

По умолчанию, создается RangeIndex с шагом 1 от 0 до N - 1. RangeIndex – это тип индекса строк, который является последовательностью целых чисел, начинающихся с 0 и увеличивающихся на 1 для каждой строки в DataFrame.

RangeIndex предоставляет компактное представление индекса строк и обычно используется для DataFrame, где индексы строк не являются уникальными или не имеют специального значения. Он также может быть полезен, когда создается новый DataFrame с помощью функции, которая возвращает список или массив значений, например, при чтении данных из файла CSV или Excel.

RangeIndex можно создать явно с помощью функции range (пример ниже).


In [None]:
#явно задаём индексы через RangeIndex
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}, index=range(3))

print(df.index)

#RangeIndex(start=0, stop=3, step=1)

В Pandas есть несколько типов индексов, которые могут быть использованы для доступа к данным в строках DataFrame:

1. Int64Index – это тип индекса строк, который содержит целочисленные значения. Он может быть использован, когда индексы строк должны быть уникальными и могут быть отрицательными.

2. Float64Index – это тип индекса строк, который содержит значения с плавающей точкой. Он может быть использован, когда индексы строк должны быть уникальными и могут содержать значения с плавающей точкой.

3. DatetimeIndex – это тип индекса строк, который содержит значения даты и времени. Он может быть использован, когда индексы строк должны быть уникальными и могут содержать значения даты и времени.

и ряд других.


**Атрибуты объекта Index в Pandas**

**Атрибут name** у индексного объекта в Pandas позволяет задать имя индекса при его создании или изменить его позднее. Имя индекса полезно для идентификации индекса при работе с DataFrame или Series. Если DataFrame был создан без задания имени индекса, то имя индекса может быть задано путем присваивания имени атрибуту name у индекса DataFrame.

In [None]:
#пример присванивания индексам имени

df = pd.DataFrame({'values': [0.25, 0.5, 0.75, 1.0]}, index=[1, 2, 3, 4])

df.index.name = 'index_name'

print(df)

#            values
#index_name        
#1             0.25
#2             0.50
#3             0.75
#4             1.00

**Атрибут dtype** объекта Index в Pandas показывает тип данных элементов, хранящихся в данном индексе. Он может быть использован для проверки типа индекса и определения того, какие операции могут быть выполнены с использованием этого индекса.

В зависимости от типа элементов в индексе, атрибут dtype может принимать различные значения. Например, если индекс содержит только числовые значения, то dtype будет соответствовать типу данных этих чисел, таким как int64 или float64. Если индекс содержит строковые значения, то dtype будет иметь тип object. 

Атрибут dtype может быть полезен для выполнения операций, которые требуют определенного типа данных. Например, если мы хотим выполнить математическую операцию, например, суммирование значений в индексе, нам нужно убедиться, что все элементы имеют числовой тип данных. Если же индекс содержит элементы различных типов, то для выполнения операций нам необходимо сначала преобразовать индекс к нужному типу данных.

Атрибуты shape, size и values являются частями объекта Index в Pandas и предоставляют информацию о его структуре и содержании.

**Атрибут shape** возвращает кортеж, который содержит количество элементов в каждом измерении индекса. Если индекс одномерный, то shape будет иметь вид (n,), где n – это количество элементов в индексе.

**Атрибут size** возвращает количество элементов в индексе. Это просто целое число, равное количеству элементов в индексе.

**Атрибут values** возвращает массив, содержащий фактические элементы индекса. Этот массив может быть использован для выполнения различных операций на элементах индекса.


In [None]:
#использование атрибутов dtype, shape, size и values
import pandas as pd

idx = pd.Index(['a', 'b', 'c', 'd'])

print("dtype:", idx.dtype)
print("shape:", idx.shape)
print("size:", idx.size)
print("values:", idx.values)

#dtype: object
#shape: (4,)
#size: 4
#values: ['a' 'b' 'c' 'd']

**Флаги в объекте Index**

Флаги в Pandas – это логические значения, которые показывают различные свойства индекса, такие как уникальность значений, их упорядоченность, отсутствие дубликатов и т.д. Некоторые из флагов, доступных для объекта Index, являются следующими:

1. is_unique: флаг, указывающий, являются ли все значения индекса уникальными. Возвращает True, если все значения в индексе уникальны, в противном случае возвращает False.

2. is_monotonic_increasing: флаг, указывающий, упорядочены ли значения индекса монотонно по возрастанию. Возвращает True, если индекс монотонный по возрастанию, в противном случае возвращает False.

3. is_monotonic_decreasing: флаг, указывающий, упорядочены ли значения индекса монотонно по убыванию. Возвращает True, если индекс монотонный по убыванию, в противном случае возвращает False.

In [None]:
#проверка флагов
import pandas as pd

idx1 = pd.Index(['a', 'b', 'c', 'd', 'a'])
idx2 = pd.Index(['a', 'b', 'c', 'd'])

print("is_unique:", idx1.is_unique)
print("is_monotonic_increasing:", idx2.is_monotonic_increasing)
print("is_monotonic_decreasing:", idx2.is_monotonic_decreasing)

#is_unique: False
#is_monotonic_increasing: True
#is_monotonic_decreasing: False

**Метод isin() объекта Index в Pandas**

Метод isin() является одним из методов, доступных для объектов индекса в Pandas. Он позволяет проверить, содержит ли данный индекс определенные значения. Синтаксис метода isin() для Index:

Index.isin(values)

Values –  итерируемый объект, содержащий значения для проверки.

Метод возвращает булев массив, указывающий, содержатся ли соответствующие значения индексного массива в последовательности values. В качестве аргумента values могут выступать различные типы объектов, например, список, кортеж, множество и др.

Метод isin() может быть полезен, когда требуется выбрать только определенные значения из индекса или выполнить фильтрацию данных по индексу.

In [None]:
#пример использования метода isin()
import pandas as pd

idx = pd.Index([1, 2, 3, 4, 5])

print(idx.isin([2, 4, 6]))

#[False True False True False]


**Метод reindex в Pandas**
=
Метод reindex в pandas используется для изменения порядка, добавления или удаления строк и столбцов в DataFrame. Он возвращает новый объект DataFrame с новым индексом. Метод reindex может быть использован с различными параметрами, которые позволяют осуществлять различные манипуляции с данными.

Синтаксис метода reindex:

DataFrame.reindex(labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=None, fill_value=nan, limit=None, tolerance=None)

Параметры метода reindex:
1.	labels: Список новых меток для переиндексации. Используется, если не указаны параметры index или columns.
2.	index: Список новых индексов для строк.
3.	columns: Список новых индексов для столбцов.
4.	axis: Ось для переиндексации (0 для строк, 1 для столбцов).
5.	method: Метод для заполнения значений, если новые метки не соответствуют старым. Возможные значения:
6.	copy: Если True, создается копия данных, даже если индексы совпадают.
7.	level: Уровень для мультииндексации.
8.	fill_value: Значение для заполнения отсутствующих данных.
9.	limit: Максимальное количество замен при заполнении.
10.	tolerance: Допустимое отклонение для заполнения методом 'nearest'.

Возможные значения method:
1. 'None (по умолчанию)
2. 'pad' / 'ffill' (заполнение вперед)
3. 'backfill' / 'bfill' (заполнение назад)
4. 'nearest' (ближайшее значение)


**Основные варианты использования**

Переиндексация строк или столбцов:
1.	Переиндексация строк.
2.	Переиндексация столбцов.
3.	Переиндексация строк и столбцов одновременно.

Заполнение отсутствующих значений:
1.	Использование метода заполнения вперед (pad/ffill).
2.	Использование метода заполнения назад (backfill/bfill).
3.	Заполнение конкретным значением.
Работа с мультииндексом: нет в этом курсе.
