In [3]:
import pandas as pd
 # Lesson 3 - Indexes in Pandas

In [None]:
df = pd.read_csv("world_population.csv", index_col="Country")
df

In [None]:
# Это сбрасывает все текущие индексы и возвращает DataFrame к стандартной нумерации (0, 1, 2...).
# Аргумент inplace=True означает, что изменения применяются к самому df.
# Если не указать inplace=True, метод вернет новый DataFrame сброшенным индексом,
# а исходный df останется без изменений.
df.reset_index(inplace=True)

In [None]:
# Этот код устанавливает колонку 'Country' как новый индекс, но только для вывода.
# Он не сохраняет изменения в самом DataFrame.
df.set_index("Country")
# А вот здесь, благодаря inplace=True, колонка 'Country' становится
# постоянным индексом для нашего df.
df.set_index("Country", inplace=True)
df

In [None]:
# Можно установить несколько индексов, создав "многоуровневый" индекс (MultiIndex).
# Это очень удобно для иерархических данных.
df.set_index(["Continent", "Country"], inplace=True)
df

In [13]:
pd.set_option("display.max.rows", 235)

In [None]:
# Этот метод сортирует DataFrame по значениям в индексе.
# Если у тебя MultiIndex, ты можешь указать порядок сортировки для каждого уровня,
# передав список в ascending.
df.sort_index()
# Также указывать способ сортировки
df.sort_index(ascending=[False, True])

In [None]:
# Для MultiIndex всегда используй .loc, чтобы получать доступ по именам индексов.
# Ты передаешь кортеж или список с именами для каждого уровня индекса.
df.loc["Africa", "Angola"]

In [None]:
# А .iloc всегда работает только с числовыми позициями, независимо от того, какие у тебя имена индексов.
# Оно просто вернет вторую строку (так как счет с 0).
df.iloc[1]

In [None]:
# Мои наблюдения:
# 1. Запомни, что .loc работает с именами, а .iloc — с позициями.
#    Это главное правило, которое поможет тебе избежать путаницы.

# 2. Не все индексы должны быть уникальными! Если ты установишь индекс "Continent",
#    а потом вызовешь df.loc["Asia"], Pandas вернет ВСЕ строки, где Continent = "Asia".
#    Это мощный способ для быстрого выбора целых групп данных.

# 3. Используй .loc[(slice(None), 'United States')] для MultiIndex,
#    если тебе нужно выбрать данные по конкретному значению на втором уровне
#    индекса, но для всех значений на первом.