# преобразование столбца Pandas в список

In [3]:
import pandas as pd

# create a sample dataframe
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)

# Convert a column to a list
column_A_list = df['A'].tolist()
print("Column A as list:", column_A_list)

Column A as list: [1, 2, 3]


# DataFrame во вложенный список

In [4]:
import pandas as pd

# create a sample dataframe
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)

# Convert a column to a list
nested_list = df.values.tolist()
print("Nested list:", nested_list)

Nested list: [[1, 4, 7], [2, 5, 8], [3, 6, 9]]


# столбец индекса Pandas в список

In [5]:
import pandas as pd

# create a sample dataframe
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
index_values = ['row1', 'row2', 'row3']
df = pd.DataFrame(data, index=index_values)

# Convert index column to a list
index_list = df.index.tolist()
print("Index column as list:", index_list)

Index column as list: ['row1', 'row2', 'row3']


# преобразование DataFrame в список, содержащий все столбцы строк и имена столбцов

In [6]:
import pandas as pd

data = {'Name': ['Eleven', 'KL', 'SM', 'KB'],
        'Points': [11, 21, 18, 19]}

df = pd.DataFrame(data) 
 
# Converting dataframe to list
li = [df.columns.values.tolist()] + df.values.tolist()
 
# Printing list
print(li)

[['Name', 'Points'], ['Eleven', 11], ['KL', 21], ['SM', 18], ['KB', 19]]


# Синтаксис

In [None]:
DataFrame.set_index(keys, drop=True, append=False, 
                    inplace=False, verify_integrity=False)

In [None]:
# keys: имя столбца или список имен столбцов.
# drop: логическое значение попадает в столбец, используемый для индекса, если оно истинно.
# append: добавляет столбец к существующему столбцу индекса, если оно истинно.
# inplace: вносит изменения в DataFrame, если это True.
# verify_integrity: проверяет новый столбец индекса на наличие дубликатов, если оно истинно.

# как использовать метод Pandas DataFrame set_index()

In [7]:
import pandas as pd

# Create a sample DataFrame
data = {'ID': [101, 102, 103], 
        'Name': ['Krunal', 'Ankit', 'Rushabh'], 
        'Age': [25, 30, 35]}
df = pd.DataFrame(data)

print("Original DataFrame:")
print(df)

# Set the 'ID' column as the index
df_indexed = df.set_index('ID')

print("\nDataFrame after setting the 'ID' column as the index:")
print(df_indexed)

Original DataFrame:
    ID     Name  Age
0  101   Krunal   25
1  102    Ankit   30
2  103  Rushabh   35

DataFrame after setting the 'ID' column as the index:
        Name  Age
ID               
101   Krunal   25
102    Ankit   30
103  Rushabh   35


# как установить несколько столбцов в качестве индекса

In [8]:
import pandas as pd

# Create a sample DataFrame
data = {'ID': [101, 102, 103], 
        'Name': ['Alice', 'Bob', 'Charlie'], 
        'Age': [25, 30, 35]}
df = pd.DataFrame(data)

print("Original DataFrame:")
print(df)

# Set the 'ID' and 'Name' columns as the index
df_multi_indexed = df.set_index(['ID', 'Name'])

print("\nDataFrame after setting the 'ID' and 'Name' columns as the index:")
print(df_multi_indexed)

Original DataFrame:
    ID     Name  Age
0  101    Alice   25
1  102      Bob   30
2  103  Charlie   35

DataFrame after setting the 'ID' and 'Name' columns as the index:
             Age
ID  Name        
101 Alice     25
102 Bob       30
103 Charlie   35


# установка одного столбца с плавающей запятой в качестве индекса в Pandas DataFrame

In [9]:
import pandas as pd

df = pd.DataFrame({
  'A': [1.1, 2.2, 3.3, 4.4],
  'B': ['a', 'b', 'c', 'd'],
  'C': [5, 6, 7, 8]
})

# Set column 'A' as the index
df.set_index('A', inplace=True)
print(df)

     B  C
A        
1.1  a  5
2.2  b  6
3.3  c  7
4.4  d  8


# установка трех столбцов в качестве MultiIndex в Pandas DataFrame

In [10]:
import pandas as pd

# Suppose we have the following DataFrame
df = pd.DataFrame({
  'A': ['A0', 'A1', 'A2', 'A3'],
  'B': ['B0', 'B1', 'B2', 'B3'],
  'C': ['C0', 'C1', 'C2', 'C3'],
  'D': ['D0', 'D1', 'D2', 'D3']
})

# Set columns 'A', 'B' and 'C' as the index
df.set_index(['A', 'B', 'C'], inplace=True)
print(df)

           D
A  B  C     
A0 B0 C0  D0
A1 B1 C1  D1
A2 B2 C2  D2
A3 B3 C3  D3
