-Выполнение операций над объектом Dataframe и его содержимым

In [1]:
import numpy as np
import pandas as pd
import datetime
from datetime import datetime, date

pd.set_option('display.notebook_repr_html', False)
pd.set_option('display.max_columns', 7)
pd.set_option('display.max_rows', 10)
pd.set_option('display.width', 60)

sp500 = pd.read_csv("C:/Users/Anton.Zaimist/Desktop/pandas/Learning_pandas_russian_translation/Data/sp500.csv",
                   index_col='Symbol',
                    usecols=[0,2,3,7])

-Переименовывание столбцов

In [4]:
#переименовываем столбец Book Value так, что бы удалить пробел
#программный код возвращает копию датафрейма с переименованным столбцом
newSP500 = sp500.rename(columns=
                       {'Book Value': 'BookValue'})
newSP500[:2]

             Sector   Price  BookValue
Symbol                                
MMM     Industrials  141.14     26.668
ABT     Health Care   39.60     15.573

In [5]:
sp500.columns

Index(['Sector', 'Price', 'Book Value'], dtype='object')

In [6]:
#Этот код переименовывает столбец на месте
sp500.rename(columns=
            {'Book Value': 'BookValue'},
            inplace=True)
sp500.columns

Index(['Sector', 'Price', 'BookValue'], dtype='object')

In [14]:
sp500.BookValue[:5]

Symbol
MMM     26.668
ABT     15.573
ABBV     2.954
ACN      8.326
ACE     86.897
Name: BookValue, dtype: float64

-Добавление новых столбцов с помощью оператора [] и метода .insert()

In [16]:
#создаем копию, чтобы исходные данные остальсб в неизмененном виде
sp500_copy = sp500.copy()
#добавляем столбец
sp500_copy['RoundedPrice'] = sp500.Price.round()
sp500_copy[:2]

             Sector   Price  BookValue  RoundedPrice
Symbol                                              
MMM     Industrials  141.14     26.668         141.0
ABT     Health Care   39.60     15.573          40.0

In [17]:
#создаем копию
copy = sp500.copy()
#вставляем столбец RoundedPrice в качестве второго столбца датафрейма
copy.insert(1, 'RoundedPrice', sp500.Price.round())
copy[:2]

             Sector  RoundedPrice   Price  BookValue
Symbol                                              
MMM     Industrials         141.0  141.14     26.668
ABT     Health Care          40.0   39.60     15.573

-Добавление столбцов за счет расширения датафрейма

In [18]:
#создаем копию среза
ss = sp500[:3].copy()
#добавляем столбец с нулевыми значениями
ss.loc[:,'PER'] = 0
ss

             Sector   Price  BookValue  PER
Symbol                                     
MMM     Industrials  141.14     26.668    0
ABT     Health Care   39.60     15.573    0
ABBV    Health Care   53.95      2.954    0

In [19]:
ss = sp500[:3].copy()
#добавляем новый столбец с рандомныит значениями
np.random.seed(123456)
ss.loc[:,'PER'] = pd.Series(np.random.normal(size=3), index=ss.index)
ss

             Sector   Price  BookValue       PER
Symbol                                          
MMM     Industrials  141.14     26.668  0.469112
ABT     Health Care   39.60     15.573 -0.282863
ABBV    Health Care   53.95      2.954 -1.509059

-Добавление столбцов с помощью конкатенации

In [20]:
#создаем объект DataFrame c единственным столбцом RoundedPrice
rounded_price = pd.DataFrame({'RoundedPrice':
                             sp500.Price.round()})
#конкатенируем по оси столбцов
concatenated = pd.concat([sp500, rounded_price], axis=1)
concatenated[:5]

                        Sector   Price  BookValue  \
Symbol                                              
MMM                Industrials  141.14     26.668   
ABT                Health Care   39.60     15.573   
ABBV               Health Care   53.95      2.954   
ACN     Information Technology   79.79      8.326   
ACE                 Financials  102.91     86.897   

        RoundedPrice  
Symbol                
MMM            141.0  
ABT             40.0  
ABBV            54.0  
ACN             80.0  
ACE            103.0  

In [21]:
rounded_price = pd.DataFrame({'Price':
                             sp500.Price.round()})
rounded_price[:5]

        Price
Symbol       
MMM     141.0
ABT      40.0
ABBV     54.0
ACN      80.0
ACE     103.0

In [22]:
#в результате получаем два столбца Price
dups = pd.concat([sp500, rounded_price],axis=1)
dups[:5]

                        Sector   Price  BookValue  Price
Symbol                                                  
MMM                Industrials  141.14     26.668  141.0
ABT                Health Care   39.60     15.573   40.0
ABBV               Health Care   53.95      2.954   54.0
ACN     Information Technology   79.79      8.326   80.0
ACE                 Financials  102.91     86.897  103.0

In [23]:
dups.Price[:5]

         Price  Price
Symbol               
MMM     141.14  141.0
ABT      39.60   40.0
ABBV     53.95   54.0
ACN      79.79   80.0
ACE     102.91  103.0

-Переупорядочивание столбцов

In [24]:
#возвращаем новый объект DataFrame со столбцами, расположенными в обратном порядке
reverse_column_names = sp500.columns[::-1]
sp500[reverse_column_names][:5]

        BookValue   Price                  Sector
Symbol                                           
MMM        26.668  141.14             Industrials
ABT        15.573   39.60             Health Care
ABBV        2.954   53.95             Health Care
ACN         8.326   79.79  Information Technology
ACE        86.897  102.91              Financials

-Замена содержимого столбца

In [25]:
#операция выполняется на месте, поэтому создадим копию
copy = sp500.copy()
#заменяем данные в столбце Price новыми значениями вместо добавления нового столбца
copy.Price = rounded_price.Price
copy[:5]

                        Sector  Price  BookValue
Symbol                                          
MMM                Industrials  141.0     26.668
ABT                Health Care   40.0     15.573
ABBV               Health Care   54.0      2.954
ACN     Information Technology   80.0      8.326
ACE                 Financials  103.0     86.897

In [26]:
copy = sp500.copy()
#заменяем данные в столбце Price округленными значениями
copy.loc[:,'Price'] = rounded_price.Price
copy[:5]

                        Sector  Price  BookValue
Symbol                                          
MMM                Industrials  141.0     26.668
ABT                Health Care   40.0     15.573
ABBV               Health Care   54.0      2.954
ACN     Information Technology   80.0      8.326
ACE                 Financials  103.0     86.897

-Удаление столбцов

In [27]:
#пример использования del для удаления столбца
#делаем копию, потому что операция выполняется на месте
copy = sp500.copy()
del copy['BookValue']
copy[:2]

             Sector   Price
Symbol                     
MMM     Industrials  141.14
ABT     Health Care   39.60

In [28]:
#пример использования pop для удаления столбца из датафрейма
#делаем копию
copy = sp500.copy()
#эта строка удалит столбец Sector и возвратит его как серию
popped = copy.pop('Sector')
#столбец Sector удален на месте
copy[:2]

         Price  BookValue
Symbol                   
MMM     141.14     26.668
ABT      39.60     15.573

In [29]:
#и у нас есть сволбец Sector, полученный в результате применения pop
popped[:5]

Symbol
MMM                Industrials
ABT                Health Care
ABBV               Health Care
ACN     Information Technology
ACE                 Financials
Name: Sector, dtype: object

In [30]:
#пример использования drop для столбца из датафрейма
#делаем копию
copy = sp500.copy()
#эта строка вернет новый датафрейм с удаленным столбцом Sector
#копия датафрейма не изменится
afterdrop = copy.drop(['Sector'], axis = 1)
afterdrop[:5]

         Price  BookValue
Symbol                   
MMM     141.14     26.668
ABT      39.60     15.573
ABBV     53.95      2.954
ACN      79.79      8.326
ACE     102.91     86.897

-Присоединение новых строк