In [2]:
import pandas as pd

In [3]:
ice_cream = ["Chocolate", "Vanilla", "Strawberry", "Run Raisin"]

series = pd.Series(ice_cream)

In [4]:
lottery = ["Socholar", 12, True]

pd.Series(lottery)

0    Socholar
1          12
2        True
dtype: object

### CSV 파일을 읽고 Series 데이터로 변환

pd.read_csv 의 옵션 중에 usecols 는 칼럼 명을 선택하며, squeeze 는 True 로 설정할 경우 Series 객체를 반환합니다. 만약에 squeeze 를 False 로 지정할 경우 pandas 의 DataFrame 을 출력합니다.

> squeeze : bool, default False 
>> If the parsed data only contains one column then return a Series.

In [5]:
# squeeze 옵션을 True 혹은 False 로 바꾸어 출력 결과를 확인합니다.
pokemon = pd.read_csv("pokemon.csv", usecols=['Pokemon'], squeeze=True)
print(type(pokemon))
if isinstance(pokemon, pd.core.frame.DataFrame):
    print("Pokemon is DataFrame")
elif isinstance(pokemon, pd.Series):
    print("Pokemon is pd.Series")

<class 'pandas.core.series.Series'>
Pokemon is pd.Series


In [6]:
google = pd.read_csv("google_stock_price.csv", squeeze=True)

### .head 와 .tail 메서드

각 메서드는 인자로 출력할 항목의 개수를 지정할 수 있다.

- head 메서드는 위에서 아래로 5개(Default) 레코드를 출력한다.
- tail 메서드는 아래에서 위로 5개(Default) 레코드를 출력한다.


In [7]:
# google.head()
google.tail(3)

3009    773.18
3010    771.61
3011    782.22
Name: Stock Price, dtype: float64

### Python Built-in Method

|name|desc.|
|:---:|:---:|
|dir| 객체의 어트리뷰트 리스트를 출력|
|sorted| 데이터를 정렬하여 출력한다|
|list| Series 객체를 list 타입으로 변환한다.|
|dict| Series 객체를 dict 타입으로 변환한다.|
|max, min| 데이터의 최대, 최소를 출력한다.|


In [8]:
# 정렬은 오름차순으로 나열한다. 따라서 마지막 데이터가 가장 큰 값이다. 
# max 함수를 통해 출력할 수 있는 최대 크기와 같다.
( sorted(google)[-1] == max(google) ) == True # It should return true

True

### Series Attribute 살펴보기

|attr. name|descr.|
|:---:|:---:|
|Series.values| 데이터만 array 타입으로 출력한다.|
|Series.index| index 만 출력한다. |
|Series.dtype| 데이터 타입을 출력한다. |
|Series.is_unique| 인덱스가 모두 고유하다면 True 그렇지 않다면 False 이다. |
|Series.ndim| 데이터의 차원(1이면 1차원, 2이면 2차원)|
|Series.shape| 행과 열의 갯수로 (row,column) 과 같이 표현한다.|
|Series.name | 열의 이름을 출력한다. `google.name = "Google Stock Pr"` 과 같이 할당이 가능하다. |

In [9]:
pokemon.dtype 
google.dtype

dtype('float64')

In [10]:
pokemon.values

array(['Bulbasaur', 'Ivysaur', 'Venusaur', 'Charmander', 'Charmeleon',
       'Charizard', 'Squirtle', 'Wartortle', 'Blastoise', 'Caterpie',
       'Metapod', 'Butterfree', 'Weedle', 'Kakuna', 'Beedrill', 'Pidgey',
       'Pidgeotto', 'Pidgeot', 'Rattata', 'Raticate', 'Spearow', 'Fearow',
       'Ekans', 'Arbok', 'Pikachu', 'Raichu', 'Sandshrew', 'Sandslash',
       'Nidoran', 'Nidorina', 'Nidoqueen', 'Nidoran♂', 'Nidorino',
       'Nidoking', 'Clefairy', 'Clefable', 'Vulpix', 'Ninetales',
       'Jigglypuff', 'Wigglytuff', 'Zubat', 'Golbat', 'Oddish', 'Gloom',
       'Vileplume', 'Paras', 'Parasect', 'Venonat', 'Venomoth', 'Diglett',
       'Dugtrio', 'Meowth', 'Persian', 'Psyduck', 'Golduck', 'Mankey',
       'Primeape', 'Growlithe', 'Arcanine', 'Poliwag', 'Poliwhirl',
       'Poliwrath', 'Abra', 'Kadabra', 'Alakazam', 'Machop', 'Machoke',
       'Machamp', 'Bellsprout', 'Weepinbell', 'Victreebel', 'Tentacool',
       'Tentacruel', 'Geodude', 'Graveler', 'Golem', 'Ponyta', 'Rapidash'

In [11]:
pokemon.index

RangeIndex(start=0, stop=721, step=1)

In [12]:
pokemon.head(3)

0    Bulbasaur
1      Ivysaur
2     Venusaur
Name: Pokemon, dtype: object

In [13]:
pokemon.is_unique
google.is_unique

False

In [14]:
google.ndim
pokemon.ndim

1

In [15]:
pokemon.shape
google.shape

(3012,)

In [16]:
pokemon.name = 'Newly Assigned Name by gbkim'
pokemon.head(3)

0    Bulbasaur
1      Ivysaur
2     Venusaur
Name: Newly Assigned Name by gbkim, dtype: object

### .sort_values 메서드

pokemon.sort_values 의 경우 데이터를 알파벳 순서로 정렬한다.

메서드 체이닝이 가능한데 아래와같이 코드를 적을 수 있다. 

`ascending = False # [True]` 를 통해 내림차순으로 정렬할 수 있다.

In [18]:
pokemon.sort_values(ascending=False, inplace=True).head(5)

AttributeError: 'NoneType' object has no attribute 'head'

### inplace 파라미터

`inplace=False` 가 기본 옵션이다. 만약에 True 로 변경할 경우 어떠한 객체도 리턴하지 않는다. 객체 자체의 형질을 변환시킨다. 따라서 다음과 같이 이해한다. 

inplace 가 False 인 경우 (Default) operation 마다 새로운 복사본 객체를 리턴한다. 만약 True 인 경우 복사본 객체를 반환하지 않고 operation 이 일어난 객체를 변경한다. 

In [19]:
pokemon.sort_values(ascending=False, inplace=True)
pokemon.head(3)

717     Zygarde
633    Zweilous
40        Zubat
Name: Newly Assigned Name by gbkim, dtype: object

In [23]:
pokemon.sort_index(ascending=True,inplace=True)
pokemon.head(3)

0    Bulbasaur
1      Ivysaur
2     Venusaur
Name: Newly Assigned Name by gbkim, dtype: object

In [26]:
100 in pokemon.index
100 in pokemon

True

In [29]:
"Bulbasaur" in pokemon.values

True

### 인덱스를 이용한 데이터 가져오기

인덱스를 통해 특정 위치의 데이터를 Series 객체로부터 가져올 수 있다.

In [40]:
pokemon[1]
pokemon[[199, 200, 201, 202]]
pokemon[50:]
pokemon[-10:]

711     Bergmite
712      Avalugg
713       Noibat
714      Noivern
715      Xerneas
716      Yveltal
717      Zygarde
718      Diancie
719        Hoopa
720    Volcanion
Name: Newly Assigned Name by gbkim, dtype: object

### 인덱스 레이블을 이용한 데이터 가져오기


In [49]:
pokemon = pd.read_csv("pokemon.csv", index_col="Pokemon", squeeze=True)
pokemon.head(3)
pokemon["Bulbasaur"]

'Grass'

In [51]:
pokemon.get(key = ['Moltres', 'Meowth'])

Pokemon
Moltres      Fire
Meowth     Normal
Name: Type, dtype: object

In [53]:
pokemon.get(key="Digimon", default="this is not a pokemon")

'this is not a pokemon'

In [57]:
pokemon.get(key=["Charizard", "Digimon", "Blah Blah Mon"], default="this is not a pokemon")

Pokemon
Charizard        Fire
Digimon           NaN
Blah Blah Mon     NaN
Name: Type, dtype: object

### Math 메서드를 Series 객체에 적용하기

In [62]:
# len(google)
google.head(3)

0    50.12
1    54.10
2    54.65
Name: Stock Price, dtype: float64

In [65]:
google.sum() # 합계
google.mean() # 평균

334.31009296148744

In [67]:
google.mean() == google.sum() / google.count()

True

In [68]:
google.std() # 표준편차

173.18720477113106

In [71]:
google.min() # 최소값

49.950000000000003

In [74]:
google.median() # 중간값 

283.315

In [80]:
google.mode()

0    291.21
dtype: float64

In [82]:
google.describe() # 

count    3012.000000
mean      334.310093
std       173.187205
min        49.950000
25%       218.045000
50%       283.315000
75%       443.000000
max       782.220000
Name: Stock Price, dtype: float64

In [84]:
google.idxmax() # 최대 값인 인덱스를 찾아준다.

3011

In [88]:
min_idx = google.idxmin() # 최소 값인 인덱스를 찾아준다.
google[min_idx] == google.min() # 비교하면 결국은 True

True

In [90]:
google[min_idx]

49.950000000000003

In [92]:
pokemon.value_counts()

Water       105
Normal       93
Grass        66
Bug          63
Psychic      47
Fire         47
Rock         41
Electric     36
Ground       30
Dark         28
Poison       28
Fighting     25
Dragon       24
Ice          23
Ghost        23
Steel        22
Fairy        17
Flying        3
Name: Type, dtype: int64

In [95]:
pokemon.value_counts().sum() == pokemon.count()

True

In [98]:
# 포켓몬 속성에 대한 카운트 중에 카운트가 93 인 것과 비교한다.
# 
pokemon.value_counts() == 93

Water       False
Normal       True
Grass       False
Bug         False
Psychic     False
Fire        False
Rock        False
Electric    False
Ground      False
Dark        False
Poison      False
Fighting    False
Dragon      False
Ice         False
Ghost       False
Steel       False
Fairy       False
Flying      False
Name: Type, dtype: bool

### .apply() 메서드 활용하기



In [101]:
def classify_performance(number):
    if number < 300:
        return "OK"
    elif number >= 300 and number < 650:
        return "Satisfactory"
    else:
        return "Incredible!"

In [114]:
# 선언한 함수를 전달하니 분류가 되어서 튀어나온다.
# 그리고 통계를 매길 수 있다.
google.apply(classify_performance).value_counts().sort_values(ascending=True)

Incredible!      216
Satisfactory    1075
OK              1721
Name: Stock Price, dtype: int64

In [118]:
google.apply(lambda stock_price : stock_price +1).head(3) # 모든 데이터에 대해 1 씩 더한다

0    51.12
1    55.10
2    55.65
Name: Stock Price, dtype: float64

### .map 메서드 활용하기



In [120]:
pokemon_names = pd.read_csv("pokemon.csv", usecols=["Pokemon"], squeeze=True)
pokemon_names.head(3)

0    Bulbasaur
1      Ivysaur
2     Venusaur
Name: Pokemon, dtype: object

In [124]:
pokemon_types = pd.read_csv("pokemon.csv", index_col = "Pokemon", squeeze=True)
pokemon_types.head(3)

Pokemon
Bulbasaur    Grass
Ivysaur      Grass
Venusaur     Grass
Name: Type, dtype: object

In [127]:
pokemon_names.map(pokemon_types).head(3)

0    Grass
1    Grass
2    Grass
Name: Pokemon, dtype: object

In [134]:
pokemon_names = pd.read_csv("pokemon.csv", usecols=["Pokemon"], squeeze=True)
pokemon_types = pd.read_csv("pokemon.csv", index_col = "Pokemon", squeeze=True).to_dict()

In [135]:
pokemon_names.head()


0     Bulbasaur
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Pokemon, dtype: object

In [137]:
pokemon_types

{'Abomasnow': 'Grass',
 'Abra': 'Psychic',
 'Absol': 'Dark',
 'Accelgor': 'Bug',
 'Aegislash': 'Steel',
 'Aerodactyl': 'Rock',
 'Aggron': 'Steel',
 'Aipom': 'Normal',
 'Alakazam': 'Psychic',
 'Alomomola': 'Water',
 'Altaria': 'Dragon',
 'Amaura': 'Rock',
 'Ambipom': 'Normal',
 'Amoonguss': 'Grass',
 'Ampharos': 'Electric',
 'Anorith': 'Rock',
 'Arbok': 'Poison',
 'Arcanine': 'Fire',
 'Arceus': 'Normal',
 'Archen': 'Rock',
 'Archeops': 'Rock',
 'Ariados': 'Bug',
 'Armaldo': 'Rock',
 'Aromatisse': 'Fairy',
 'Aron': 'Steel',
 'Articuno': 'Ice',
 'Audino': 'Normal',
 'Aurorus': 'Rock',
 'Avalugg': 'Ice',
 'Axew': 'Dragon',
 'Azelf': 'Psychic',
 'Azumarill': 'Water',
 'Azurill': 'Normal',
 'Bagon': 'Dragon',
 'Baltoy': 'Ground',
 'Banette': 'Ghost',
 'Barbaracle': 'Rock',
 'Barboach': 'Water',
 'Basculin': 'Water',
 'Bastiodon': 'Rock',
 'Bayleef': 'Grass',
 'Beartic': 'Ice',
 'Beautifly': 'Bug',
 'Beedrill': 'Bug',
 'Beheeyem': 'Psychic',
 'Beldum': 'Steel',
 'Bellossom': 'Grass',
 'Bellsp

In [138]:
# 두개의 다른 타입의 오브젝트를 mapping 한다.
pokemon_names.map(pokemon_types)

0         Grass
1         Grass
2         Grass
3          Fire
4          Fire
5          Fire
6         Water
7         Water
8         Water
9           Bug
10          Bug
11          Bug
12          Bug
13          Bug
14          Bug
15       Normal
16       Normal
17       Normal
18       Normal
19       Normal
20       Normal
21       Normal
22       Poison
23       Poison
24     Electric
25     Electric
26       Ground
27       Ground
28       Poison
29       Poison
         ...   
691       Water
692       Water
693    Electric
694    Electric
695        Rock
696        Rock
697        Rock
698        Rock
699       Fairy
700    Fighting
701    Electric
702        Rock
703      Dragon
704      Dragon
705      Dragon
706       Steel
707       Ghost
708       Ghost
709       Ghost
710       Ghost
711         Ice
712         Ice
713      Flying
714      Flying
715       Fairy
716        Dark
717      Dragon
718        Rock
719     Psychic
720        Fire
Name: Pokemon, Length: 7