# Pandas의 기본 사용법

- 시리즈 (Series)\
시리즈는 인덱스와 값으로 구성된다.

In [1]:
import pandas as pd

array = pd.Series(['사과', '바나나', '당근'], index = ['a', 'b', 'c'])

print(array)
print(array['a'])

a     사과
b    바나나
c     당근
dtype: object
사과


데이터 프레임
- 다수의 시리즈(Series)를 모아 처리
- 표 형태로 데이터를 손쉽게 출력하고자 할 때 사용

In [2]:
import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근'
}
frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7
}

word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)

summary = pd.DataFrame({
    'word' : word,
    'frequency' : frequency
})

print(summary)

       word  frequency
Apple    사과          3
Banana  바나나          5
Carrot   당근          7


시리즈의 연산
- 시리즈를 서로 연산하여 새로운 시리즈를 만들 수 있다.

In [16]:
import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근'
}
frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7
}
importance_dict = {
    'Apple' : 3,
    'Banana' : 2,
    'Carrot' : 1
}

word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)
importance = pd.Series(importance_dict)

summary = pd.DataFrame({
    'word' : word,
    'frequency' : frequency,
    'importance' : importance
    })

score = summary['frequency'] * summary['importance']
summary['score'] = score
#summary.loc[:,'score'] = score
print(summary)

       word  frequency  importance  score
Apple    사과          3           3      9
Banana  바나나          5           2     10
Carrot   당근          7           1      7


데이터 프레임의 슬라이싱

In [9]:
import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근',
    'Durian' : '두리안'
}
frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7,
    'Durian' : 2
}
importance_dict = {
    'Apple' : 3,
    'Banana' : 2,
    'Carrot' : 1,
    'Durian' : 1
}

word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)
importance = pd.Series(importance_dict)

summary = pd.DataFrame({
    'word' : word,
    'frequency' : frequency,
    'importance' : importance
})

print(summary)
#이름 기준으로 슬라이싱
print(summary.loc['Banana': 'Carrot', 'importance':])
#인덱스 기준으로 슬라이싱
print(summary.iloc[1:3, 2:])

       word  frequency  importance
Apple    사과          3           3
Banana  바나나          5           2
Carrot   당근          7           1
Durian  두리안          2           1
        importance
Banana           2
Carrot           1
        importance
Banana           2
Carrot           1


데이터 프레임의 연산

In [13]:
import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근',
    'Durian' : '두리안'
}
frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7,
    'Durian' : 2
}
importance_dict = {
    'Apple' : 3,
    'Banana' : 2,
    'Carrot' : 1,
    'Durian' : 1
}

word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)
importance = pd.Series(importance_dict)

summary = pd.DataFrame({
    'word' : word,
    'frequency' : frequency,
    'importance' : importance
})

print(summary)

summary.loc['Apple', 'importance'] = 5
summary.loc['Elderberry'] = ['엘더베리', 5, 3]
print(summary)

       word  frequency  importance
Apple    사과          3           3
Banana  바나나          5           2
Carrot   당근          7           1
Durian  두리안          2           1
            word  frequency  importance
Apple         사과          3           5
Banana       바나나          5           2
Carrot        당근          7           1
Durian       두리안          2           1
Elderberry  엘더베리          5           3


엑셀로 내보내기/불러오기

In [17]:
import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근',
    'Durian' : '두리안'
}
frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7,
    'Durian' : 2
}
word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)

summary = pd.DataFrame({
    'word' : word,
    'frequency' : frequency
})

summary.to_csv("summary.csv", encoding='utf-8-sig')
saved = pd.read_csv("summary.csv", index_col=0)
print(saved)

       word  frequency
Apple    사과          3
Banana  바나나          5
Carrot   당근          7
Durian  두리안          2
