# 파이썬 기초 및 라이브러리 소개

------------------------

## 2. 파이썬 라이브러리

### 라이브러리 설치

In [None]:
!pip install numpy

In [None]:
!pip install pandas

In [None]:
!pip install matplotlib

### 라이브러리 사용

In [None]:
import numpy as np
print(np.__version__)

In [None]:
import pandas as pd
print(pd.__version__)

In [None]:
import matplotlib 
print(matplotlib.__version__)

-------------------------------

## numpy

### numpy 배열 기초

#### #넘파이를 사용한 벡터 표현
- **스칼라**(scalar) : 숫자 하나만으로 이루어진 데이터, 보통 $x$와 같이 알파벳 소문자로 표기, 실수 숫자로 $x ∈ R$
- **벡터**(vector) : 여러 숫자가 특정한 순서대로 모여 있는 것. ex)데이터 레코드들. 행(row), 열(columns)을 가지는 형태, $x ∈ R^n$
- **행렬**(array) : 복수 차원을 가지는 데이터 레코드

In [None]:
import numpy as np

x1 = np.array([5.1, 3.5, 1.4 , 0.2])
print(x1)

x2 = np.array([[5.1],[3.5],[1.4],[0.2]])
print(x2)

#### #1차원 배열 만들기

In [None]:
na = np.array([0,1,2,3,4,5,6,7,8,9])
print(na)

In [None]:
na = np.array(range(0,10,1))
print(na)

In [None]:
na = np.arange(10)
print(na)

#### 2차원 배열 

In [None]:
na = np.array([[0,1,2],[3,4,5]])  # 2  x 3 array (괄호의 갯수=차원)
print(na)

#### #3차원 배열

In [None]:
na = np.array([[[0,1,2],[3,4,5]],[[6,7,8],[9,10,11]]])
print(na)

#### #배열의 차원과 크기

In [None]:
na1 = np.array([0,1,2,3,4,5,6,7,8,9])
na2 = np.array([[0,1,2],[3,4,5]])
na3 = np.array([[[0,1,2],[3,4,5]],[[6,7,8],[9,10,11]]])

print(len(na1),len(na2),len(na3))    # 배열의 요소 개수
print(len(na1),len(na2[0]),len(na3[1][0])) 

#### - ndim : 배열의 차원

In [None]:
na3.ndim    #배열의 차원

#### - shape : 배열의 크기

In [None]:
na3.shape   #배열의 크기   (면, 행, 열) matrix

#### - reshape : 배열의 크기 변경

In [None]:
na = np.arange(12)
print(na)

In [None]:
nb = na.reshape(3,4)
print(nb)

In [None]:
nb = na.reshape(3,-1)   # -1 : 3행은 정해지고 열은 자동으로 계산
print(nb)

In [None]:
nb = na.reshape(2,2,-1)  # -1 : 2행 2열은 정해지고 면은 자동으로 계산
print(nb)

In [None]:
nb = na.reshape(2,-1,2)
print(nb)

#### #배열의 인덱싱 & 슬라이싱

In [None]:
na1 = np.array([0,1,2,3,4,5,6,7,8,9])
print(na1[2])
print(na1[1:3])
print(na1[::-1])
print('-'*20)

na2 = np.array([[0,1,2],[3,4,5]])
print(na2[0,0])
print(na2[-1,2])
print(na2[:,1])
print(na2[1,1:])
print('-'*20)

na3 = np.array([[[0,1,2],[3,4,5]],[[6,7,8],[9,10,11]]])
print(na3[0,0])
print(na3[0,1,2])
print(na3[1,1:2,2])

#### #배열의 데이터 타입 : 한가지 데이터 타입만 가질 수 있다

In [None]:
na = np.array([0,1,2,3,4,5,6,7,8,9])
na.dtype

#### - 배열은 한가지 데이터 타입만 가질 수 있다.

In [None]:
na = np.array([0,1,2,3.5,4,5,6,7,8,9])  # 3.5는 실수
print(na)
print(na.dtype)   # float

In [None]:
na = np.array([0,1,2,3.5,'4',5,6,7,8,9])
print(na)
print(na.dtype)   # 유니코드 문자열

#### - 데이터 타입 지정

In [None]:
na = np.array([1, 2, 3], dtype='float')
print(na.dtype)
print(na)

#### #Python의 데이터 형과 대응되는 numpy의 데이터 형

In [None]:
print(int is np.int)
print(float is np.float)
print(float is np.float64)
print(float == 'float64')
print(str == np.unicode)

#### - 모두 동일한 데이터 타입

In [None]:
na = np.array([1, 2, 3], dtype=np.int64) 
print(na.dtype) # int64 

na = np.array([1, 2, 3], dtype='int64') 
print(na.dtype) # int64 

na = np.array([1, 2, 3], dtype='i8') 
print(na.dtype) # int64

In [None]:
na = np.array([1, 2, 3], dtype=np.float64) 
print(na.dtype) # float64 

na = np.array([1, 2, 3], dtype='float64') 
print(na.dtype) # float64 

na = np.array([1, 2, 3], dtype='f8') 
print(na.dtype) # float64

In [None]:
na = np.array([True, False])
#na = np.array([True, False], dtype='int')
print(na, na.dtype)

#### #숫자형 데이터가 취할 수 있는 값 범위 (최소값, 최대값)의 확인 :  iinfo() finfo()

In [None]:
# 정수 int, unit이 취할 수 있는 범위
print(np.iinfo('int64'))

 - 부동소수점 float이 취할 수 있는 범위
 - np.finfo()

In [None]:
print(np.finfo('float'))

#### #데이터 타입 변경 : astype()

In [None]:
na = np.array([0,1,2,3,4])
print(na)
print(na.dtype)

na = na.astype(np.float)
print(na)
print(na.dtype)

### [실습문제] 
2차원 이미지를 1차원 벡터로 변경하기 : - 8 x 8 --> (64 x 1) 

In [None]:
# 사이킷런 라이브러리 설치하기
!pip install scikit-learn

#### 8 x 8 형태의 2차원 행렬(이미지) 출력하기

In [None]:
from sklearn.datasets import load_digits
import matplotlib.pyplot as plt

digits = load_digits()
# print(digits)

samples = [0, 10, 20, 30, 1, 11, 21, 31]  # 선택할 이미지 번호
result= []    # 최종 1차원 데이터를 담을 리스트 변수
for i in range(8):
    result.append(digits.images[samples[i]])
# print(result)
    
# result에 담긴 데이터를 이미지 형태로 그래프로 출력하기
plt.figure(figsize=(8, 2))
plt.suptitle('** load_digits image **')  # 그래프 그룹 제목
for i in range(8):
    plt.subplot(1, 8, i+1)   # 그래프를 1행 8열로 구분하기
    plt.imshow(result[i], interpolation='nearest', cmap=plt.cm.bone_r)
    plt.grid(False)         # 그래프에 격자 모양 출력 X
    plt.xticks([])           # x축 눈금 빈 상태로 보이기
    plt.yticks([])           # y축 눈금 빈 상태로 보이기
    plt.title(f'image: {i+1}')  # 그래프 제목
plt.tight_layout()           # 그래프 설정 값에 맞게 출력
plt.show()

#### 64 x 1 형태의 1차원 벡터로 변형하기

In [None]:
v = []
for i in range(8):
    v.append(d[i].reshape(64,1))  #벡터화
    
plt.figure(figsize=(10, 3))
for i in range(8):
    plt.subplot(1, 8, i+1)
    plt.imshow(v[i], aspect=0.4, interpolation='nearest', cmap=plt.cm.bone_r)
    plt.grid(False)
    plt.xticks([])
    plt.yticks([])
    plt.title(f'vector: {i+1}')
plt.suptitle('Vector image', y=1.05)
plt.tight_layout(w_pad=7)
plt.show()

#### #다양한 배열생성 방법

#### - zeros

In [None]:
np.zeros(5)

In [None]:
np.zeros((2, 3), dtype=int)  # 튜플 타입으로 지정

In [None]:
np.zeros((2, 3, 4))

In [None]:
np.zeros(5, dtype="U4")

#### - zeros((768, 1024))로 0을 채운 후 이미지 화면 띄우기

In [None]:
'''
이 코드를 오류없이 실행하려면 opencv 라이브러리(cv2)를 설치해야한다.
pip install opencv-python
'''

import numpy as np
import cv2

image = np.zeros((768, 1024), np.uint8)  #
# image.fill(200)      # image에 200 을 채우기 -> image[:] = 200

cv2.imshow("Window title", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

#### - ones

In [None]:
np.ones(5)

In [None]:
np.ones((2,3), dtype='i')

#### - zeros_like, ones_like: 다른 배열과 같은 크기의 배열 생성

In [None]:
na = np.ones((2,3), dtype='i')
nb = np.ones_like(na)    # 형태를 복사하고 1로 채움
print(nb)

#### - empty : 배열만 생성 (값을 초기화 하지 않음)

In [None]:
na = np.empty((3,1))  # 배열의 크기가 커지면 배열을 초기화하는데도 시간이 걸린다
print(na)

#### - arange : range와 유사한 명령

In [None]:
na = np.arange(10)
print(na)

In [None]:
na = np.arange(2, 10, 2)  # start, end(포함안됨), step
print(na)

#### - linspace: 선형구간 지정, logspace: 로그구간 지정

In [None]:
na = np.linspace(0, 100, 5, dtype=int)
print(na)

In [None]:
na = np.logspace(0.1, 1, 10)
print(na)

--------------------------------

### 배열의 연산

### [실습문제] 
numpy 배열을 이용하여 아래 z = x + y 를 코딩하기

In [None]:
x = np.arange(1,10001)
y = np.arange(10001, 20001)
z = x + y
z

#### #벡터화 연산

In [None]:
x = np.array([0,1,2,3,4])
print(x+1)

In [None]:
print(2*x)

In [None]:
a = np.array([1,2,3])
b = np.array([10,20,30])
print(2*a + b)

In [None]:
print(a == 2)

In [None]:
print(b > 10)

In [None]:
print((a == 2) & (b > 10))

#### #브로드캐스팅
 - 서로 다른 크기를 가진 두 배열의 사칙 연산을 지원함
 - 크기가 작은 배열을 자동으로 반복 확장하여 크기가 큰 배열에 맞추는 방법

In [None]:
x1 = np.arange(0,5)
x1 = x1.reshape(-1,1)
x2 = x1 + 1
x3 = x2 + 1

arr = np.hstack([x1,x2,x3])
print(arr)
print(x1)
print(arr + x1)

In [None]:
y = np.arange(0,3)
print(arr)
print(y )
print(arr + y)

### [실습문제]
A, B, C 세 회사의 주식은 각각 100만원, 80만원, 50만원이다. 이 주식을 각각 3주 4주 5주를 매수할 때 필요한 금액을 넘파이를 이용하여 구해보시오.

In [None]:
p = np.array([100, 80, 50])
n = np.array([3, 4, 5])

total = np.sum(p * n)
total = p @ n  # 벡터와 행렬의 내적구하는 방법

print(f'총금액: {total} 만원')

----------------------------------------------

### 기술통계 함수

numpy는 아래와 같은 데이터 집합에 대해 간단한 통계를 계산하는 함수(통계량)를 제공한다.
 - **데이터의 개수(count)**
 - **평균(mean, average)**: 평균을 통계용어->표본 평균(sample average, sample mean)
 - **분산(variance)**: 표본 분산, 데이터와 표본 평균간의 거리의 제곱의 평균, 표본 분산이 작으면 데이터가 모여있는 것이고 크면 흩어져 있는 것
 - **표준 편차(standard deviation)** : 표본 분산의 양의 제곱근 값
 - **최댓값(maximum)** : 데이터 중에서 가장 큰 값
 - **최솟값(minimum)** : 데이터 중에서 가장 작은 값
 - **중앙값(median)** : 데이터를 크기대로 정렬하였을 때 가장 가운데에 있는 수
 - **사분위수(quartile)** : 데이터를 가장 작은 수부터 가장 큰 수까지 크기가 커지는 순서대로 정렬하였을 때 1/4, 2/4, 3/4 위치에 있는 수
 
 **x={18,5,10,23,19,−8,10,0,0,5,2,15,8,2,5,4,15,−1,4,−7,−24,7,9,−6,23,−13}**

In [None]:
import numpy as np

x = np.array([18,5,10,23,19,-8,10,0,0,5,2,15,8,2,5,4,15,-1,4,-7,-24,7,9,-6,23,-13])
print(x)

#### - 평균(mean, average)

In [None]:
print( np.mean(x) )

#### - 분산(variance)

In [None]:
print( np.var(x) )

#### - 표준 편차(standard deviation)

In [None]:
print( np.std(x) )

#### - 최대값(maximum)

In [None]:
print( np.max(x) )

#### - 배열의 최대값 인덱스(argmax)
- 동일한 값이 있을 경우 첫 번째 인덱스

In [None]:
print( np.argmax(x) )

#### - 최솟값(minimum)

In [None]:
print( np.min(x) )

#### - 배열의 최소값 인덱스(argmin)
- 동일한 값이 있을 경우 첫 번째 인덱스

In [None]:
print( np.argmin(x) )

#### - 중앙값(median)

In [None]:
print( np.median(x) )

 #### - 사분위수(quartile)
 - 자동 정렬 후 계산

In [None]:
print( np.percentile(x, 0) ) # 0% 해당하는 수

In [None]:
print( np.percentile(x, 25) )  # 25%,  1사분위 수

In [None]:
print( np.percentile(x, 50) )  # 50%, 2사분위 수

In [None]:
print( np.percentile(x, 75) ) # 75%, 3사분위 수

In [None]:
print( np.percentile(x, 100) )  # 100%,  최대값

#### - 히스토그램 그리기

In [None]:
x = np.array([18,5,10,23,19,-8,10,0,0,5,2,15,8,2,5,4,15,-1,4,-7,-24,7,9,-6,23,-13])
print(f'도수: {len(x)}')   # 도수

bins = np.arange(np.min(x), np.max(x),5 )   # 도수분포 구간 
print(f'도수분포 구간: {bins}')   

hist, bins = np.histogram(x, bins)  # 
# hist, bins = np.histogram(x, bins=5)  # 도수를 5개의 구간으로 나눈 수
print(f'히스토그램 구간에 해당하는 도수: {hist}')


In [None]:
import matplotlib.pyplot as plt

plt.hist(x, edgecolor='w')
plt.show()

In [None]:
# 구간의 개수를 직접 지정 : bins=5
import matplotlib.pyplot as plt

plt.hist(x, bins=5, edgecolor='w')
plt.show()

In [None]:
n, bins, patches = plt.hist(x, bins=10, edgecolor='w')
print(n, bins, patches)
plt.show()

### 난수(Random) 

#### #난수 발생

#### - 시드 설정
인수로는 0과 같거나 큰 정수를 넣어준다

In [None]:
np.random.seed(0)

#### - 난수 발생 : rand
 0과 1사이의 균일 분포 난수를 발생

In [None]:
np.random.rand(5)  # 0~1사이 균일분포 5개

#### - randn: 표준 정규 분포:
- 기댓값이 0이고 표준편차가 1인 표준 정규 분포

In [None]:
np.random.randn(5) 

#### - randint: 균일 분포의 정수 난수: 
- random.randint(low, high=None, size=None)

In [None]:
np.random.randint(10,size=5) 

In [None]:
np.random.randint(10, 20, size=5) 

#### - 데이터 순서 임의로 바꾸기 :  shuffle

In [None]:
x = np.arange(10)
print(x)

np.random.shuffle(x)
print(x)

#### - 데이터 샘플링 : choice
이미 있는 데이터 집합에서 일부를 무작위로 선택하는 것을 표본선택 혹은 샘플링(sampling)이라고 한다

numpy.random.choice(a, size=None, replace=True, p=None)
 - a : 배열이면 원래의 데이터, 정수이면 arange(a) 명령으로 데이터 생성
 - size : 정수. 샘플 숫자
 - replace : 불리언. True이면 한번 선택한 데이터를 다시 선택 가능(복원추출/비복원추출)
 - p : 배열. 각 데이터가 선택될 수 있는 확률

In [None]:
np.random.choice(5, 3, replace=False)  # arange(5)에서 3개만 선택

In [None]:
np.random.choice(5, 5, replace=False)  # shuffle 명령과 같다.

In [None]:
np.random.choice(5, 10)  # 반복해서 10개 선택

In [None]:
np.random.choice(5, 10, p=[0.1, 0, 0.3, 0.6, 0])  # 선택 확률을 다르게 해서 10개 선택

#### - 카운트, 정렬
- bincount: 배열 요소들의 각 개수 셈
- unique: 배열 요소 중 중복되지 않은 요소만 개수 셈
- sort: 배열 요소 정렬

In [None]:
x = np.random.choice(5, 10)
print(x)

print( np.bincount(x) ) 
print( np.unique(x) )
print( np.sort(x) )

### [실습문제] 
**1번**: 주사위를 100번 던져서 나오는 숫자의 평균을 구하라.

In [None]:
# 주사위 데이터 100개 생성
x = np.random.randint(1,7, size=100) 
print(x)


# 정렬하기
print( np.sort(x) ) 


# 배열 요소들의 각 개수 세기
print(np.bincount(x))
print('최종 ---------------')
X = list(range(1,7))
Y = np.bincount(x)[1:]
for i, j in zip(X, Y):
    print(f'{i}:{j}번', end='  ')

#### - 평균, 중위수

In [None]:
print(np.mean(x))
# x = np.median(x)

#### - 히스토그램

In [None]:
plt.hist(x, edgecolor='w')
plt.show()

In [None]:
import matplotlib.pyplot as plt
plt.bar(X, Y, edgecolor='w')
plt.show()

**2번**: 가격이 10,000원인 주식이 있다. 이 주식의 일간 수익률(%)은 기댓값이 0%이고 표준편차가 1%인 표준 정규 분포를 따른다고 하자. 
250일 동안의 주가를 무작위로 생성하라


In [None]:
np.random.seed(0)
x = np.random.randn(250) 
x = x + 10000
x.astype(dtype=int)

-------------------------

## #pandas

### Pandas의 데이터 구조


#### 1. Series 객체: 1차원 배열, 1차원 ndarray와 호환
- **pandas.Series**(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

#### 2. DataFrame 객체: 2차원 배열. 서로 다른 자료형을 사용 가능. 행(인스턴스), 열(컬럼, 피쳐(feature))
- **pandas.DataFrame**(data=None, index=None, columns=None, dtype=None, copy=None)

### Series

#### - Series 데이터 정의하기

In [None]:
# Series 데이터 정의하기
data = pd.Series([4, 7, -5, 3])
data

#### - Series 데이터 분리된 정보

In [None]:
# Series 데이터 분리된 정보
print(data.values)
print(data.index)
print(data.dtype)

#### - Series에 인덱스 직접 지정하기

In [None]:
data = pd.Series([4, 7, -5, 3], index=['a','b','c','d'])
data

### DataFrame

#### 예제1) 딕셔너리 데이터를 DataFrame 데이터로 보여주기

In [None]:
import pandas as pd

datas = {2004:[472761,108.2], 2005:[435031,107.8], 2006:[448153,107.5], 
         2007:[493183,106.2], 2008:[465891,106.4], 2009:[444849,106.4],
         2010:[470171,106.9], 2011:[471265,105.7], 2012:[484550,105.7]}

df = pd.DataFrame(datas, index=['출생아수', '출생성비'])
df.columns.name = '년도'
df

#### 예제2)  사이킷런 빌트인 데이터셋 DataFrame 데이터로 보여주기

In [None]:
# 사이킷런 빌트인 데이터셋(sklearn.datasets): 붓꽃
from sklearn.datasets import load_iris

iris = load_iris()

df = pd.DataFrame(iris['data'], columns=iris['feature_names'])
df

#### 예제3)  csv 파일 읽어와서 DataFrame 데이터로 보여주기
- https://www.kaggle.com/datasets/uciml/iris 데이터 다운로드

In [None]:
import pandas as pd

df = pd.read_csv('data/iris.csv')
df

### [실습] : Pandas를 이용한 간단한 데이터 분석 예제
- 별도 코드 확인

-----------------------

## #matplotlib

### matplotlib 사용 예:

In [None]:
import matplotlib.pyplot as plt

# 한글출력 설정
matplotlib.rcParams['font.family'] = 'Malgun Gothic'   

# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (10, 5)  # (가로,세로) 인치 단위
#plt.figure(figsize=(10, 5))

# X축, Y축 데이터
X = list(range(2005,2015,1))
Y = [15,7,2,10,8,5,14,9,18,8]


plt.plot(X, Y, c='r')     #선 그래프
plt.grid(True)
plt.title('년도별 그래프')
plt.show()

### 선 그래프 : 선그래프 나타내기

In [None]:
import matplotlib.pyplot as plt
import pandas as pd

# 한글출력 설정
plt.rcParams['font.family'] = 'Malgun Gothic'  # '맑은 고딕'으로 설정 
plt.rcParams['axes.unicode_minus'] = False     # 그래프에서 (-)숫자표시

# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (10, 5) # 그래프(figure)의 크기, (가로,세로) 인치 단위
plt.rcParams['lines.linewidth'] = 3      # 선 두께
plt.rcParams['axes.grid'] = True 

# DataFrame
data    = [[15,7,2,10,8,5,14,9,18,8]]  
columns = list(range(2005,2015,1))
index   = ['횟수']

#데이터 프레임으로 만들어 
df = pd.DataFrame(data, columns=columns, index=index)
df.columns.name = '연도'

x = df.columns    #x = df.columns
y = df.values[0]  #y = df.values[0]

plt.plot(x, y, 'o', linestyle='dashed', c='b')
plt.title('년도별 그래프')
plt.show()

### 선 그래프 : 2개 선 하나의 그래프에 나타내기

In [None]:
import matplotlib.pyplot as plt

# 한글출력 설정
plt.rcParams['font.family'] = 'Malgun Gothic'   

# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (10, 5)  # (가로,세로) 인치 단위

# X축, Y축 데이터
X1 = list(range(2005,2015,1))
X2 = list(range(2008,2018,1))
Y = [15,7,2,10,8,5,14,9,18,8]

plt.plot(X1, Y, 'o', linestyle='solid', c='c', label='X1')     #선 그래프
plt.plot(X2, Y, 'X', linestyle='solid', c='m', label='X2')     #선 그래프
plt.title('년도별 그래프')
plt.grid(False)
plt.legend()
plt.show()

### 선 그래프 : numpy 데이터

In [None]:
import matplotlib.pyplot as plt
import numpy as np

a = np.array([10,14,19,20,25])
plt.plot(a)

a2 = np.arange(20)
plt.plot(a2)

plt.show() 

#### - 2차 방정식의 그래프 : f(x) = a*x^2 + b, 포물선 방정식

In [None]:
import matplotlib.pyplot as plt
import numpy as np

x = np.arange(-4.5,5,0.5)
y = 2*x**2
plt.plot(x, y)

plt.plot(x, 4*x)
plt.plot(x,-3*x)
plt.show()

### 막대 그래프 나타내기

In [None]:
import matplotlib.pyplot as plt

# 한글출력 설정
plt.rcParams['font.family'] = 'Malgun Gothic'   

# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (10, 5)  # (가로,세로) 인치 단위

# X축, Y축 데이터
X = list(range(2005,2015,1))
Y = [15,7,2,10,8,5,14,9,18,8]

plt.bar(X, Y)     # 막대 그래프
plt.grid(False)
plt.title('년도별 그래프')
plt.show()

In [None]:
plt.barh(X, Y)     # 막대 그래프
plt.grid(False)
plt.title('년도별 그래프')
plt.show()

In [None]:
#그래프 색상 지정
colors = ['r','g','b','c','m','y','k','w']  # 기본색상  # Hexa코드 or CSS컬러사용
plt.bar(X, Y,color=colors)
plt.show()

In [None]:
import matplotlib.pyplot as plt

# 한글출력 설정
plt.rcParams['font.family'] = 'Malgun Gothic'   

# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (10, 5)  # (가로,세로) 인치 단위

# X축, Y축 데이터
X1 = list(range(2005,2015,1))
X2 = [x+3 for x in X1]
Y = [15,7,2,10,8,5,14,9,18,8]

plt.bar(X1, Y)     # 막대 그래프
plt.bar(X2, Y)     # 막대 그래프
plt.title('년도별 그래프')
plt.grid(False)
plt.show()

### 2개 막대 그래프

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 한글출력 설정
plt.rcParams['font.family'] = 'Malgun Gothic'   

# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (10, 5)  

# X축, Y축 데이터
X = list(range(2005,2015,1))
Y1= [15,7,2,10,8,5,14,9,18,8]
Y2= [y+1 for y in Y1]
lable = X
X = np.arange(len(X))

plt.bar(X-0.2, Y1, width=0.4, label='Y1')     # 막대 그래프
plt.bar(X+0.2, Y2, width=0.4, label='Y2')     # 막대 그래프
plt.xticks(X, lable)

plt.title('년도별 그래프')
plt.grid(False)
plt.legend()
plt.show()

In [None]:
# X축, Y축 데이터
X = list(range(2005,2015,1))
Y1= [15,7,2,10,8,5,14,9,18,8]
Y2= [y+1 for y in Y1]

plt.plot(X, Y1, 'o', linestyle='dashed', c='r', label='Y1') # 선 그래프
plt.bar(X, Y2, width=0.4, label='Y2')     # 막대 그래프
plt.xticks(X, lable)

plt.title('년도별 그래프')
plt.grid(False)
plt.legend()
plt.show()

### 원 그래프

In [None]:
import matplotlib.pyplot as plt 
import pandas as pd

idx = ['1학년','2학년','3학년','4학년']
val = [16,12,7,5]
per = [val[x]/sum(val) *100 for x in range(len(val))]

plt.pie(per, autopct='%1.1f%%',
              textprops=dict(color="w"))
plt.title("학년별 동아리 회원수")
plt.legend(idx, title='학년', loc="center right",
          bbox_to_anchor=(1, 0, 0.5, 1))
plt.show()

---------------------------------------------

In [None]:
THE END