# 아나콘다 및 주피터 노트북
---
- 아나콘다는 머신러닝이나 데이터 과학 작업을 유용하게 할 수 있도록 기본적으로 패키지들이 깔려있다.

## 주피터 노트북
---
- 웹 브라우저 상에서 개발을 할 수 있는 도구이며, 코드를 cell 단위로 묶어서 실행하고 그래프나 표, 그리고 이미지나 영상 등을 쉽게 볼 수 있어서 특히 데잍터 관련 작업을 할 때 많이 활용한다  

### 특징
---
1. 코드를 cell 단위로 작성 및 실행
1. 마크다운을 통한 문서화
1. 그래프나 표 등을 실시간으로 확인
1. html, pdf등 파일로 저장

### 데이터 관련 작업시 파이썬 단점
---
- 별도로 패키지들을 하나씩 설치해야 한다.
- 버전에 따라 호환성 문제가 일어날 수 있다.

### 사전 학습 자료
[Pandas 홈페이지](https://pandas.pydata.org/docs/user_guide/index.html)  
[matplotlib 홈페이지](https://matplotlib.org/stable/tutorials/index)  
[마크다운 사용법](https://gist.github.com/ihoneymon/652be052a0727ad59601)  

In [1]:
%%HTML
<iframe width="640" height="360" src="https://www.youtube.com/embed/PjhlUzp_cU0" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>

![image.png](attachment:image.png)

- PrintScreen 누르고 ctrl + v 를 사용하여 쉽게 이미지를 넣을 수 있다.
- 이미지 저장 후 삽입을 통해서 넣을 수 있다.

## 파이썬 기본 문법

In [2]:
print("Hello world")

Hello world


In [3]:
print("안녕")

안녕


- In[숫자] In 안에 숫자는 실행 순서를 나타낸다
- 실행 순서가 바뀌면 값이 변경될 수 있다.
- 동작 중이면 *로 표시된다

### 주피터 노트북 단축기

In [4]:
print("ctrl + Enter : 현재 cell 실행")

ctrl + Enter : 현재 cell 실행


In [5]:
print("Shift + Enter : 현재 cell 실행 후 다음 cell 선택")

Shift + Enter : 현재 cell 실행 후 다음 cell 선택


In [6]:
print("Alt + Enter : 현재 cell 실행 후 다음 위치에 cell 산입")

Alt + Enter : 현재 cell 실행 후 다음 위치에 cell 산입


In [7]:
print("d + d : cell 삭제")

d + d : cell 삭제


In [8]:
print(1)
print(2)
print(3)

SyntaxError: invalid syntax (Temp/ipykernel_25364/3091867121.py, line 3)

- 오류가 발생하면 바로 알 수 있다.

### 주피터 노트북 모듈 사용방법

In [None]:
import random
print(random.randint(1, 45))

- 모듈에 대해서 어떤 함수가 있는지 모를 떄 Tap 누르면 목록이 나온다
- 함수 설명이 필요하다면 random.randint? 끝에 ?를 붙이면 알 수 있다.
- 소스코드를 같이 보고 싶다면 ??를 붙이면 알 수 있다.

## 시각화 예제1 : 그래프
---
- matplotlib를 이용하면 다양한 그래프를 그릴 수 있으며 결과를 바로 확인할 수 있다.

In [None]:
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots()  # Create a figure containing a single axes.
ax.plot([1, 2, 3, 4], [1, 4, 2, 3]);  # Plot some data on the axes.

## 시각화 예제2 : 그래프
---
- pandas는 복잡한 데이터를 분석할 떄 아주 유용하다.

In [None]:
import pandas as pd
import numpy as np
import matplotlib as mpl

df = pd.DataFrame([[38.0, 2.0, 18.0, 22.0, 21, np.nan],[19, 439, 6, 452, 226,232]],
                  index=pd.Index(['Tumour (Positive)', 'Non-Tumour (Negative)'], name='Actual Label:'),
                  columns=pd.MultiIndex.from_product([['Decision Tree', 'Regression', 'Random'],['Tumour', 'Non-Tumour']], names=['Model:', 'Predicted:']))
df.style