In [None]:
# 해시탐색법

# 선형탐색이나 이진탐색의 전제 조건은 어떤 데이터가 어떤 요소 (index)에 있는지
# 전혀 모르는 상태에서 검색을 시작한다는 것
# 그러나 해시 탐색법은 데이터의 '내용'과 저장한 곳의 '요소'를 미리 저장할 때
# 연계를 해서 극히 (***) 짧은 시간 안에 탐색할 수 있도록 고안된 알고리즘임

# 24인 데이터는 첨자 24에 넣어두고 36인 데이터는 첨자 36에 넣어두는 것
# 단지 2개의 데이터를 보관하는데 최소한 37개 요소의 배열이 필요함 > 낭비가 심해짐

# 해시탐색법의 특징은 나중에 데이터를 쉽게 찾도록 보관하는 단계에서 사전 준비를 해두는 것

# 가장 알기 쉬운 방법은 데이터를 데이터의 숫자와 같은 방에 넣어두는 것
# 하지만 메모리의 불필요한 누수가 커짐
# 따라서, 먼저 방을 7개를 준비함 (index 0 - 6)

# index : 0  1  2  3  4  5  6
# data : 11 15 23 26
# 11 % 7 (index의 수) = 4
# 15 % 7 (index의 수) = 1
# 23 % 7 (index의 수) = 2
# 26 % 7 (index의 수) = 5
# index : 0  1  2  3  4  5  6
# data :    15 23    11 26

# 제대로 흩어진 상태가 되었음. 각각의 데이터를 나머지 값과 같은 번호의 방에 넣어 둠.
# 데이터를 넣은 방의 번호를 계산한 식은 해시값 > 방번호 = 데이터 % 7 (방의 개수) < 해시 함수

# 해시 탐색법으로 데이터 찾는 방법
# 11이라는 데이터를 찾기 위해서는 찾을 때도 저장할 때 사용했던 해시 함수를 다시 사용함
# 저장할 때의 계산식은 '데이터 % 7' 이고 해시 값은 4이며 인덱스 번호를 나타냄
# 따라서 해시 탐색법을 사용하면 단 한 번의 계산으로 찾고자 하는 공을 찾을 수 있음
# 검색 시간을 놀라울 정도로 단축시킬 수 있다는 큰 장점이 있음

In [None]:
# 해시 함수로 데이터를 보관하는 알고리즘
# 해시 함수는 데이터의 저장소 첨자를 계산함
# 저장소의 첨자가 겹치는 것을 충돌이라고 함
# 충돌이 발생하면 옆의 빈 요소에 데이터를 보관함

# 1. 배열은 2개 준비한다

# - 첫 번째 배열은 데이터의 개수만큼 준비 (임시 배열) arrayD
#  0  1  2  3  4  5  6
# 12 25 36 20 30  8 42

# - 두 번째 배열은 11개를 준비하여 0으로 초기화 (실제 저장될 배열) array H
#  0  1  2  3  4  5  6  7  8  9  10
#  0  0  0  0  0  0  0  0  0  0   0

# arrayD에 첫 번째 요소부터 순차적으로 해시값을 계산하여 arrayH로 저장
# 지금은 요소수가 11개이므로 11로 나눈 나머지를 계산하여 저장함

# 해시값 = arrayD데이터 % 11 (해시 함수)

# 첫 번째 arrayD[0] = 12 를 해시함수에 넣어 계산하면 해시값은 1

# 0  1  2  3  4  5  6  7  8  9  10
# 0 12  0  0  0  0  0  0  0  0   0

# 이미 다른 데이터가 할당 되어 있는지 확인하여 비어있으면 대입
# 왜 확인이 필요하느냐는 다음에 자세히 나오지만 요소가 많으면 해시값이
# 즉 나머지 값이 우연히 일치하는 경우가 많아 이미 데이터가 저장되어있을 가능성이 높음

# 요소가 비어 있는지 확인하려면 0이 있는지 확인하면 됨

# arrD[0] 이후의 데이터들도 마찬가지로 같은 절차를 사용하여 데이터들을 순차적으로 대입

# 종료 조건도 필요함 i의 최대값은 6이므로 7이 되었을 때 반복을 종료하도록 함

# arrD[2] 의 데이터 36의 해시값은 3, 이미 데이터 25가 존재하고 있음 > 충돌 발생
# 0  1  2  3  4  5  6  7  8  9  10
# 0 12  0 25  0  0  0  0  0  0   0 < 36 들어갈 자리가 25로 차있음

# 해시탐색법에서는 이러한 해시값이 이미 존재하는 것을 '충돌' synonym 이라고 칭함

# 이러한 충돌이 발생하는 경우 즉 arrH[k] = 0이 아닌 No의 경우 처리를 생각해야 함
# 해결책 : 바로 옆의 요솩 비어 있으면 거기 저장함
# arrH[k] 옆의 요소는 arrH[K + 1], k값을 하나 증가시켜 0인지의 여부를 확인

In [None]:
# 충돌에 대하여
# 충돌이 너무 자주 일어나면 추가적인 처리가 많이 필요하게 됨
# 해시탐색법의 장점이 무색해짐
# 충돌이 일어나지 않게 하려면 데이터가 많이 흩어지도록 해야함
# 요소가 많아질수록 충돌의 가능성은 적어지지만메모리의 사용량이 늘어나
# 알고리즘의 효율성이 저하되는 문제점이 발생
# 탐색 처리의 속도를 유지하는 것과 가능한 메모리를 적게 사용하는 요소의 수는
# 일반적으로 저장 데이터 수의 1.5배에서 2배라고 알려져 있음

In [None]:
# 0  1  2  3  4  5  6  7  8  9  10
# 0 12  0 25 36  0  0  0  0 20   0 

# 0  1  2  3  4  5  6  7  8  9  10
# 0 12  0 25 36  0  0  0 30 20   0 
#                                  < 8 충돌 발생

# 0  1  2  3  4  5  6  7  8  9  10
# 0 12  0 25 36  0  0  0 30 20   0 
#                                   < 9 충돌 발생

# 0  1  2  3  4  5  6  7  8  9  10
# 0 12  0 25 36  0  0  0 30 20   8

# 마지막 요소인 42는 해시값이 9다. arrH[9]에 이미 데이터가 존재하고
# arrH[10]에도 이미 데이터가 존재 그리고 그 이상의 값은 없음

# 좀 더 간단한 방법 사용: k를 하나 증가시키는 처리 k + 1 > k의 
# k + 1을 arrH의 요소수로 나눠 그 나머지를 k에 대입하는 방법
# 즉, (k + 1) % 11 > k

# k값이 0에서 10인 경우에는 11로 나눌 필요가 없지만 k값이 10을 초과하는 경우의
# 처리를 별도로 준비하는 것은 비효율적이기 때문에 두 경우 모두 11로 나누는 처리를 거친 값을 대입
# k값이 0에서 10인 경우에는 이 과정을 거친 후에도 원래 값과 같음
# k가 10을 넘어 11이 된다면 나머지가 0이 돼서 (11 % 11 = 0) 맨 앞 요소에 다시 할당할 수 있는 장소를 찾게 됨
# 만약 arrH[0]에도 이미 데이터가 있다면 k 12 % 11 = 1이 되어 바로 옆 칸을 확인하는 처리를 수행하게 됨
# 언젠가는 빈칸을 찾을 수 있게 됨

# 0  1  2  3  4  5  6  7  8  9  10
#42 12  0 25 36  0  0  0 30 20   8

# 마지막 데이터 42를 할당하고 i가 7이 되어 반복처리를 종료하고 끝남
# 이제 arrD에 있는 7개의 데이터가 모두 arrH의 요소에 저장되었음

In [None]:
# 해시 탐색법으로 데이터를 탐색하는 알고리즘

#  0  1  2  3  4  5  6  7  8  9  10
# 42 12  0 25 36  0  0  0 30 20   8

# 찾을 때도 저장할 때 사용한 것과 같은 해시함수를 사용하여 위치를 산출

# 해시값 = 데이터값 % 11
#            12    % 11 = 1 arrH[1]

In [None]:
# 저장할 때 충돌이 일어났던 36을 검색해보자.
# x에 36을 입력하면 해시 값은 3을 얻게 됨
# arrH[3]에는 이미 25로 다른 데이터가 존재하고 있음
# 이것은 찾고 있는 데이터 36이 아니기 때문에 이럴 경우 저장했을 때와 마찬가지로
# k의 값을 하나 증가시켜 옆 자리를 찾게 됨
# 저징할 때 사용한 k가 10을 넘어도 문제가 생기지 않도록 미리 (k + 1) % 11 을 사용함

In [None]:
# 검색하고 있는 데이터가 존재하지 않을 경우

# 현재는 찾는 데이터가 존재하지 않는 경우 무한루프가 발생하게 됨
# 탐색 데이터가 발견되지 않으면 k값을 점점 증가하다가 다시 처음부터 검색하고 이 과정이 계속 반복됨
# 그러면 과연 어디까지 찾아야 존재하지 않는다고 말할 수 있을까?
# 바로 데이터가 보관되지 않은 요소(값)이 나왔을 때까지이다. 

# 만약 데이터가 존재한다면 설사 저장할 때 충돌이 발생하여 어딘가 다른 요소에 저장되어 있다 하더라도
# 저장 위치를 찾을 때까지의 사이에 데이터가 0인 요소는 절대 있을 수 없음

In [None]:
# 예외처리 고급

# 프로그램을 개발하다보면 수많은 오류들을 만나게 됨
# 또한 처음 프로그램을 개발했을 때 모든 오류를 예측하고 처리할 수는 없음
# 개발이 완료된 후에도 예측하지 못한 오류들이 계속 발생되기 대문에 
# 유지보수가 필요함

try : 
    예외 발생 가능성 있는 구문
except 예외의 종류 as e(예외 객체를 활용할 변수 이름):
    예외가 발생했을 때 실행할 구문

예외가 발생하면 예외 정보가 생기고 예외 정보는 예외 객체에 저장되어 생성됨

In [1]:
try:
    num = int(input('정수를 입력하세요 >>'))

    print('입력한 정수 :',num)

except Exception as e:
    print('type(exception) :', type(e))
    print('exception :', e)

# 만약 큰 규모의 웹 서비스를 구축하게 된다면 다양한 예외가 분명히 발생함
# 예외가 발생할 때 그 정보를 수집하면 이후 프로그램을 유지 및 보수하는 데 큰 도움이 됨

type(exception) : <class 'ValueError'>
exception : invalid literal for int() with base 10: 'abc'


In [6]:
# 예외 구분하기

list = [52,273,32,72,100]

try:
    num = int(input('정수 입력 >>> '))
    print(f'{num}번째 요소 : {list[num]}')
    
#except Exception as e:
#    print('type(exception :', type(e))
#    print('exception', e)

    # 코드의 내부에서는 이처럼 여러 가지의 예외가 발생할 수 있음
    # 파이썬은 예외들을 구분하여 처리할 수 있음

except ValueError as e:
    print('정수를 입력하셔야만 합니다.')
    print('exception :', e)

except IndexError as e:
    print('리스트 크기보다 큰 수는 입력하실 수 없습니다.')
    print('exception', e)

except Exception as e:
    print('미리 파악하지 못한 예외 발생')
    print(type(e), e)
    # 나머지의 모든 예기치 못한 예외를 여기서 처리
    # 너무 치명적인 문제인데도 프로그램 강제 종료 되지 않게 만들면 
    # 그것으로 또 다른 더욱 큰 문제를 발생시킬 수도 있으므로 상황에 맞게 대처할 수 있어야 함
    # 큰 규모의 프로그램을 개발할 때는 '예외처리로 떡칠한다'라고 표현할 정도로 예외 처리를 많이 사용하게 됨
    # 예외처리에서 가장 중요한 것은 '이 코드에서 어떤 예외가 발생할 것인가?'를
    # 미리 잘 예측하는 것

4번째 요소 : 100


In [None]:
# 예외를 강제로 발생시키기, raise

num = int(input('정수 입력 >>> '))

if num > 0:
    raise NotImplementedError
else:
    raise NotImplementedError

In [None]:
# 모듈
# 여러 변수와 함수를 가지고 있는 집합체
# 파이썬에 기본적으로 내장되어 있는 모듈을 '표준 모듈'이라고 부름
# 다른 사람이 만들어서 공개한 모듈을 '외부 모듈'이라고 부름

In [13]:
# math 모듈 - 수학과 관련된 기능들을 가진 모듈

import math

print(math.sin(1))
print(math.cos(1))
print(math.tan(1))

# ceil() 올림
# floor() 내림
# round() 반올림


0.8414709848078965
0.5403023058681398
1.5574077246549023


In [14]:
#from math import sin, cos, tan 특정 메서드들만 가지고 와서 사용
from math import * # 모든 매서드 다 가져와서 사용

print(sin(1))
print(cos(1))
print(tan(1))

0.8414709848078965
0.5403023058681398
1.5574077246549023


In [16]:
import math as m

print(m.sin(1))
print(m.tan(1))
print(m.cos(1))

0.8414709848078965
1.5574077246549023
0.5403023058681398


In [19]:
# pip install 모듈명
# !pip install selenium
import selenium

In [42]:
# random 모듈 - 랜덤한 숫자를 생성해주는 모듈
import random
print('# random 모듈')

# 기본적으로 0.0에서 1.0 사이의 float으로 난수를 발생시킴
print('- random() :', random.random())

# uniform(min, max) : 지정한 범위 사이의 float을 발생시킴
print('- uniform (10, 20) :', random.uniform(10,20))

# randrange() : 지정한 범위의 int를 발생시킴
print('- randrange (10, 20) :', random.randrange(10,20))
print('- randrange (10) :', random.randrange(10))

# choice(list) : 리스트 내부에 있는 요소를 랜덤하게 선택
print('- choice([1,2,3,4,5]) :', random.choice([1,2,3,4,5]))

# shuffle(list) : 리스트의 요소들을 랜덤하게 섞어줌
# shuffle은 파괴적 처리를 수행하기 때문에 먼저 섞는 작업을 하고 나서 출력함
list = ['1','2','3','4','5']
random.shuffle(list)
print('- shuffle([1,2,3,4,5]) :',list) 

# sample(list, k = 숫자) : 리스트의 요소 중 k개를 랜덤하게 뽑아줌
print('- sample([1,2,3,4,5],2) :', random.sample([1,2,3,4,5],2))

# random 모듈
- random() : 0.04586039447650225
- uniform (10, 20) : 14.720142725900178
- randrange (10, 20) : 15
- randrange (10) : 8
- choice([1,2,3,4,5]) : 3
- shuffle([1,2,3,4,5]) : ['1', '2', '4', '5', '3']
- sample([1,2,3,4,5],2) : [1, 4]


In [49]:
# 여러분은 로또 당첨 번호 추천 인공지능 시스템을 개발하였다.
# 매주 5개의 1등 완전 당첨 추천 번호 판매를 시작한다.
# 코드를 실행하면 5개의 로또 번호 세트를 보여주는 프로그램을 작성하시오.

import random

li = [0,0,0,0,0,0]
for i in range(5):
    for j in range(6):
        li[j] = random.randrange(1,47)

    print(li)
    li = [0,0,0,0,0,0]

[41, 29, 35, 17, 25, 16]
[24, 25, 12, 4, 41, 29]
[3, 45, 31, 46, 45, 6]
[10, 34, 27, 17, 29, 46]
[46, 46, 15, 35, 44, 8]


In [53]:
# os 모듈

import os

print('현재 운영체제 :', os.name)
print('현재 작업폴더 :', os.getcwd())
print('현재 폴더내부 :', os.listdir())

os.mkdir('hello')
print('현재 폴더 내부 :', )

현재 운영체제 : nt
현재 작업폴더 : c:\Users\rlawl\OneDrive - 동국대학교\문서\GitHub\ai
현재 폴더내부 : ['.git', '.ipynb_checkpoints', 'Day01.ipynb', 'Day01.txt', 'Day02.ipynb', 'Day03.ipynb', 'Day04.ipynb', 'Day05.ipynb', 'Day06.ipynb', 'Day07.ipynb', 'README.md', '파이썬 - 알고리즘.txt']


In [54]:
# urllib 크롤링 등 웹 접근 라이브러리

from urllib import request

target = request.urlopen('https://www.naver.com')
output = target.read()

print(output)

b'\n<!doctype html>                          <html lang="ko" data-dark="false"> <head> <meta charset="utf-8"> <title>NAVER</title> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=1190"> <meta name="apple-mobile-web-app-title" content="NAVER"/> <meta name="robots" content="index,nofollow"/> <meta name="description" content="\xeb\x84\xa4\xec\x9d\xb4\xeb\xb2\x84 \xeb\xa9\x94\xec\x9d\xb8\xec\x97\x90\xec\x84\x9c \xeb\x8b\xa4\xec\x96\x91\xed\x95\x9c \xec\xa0\x95\xeb\xb3\xb4\xec\x99\x80 \xec\x9c\xa0\xec\x9a\xa9\xed\x95\x9c \xec\xbb\xa8\xed\x85\x90\xec\xb8\xa0\xeb\xa5\xbc \xeb\xa7\x8c\xeb\x82\x98 \xeb\xb3\xb4\xec\x84\xb8\xec\x9a\x94"/> <meta property="og:title" content="\xeb\x84\xa4\xec\x9d\xb4\xeb\xb2\x84"> <meta property="og:url" content="https://www.naver.com/"> <meta property="og:image" content="https://s.pstatic.net/static/www/mobile/edit/2016/0705/mobile_212852414260.png"> <meta property="og:description" content="\xeb\x84\xa4\xec\x9d\xb4\xeb\xb2

In [1]:
# 외부 모듈
# 파이썬이 기본적으로 제공해주는 것이 아니라 누군가가 만들어서 배포하는 모듈을 말함

# !pip install pybithumb
import pybithumb
import time

while True:
    print(pybithumb.get_current_price('BTC'))
    time.sleep(1)

52835000.0
52835000.0
52835000.0
52813000.0
52813000.0
52813000.0


In [3]:
import pybithumb

tickers = pybithumb.get_tickers()
print(tickers)

['BTC', 'ETH', 'LTC', 'ETC', 'XRP', 'BCH', 'QTUM', 'BTG', 'EOS', 'ICX', 'TRX', 'ELF', 'OMG', 'KNC', 'GLM', 'ZIL', 'WAXP', 'POWR', 'LRC', 'STEEM', 'STRAX', 'ZRX', 'REP', 'XEM', 'SNT', 'ADA', 'CTXC', 'BAT', 'WTC', 'THETA', 'LOOM', 'WAVES', 'TRUE', 'LINK', 'ENJ', 'VET', 'MTL', 'IOST', 'TMTG', 'QKC', 'ATOLO', 'AMO', 'BSV', 'ORBS', 'TFUEL', 'VALOR', 'CON', 'ANKR', 'MIX', 'CRO', 'FX', 'CHR', 'MBL', 'MXC', 'FCT', 'TRV', 'DAD', 'WOM', 'SOC', 'BOA', 'FLETA', 'SXP', 'COS', 'APIX', 'EL', 'BASIC', 'HIVE', 'XPR', 'VRA', 'FIT', 'EGG', 'BORA', 'ARPA', 'CTC', 'APM', 'CKB', 'AERGO', 'ANW', 'CENNZ', 'EVZ', 'CYCLUB', 'SRM', 'QTCON', 'UNI', 'YFI', 'UMA', 'AAVE', 'COMP', 'REN', 'BAL', 'RSR', 'NMR', 'RLC', 'UOS', 'SAND', 'GOM2', 'RINGX', 'BEL', 'OBSR', 'ORC', 'POLA', 'AWO', 'ADP', 'DVI', 'GHX', 'MIR', 'MVC', 'BLY', 'WOZX', 'ANV', 'GRT', 'MM', 'BIOT', 'XNO', 'SNX', 'SOFI', 'COLA', 'NU', 'OXT', 'LINA', 'MAP', 'AQT', 'WIKEN', 'CTSI', 'MANA', 'LPT', 'MKR', 'SUSHI', 'ASM', 'PUNDIX', 'CELR', 'CWD', 'ARW', 'FRONT'

In [5]:
import time

tickers = pybithumb.get_tickers()

for ticker in tickers:
    price = pybithumb.get_current_price(ticker)
    print(ticker,price)
    time.sleep(1)

BTC 52759000.0
ETH 3746000.0
LTC 167100.0
ETC 40200.0
XRP 1032.0
BCH 410200.0
QTUM 8630.0
BTG 42760.0
EOS 3204.0
ICX 1025.0
TRX 82.8
ELF 466.7
OMG 6360.0
KNC 2304.0
GLM 487.6
ZIL 66.31
WAXP 435.2
POWR 703.8
LRC 1304.0
STEEM 433.2
STRAX 1385.0
ZRX 816.8
REP 18160.0
XEM 141.1
SNT 75.42
ADA 1429.0
CTXC 408.8
BAT 1124.0
WTC 693.1
THETA 4005.0
LOOM 97.09
WAVES 12900.0
TRUE 258.4
LINK 21850.0
ENJ 2510.0
VET 77.48
MTL 2206.0
IOST 36.15
TMTG 3.831
QKC 21.4
ATOLO 50.88
AMO 2.425


In [2]:
import pybithumb

print(pybithumb.get_market_detail('BTC'))

# 저가, 고가, 평균, 거래량

(53309000.0, 54123000.0, 52214000.0, 52781000.0, 2924.64822417)


In [6]:
# !pip install pykorbit
import pykorbit

print(pykorbit.get_current_price('BTC'))

52908000.0
