# 프로그래밍과 문제해결

- 현실에서 발생하는 복잡한 문제를 작은 문제로 분할하면서 해결한다.
- 문제에 대한 패턴을 발견한다.
- 문제를 최소한의 비용으로 최대한 빠르게 해결한다.

### 프로그램을 만들려면 가장 먼저 '입력'과 '출력'을 생각하자

입력받는 값? \
출력하는 값? \
생각해 볼 것은? (패턴, 조건 등등)

In [2]:
# 구구단 만들기

def GU(n):
    result = []
    i = 1
    while i < 10:
        result.append(n*i)
        i = i + 1
    return result

print(GU(3))

[3, 6, 9, 12, 15, 18, 21, 24, 27]


Q. 10 미만의 자연수에서 3과 5의 배수를 구하면 3,5,6,9 이다. 이들의 총합은 23이다.\
1000미만의 자연수에서 3의 배수와 5의 배수의 총합을 구하라.

In [3]:
# 1. 1000미만의 자연수는 어떻게 구할 수 있을지 생각해보기

n = 1
while n < 10:
    print(n)
    n += 1

1
2
3
4
5
6
7
8
9


In [4]:
# 다른 방법

for n in range(1,10):
    print(n)

1
2
3
4
5
6
7
8
9


In [5]:
# 2. 3과 5의 배수를 구하는 방법을 생각해보자.

result = 0
for n in range(1, 1000):  # 1~999까지 n에 대입하여 반복
    if n % 3 ==0 or n % 5 ==0: # n을 3으로 나누거나 5로 나눈 나머지가 0 이라면
        result += n
print(result)

233168


# 정규표현식

- 정규 표현식은 복잡한 문자열을 처리할 때 사용하는 기법
- 프로그래밍에서 범용적으로 쓰이는 기술들은 프로그래밍언어나 특정 기술에 종속되지 않고 쓰이기 때문에 익숙해져야 할 중요한 방법

정규 표현식의 기초, 메타 문자

```Python
. ^ $ * + ? {}\|()
```

In [7]:
# 파이썬에서 정규 표현식을 지원하는 re 모듈

import re

### 정규식을 사용한 문자열 검색
compile된 패턴 객체는 다음 4가지 메서드를 제공한다.

메서드 - 목적\
`match()` - 문자열의 처음부터 정규식과 매치되는지 조사한다.\
`search()` - 문자열 전체를 검색하여 정규식과 매치되는지 조사한다.\
`findall()` - 정규식과 매치되는 모든 문자열(substring)을 리스트로 돌려준다.\
`finditer()` - 정규식과 매치되는 모든 문자열(substring)을 반복 가능한 객체로 돌려준다.

In [None]:
p = re.compile('ab*')
p

In [8]:
p = re.compile('[a-z]+')
p

re.compile(r'[a-z]+', re.UNICODE)

match

In [9]:
m = p.match("python")
print(m)

<re.Match object; span=(0, 6), match='python'>


In [10]:
m = p.match("3 python")
print(m)

# 문자 3이 정규식 [a-z]+에 부합되지 않으므로 None을 돌려준다.

None


정규표현식 작성 흐름

In [None]:
p = re.complie(정규 표현식)
m = p.match("조사할 문자열")

if m:
    print('Match found: ', m.group())
else:
    print('No match')

search

In [11]:
m = p.search("python")
print(m)

<re.Match object; span=(0, 6), match='python'>


In [12]:
m = p.search("3 python")
print(m)

<re.Match object; span=(2, 8), match='python'>


findall

In [13]:
result = p.findall("life is too short")
print(result)

['life', 'is', 'too', 'short']


finditer

In [14]:
result = p.finditer("life is too short")
print(result)

<callable_iterator object at 0x00000174D1CBAFD0>


In [15]:
for r in result: print(r)

<re.Match object; span=(0, 4), match='life'>
<re.Match object; span=(5, 7), match='is'>
<re.Match object; span=(8, 11), match='too'>
<re.Match object; span=(12, 17), match='short'>


### match 객체의 메서드

`group()` - 매치된 문자열을 돌려준다.\
`start()` - 매치된 문자열의 시작 위치를 돌려준다.\
`end()` - 매치된 문자열 끝 위치를 돌려준다.\
`span()` - 매치된 문자열의 (시작, 끝)에 해당하는 튜플을 졸려준다.

In [16]:
import re

p = re.compile('[a-z]+')
m = p.match("python")
m.group()

'python'

In [17]:
m.start()

0

In [18]:
m.end()

6

In [19]:
m.span()

(0, 6)

In [20]:
m = p.search("3 python")
print(m.group())
print(m.start())
print(m.end())
print(m.span())

python
2
8
(2, 8)


다양한 메소드

```Python
rjust(width, [fillchar])
zfill(width)
split()
copy()
deepcopy()
```

# 탐색 알고리즘 DFS / BFS

DFS - 깊이 우선 탐색

In [1]:
# 인접 행렬 방식 예제

INF = 999999999 # 무한의 비용 선언

# 2차원 리스트를 이용해 인접 행렬 표현

graph = [
    [0,7,5],
    [7,0,INF],
    [5,INF,0]
]

print(graph)

[[0, 7, 5], [7, 0, 999999999], [5, 999999999, 0]]


In [2]:
# 인접 리스트 방식 예제

graph = [[]for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((1,7))
graph[0].append((2,5))

# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0,7))

# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0,5))

print(graph)

[[(1, 7), (2, 5)], [(0, 7)], [(0, 5)]]


In [3]:
def dfs(graph, v, visited):
    # 현재 노드를 방문 처리
    visited[v] = True
    print(v, end=' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False]*9

# 정의된 DFS 함수 호출
dfs(graph, 1, visited)

1 2 7 6 8 3 4 5 

BFS - 너비 우선 탐색

In [4]:
from collections import deque

# BFS 메서드 정의

def bfs(graph, start, visited):
    # 큐(Queue) 구현을 위해 deque 라이브러리 사용
    queue = deque([start])
    # 현재 노드를 방문 처리
    visited[start] = True
    # 큐가 빌 때까지 반복
    while queue:
        # 큐에서 하나의 원소를 뽑아 출력
        v = queue.popleft()
        print(v, end=' ')
        # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True

# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현 (1차원 리스트)
visited = [False]*9

# 정의된 BFS 함수 호출
bfs(graph, 1, visited)

1 2 3 8 7 4 5 6 

# 정렬

정렬 - 데이터를 특정한 기준에 따라서 순서대로 나열하는 것

선택 정렬
- 가장 작은 것을 앞으로 보내는 과정을 반복해서 수행하는 것

In [1]:
array = [7,5,9,0,3,1,6,2,4,8]

for i in range(len(array)):
    min_index = i # 가장 작은 원소의 인덱스
    for j in range(i + 1, len(array)):
        if array[min_index] > array[j]:
            min_index = j
    array[i], array[min_index] = array[min_index], array[i]

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


삽입 정렬
- 특정 데이터를 적절한 위치에 '삽입'한다는 의미

In [3]:
array = [7,5,9,0,3,1,6,2,4,8]

for i in range(1, len(array)):
    for j in range(i, 0, -1):
        if array[j] < array[j-1]:
            array[j], array[j-1] = array[j-1], array[j]
        else:
            break

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


퀵 정렬
- 피벗을 설정한 뒤 왼쪽에서부터 피벗보다 큰 데이터를 찾고, 오른쪽에서는 피벗보다 작은 데이터를 찾는다.

In [6]:
array = [5,7,9,0,3,1,6,2,4,8]

def quick_sort(array):
    # 리스트가 하나 이하의 원소만을 담고 있다면 종료
    if len(array) <= 1:
        return array
    
    pivot = array[0]
    tail = array[1:]

    left_side = [x for x in tail if x <= pivot]
    right_side = [x for x in tail if x > pivot]

    # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬을 수행하고, 전체 리스트를 반환
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


계수 정렬
- 특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠른 정렬 알고리즘

In [8]:
# 모든 원소의 값이 0보다 크거나 같다고 가정
array = [7,5,9,0,3,1,6,2,9,1,4,8,0,5,2]

# 모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
count = [0] * (max(array)+1)

for i in range(len(array)):
    count[array[i]] += 1 # 각 데이터에 해당하는 인덱스의 값 증가

for i in range(len(count)):
    for j in range(count[i]):
        print(i, end=' ')

0 0 1 1 2 2 3 4 5 5 6 7 8 9 9 

파이썬 라이브러리

In [9]:
array = [7,5,9,0,3,1,6,2,4,8]

result = sorted(array)
print(result)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [10]:
array = [7,5,9,0,3,1,6,2,4,8]

array.sort()
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [11]:
array = [('바나나',2),('사과',5),('당근',3)]

def setting(data):
    return data[1]
result = sorted(array, key = setting)
print(result)

[('바나나', 2), ('당근', 3), ('사과', 5)]


# 이진 탐색

순차 탐색 - 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법

In [None]:
# 순차 탐색 소스코드 구현
def sequential_search(n, target, array):
    # 각 원소를 하나씩 확인하며
    for i in range(n):
        # 현재의 원소가 찾고자 하는 원소와 동일한 경우
        if array[i] == target:
            return i + 1 # 현재의 위치 반환(인덱스는 0부터 시작하므로 1 더하기)

print("생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.")
input_data = input().split()
n = int(input_data[0])
target = input_data[1]

print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.")
array = input().split()

# 순차 탐색 수행 결과 출력
print(sequential_search(n, target, array))

이진 탐색 : 반으로 쪼개면서 탐색하기

In [2]:
# 이진 탐색 소스코드 구현(재귀 함수)

def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    # 찾은 경우 중간점 인덱스 반환
    if array[mid] == target:
        return mid
    elif array[mid] > target:
        return binary_search(array, target, start, mid-1)
    # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
    else:
        return binary_search(array, target, mid + 1, end)

# n(원소의 개수)과 target(찾고자 하는 문자열)을 입력받기
n, target = list(map(int, input().split()))

# 전체 원소 입력받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n-1)
if result == None:
    print("원소가 존재하지 않습니다.")

else:
    print(result+1)

# 다이나믹 프로그래밍

- 문제의 일부분을 풀고 그 결과를 재활용하는 방법
    - 중복되는 서브문제로 나누어 푸는 방법
    - 분할 정복과 유사한 개념
  

In [4]:
# 피보나치 함수 소스코드

def fibo(x):
    if x == 1 or x == 2:
        return 1
    return fibo(x -1)+ fibo(x-2)

print(fibo(30))

# 위 소스코드의 문제점
# f(n) 함수에서 n이 커지면 커질수록 수행 시간이 기하급수적으로 늘어난다.

832040


항상 다이나믹 프로그래밍을 사용할 수는 없으며, 다음 조건을 만족할 때 사용할 수 있다.
1. 큰 문제를 작은 문제로 나눌 수 있다.
2. 작은 문제에서 구한 정답은 그것을 포함하는 큰 문제들에서도 동일하다.

In [6]:
# 메모이제이션 기법 활용
# 피보나치 수열 소스코드(재귀적)

# 한 번 계산된 결과를 메모이제이션(Memoization)하기 위한 리스트 초기화
d = [0] * 100

# 피보나치 함수(Fibo)를 재귀함수로 구현(탑다운 다이나믹 프로그래밍)
def fibo(x):
    # 종료 조건(1 혹은 2일 때 1을 반환)
    if x == 1 or x == 2:
        return 1
    # 이미 계산한 적 있는 문제라면 그대로 반환
    if d[x] != 0:
        return d[x]
    # 아직 계산하지 않은 문제라면 점화식에 따라서 피보나치 결과 반환
    d[x] = fibo(x -1)+fibo(x-2)
    return d[x]

print(fibo(99))

218922995834555169026


In [7]:
# 호출되는 함수 확인

d = [0]*100

def fib(x):
    print('f('+str(x)+')', end=' ')
    if x == 1 or x == 2:
        return 1
    if d[x] != 0:
        return d[x]
    d[x] = fib(x-1)+fib(x-2)
    return d[x]

fib(6)

# 큰 문제를 해결하기 위해 작은 문제를 호출하는 탑다운 방식

f(6) f(5) f(4) f(3) f(2) f(1) f(2) f(3) f(4) 

8

In [8]:
# 단순히 반복문을 이용하여 소스코드를 작성하는 경우 작은 문제부터 차근차근 도출한다고 하여 보텀업 방식

# 피보나치 수열 소스코드(반복적)

# 앞서 계산된 결과를 저장하기 위한 DP 테이블 초기화
d = [0] * 100

# 첫 번째 피보나치 수와 두 번째 피보나치 수는 1
d[1] = 1
d[2] = 1
n = 99

# 피보나치 함수 반복문으로 구현
for i in range(3, n+1):
    d[i] = d[i-1] + d[i-2]

print(d[n])

218922995834555169026


# 그래프 이론

서로소 집합 - 공통 원소가 없는 두 집합\
서로소 집합 자료구조 - 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조