# 개요


- 목적
  - 기본 절차적 코드
    - 중복 표현(반복 표현)이 많이 발생될 수 있다
    - 재사용 방법이 없다
    - 흐름제어 난이도가 높다
    - 구조나 흐름 이해하기 어렵다
    - 코드의 깊이가 깊고, 반복문 남발된다
  - 함수 장점
    - 특정 단위의 수행문을 묶어서 **하나의 수행 단위로 구성** 가능
    - **재사용성**을 높임
    - **생산성** 향상
    - 재사용성 -> 초기 개발시 어느정도 자동적 진행가능함(맨땅에서 개발x, 어느정도 진척된 상황에서 개발)
  - 트랜드
    - s/w
      - 절차적 -> 함수지향적 -> 객체지향적 -> 함수지향적(자바는 제외)

- 함수를 만드는 시점
  - 같은 수행문이 2군대 이상 등장
  - 한번만 구현된 코드라도 그 내용이 복잡(혹은 길다)하면 함수로 구성
  - 필요하면 만드는 것으로 시작

- 함수 본질
  - 구성요소
    - **입력** : 함수에 전달하는 데이터
      - 함수를 정의 : 매개변수, parameter
      - 함수를 호출(사용) : 인자, argument
    - **처리** : 전달된 데이터를 기반 뭔가 연산 수행
      - 개발자가 로직을 도입해서 구성
      - ex)
        - 더하기 함수
        - 리스트의 모든 맴버를 합산하는 함수
        - 로그인 처리 함수
        - GPT에서 질의 하여 결과를 받는 함수
          - 추론행위, 글요약, 생성, ... AI처리
    - **출력** : 처리 결과를 반환
      - 반환, 없을 수도 있음, 1개, n개 모두 가능
  - 함수 구현
    - 입력, 처리, 출력을 구현

- AI 관점
  - 스마트폰(2007~) -> 빅데이터 -> 분석, 머신러닝(기계학습)/딥러닝 -> LLM, 생성형 모델
    - 사람의 직관으로 해결할 수 없는 문제 -> 인공지능을 해결
    - 입력, 출력 => 데이터가 필요
    - 입력, 출력 => 학습 => 처리과정을 찾아내는것
      - 과거는 사람의 경험, 직관 등등 직접 구현
    - 빅데이터에서는 직관 => 패턴을 찾기가 어렵다 => 인간의 지성으로 해결 x => 머신러닝/딥러닝의 학습행위 해결 => 모델
      - 입력과 출력 => 학습 => 모델 생성
      - 새로운 데이터(입력) => 모델 추론 => 출력
        - LLM, 생성형 모델 이용하여 함수를 만들때 모습

In [None]:
# 입력 받은 두 수를 더해서 반환하는 함수
# 함수 정의
def my_sum(x, y):
  return x+y

my_sum(1, 2), my_sum(2, 3), my_sum(100, 1) # 함수 호출

# 기초 문법(사용자 정의 함수)

- 개발자가 필요에 의해 정의한 함수

```
# [..] => 생략가능
# 파이썬 def, 자바스크립트 function, 모바일 func/fun,...

[데커레이터]
def 함수명 ( 입력파트:[매개변수1, 매개변수2, ... ] ):
  # 들여쓰기(인텐트)후 코드 작성
  # 처리파트 : statements(수행문)

  # 반환파트
  [return[출력값1, 출력값2, ...]]

```

- 매개변수명, 함수명
  - 원래 표기법대로 사용(스네이크 표기법)

# 기본함수 (사용자 정의 함수, 커스텀 함수)

#### (*)사용자 정의 함수 1 - 기본형

In [None]:
'''
  요구사항
  - 함수명 : add
  - 입력 : 정수값 2개, x, y
  - 처리 : 입력받은 두수를 더하기(합산) -> +
  - 출력 : 합산한(더한) 값을 반환(리턴)
'''

# 실습 : 위의 요구사항에 맞게 함수 구현하시오
def add(x, y): # 함수 선언 및 입력
  # 처리
  res = x + y
  # 반환
  return res

# 함수는 호출(call by value)해야 존재의 의미를 가짐
# 호출(함수 사용) 문법 : 함수명(입력)

add(1, 2)

#### 사용자 정의 함수 2 -출력없음
  - 출력값이 없다  표현

In [None]:
# 예시
def add2(x,y):
  print(x+y) # 콘솔|터미널 값 출력
  # 반환코드(return...) x : 필요없다면 return 생략가능

def add3(x,y):
  print(x+y)
  return # 반환값 없다, 수행문 중간에 중단하고 싶으면 단독 사용함(용도)

add2(2, 4), add3(2, 4)
# 함수를 호출해서 셀에서 마지막줄에 사용 -> 반환값을 출력하게 되있음(코랩 특성)
# -> 반환값 없음 -> None(값이 없다)로 표현, None 단독 출력이면 화면 표시가 생략됨

#### 사용자 정의 함수 3 - 여러개의 값을 반환(튜플)

In [None]:
'''
  요구사항
  - 함수명 : multi_oper
  - 입력 : x, y
  - 처리 : 입력받은 2개의 수에 대한 +,-,*,/ 연산 수행
  - 반환 : 위의 4개의 연산결과 반환
'''
def multi_oper(x, y):
  return x+y, x-y, x*y, x/y

# 함수 사용 -> 호출 -> 결과를 돌려 받는다 : call by value
multi_oper(5, 3)
# (8, 2, 15, 1.6666666666666667) => 소괄호로 값이 묶였다 => 튜플

In [None]:
# 요구사항 위의 결과중 곱하기 결과만 mul이라는 변수에 담으시오
## mul = multi_oper(5, 3)[2] ## results를 생략한 거같음
## mul
results = multi_oper(5, 3)
mul = results[2]
mul

In [None]:
_, _, mul, _ = multi_oper(5, 3)
mul

#### 사용자 정의 함수 4 - 매개변수, 인자 : 가변인자(튜플)

- 가변인자
  - 함수 호출할때 인자 1개, 2개, 3개, ... n개 자유롭게 전달하는 방식 => 가변인자
  - 예시 print()
  - 필요하면 사용, 필요 없으면 미사용

In [None]:
print(1)
print(1, 2)
print(1, 2, 3)
print(1,2, 'hi', 56)

In [None]:
# 가변인자 형태 함수 구현
'''
  요구사항
  - 함수명 : add_ex
  - 입력 : 가변인자, x
  - 처리 : 입력된 모든 인자를 합산(모두 더하기)
  - 반환 : 합산 결과
'''
def add_ex(*x):
  # 처리 => 전달된 모든 데이터 합산
  print(x, type(x)) ## 쓰인 함수?확인??
  sum = 0 # 합산 결과
  for n in x: # x는 튜플, 맴버를 하나씩 추출
    sum = sum + n # 합산 진행중
  return sum

# 함수 호출하여 테스트 진행
# 함수는 1개인데, 인자가 늘어나도 자동으로 처리됨 => 기능은 제한적
print(add_ex()) # 가변인자는 인자 자체에 데이터 전달 안해도 됨
print(add_ex(1))
print(add_ex(1, 2))
print(add_ex(1, 2, 3))
print(add_ex(1, 2, 3, 4))

#### 사용자 정의 함수 5 - 매개변수, 인자 : 일반인자, 가변인자 혼용

- 대부분 라이브러리들은 이 구조를 선호
- 일반인자는 무조건 필수 인자로 설정됨
  - 인자는 필수, 옵션(생략가능함) 구분됨

In [None]:
# *y : 포인터 y
# (일반인자, 가변인자)
def add_ex2(x, *y):
  print(f'x={x}, y={y}')

# add_ex2() # 에러, x 누락됨
add_ex2(1)
add_ex2(1, 2)
add_ex2(1, 2, 3)

In [None]:
# (가변인자, 일반인자) => 가급적 사용 x
def add_ex3(*y, x):
  print(f'x={x}, y={y}')

# 인자를 1~여러개 넣을 경우 어디까지가 가변인자인지? 판단 x
# add_ex3(1, 2, 3, 4) # 에러 missing x
add_ex3(1, 2, 3, 4, x=100) # 유일한 방법 일반인자명=값 사용

#### (*)사용자 정의 함수 6 - 매개변수, 인자 : 인자에 기본값 부여

- 매개변수에 기본값 설정(함수 정의할때)
  - 해당 매개변수의 타입을 표현
  - 중요한 값을 표시
  - 함수 사용에 편의성 증대(호출시 인자생략 가능함)

In [None]:
# 매개변수에 기본값 부여
def add6(x=1, y=2, shape=None):
  if not shape:   # shape 매개변수값이 비워있다면
    shape = (x, y) # numpy, pandas, 딥러닝 --> 데이터볼륨 shape 통해 확인가능
  print(shape)

# 기본값 부여 => 함수 사용이 편해
# 인자 생략
add6()
add6(2, 3)
add6(y = 7) # y만 조정
add6(x = 100) # x만 조정
add6(shape = (5, 6)) # shape 조정

#### 사용자 정의 함수 7 - 매개변수, 인자 : keyword argument

- 표현
  - **변수명
  - 함수 내부로 딕셔너리 형태로 데이터가 전달
- 통상 외부 라이브러리 사용시, **마지막 인자로 늘 보인다**
  - 왜? 외형은 그대로 유지, 함수를 내부적으로 **업그레이드** 할때 사용

In [None]:
def add7(**kwargs):
  print(kwargs, type(kwargs)) # 딕셔너리

add7()
add7(name='파이썬', age=35)

#### (*)사용자 정의 함수 8 - 매개변수, 인자 : 종합

- 매개변수 배치 순서
  - 일반인자, 가변인자, 키워드인자

In [None]:
def add8(a, b, *c, **kwagrs):
  print(a, b, c, kwagrs)

# a, b는 순서대로 배치
# 나머지는 모두 가변인자로 배치
# 매개변수명으 지정 => kwagrs 전달
add8(1, 2, 3, 4, 5, 6, ppp='파이썬')

In [None]:
# 치트키 => 매개변수명을 명확하게 사용하면 문제 x, 순서 x
add8(a=10, ppp='파이썬', b=100)

# 함수 종류

- 내장 함수
  - 파이썬을 설치하면 바로 사용 가능
  - print(), type(), int(), ...
- 외장 함수(내장 함수 반대 표현)
  - 모듈 **가져오기**를 동반 => 라이브러리 설치 및 사용(numpy, pandas, ...)
  ```
  import random

  random.randint()
  ```
  - 데이터 수집, 분석, 머신러닝/딥러닝, LLM, 생성형 AI, 웹,... 해당
- 사용자 정의 함수
  - 개발자가 필요에 의해 만든 함수

- 기타 함수
  - (*)람다 함수(가장 빠른 함수)
    - 표현기법


---


  - 클로저(생략)
    - 퓨어함수
    - 고급함수
  - 함수의 구성, 외관
    - 데코레이터 적용 함수
      - 웹 개발
    - 제너레이터 적용 함수
      - 생략
    - 이너레이터 적용 함수
    - 애너테이션 적용 함수
      - 작성된 코드를 있어 보이게 구성, 가이드

# 중요 내장 함수

### 파일 I/O (입력/출력)

- 목적
  - 파이썬 프로그램 <-> 파일(리소스:파일,디비,네트워크,...)
    - 읽고, 쓰기

- 파일 생성, 쓰고, 읽고 등등 처리 함수
  - open()

- 기억할 부분
  - 파이썬 전체 -> I/O가 발생하면 반드시 예외상황(오류)이 발생될 수 있다(참고)
    - 파일 읽고 쓰기도 동일하게 적용
    - 네트워크, 데이터베이스 연동, 파일, ...
  - 오픈했으면(열었으면) **반드시** 나중에 **닫는다**
    - **with문** 제공(알아서 닫아줌)

In [None]:
# 기본 파일 생성 및 오픈, 닫기
# 1. 오픈
# 'w' : 쓰기 모드로 파일을 오픈한다
f = open('a.txt', 'w')

# 2. 작업

# 3. 닫기
f.close()

In [None]:
# 1. 오픈
f = open('a.txt', 'w')

# 2. 작업
f.write('abc ABC 가나다 123 !@#')

# 3. 닫기
f.close()

In [None]:
# 자동 close 적용 코드
# as 별칭
with open('a.txt', 'w') as f:
  f.write('++ abc ABC 가나다 123 !@#')
  # whit문이 종료되면 자동 close 처리됨

In [None]:
# 1. 파일 읽기모드로 오픈
with open('a.txt', 'r') as f:
  # 2. 작업
  print(f.read())

- 파일 모드
  - 읽기 : r, 쓰기 w
  - 파일의 대상
    - 텍스트(txt, csv, ...)
      - 기본값
    - 바이너리(이미지, 엑셀, ...) : b
      - ex) 바이너리파일을 읽는다 => rb

### map()

- 목적
  - 연속된 데이터(리스트, ...)의 맴버들을 하나씩 꺼내서, 뭔가 작업(2배 값 키우기, 특정 처리, ...)을 수행
  - 데이터를 일일이 꺼내 조작(전처리, 엑세스)

In [None]:
datas = [1,2,3,4,5]
datas

In [None]:
# 요구사항 : datas의 모든 구성원의 값을 2배로 업그레이드(수정) 하시오
# 입력 : [1,2,3,4,5], 출력 : [2,4,6,8,10]

datas*2 # 리스트 2회 반복 -> 원하는 결과가 아님

In [None]:
def double(x): # x는 원데이터에서 하나씩 전달됨
  # 전달된 데이터는 무조건 2배 업그레이드
  print(f'함수 자동호출 x={x}')
  return x * 2

# map(함수: 뭔가를 처리할(맴버를 일일이 2배 업그레이드), 원데이터(연속형))
list(map(double, datas))

In [None]:
# datas의 모든 구성원을 3배로 확장하시오?
def tr(x):
  return x * 3

tr(1)

In [None]:
list(map(tr, datas))

- 참고 1
  - 리스트 컴프리핸션으로 구성

In [None]:
# 결과중심 => 2배, 3배 => 결론은 리스트
# 4배
[v*4 for v in datas] ## for정의 v는 in datas에서 한땀한땀 가져온거다

- 참고 2
  - 람다함수 사용(가장 빠른 처리속도를 가짐)
    ```
      lambda 매개변수: 함수의 처리 파트(통상1줄)

      # 전달된 데이터는 무조건 2배
      lambda x: x*2
    ```

In [None]:
# list(map(함수, 원데이터))
list(map(lambda x: x*2, datas))

### filter()

- 필터 => 필터링 용도 => 데이터를 걸러내는 용도
  - 데이터를 하나씩 꺼내서 비교(조건체크) 대상이되면 합류, 아니면 제거

In [None]:
datas

# 위 데이터에서 짝수만 추출하시오 => 필터링

In [None]:
# list(filter(함수, 원데이터))
def 함수(x):
  print(f'짝수여부체크 x={x}')
  if x % 2 == 0: # 짝수임
    print(f'짝수임')
    return True
  return False

list(filter(함수, datas))

- 참고
  - 조건문을 좀 더 간결하게

In [None]:
def 함수(x):
  # 0은 조건문에 오면 False, 1(홀수)는 조건문에 오면 True
  # 짝수만 수집 => 함수(x)의 결과가 True 이여야한다
  return not x % 2

 list(filter(함수, datas))

- 참고
  - 리스트 컴프리핸션 - 실습

In [None]:
%%time
# 구현실습
[v1 for v1 in datas if not v1%2]

- 참고
  - 람다 함수 사용 - 실습

In [None]:
%%time
# 구현실습
list(filter(lambda x:not x%2, datas))

- 참고 (차후 정리시간에 시도)
  - 삼항 연산자로 조건식을 변경하시오

### 기타 함수

####  ord()

In [None]:
# 문자의 코드값(컴퓨터가 인식하는 수치값)
# 영어문자, 특수문자, 숫자기호등등 범용적인 것들 => ASCII로 정의되어 사용
# 컴퓨터는 모든 데이터, 코드를 0과 1로 인식
ord('A'), ord('a')

In [None]:
# 말뭉치(코퍼스) -> 빈도 계산 -> 중요도 체크 -> 핵심키워드가 나옴(가장 단순하게 표현)
# 영어 말뭉치 -> a-z 사용 빈도 -> 알파벳 문자를 사용하는 국가를 구분할 수 있음
ord('a'), ord('b'), ord('c'), ord('z'), ord('a')+25

In [None]:
# 요구사항
# datas의 말뭉치는 알파벳만 모여있다 -> 이 알파벳을 하나씩 카운트해서
# [a빈도, b빈도, ..., z빈도] 구성할 것이다
# 원래는 정규식을 통해서 알파벡만 남기고 모두 제거함
datas = 'vkrnofivewnvoiewnvocewnviesmfwekdfxjewskudfhvxskfjsndkvjnfsdkvjndkvnfdkjvnfdskjvcnfdskjvcndskjcndsjkcbdnskjcndslkcndskcsdkcdsnkcjsdbcjkdsncjkdsncdskjncsdlkcsdkcnjdfs'

# 함수 정의
# 입력 : 말뭉치
# 처리 : 말뭉치 -> 알파벳 하나씩 꺼내서 -> 판단 -> 빈도 증가 -> 리스트 빈도 자리를 업데이트
# 출력 : 말뭉치=>빈도계산=>리스트로반환, 사이즈 26
def my_alpha_count(raw_lang):
  # 결과 => 리스트 (빈도가 담긴)
  # 최초 빈도(카운트 전) => 0
  results = [0]*26
  # raw_lang에서 문자를 하나씩 추출 -> 해당문자의 위치를  판단 -> 빈도수 증가 -> 반복
  for ch in raw_lang:
    # print(ch)
    특정문자의빈도위치 = ord(ch) - ord('a') # 0~25
    results[특정문자의빈도위치] += 1
  return results

res = my_alpha_count(datas)
# a-z 빈도 카운트
print(res)

In [None]:
# 모든 빈도를 0.0 ~ 1.0 사이로 재구성
# 개별빈도/전체빈도 => 언어내 문자의 비중을 의미함 => map()을 이용하여 구현
# 실습
# 전체빈도 => 전체 문자수
total_freq = len(datas)
list(map(lambda x: x/total_freq, res)) # 차후 softmax() 함수로 제공

# 이런 행위 => 정규

In [None]:
# 특정문자 발견 -> 빈도수 증가 -> results 내에 어디 위치를 증가하는가?
# -> 특정문자의 위치(인덱스) 찾아야함
# a의 자리(인덱스)
print(ord('a') - ord('a'))

# b의 자리(인덱스)
print(ord('b') - ord('a'))

# z의 자리(인덱스)
print(ord('z') - ord('a'))

# 외장 함수(특정 라이브러리 제공 함수)

- 별도의 설치가 필요하다
  - 패키지(라이브러리) 설치방법
  ```
    pip install 패키지명
    conda install 패키지명
  ```

In [None]:
# 코랩에 설치된 내용 확인
# !를 사용 => 코랩이 작동하는 OS에 명령어 전달되어 실행됨
!pip list

### pickle

- 파이썬의 자료구조, 타입, 객체둥둥 그대로 보존(덤프), 로드 후 사용할 수 있게 제공

In [None]:
import pickle

In [None]:
datas = [1,2,3,4]
datas

In [None]:
# 덤프 => 특정파일에 저장
# 원데이터의 구조, 데이터등등 유지하여 저장
# 머신러닝/딥러닝 서비스 => 모델 덤프(따로 제공함)의 참고용
with open('test.pk', 'wb') as f:
  # 외장함수 => 출처.함수()
  # 모듈명.함수()
  pickle.dump(datas, f)

In [None]:
# 로드 => 파일을 읽어서 => 자료구조 그대로 복구 => 사용가능
# 머신러닝/딥러닝 서비스 => 모델 서빙(별도로 제공)
with open('test.pk', 'rb') as f:
  print(pickle.load(f))

# 변수의 범위(scope)

- 기본
  - 함수 내부의 변수는 **지역(로컬)변수**라고 부른다
  - 기존에 사용하던 변수, 맨 앞줄에 붙여서 정의한 변수 => **전역(글로벌)변수**

- 종류
  - 전역변수(global)
    - 코드 맨 앞줄에 생성된 변수
    - 코드 전방위 사용 가능함
  - 지역변수(local)
    - 함수 내에서 정의된 변수
    - 함수 밖에서는 사용 x
  - 넌지역변수(nonlocal)
    - 함수 안에 함수 구조에서 사용됨
    - 참고

In [None]:
# 전역변수
score = 100

# 함수
def test():
  # 함수내 사용
  print(score)

test()
print(score)

In [None]:
# 전역변수
score = 100

# 함수
def test():
  # score는 지역(ok) 전역(x)
  score = 0
  score += 1
  print(score)

test()
print(score)

In [None]:
# 전역변수
score = 100

# 함수
def test():
  global score # score는 전역변수이다
  score += 1
  print(score)

test()
print(score)

- 변수명 중복되지 않게 사용해라

# 애너테이션

- 프로젝트 결과물 => 깃허브에 업로드시 코드를 조정/편집/관리 등등 하여 업로드시 유용함
  - 코드의 퀄리티를 보여주는 요소

- 특징
  - 변수, 함수, 클레스 등등 타입 가이드(추구하는 방향을 표현) 제시
  - 강제성 x
  - 다른 타입을 넣어도 오류 x
  - 오직 설명용

### 변수 에너테이션

In [None]:
score : int = 100 # 개발자에게 이 변수는 가급적 정수로 값을 세팅, 사용 가이드
name  : str = '파이썬'

score, name

In [None]:
# 강제성이 없어서 다른 타입을 대입해도 문제 x
score = 'python'

score

### 함수 에너테이션

In [None]:
def test(x,y):
  return x+y

In [None]:
# 함수의 반환값의 타입 표현 : -> int:
def test(x:int, y:int) -> int:
  return x+y

In [None]:
# 다른 타입을 넣어도 문제 x
test("hi", 'hello')

In [None]:
# 이런 오류를 미연에 방지하기 위해 타입 가이드를 해줌
# test(100, 'hello')