## Python 사용을 위한 준비 단계
- 파이썬 코딩 연습을 위한 환경 설정
- 프로그래밍 기초 원리
- 파이썬 코딩의 기초: 변수 설정, 데이터 타입, 슬라이싱 등

#### 1. 필요 도구
- Python (ver. 3.10)
- Google Colab
<!-- - Jupyter notebook -->
- Notepad++
- AntConc

##### 사용 환경
- Google Colab: 구글 계정만 있으면 별다른 프로그램 설치 없이 Python 및 R 프로그래밍을 바로 시작할 수 있다.
- Colab 세팅 및 기본 사용법은 아래 링크에 자세히 설명되어 있다.
- https://velog.io/@s6820w/colab1
- https://nevertrustbrutus.tistory.com/365

#### 2. Python 프로그래밍의 기본 단위
- Python 프로그래밍은 기본적으로 (이는 파이썬을 비롯한 다른 언어도 동일하다)
1. 변수를 지정하고,
1. 변수에 값을 넣고(또는 할당하고),
1. 값이 채워진 변수를 다른 명령어로 조작하는
- 세 단계로 이루어진다. 이 최소 블록들을 여러 개 쌓아올리면 하나의 프로그램을 만들 수 있다.

In [None]:
hello = "Hello, World!"
print(hello)

In [None]:
sentences = "국내 연구진이 실내외 환경 구분 없이 정밀한 위치인식이 가능한 '위성위치확인시스템(GPS)' 시스템을 개발했다. 실내지도가 제공되지 않는 건물에서 사용자가 위치한 층의 정확한 정보를 제공할 수 있는 수준이다. [출처: 동아사이언스(https://news.v.daum.net/v/20220708160023490)]"
sentences_cleaned = sentences.replace(".", "")
words = sentences_cleaned.split(' ')
num_words = len(words)

In [None]:
print(words)

In [None]:
print(num_words)

#### 3. Python을 이용한 텍스트 처리에서 자주 사용할 데이터 유형(https://velog.io/@jewon119/01.-Python-%EA%B8%B0%EC%B4%88-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%83%80%EC%9E%85data-type)
- 문자열(str): 단어, 문장, 문서 등 문자로 된 유형. 문자를 다룰 수 있는 다양한 추가, 삽입, 수정, 삭제 기능을 제공함(길이 구하기, 인덱싱, 슬라이싱, 갯수 세기, 위치 찾기, 삽입, 대체하기, 나누기 등..). 
- 리스트(list): 하나 이상의 원소로 이루어진 묶음. [...]로 나타낸다. 문자열, 숫자 등이 원소가 될 수 있다. 리스트가 다른 리스트의 원소가 될 수도 있다. 인덱싱(indexing)과 슬라이싱(slicing) 사용 가능. 수정, 삭제, 추가, 정렬, 뒤집기, 삽입 등 모두 가능
- 딕셔너리(dictionary): 리스트처럼 하나 이상의 원소로 이루어진 묶음. 이때 원소는 key: value 쌍의 형태이다. {...}로 나타낸다. {key1:value1, key2:value2, key3:value3, ...key(N):value(N)}. 순차적인 index값을 요구하지 않는다.
- 데이터프레임(dataframe): 엑셀 파일과 같이 행과 열로 이루어진 데이터 유형. python의 고유한 데이터 유형은 아니지만 pandas라는 라이브러리를 통해 생성할 수 있다.

#### 4. 문자열 다루기

##### 문자열 입력하기

In [None]:
string_1 = 'character'
string_2 = "This is a character string."
string_3 = "Dave's most favourite food is pizza."
string_3_1 = 'Dave\'s most favourite food is pizza.'
string_4 = '"Hello there", she said.'
string_4_1 = "\"Hello there\", she said."

In [None]:
print(string_3)

In [None]:
print(string_3_1)

##### 문자열 길이 구하기
- 저장된 문자열이 몇 개의 문자로 이루어졌는지 확인

In [None]:
str_len = len(string_1)
print(str_len)

In [None]:
print(len(string_2))

In [None]:
print(len(string_4))

##### 문자열 인덱싱 및 슬라이싱
- 문자열 내의 각 문자의 위치값을 이용하여 특정 위치에 위치한 문자를 추출할 수 있다.

In [None]:
print(string_3[0])

In [None]:
print(string_3[7])

In [None]:
print(string_3[-1])

In [None]:
print(string_3[0:5])

In [None]:
print(string_3[:5])

In [None]:
print(string_3[5:])

In [None]:
print(string_1[-1])

In [None]:
print(string_1[-3:])

##### 문자 갯수 세기

In [None]:
print(string_3.count('o'))

In [None]:
print(string_3.count('a'))

##### 문자열에 문자 삽입하기
- **'추가할 문자'.join()**을 사용하여 기존 문자열에 새로운 문자를 추가할 수 있다.

In [None]:
new_string_1 = '-'.join(string_1)
print(new_string_1)

In [None]:
print('.'.join(string_1))

##### 문자열 양쪽 공백 지우기
- 문자열의 시작 부분과 끝 부분에 불필요한 공백이 있을 때 **.strip()** 함수를 사용하여 삭제할 수 있다.
- 여러 라인으로 구성된 텍스트 파일을 읽어 각 라인의 앞뒤 공백을 지우고자 할 때 사용한다. 

In [None]:
string_5 = '    character    '
string_5_1 = string_5.strip()
print(string_5_1)

##### 대소문자로 바꾸기

In [None]:
new_string_1 = string_1.upper()
print(new_string_1)

In [None]:
print(new_string_1.lower())

##### 문자열 바꾸기
- **.replace()** 함수로 문자열 내의 특정 문자를 다른 것으로 교체할 수 있다.

In [None]:
print(string_3.replace('pizza', 'hamburger'))

In [None]:
print(string_3.replace('Dave', 'Jane'))

##### 문자열 나누기(분할하기)

In [None]:
splitted_string_3 = string_3.split()
print(splitted_string_3)

In [None]:
type(splitted_string_3)

In [None]:
type(string_3)

In [None]:
string_6 = 'character, letter, number'
print(string_6.split(', '))

#### 5. 리스트 다루기: [...]
- 리스트는 하나 이상의 요소(element)를 가지는 집합과 유사한 개념
- 인덱싱과 슬라이싱을 통해 일부 요소의 추출 가능

##### 리스트 만들기
- 리스트는 []를 사용하여 만들 수 있다. 이 [] 내에 문자, 숫자, 리스트 등이 구성 요소로 들어간다.

In [None]:
list_1 = [1, 2, 3, 4, 5]
list_1_1 = [5, 4, 3, 2, 1]
list_2 = ['apple', 'banana', 'orange', 'pineapple', 'watermelon']

In [None]:
print(list_2)

In [None]:
list_3 = []
list_3.append(9)
list_3.append(10)
print(list_3)

In [None]:
del list_3[1]
print(list_3)

##### 리스트 인덱싱 및 슬라이싱(slicing)하기

In [None]:
print(list_1[0])

In [None]:
print(list_1[:3])

In [None]:
print(list_2[1:3])

##### 리스트 정렬하기

In [None]:
list_1_1.sort()
print(list_1_1)

In [None]:
list_2.reverse()
print(list_2)

##### 리스트 요소 갯수 세기
- 리스트의 전체 요소 수를 셀 때는 **len()** 함수를, 리스트 내에 있는 특정 요소의 수를 셀 때는 **.count()** 함수를 사용

In [None]:
print(len(list_1))

In [None]:
list_4 = ["a", "b", "c", "a", "d", "e", "a"]
print(list_4.count('a'))

#### 5. 딕셔너리
- 딕셔너리는 리스트와 같이 여러 개의 요소로 구성되지만 하나의 요소가 key와 value의 쌍이다.
- 리스트와 달리 인덱스를 통해 접근할 수 없고 key 값을 통해 접근할 수 있다. key 값을 제시하면 해당 key의 value가 출력된다.
- {} 괄호로 만든다. {key1:value1, key2:value2, key3:value3, ...key(N):value(N)}과 같이 구성된다.

##### 딕셔너리 만들기

In [None]:
dict_1 = {'apple':10, 'banana':4, 'orange':7, 'pineapple': 2, 'watermelon':1}
dict_2 = {'name':'James', 'age':34, 'nationality':'USA', 'social_code':12345}

In [None]:
print(dict_1)

In [None]:
print(dict_2)

In [None]:
print(len(dict_1))

##### 딕셔너리 내용 들여다보기: key 값을 이용하여 value를 확인

In [None]:
print(dict_1['apple'])

In [None]:
print(dict_2['nationality'])

##### 딕셔너리 요소 추가하기

In [None]:
dict_1['strawberry'] = 15
dict_2['education'] = 'college'

In [None]:
print(dict_1)

In [None]:
print(dict_2)

##### key와 value를 따로 추출하여 리스트로 만들기

In [None]:
list_keys = list(dict_1.keys())
print(list_keys)

In [None]:
list_values = list(dict_1.values())
print(list_values)