# (예제) 파일

**기본 설정**

파일 저장 경로와 파일 서버 주소를 지정에 필요한 기본 설정을 지정한다.

In [1]:
from pathlib import Path
from urllib.request import urlretrieve

데이터가 저장된 텍스트 파일 서버 주소는 다음과 같다.

In [2]:
base_url = "https://raw.githubusercontent.com/codingalzi/pybook/master/jupyter-book/data/"

현재 작업 디렉토리의 `data` 하위 디렉토리에 파일을 다운로드해서 저장할 준비를 한다.

In [3]:
# 저장위치 지정과 생성
data_path = Path() / "data"
data_path.mkdir(parents=True, exist_ok=True)

`myWget()` 함수는 파일 서버에서 지정된 파일을 동일한 파일명으로 지정된 디렉토리에 저장한다.

In [4]:
def myWget(filename):
    # 다운로드 대상 파일 경로
    file_url = base_url + filename

    # 저장 경로와 파일명
    target_path = data_path / filename

    return urlretrieve(file_url, target_path)

## 문제 7

(Think Python) 기본 자료형: 파일 - 연습문제 7번

In [16]:
sketch1 = "Man: Is this the right room for an argument?\nOther Man: Oh I'm sorry: or the full half hour?\n(pause)\nMan: Ah! Just the five minutes."

`sketch1` 변수에 할당된 문자열을 `sketch1.txt` 파일에 저장한다.

In [17]:
with open('sketch1.txt', 'w') as file:
  file.write(sketch1)

In [18]:
with open('sketch1.txt', 'r') as file:
  print(file.read())

Man: Is this the right room for an argument?
Other Man: Oh I'm sorry: or the full half hour?
(pause)
Man: Ah! Just the five minutes.


이제 `role_words` 함수를 완성하세요.

In [19]:
def role_words(fileName):
    with open(fileName) as data:
        for each_line in data:
            try:
                role, spoken = each_line.split(':',1)
                print(role+' said:'+spoken,end='')
            except:
                pass

In [20]:
role_words('sketch1.txt')

Man said: Is this the right room for an argument?
Other Man said: Oh I'm sorry: or the full half hour?
Man said: Ah! Just the five minutes.

## 문제 8

(Think Python) 기본 자료형: 파일 - 연습문제 8번

In [21]:
def role_texts(fileName):
    with open(fileName) as data, \
        open('dialogues_Man.txt','w') as man, \
        open('dialogues_Other.txt','w') as other:

        for each_line in data:
            try:
                line = each_line.split(':', 1)
                line_spoken = line[1].lstrip()
                if line[0] == 'Man' :
                    man.write(line_spoken)
                if line[0] == 'Other Man':
                    other.write(line_spoken)
            except IndexError:
                pass

In [22]:
role_texts('sketch1.txt')

In [23]:
with open("dialogues_Man.txt") as man:
  print(man.read())

Is this the right room for an argument?
Ah! Just the five minutes.


In [24]:
with open("dialogues_Other.txt") as other:
  print(other.read())

Oh I'm sorry: or the full half hour?



## 문제 6

In [13]:
# words.txt 파일 다운로드
import urllib.request
urllib.request.urlretrieve('http://greenteapress.com/thinkpython2/code/words.txt', 'words.txt')

('words.txt', <http.client.HTTPMessage at 0x7fa3f8406ac8>)

In [14]:
def txt2list(aFile):
    a = []
    with open(aFile,'r') as data:
        for line in data:
            a.append(line.strip())
    return a

In [15]:
print(txt2list('words.txt')[:10])

['aa', 'aah', 'aahed', 'aahing', 'aahs', 'aal', 'aalii', 'aaliis', 'aals', 'aardvark']


In [16]:
print(txt2list('words.txt')[-10:])

['zymogene', 'zymogenes', 'zymogens', 'zymologies', 'zymology', 'zymoses', 'zymosis', 'zymotic', 'zymurgies', 'zymurgy']


## 문제 7

In [17]:
def itemSearch(aWordsList, aWord):
    if aWord in aWordsList:
        return True
    else:
        return False

### 테스팅

**주의:** 수정하지 말 것.

In [18]:
# 리스트 항목 탐색은 시간이 오래 걸린다.
import time

words = txt2list('words.txt')

exc7A = itemSearch(words, 'aback') == True
exc7B = itemSearch(words, 'accru') == False
exc7C = itemSearch(words, 'frett') == False
exc7D = itemSearch(words, 'reporting') == True

# 마지막 단어 검색시간 측정
start_time = time.time()
exc7E = itemSearch(words, 'zymurgy') == True
elapsed_time = time.time() - start_time
print(f"마지막 항목 검색시간: {elapsed_time:.6f}초")

all([exc7A, exc7B, exc7C, exc7D, exc7E])

마지막 항목 검색시간: 0.001359초


True

## 문제 8

(Think Python) 프로그래밍 기본 요소: 집합과 사전 - 연습문제 4번

In [19]:
def binarySearch(aWordsList, aWord):
    low = 0
    high = len(aWordsList)

    while low <= high:
        mid = (low + high)//2
        if aWordsList[mid] == aWord:
            return True
        elif aWordsList[mid] < aWord:
            low = mid + 1
        else:
            high = mid - 1

    return False

### 테스팅

**주의:** 수정하지 말 것.

In [20]:
# 리스트 항목 탐색은 시간이 오래 걸린다.
import time

words = txt2list('words.txt')

exc8A = binarySearch(words, 'aback') == True
exc8B = binarySearch(words, 'accru') == False
exc8C = binarySearch(words, 'frett') == False
exc8D = binarySearch(words, 'reporting') == True

# 마지막 단어 검색시간 측정
start_time0 = time.time()
exc8E = binarySearch(words, 'zymurgy') == True
elapsed_time0 = time.time() - start_time0
print(f"이진탐색이 일반 탐색보다 약 {elapsed_time/elapsed_time0:.1f}배 빠르다.")

all([exc8A, exc8B, exc8C, exc8D, exc8E])

이진탐색이 일반 탐색보다 약 8.1배 빠르다.


True

## 문제 9

(Think Python) 프로그래밍 기본 요소: 집합과 사전 - 연습문제 5번

In [21]:
def txt2dict(aFile):
    a = dict()
    with open(aFile) as data:
        for item in data:
            item = item.strip()
            a[item] = True
      
    return a

In [22]:
def keySearch(aWordsDict, aWord):
    if aWord in aWordsDict:
        return True
    else:
        return False

### 테스팅

**주의:** 수정하지 말 것.

In [23]:
# 리스트 항목 탐색은 시간이 오래 걸린다.
import time

words = txt2dict('words.txt')

exc9A = keySearch(words, 'aback') == True
exc9B = keySearch(words, 'accru') == False
exc9C = keySearch(words, 'frett') == False
exc9D = keySearch(words, 'reporting') == True

# 마지막 단어 검색시간 측정
start_time1 = time.time()
exc9E = keySearch(words, 'zymurgy') == True
elapsed_time1 = time.time() - start_time1
print(f"사전 탐색이 리스트 일반 탐색보다 약 {elapsed_time/elapsed_time1:.1f}배 빠르다.")
print(f"사전 탐색이 리스트 이진탐색보다 약 {elapsed_time0/elapsed_time1:.1f}배 빠르다.")

all([exc9A, exc9B, exc9C, exc9D, exc9E])

사전 탐색이 리스트 일반 탐색보다 약 30.8배 빠르다.
사전 탐색이 리스트 이진탐색보다 약 3.8배 빠르다.


True

**쇼핑몰 파일 관련**

**문제 1**

`shopA.txt` 파일은 쇼핑몰A에서 판매하는 상품의 가격을 담고 있음을 확인해보자.
먼저 해당 파일을 다운로드 한다.

In [5]:
myWget("shopA.txt")

(PosixPath('data/shopA.txt'), <http.client.HTTPMessage at 0x7fdac837f760>)

이제 파일 전체 내용을 출력하는 코드를 작성하라.

힌트: `with-as` 명령문, `open()` 함수, `readlines()` 또는 `read()` 파일 메서드.

In [6]:
# 코드를 작성하세요.



**문제 2**

`shopA.txt` 파일의 내용을 확인하면, 오타가 있다. 
'오레ㄴ지' 를 '오렌지'로 변경한 후에
`shopA.txt` 파일을 열어 오타가 수정되었는지를 확인하여라.  

힌트: 파일의 `read()` 메서드, 문자열의 `replace()` 메서드

* 파일 읽기: `read()` 메서드 활용

In [7]:
# 파일내용을 하나의 문자열로 생성하는 코드를 작성하라.



* 오타 수정: `replace()` 문자열 메서드 활용

In [8]:
# 오타를 수정하는 코드를 작성하라.



* 파일 저장

In [9]:
# 오타가 수정된 문자열을 파일로 저장하는 코드를 작성하라.



* 파일 내용 확인

In [10]:
# 오타가 수정되었음을 확인하는 코드를 작성하라.



**문제 3**

상품명과 가격을 키-값의 쌍으로 갖는 아래 모양의 딕셔너리를 만들어라.
단, 오타가 수정된 파일을 이용해야 한다.

```python
{'우유': 2540,
 '계란': 7480,
 '생수': 980,
 '짜장라면': 3220,
 '두부': 1450,
 '콩나물': 1680,
 '김': 5480,
 '닭고기': 5980,
 '식빵': 2480,
 '바나나': 4980,
 '오렌지': 990,
 '카레': 2480,
 '만두': 6980,
 '어묵': 7980,
 '참치': 11880,
 '김치': 7980,
 '간장': 10800}
```

**문제 4** 

`shopA.txt` 와 같이 상품명과 가격으로 이루어진 쇼핑 리스트가 포함된 파일의 이름을 입력받으면
상품명과 가격을 각각 키와 값으로 갖는 사전 객체를 반환하는 함수 `shopping()` 을 구현하라.

힌트: 문제 3을 해결하기 위해 작성한 코드를 이용한다.

In [11]:
# 아래 코드를 완성하라. 

def shopping(shop_file):
    shop_dict = {} # 생성할 사전 객체
    
    pass

    return shop_dict

print(shopping("shopA.txt"))

{}


**문제 5**

쇼핑 리스트와 상품을 인자로 지정하면 상품의 가격을 반환하는 함수 `item_price()` 를 구현하라.

힌트: `shopping()` 함수를 이용한다.

In [12]:
# 함수를 완성하라.

def item_price(shop_file, item):
    ...

print(item_price("shopA.txt", '김치'))

None


**문제 6**

`shopB.txt` 파일은 쇼핑몰B에서 판매하는 상품의 가격을 담고 있으며,
`shopA.txt` 파일과 동일한 방식으로 다운로드할 수 있다.

In [5]:
myWget("shopB.txt")

(PosixPath('data/shopA.txt'), <http.client.HTTPMessage at 0x7fdac837f760>)

사용자가 상품을 입력하면, 쇼핑몰A와 쇼핑몰B 중 어느 쇼핑몰에서 구입하는 것이 얼마나 저렴한지를 보여주는
함수 `price_comparison()`를 작성하라.

In [16]:
# 코드를 완성하라.

def price_comparison(item):
    ...
    
print(price_comparison('김치'))

None


**다이빙 기록 관련**

**문제 7**

[5미터 다이빙 기록 에서 등수를 확인하는 작업](https://codingalzi.github.io/pybook/files.html#sec-exp-diving-5m)과 
동일한 작업을 10미터 다이빙 기록에 대해 진행하라.

In [14]:
# 코드를 작성하라.



**문제 8**

5미터 다이빙 기록과 10미터 다이빙 기록의 합에 대해 등수를 확인하는 코드를 작성하라.

In [15]:
# 코드를 작성하라.

