# Write and Save Files

## Objectives
* Write to files using Python libraries

<h2>Table of Contents</h2>
<div class='alert alert-block alert-info'>
    <ul>
        <li>Writing Files</li>
        <li><a href=#2>Appending Files</a></li>
        <li><a href=#3>Additional File modes</a></li>
        <li><a href=#4>Copy a File</a></li>
    </ul>
</div>

## Writing Files

In [5]:
import os

exmp2 = os.path.join(os.path.expanduser('~'),'Downloads','Example2.txt')
with open(exmp2, 'w') as writefile:
    writefile.write("This is line A")

In [6]:
# Read exmp2

with open(exmp2, 'r') as file:
    print(file.read())

This is line A


In [7]:
# Write lines to file

with open(exmp2, 'w') as wf:
    wf.write('This is line A\n')
    wf.write('This is line B\n')

<div class='alert alert-box alert-success'>
    <b><code>.write()</code> 메서드는 <code>.readline()</code> 메서드와 비슷하게 작동하지만, 새로운 줄을 읽는 대신 새로운 줄을 작성합니다.</b>
</div>

In [8]:
# Check whether write to file

with open(exmp2, 'r') as testwf:
    print(testwf.read())

This is line A
This is line B



In [9]:
# Sample list of text

Lines = ["This is line A\n", "This is line B\n", "This is line C\n"]
Lines

['This is line A\n', 'This is line B\n', 'This is line C\n']

In [12]:
# Write the strings in the list to test file

with open(exmp2, 'w') as wf:
    for line in Lines:
        print(line)
        wf.write(line)

This is line A

This is line B

This is line C



In [13]:
# Verify if writing to file is successfully executed

with open(exmp2, 'r') as rf:
    print(rf.read())

This is line A
This is line B
This is line C



## Appending Files <a id =2></a>

In [14]:
# Write a new line to text file

with open(exmp2, 'a') as testwf:
    testwf.write('This is line C\n')
    testwf.write('This is line D\n')
    testwf.write('This is line E\n')

In [15]:
# Verify if the new line is in the text file

with open(exmp2, 'r') as rwf:
    print(rwf.read())

This is line A
This is line B
This is line C
This is line C
This is line D
This is line E



## Addtional modes <a id=3></a>

<div class='alert alert-block alert-warning'>
    <li><code>r+</code>: 읽기 및 쓰기. 파일을 잘라내지 않음</li>
    <li><code>w+</code>: 쓰기 및 읽기. 파일을 잘라냄.</li>
    <li><code>a+</code>: 추가 및 읽기. 파일이 없으면 새 파일을 생성함.</li>
</div>

In [16]:
with open(exmp2, 'a+') as testwf:
    testwf.write('This is line E\n')
    print(testwf.read())




<div class='alert alert-block alert-danger'>
오류는 없었지만, `read()`도 아무것도 출력하지 않았습니다. 이는 파일 내에서 우리가 위치한 지점 때문입니다.  

지금까지 살펴본 대부분의 파일 메서드는 파일 내 특정 위치에서 작동합니다.  
- `.write()`는 파일 내 특정 위치에 작성합니다.  
- `.read()`는 파일 내 특정 위치에서 읽습니다.  

이것은 메모장에서 특정 위치를 선택하여 수정하는 것처럼, 포인터를 이동시켜 특정 위치에서 작업하는 것으로 생각할 수 있습니다.
</div>
파일을 **`w` 모드**로 여는 것은 `.txt` 파일을 열고 커서를 텍스트 파일의 시작으로 이동시킨 뒤 새로운 텍스트를 작성하고, 그 뒤에 있는 모든 내용을 삭제하는 것과 같습니다.  
반면, 파일을 **`a` 모드**로 여는 것은 `.txt` 파일을 열고 커서를 맨 끝으로 이동시킨 뒤 새로운 텍스트를 추가하는 것과 유사합니다.  

파일 내에서 '커서'가 어디에 위치해 있는지 알고 이를 제어할 수 있는 것은 매우 유용합니다. 이를 위해 다음 메서드들을 사용할 수 있습니다:  

- **`.tell()`**: 현재 위치를 바이트 단위로 반환합니다.  
- **`.seek(offset, from)`**: `'from'`을 기준으로 `'offset'`만큼 위치를 변경합니다.  
  - **`from`**의 값은 다음과 같습니다:  
    - **0**: 파일의 시작  
    - **1**: 현재 위치 기준  
    - **2**: 파일의 끝  

In [18]:
with open(exmp2, 'a+') as twf:
    print(f'Initial location: {twf.tell()}')
    
    data = twf.read()
    if (not data): # empty strings return false in python
        print("Read nothing")
    else:
        print(twf.read())
        
    twf.seek(0,0) # move 0 bytes from beginning.
    
    print(f"\nNew Location : {twf.tell()}")
    data = twf.read()
    if (not data):
        print('Read nothing')
    else:
        print(data)
        
    print(f"Location after read: {twf.tell()}")

Initial location: 112
Read nothing

New Location : 0
This is line A
This is line B
This is line C
This is line C
This is line D
This is line E
This is line E

Location after read: 112


#### 코드의 실행 흐름 요약
1. 파일을 열고(a+ 모드), 현재 파일 포인터 위치를 출력합니다. (초기 위치: 파일 끝)
2. 파일을 읽으려고 시도하지만, 파일 포인터가 이미 끝에 있으므로 아무것도 읽지 못합니다.
3. 파일 포인터를 파일 시작점으로 이동합니다.
4. 파일 처음부터 내용을 읽고, 결과를 출력합니다.
5. 파일 읽기가 끝난 후의 파일 포인터 위치를 출력합니다.

<div class='alert alert-block alert-warning'>
    마지막으로, <b><code>w+</code>와 <code>r+</code>의 차이</b>에 대해 알아보겠습니다.<br> 
    이 두 모드는 모두 읽기 및 쓰기 메서드에 접근할 수 있지만, w+ 모드로 파일을 열면 기존 데이터를 모두 삭제하고 파일을 덮어씁니다.
    </div>

In [19]:
with open(exmp2, 'r+') as twf:
    twf.seek(0,0) #write at beginning of file
    twf.write("Line 1" + "\n")
    twf.write("Line 2" + "\n")
    twf.write("Line 3" + "\n")
    twf.write("Line 4" + "\n")
    twf.write("finished\n")
    twf.seek(0,0)
    print(twf.read())

Line 1
Line 2
Line 3
Line 4
finished
ne C
This is line C
This is line D
This is line E
This is line E



In [20]:
with open(exmp2, 'r+') as twf:
    twf.seek(0,0)
    twf.write("Line 1" + "\n")
    twf.write("Line 2" + "\n")
    twf.write("Line 3" + "\n")
    twf.write("Line 4" + "\n")
    twf.write("finished\n")
    # Uncomment the line below
    twf.truncate()
    twf.seek(0,0)
    print(twf.read())

Line 1
Line 2
Line 3
Line 4
finished



<hr>

## Copy a file <a id=4></a>

Let's copy the file **Example2.txt** to the file **Example3.txt**:

In [21]:
# Copy file to another
exmp3 = os.path.join(os.path.expanduser('~'),'Downloads','Example3.txt')


with open(exmp2, 'r') as rf:
    with open(exmp3, 'w') as wf:
        for line in rf:
            wf.write(line)

In [23]:
# Verify if the copy is successfuly executed

with open(exmp3, 'r') as vwf:
    print(vwf.read())

Line 1
Line 2
Line 3
Line 4
finished



<hr>

## Exercise

당신의 지역 대학교 Raptors 팬클럽은 활성 회원 목록을 .txt 파일에 보관하고 있습니다. 매달 비활성 상태인 회원을 목록에서 제거하여 파일을 업데이트합니다. 이 작업을 Python 기술을 사용하여 자동화하라는 임무를 받았습니다. 

<br>

**주어진 파일**: `currentMem`  
- `currentMem` 파일에서 'Active' 열에 'no'가 있는 각 회원을 제거하세요.  
- 제거된 회원을 추적하여 `exMem` 파일에 추가하세요.  
- 원래 파일 형식이 유지되도록 해야 합니다.  

(*힌트: 전체 줄을 읽고 쓰는 방식으로 처리하며, 헤더가 유지되도록 하세요.*)

<br>

아래 코드를 실행한 후 연습을 시작하세요. 골격 코드가 제공되어 있으니, **`cleanFiles` 함수만 수정**하면 됩니다.

In [27]:
# Run this prior to starting the exercise

from random import randint as rnd

memReg = os.path.join(os.path.expanduser('~'),'Downloads','members.txt')
exReg = os.path.join(os.path.expanduser('~'),'Downloads','inactive.txt')
fee = ('yes','no')

def genFiles(current, old):
    with open(current, 'w+') as wf:
        wf.write("Membership No  Date Joined  Active  \n")
        data = "{:^13}  {:<11}  {:<6}\n"
        
        for rowno in range(20):
            date = str(rnd(2015,2020))+'-'+str(rnd(1,12))+'-'+str(rnd(1,25))
            wf.write(data.format(rnd(10000,99999), date, fee[rnd(0,1)]))
            
    with open(old, 'w+') as wf:
        wf.write("Membership No  Date Joined  Active  \n")
        data = "{:^13}  {:<11}  {:<6}\n"
        for rowno in range(3):
            date = str(rnd(2015,2020))+'-'+str(rnd(1,12))+'-'+str(rnd(1,25))
            wf.write(data.format(rnd(10000,99999),date,fee[1]))
            
genFiles(memReg, exReg)

<div class='alert alert-block alert-warning'>
    [Tip]
    <ul>
        <li>데이터 형식 지정:</li>
        <code>data = "{:^13}  {:<11}  {:<6}\n"</code>
        <ul><li><code>{:<}</code> 외쪽정렬</li>
            <li><code>{:^}</code> 가운데정렬</li>
    </ul>
    
</div>

#### **Exercise:** Implement the cleanFiles function in the code cell below.

In [48]:
'''
The two arguments for this function are the files:
    - currentMem: File containing list of current members
    - exMem: File containing list of old members
    
    This function should remove all rows from currentMem containing 'no' 
    in the 'Active' column and appends them to exMem.
    '''
def cleanFiles(currentMem, exMem):
    # TODO: Open the currentMem file as in r+ mode
    with open(currentMem, 'r+') as wf:
        #TODO: Open the exMem file in a+ mode
        with open(exMem, 'a+') as af:

        #TODO: Read each member in the currentMem (1 member per row) file into a list.
        # Hint: Recall that the first line in the file is the header.
            wf.seek(0,0)
            members = wf.readlines()
            header = members[0]
            members.pop(0)   #헤더 삭제
        #TODO: iterate through the members and create a new list of the innactive members
            inactives = [mem for mem in members if 'no' in mem]
        # Go to the beginning of the currentMem file
        # TODO: Iterate through the members list. 
        # If a member is inactive, add them to exMem, otherwise write them into currentMem
            wf.seek(0,0)
            wf.write(header)
            for mem in members:
                if mem in inactives:
                    af.write(mem)
                else:
                    wf.write(mem)
            wf.truncate()


In [49]:
cleanFiles(memReg,exReg)


headers = "Membership No  Date Joined  Active  \n"
with open(memReg,'r') as readFile:
    print("Active Members: \n\n")
    print(readFile.read())
    
with open(exReg,'r') as readFile:
    print("Inactive Members: \n\n")
    print(readFile.read())
                

Active Members: 


Membership No  Date Joined  Active  
    49324      2019-5-3     yes   
    45160      2020-4-14    yes   
    94542      2018-9-7     yes   
    35469      2020-11-12   yes   
    56871      2015-12-17   yes   
    37744      2017-7-11    yes   
    49364      2016-3-18    yes   

Inactive Members: 


Membership No  Date Joined  Active  
    54218      2017-1-20    no    
    75480      2016-7-11    no    
    72278      2017-12-15   no    
    87612      2017-4-11    no    
    55389      2015-1-18    no    
    89628      2019-9-15    no    
    80428      2018-3-19    no    
    71128      2016-6-6     no    
    22216      2019-2-23    no    
    24012      2019-3-22    no    
    44144      2017-10-16   no    
    50563      2016-11-6    no    
    71985      2016-2-11    no    
    66288      2019-12-14   no    
    70139      2018-7-20    no    
    88097      2017-8-22    no    

