# 準備

## ファイルのダウンロード
*  このノートブックのコードを実行する前に，必ず以下のコード（正確にはコマンド）を実行する
*  このコードは，それ以降のコードで使用するファイルをダウンロードするコードになっている
*  この操作は，ノートブックを開くたび，毎回行う
*  このコードを実行しないと，それ以降のコードが実行できない場合がある
*  コードの内容を理解する必要はない

In [None]:
!curl -L -o exam.txt https://bit.ly/4ddBB2N
!curl -L -o meros.txt https://bit.ly/3MzBQKD

## ダウンロードしたファイルの確認
*  ダウンロードした2ファイルは，それぞれ「exam.txt」「meros.txt」という名前で，ノートブック上に保存される
*  ファイルは画面右側のサイドバーから確認できる（下図）
*  ノートブックをしばらく操作しないと，接続切れとなりファイルは自動的に削除される

<img src="./fig/08_download.png" width="600">

# ファイル入出力の基礎

## Pythonにおけるファイル入出力処理
*  よく行う処理:
>*  処理をした結果をファイルに書き込んで保存する
>*  ファイルからデータを読み込んで処理（集計や表示など）する
>*  例: 10万人分のテストの成績が書かれたファイルを読み込み，平均や偏差値を計算し，その計算結果を別のファイルに書き込んで保存する
*  基本的な処理手順
>*  ファイルを開く
>*  ファイルに書き込む／ファイルから読み込む
>*  ファイルを閉じる
*   Pythonでは，`open`関数を使って，こういった処理を行う

<img src="./fig/08_fileIO.png" width="500">

## `open`関数とファイルオブジェクト
*  `open`関数の基本的な書式：`open('ファイル名', 'モード', encoding='文字コード')`
*  モードはファイルの操作方法を指定するための文字
*  モードの種類（代表的なもの）
>*  `r`: 読み込み
>*  `w`: 書き込み（新規）
>*  `a`: 既に存在するファイルに追加で書き込み
*  正しい文字コードを指定しないと，読み込み／書き込みにおいて文字化けなどの問題が生じる
*  `open`関数は戻り値として，ファイルオブジェクトを返す
*  ファイルオブジェクトの生成が「ファイルを開く」ことに対応する
*  ファイルオブジェクトは，ファイルとのやり取り（読み込みや書き込みなど）を行うための機能を提供する
*  このオブジェクトのメソッド等を使って，ファイルの入出力処理を行う
 
<img src="./fig/08_file_object.png" width="400">

## ファイルオブジェクトに対する主なメソッド

|メソッド名|意味|
|:--|:--|
`read` | ファイルの内容を読み込む． |
`readline` | ファイルから1行ずつ読み込むメソッド．改行文字（`\n`）も含まれる． |
`readlines` | ファイル全体を行単位でリストとして読み込む． |
`write` | 指定された文字列やデータをファイルに書き込む． |
`writelines` | リストやイテラブルなオブジェクトの要素を一度にファイルに書き込む． |
`close` | ファイルを閉じる．ファイル操作が終わった後は，必ずこのメソッドを呼び出す． |      

## ファイルの書き込み
以下のコードはファイルを新たに作成し，書き込みを行っている．
*  1行目: ファイル名が「file1.txt」，モードが「w（書き込み）」，文字コードが「UTF-8」のファイルオブジェクト`x`を生成
*  このとき，ファイル「file1.txt」は存在しないので，新規にファイルが作成されることになる
*  2行目: `write`メソッドで，「Hello World!」をファイルに書き込む
*  3行目: `close`メソッドで，ファイルを閉じる 

In [23]:
x = open('file1.txt', 'w', encoding='utf-8')
x.write('Hello World!')
x.close()

## ファイルの読み込み
以下のコードは，上のコードで作成したファイル「file1.txt」に対する読み込みを行っている．
*  1行目: ファイル名が「file1.txt」，モードが「r（読み込み）」，文字コードが「UTF-8」のファイルオブジェクト`f`を生成
*  このとき，ファイル「file1.txt」が存在しなければ，エラーになる
*  2行目: `read`メソッドで，ファイルの内容を取り出し，変数txtに代入
*  `txt`は`str`のオブジェクトとなる
*  3行目: `txt`を表示
*  4行目: `close`メソッドで，ファイルを閉じる

In [None]:
f = open('file1.txt', 'r', encoding='utf-8')
txt = f.read()
print(f'file1.txtの内容:\n{txt}')
f.close()

## ファイルの上書き
既にあるファイルに対して，モード`'w'`で書き込むと上書きされる．  

In [None]:
#ファイルの書き込み（上書き）
x = open('file1.txt', 'w', encoding='utf-8')
x.write('This is the first line of the file.\n')
x.close()
#ファイルの読み込み
f = open('file1.txt', 'r', encoding='utf-8')
txt = f.read()
print(f'file1.txtの内容:\n{txt}')
f.close()

## ファイルに書き足す
既にあるファイルに対して，モード`'a'`で書き込むと書き足すことができる．

In [None]:
#ファイルの書き込み（書き足し）
x = open('file1.txt', 'a', encoding='utf-8')
x.write('Second line of the file.\n')
x.close()
#ファイルの読み込み
f = open('file1.txt', 'r', encoding='utf-8')
txt = f.read()
print(f'file1.txtの内容:\n{txt}')
f.close()

# `with`文を使ったファイル入出力
`with`文を使うと `close()`メソッドの記述を省略できる．  

`with`文の書式:
```
with ファイルオブジェクト as 変数:
    ファイルを操作する処理
```

*  一般に，ファイルオブジェクトは，`open`関数を使って生成する
*  ファイルオブジェクトは変数に代入される
*  ファイルを操作する処理は`with`ブロックとして記述する（ブロックの範囲をインデントで設定する）
*  `with`ブロックが終了すると，自動的にファイルを閉じる処理（`close`メソッド）が行われる

In [None]:
#ファイルの書き込み
with open('file2.txt', 'w', encoding='utf-8') as x:
    x.write('This is the first line of the file.\n')
#ファイルの読み込み
with open('file2.txt', 'r', encoding='utf-8') as f:
    txt = f.read()
    print(f'file2.txtの内容:\n{txt}')

In [None]:
#ファイルの書き足し
with open('file2.txt', 'a', encoding='utf-8') as x:
    x.write('Second line of the file.\n')
#ファイルの読み込み
with open('file2.txt', 'r', encoding='utf-8') as f:
    txt = f.read()
    print(f'file2.txtの内容:\n{txt}')

以下のコードは，入力した内容をファイルに書き込み，簡単なメモを記録する機能を持っている．

In [None]:
#ファイルの書き込み（書き足し）
with open('memo.txt', 'a', encoding='utf-8') as x:
    while True:
        flag = input('何か入力しますか？(y/n) >> ')
        if flag == 'n':
            break
        #任意のテキスト（メモ）を入力
        memo = input('テキスト入力 >> ')
        x.write(f'{memo}\n')

#ファイルの読み込み
with open('memo.txt', 'r', encoding='utf-8') as f:
    txt = f.read()
    print(f'メモの内容:\n{txt}')


## ファイルを閉じる必要性
*  プログラム（アプリなどの情報システム）は，通常，利用者とシステムとの間で，キーボードや画面などを通じてデータのやり取りをする
*  このようなデータの流れをストリームと呼ぶ
*  さらに，外部のシステムやデータベースの間にもストリームが生じることもある
*  ファイルを開き続けていると，外部のシステム等にアクセスできない，メモリの容量が不足する等の問題が生じる
*  よって，ファイルは開いたら必ず閉じるべき


## ファイル操作の例

## 「meros.txt」の操作

### 「meros.txt」の内容表示

In [None]:
with open('meros.txt', 'r', encoding='utf-8') as f:
    text = f.read()
    print(text)

### 文字列（str）に対するメソッドの利用
文字列(`str`)に対するメソッド `count()` を使って「メロス」が何回登場したかをカウントする．

In [None]:
with open('meros.txt', 'r', encoding='utf-8') as f:
    text = f.read()
    cnt = text.count('メロス')
    print(f'「メロス」の登場回数：{cnt}')

文字列(`str`)に対するメソッド `replace()` を使って「メロス」と「Python」を置き換える．

In [None]:
with open('meros.txt', 'r', encoding='utf-8') as f:
    text = f.read()
    text = text.replace('メロス', 'Python')
    print(text)

先ほどと同様にして，「Python」が何回登場したかをカウントする．

In [None]:
with open('meros.txt', 'r', encoding='utf-8') as f:
    text = f.read()
    text = text.replace('メロス', 'Python')
    cnt = text.count('Python')
    print(f'「Python」の登場回数：{cnt}')

## 「exam.txt」の操作

### 「exam.txt」の内容表示

In [None]:
with open('exam.txt', 'r', encoding='utf-8') as f:
    results = f.read()
    print(results)

## ファイルの内容をリストとして読み込む
*  ファイルオブジェクトは，イテラブルなオブジェクトなので，`for`文の`in`の後に指定することができる
*  ファイルの各行が順番に取り出される
*  取り出される要素は文字列型（str）となる
*  この性質を利用して，ファイル全体を行単位でリストとして読み込む

In [None]:
with open('exam.txt', 'r', encoding='utf-8') as f:
    results = [int(line) for line in f] # リスト内包表記
    print(results)

## ファイルの内容を計算処理する
上記のコードを応用して，「exam.txt」の各行の値を100で割り，その値を「list.txt」に書き込む．

In [None]:
with open('exam.txt', 'r', encoding='utf-8') as f:
    results = [int(line) / 100 for line in f] # リスト内包表記
    
with open('list.txt', 'w', encoding='utf-8') as g:
    for x in results:
        g.write(f'{x}\n')

with open('list.txt', 'r', encoding='utf-8') as h:
    lists = h.read()
    print(lists)

# Pythonにおけるエラー
*  エラーは大きく分けて以下の2つに分類される．
>*  構文エラー（Syntax Errors）
>*  例外（Exceptions） 
*  教科書では「例外」ことを「実行時エラー」と呼んでいる．
*  エラーが発生すると，そのエラーに関する情報が表示される
*  2つのエラーで表示される内容は異なるが，主に表示されるものは以下の3つ
>*  エラーが発生した場所
>*  発生したエラーの名前
>*  エラーメッセージ


## エラーを解決できるようになるために

### エラーの原因を理解しないまま修正しない
* そのとき表面的に解決できたとしても，再度同様のエラーが起きた時に解決できないかもしれないし，同じエラーを何度も起こしてしまうかもしれない

### エラーメッセージをちゃんと読む
*  エラーメッセージの中に，何が悪いのか，どこが悪いのかといった情報が書かれている
*  その情報をみることで，エラーの原因を突き止めることができる
*  英語の意味を調べる手間を惜しまないこと


### エラー解決の経験を積む
*  多くのエラーを，試行錯誤により解決していくことで，エラー解決能力が養われる

## 構文エラー（Syntax Error）
*  よく目にするエラーの一つで「文法エラー」とも呼ばれているエラー
*  Pythonの文法に違反するコードを実行しようとしたときに発生する
*  Pythonインタプリタがコードを理解できず，プログラムが実行される前に検出されるエラー

### SyntaxError: incomplete input
*  コードの構文が不完全である場合に発生するエラー
*  Pythonがコードの一部を正しく理解できない場合に表示される
*  下のコードのように，括弧が閉じられていない場合には，Pythonがコードの終了を検出できなくなるので，このエラーが発生する  
*  このエラーメッセージが表示された場合，コードのどの部分が不完全であるかを調べ，適切に修正する
*  通常，エラーメッセージの行番号や周辺のコードが不完全な入力を示す手がかりとなる

In [None]:
my_list = [1, 2, 3

In [None]:
x = 10
if x < 10:

### SyntaxError: expected ':'
*  コードの特定の場所でコロン「`:`」が期待されているが，それが存在しない場合に発生
*  同様のエラーメッセージに，カンマ「`,`」が抜けているときに発生する"SyntaxError: invalid syntax. Perhaps you forgot a comma?"がある

In [None]:
x = 10
if x < 10
    print('1 digit')

In [None]:
my_dict = {'key1' 10, 'key2' : 20}

### SyntaxError: invalid character
*  Pythonが特定の文字を認識できない場合に発生する
*  下のコードの場合は，全角の「＝」が認識できない無効な文字となる
*  また，全角スペースがコード内にあると"SyntaxError: invalid non-printable character U+3000"というエラーメッセージが表示される

In [None]:
x ＝ 10

In [None]:
x =　10

### SyntaxError: unterminated string literal

*  文字列リテラルが正しく閉じられていないことを示す構文エラー
*  シングルクォート `'` やダブルクォート `"` で囲まれるべき文字列が，片方のクォートで閉じられていない場合に発生

In [None]:
print('Hello!)

## 例外（Exceptions）
*  プログラム実行中に発生するエラー
*  コードが正しい構文で書かれていても，実行時にエラーが発生することがる
*  例えば，ファイルの存在確認をせずに読み込もうとしたり，0で割り算を行おうとするなどが例外の典型
*  Pythonでは，例外は特定のタイプのエラーとして扱われ，発生するときにどの種類の例外が起こったかを特定することができる
*  例外はプログラム実行中に検知して処理することもできます（詳細は次回以降説明）

### NameError


*   組み込み関数の名前などの打ち間違いによって引き起こされるエラー
*   大文字と小文字を間違えているときもこのエラーになる
---
コード:    
```
pint('Hello!')
```
  
エラー表示:   
```
NameError                                 Traceback (most recent call last)
<ipython-input-3-1aaec4ef864a> in <cell line: 1>()
----> 1 pint('Hello!')

NameError: name 'pint' is not defined
```
---


*  エラー表示の3行目 `----> 1 pint('Hello!')` には，エラーが発生した場所が示されている
*  1行目と2行目もエラーの場所に関する情報（特に気にしなくてよい）
*  `name 'pint' is not defined` の部分は，「`'pint'`という名前は定義されていません．」という意味

In [None]:
pint('Hello!')

### TypeError
*  タイプエラーは，データ型に問題があるときに表示されるエラー
*  関数，メソッド，演算が無効なデータ型（クラス）に対して使用された場合に発生

---

コード:  
```
print(10 + '円です。')
```

エラー表示:  
```
TypeError                                 Traceback (most recent call last)
<ipython-input-4-6462738270db> in <cell line: 1>()
----> 1 print(10 + '円です。')

TypeError: unsupported operand type(s) for +: 'int' and 'str'
```
---
  
*    `unsupported operand type(s) for +: 'int' and 'str'`の部分は，「+演算子は整数型（int）と文字列型（str）の演算をサポートしていません．」といったような意味になる
*    `print`関数のカッコ内で数値と文字列を「`+`」で連結しようとしているが，「`+`」は整数型（int）と文字列型（str）のデータを連結できないためエラーになっている  





In [None]:
print(10 + '円です。')

### ValueError
*  対応できないデータ型が関数やメソッドに渡されたときなどに発生する
*  例えば，数字（0～9）以外を含む文字列を`int`関数の引数にすると，ValueErrorが発生する．
  

---
コードの例:  
```
x = int('abc')
print(x)
```
  
エラー:  
```
ValueError                                Traceback (most recent call last)
<ipython-input-9-1af2b357d72b> in <cell line: 1>()
----> 1 x = int('abc')
      2 print(x)

ValueError: invalid literal for int() with base 10: 'abc'
```
---
  
  
*  `base 10`は10進法を意味している
*  `int`関数は，10進法の整数（`base 10`）で記述された値を引数として受け取ることができる
*  つまり，「`invalid literal for int() with base 10: 'abc'`」は「10進法の整数（`base 10`）で記述された値（リテラル）を引数とする`int`関数に対して，10進法の整数（`base 10`）として解釈できない不正な値（リテラル）である文字列 `'abc'`を整数に変換しようとしているよ」といった意味になる

In [None]:
x = int('abc')
print(x)

### IndexError
*  リスト，タプル，文字列などに対して範囲外のインデックスを指定したときに発生する
*  例えば，要素が3つのリストに対してインデックス「3」を指定すると，IndexErrorが発生する．  
   
--- 
コードの例:  
```
my_list = [2, 3, 5, 7] 
print(my_list[4])
```

エラー:  
```
IndexError                                Traceback (most recent call last)
<ipython-input-8-207d238f976c> in <cell line: 2>()
      1 my_list = [2, 3, 5, 7]
----> 2 print(my_list[4])

IndexError: list index out of range
```

---  

* 「`list index out of range`」は「リストのインデックスが範囲外」といった意味になる 

In [None]:
my_list = [2, 3, 5, 7] 
print(my_list[4])

### IndentationError
*  「`if 条件式:`」の次の行など，インデントが必要なところでインデントしていない場合，IndentationErrorとなる
*  このエラーは「インデントがあるはずでは？」という意味になる  

コードの例:  
```
if 10 > 5:
print(True)
```
  
エラー:  
```
  File "<ipython-input-10-95427267147a>", line 2
    print(True)
    ^
IndentationError: expected an indented block after 'if' statement on line 1
```
  
---
  
*  「expected an indented block」は「1つのインデントされたブロックが予測されました」といった意味となる


In [None]:
if 10 > 5:
print(True)

*  インデントする必要がないところでインデントしている場合もIndentationErrorになる．  
  
---
コードの例:  
```
print('Hello!')
    print('Python')
```

エラー:  
```
  File "<ipython-input-11-0a0ea23f05b4>", line 2
    print('Python')
    ^
IndentationError: unexpected indent
```
---
  
*  「unexpected indent」は「予期しないインデント」といった意味になる．  


In [None]:
print('Hello!')
    print('Python')

### KeyError
*  ディクショナリ（dict）を操作する際に，指定されたキーが辞書内に存在しない場合に発生するエラー
---
コードの例:  
```
my_dict = {'key1' : 10, 'key2' : 20}
print(my_dict['key3'])
```

エラー:  
```
KeyError                                  Traceback (most recent call last)
<ipython-input-13-b5e5fd63cdc7> in <cell line: 2>()
      1 my_dict = {'key1' : 10, 'key2' : 20}
----> 2 print(my_dict['key3'])

KeyError: 'key3'
```
---
*  このコードの場合、辞書 `my_dict` 内には '`key3`' というキーが存在しないため，'`key3`' に対する値を取得しようとしたときに KeyError が発生する  

In [None]:
my_dict = {'key1' : 10, 'key2' : 20}
print(my_dict['key3'])

### ZeroDivisionError
* 数値を0で割ろうとしたときに発生する
---
コードの例:  
```
x = 0
10 / x
```

エラー:  
```
ZeroDivisionError                         Traceback (most recent call last)
<ipython-input-14-84bb7c42511b> in <cell line: 2>()
      1 x = 0
----> 2 10 / x

ZeroDivisionError: division by zero
```
---

In [None]:
x = 0
10 / x

## スタックトレース
*  実行時エラーが発生すると多くの場合に表示される
*  エラーが発生するまでの過程（関数の呼び出し順序等）が示される
*  エラー解決に役立つ情報
*  一般にスタックトレースを遡って順に問題がないか確認する


In [None]:
def funcA(z):
    ans = z * a
    print(ans)

def funcB(x, y):
    z = x + y
    funcA(z)

x = 10
y = 20
funcB(x, y)

<img src="./fig/08_stack_trace.png" width="500">

# 参考資料
*  東京大学, [4-1. ファイル入出力の基本](https://colab.research.google.com/github/utokyo-ipp/utokyo-ipp.github.io/blob/master/colab/4/4-1.ipynb), 「プログラミング入門」講義資料
*  ひらまつしょうたろう, [Python でわかる オブジェクト指向 とはなにか？【Python オブジェクト指向 の「なぜ？」を「徹底的に」解説】](https://www.udemy.com/course/oop-python/?couponCode=KEEPLEARNING), Udemy, 最終更新日 2023/7