# 第6回予習課題（＋挑戦課題）

▲は挑戦課題を意味する。
予習課題を解いた後に、任意で挑戦することを意図している。

▲ indicates advanced exercises.
They are designed to tackle optionally with after solving pre-exercises.

## イテレータと高階関数によるデータ処理 (Data processing with iterators and higher-order functions)

次のような、縦棒`'|'`区切りのCSVファイルpre6-table.csvを処理することを考える。

Consider data processing of the following CSV file pre6-table.csv delimited by vertical bar `'|'`. 
```
名前     | 年齢 | 職業
東大太郎 | 20   | 学生
東大次郎 | 18   | 学生
岩田聡   | 55   | ゲームクリエイター
Larry    | 12   | Chief Mouser to the Cabinet Office
香香     |  2   | ジャイアントパンダ
```

1行目は、各列の意味を説明する文字列（フィールド名）が入り、2行目以降が、実際のデータ部分である。

このファイルの1行の文字列を与えて、その中のセルを走査するイテレータを返す関数`cells()`が、次のように与えられている。

The first row denotes the descriptions of columns, i.e., field names, and the remaining rows denotes the actual data part.

A function `cells()` that takes a line of this file and returns an iterator traversing the cells is given as follows.

In [None]:
def cells(line):
    return map(str.strip, line.split('|'))

print(*cells('東大太郎 | 20   | 学生\n'))
print(tuple(cells('東大太郎 | 20   | 学生\n')))

まず、pre6-table.csvのファイルオブジェクト（行単位のイテレータ）を受け取り、データ部分（2行目以降）の各行をタプルで生成するイテレータを返す関数`datarows()`を定義せよ。ただし、for文などを使わずに、`map()`や内包表記（特にジェネレータ式）を使って、入力ファイルの行数を限定せずに実装せよ。6-1の`tailmax()`の定義を参考にせよ。

First of all, define a function `datarows()` that takes a file object (i.e., linewise iterator) of pre6-table.csv and returns an iterator yielding row tuples of the actual data part.
The `datarows()` function must be defined without use of iteration like the for statement and with use of `map()` and/or comprehensions (especially, generator expressions) and must not limit the number of the lines of a given file; cf. the definition of `tailmax()` in 6-1.

In [None]:
## 解答用セル（A cell for answering) ##
##===================================##
## 次の関数を完成させよ。            ##
## Complete the following function.  ##
def datarows(f):
    ...

定義できたら、次のセルを実行したときに次のように印字されることを確かめよ

After defined, confirm that the following cell run prints as follows.
```
('東大太郎', '20', '学生') ('東大次郎', '18', '学生') ('岩田聡', '55', '代表取締役社長') ('Larry', '12', 'Chief Mouser to the Cabinet Office') ('香香', '2', 'ジャイアントパンダ')
```

In [None]:
with open('pre6-table.csv', encoding='utf-8') as f:
    print(*datarows(f))

`datarows()`の結果を受け取って、その中で最若年の行（タプル）を返す関数`youngest()`を定義せよ。
for文などを使わずに、高階関数（`min()`など）を使って定義せよ。

Define a function `youngest()` that takes a result of `datarows()` and return a row tuple of the youngest.
The `youngest()` function must be defined without use of iteration like the for statement and with use of higher-order functions (e.g., `min()`).

In [None]:
## 解答用セル（A cell for answering) ##
##===================================##
## 次の関数を完成させよ。            ##
## Complete the following function.  ##
def youngest(rows):
    ...

定義できたら、次のセルを実行したときに、Trueが印字されることを確認せよ。

After defined, confirm that the following cell run prints True.

In [None]:
with open('pre6-table.csv', encoding='utf-8') as f:
    print(youngest(datarows(f)) == ('香香', '2', 'ジャイアントパンダ'))

## ▲タプルクラスの拡張 (Extending the tuple class)
上の例では、1行をタプルで表現した。
しかし、各列のフィールド名を用いて、行内のセルをアクセスできると分かりやすい。
そこで、`tuple`を継承し、与えられたフィールド名によってセルを選択するメソッド`field()`を持つ`Row`クラスを定義せよ。
ただし、与えられる表の1行目は、pre6-table.csvのもの同じと仮定してよい。

In the above example, a tuple represents a row.
It is, however, easier to read to access cells of rows with field names.
Then, by inheriting `tuple`, define a `Row` class that has a method `field()` that takes a field name of `str` and returns the corresponding cell.
You can assume to the first line of a given table to be the same as that of pre6-table.csv.

In [None]:
## 解答用セル（A cell for answering) ##
##===================================##
## 次のクラスを完成させよ。          ##
## Complete the following class.     ##
class Row(tuple):
    ...

定義できたら、セルの実行したときに、Trueのみが印字されることを確認せよ。

After defined, confirm that the following cell run prints only True.

In [None]:
r = Row(cells('東大太郎 | 20   | 学生\n')) 
print(r.field('名前') == '東大太郎')
print(r.field('年齢') == '20')
print(r.field('職業') == '学生')

さて、実用的には、pre6-table.csvのフィールド名に限定せず、与えらた表の1行目に記述されているフィールド名を認識するような`Row`クラスが望ましい。
データ部分について、タプルの代わりに、そのような`Row`クラスのインスタンスを生成する`datarows()`を定義せよ。

Then, practically, the `Row` class should not be limited to the fields of pre6-table.csv and should recognize the field description of a given table.
Define `datarows()` that returns an iterator yielding, instead of tuples, the instances of such a `Row` class for the actual data part.

In [None]:
## 解答用セル（A cell for answering) ##
##===================================##
## 次の関数を完成させよ。            ##
## Complete the following function.  ##
def datarows(f):
    ...

定義できたら、セルの実行したときに、表中の名前と年齢が印字されることを確認せよ。

After defined, confirm that the following cell run prints the names and ages in the table.

In [None]:
with open('pre6-table.csv', encoding='utf-8') as f:
    for row in datarows(f):
        print(row.field('名前'), row.field('年齢'))
        
with open('pre6-table-ext.csv', encoding='utf-8') as f:
    for row in datarows(f):
        print(row.field('名前'), row.field('年齢'))