# Colabプログラム入門(3) リストと乱数

# リストことはじめ
複数のデータをまとめて扱う時には **リスト** を使うと便利である． 

リストを作る最も簡単な方法は，`[`と`]`の中に要素をカンマ(`,`)で区切って並べる方法である．

たとえば，以下のコードは，`fruits` という変数を定義し，果物の名前からなるリストで初期化する．

In [None]:
fruits = ['banana', 'apple', 'banana', 'orange', 'banana', 'peach', 'apple']
fruits # リストの中身を表示させる

['banana', 'apple', 'banana', 'orange', 'banana', 'peach', 'apple']

リストの各要素には，0から始まる **インデックス** がついている． 上記のコード・セルで生成される `fruits` というリストの各インデックスの要素は，以下のようになっている．

|インデックス|要素|
|---|---|
|`0`|`'banana'`|
|`1`|`'apple'`|
|`2`|`'banana'`|
|`3`|`'orange'`|
|`4`|`'banana'`|
|`5`|`'peach'`|
|`6`|`'apple'`|

**リスト**と**インデックス**の関係は，**アパート**と**部屋番号**の関係に似ている．`fruits`がアパートの名前でインデックス`n`というのは`n`号室に相当すると考えてみると理解しやすいかもしれない．

`fruits`のインデックス`n`(`n`号室)の要素にアクセスするには， `fruits[n]`とする． 以下のコードで `n=0` の値をいろいろ変えて実行してみよう．

In [None]:
n = 0
print( fruits[n] )

banana


インデックスに負の値(`-n`)を与えると，リストの末尾から`n`番目の要素にアクセスできる． 以下のコードでは `n=-1` の時はリストの最後の要素`iris`が表示される．`n=-1`の部分をいろいろ変えて実行してみよう．

In [None]:
n = -1
print( fruits[n] )

apple


存在しないインデックス(上記の場合，7以降や，-8以前)を参照しようとするとエラーが出る． 7部屋しかないアパート(部屋番号は0, 1, 2, 3, 4, 5, 6)に「7号室」の住人が存在しないのと同じ．

In [None]:
n = 7
print( fruits[n] )

IndexError: ignored

リストの要素の変わりにリスト名を`print`関数に渡せば，リスト全体を表示させられる．

In [None]:
print( fruits )

['banana', 'apple', 'banana', 'orange', 'banana', 'peach', 'apple']


リストの長さを獲得するには, `len`関数を使う． リストの**インデックス(部屋番号)の最大値はリストの長さより1だけ小さい**ことに注意しよう．

In [None]:
len( fruits )

7

## リストへの要素の追加と削除
リストに対する操作として，この講義では以下の6つを紹介しておく

|命令|使用例|効果|
|---|---|---|
|`append`|`fruits.append('orange')`| リスト`fruits`の末尾に `'orange'`を追加する |
|`remove`|`fruits.remove('banana')` |  リスト`fruits`の最初の要素 `'banana'` を削除する('banana'がリスト内に無い場合はエラー) |
|`count` | `fruits.count('apple')` | リスト`fruits`内の要素`'apple'`の個数を出力 | 
|`index` | `fruits.index('apple')` | リスト `fruits`内の最初の要素 `'apple'`のインデックスを得る(`'apple'`がリスト内に無い場合はエラー)| 
|`in`|`'kiwi' in fruits`| リスト `fruits` 内に `kiwi`が1つでもあれば `True`, そうでなければ `False` を返す|
|`+` |`fruits = fr0 + fr1` | 2つのリスト`fr0`と`fr1`を連結したものを `fruits`に代入|

次のセルは，上述の操作の例を示す．

In [None]:
# 2つのリスト fr0 および fr1 から fruites を構成する
fr0 = ['banana', 'apple', 'banana', 'orange']
fr1 = ['banana', 'peach', 'apple']
fruits = fr0 + fr1
print( len(fruits), fruits ) # fruits の長さと内容を表示

# append: リスト末尾への要素の追加
fruits.append('orange') # fruits の末尾に 'orange' が追加され，長さが1つ増えて8になる
print( len(fruits), fruits ) # fruits の長さと内容を表示

# remove: リスト内から特定の要素を消去
fruits.remove('orange') # fruits の中から最初の 'orange' が削除され，長さが1つ減って7になる
print( len(fruits), fruits ) # fruits の長さと内容を表示

# count: リスト内の特定の要素の個数を取得
cnt = fruits.count('apple') # fruits の中の `apple` の個数(=2)を変数 cnt に代入
print( "fruits.count('apple')=", cnt ) # cnt を表示

# index: リスト内の特定の要素のインデックスを取得
ind = fruits.index('apple') # fruits の中から 'apple' のインデックス(=1)が変数 ind に格納される(リストに変更なし)
print( "fruits.index('apple')=", ind ) # ind を表示

# in: fruits の中に 'kiwi' があれば True, そうでなければ False を変数 is_kiwi_in_fruits に代入
is_kiwi_in_fruits = 'kiwi' in fruits
print( is_kiwi_in_fruits )

7 ['banana', 'apple', 'banana', 'orange', 'banana', 'peach', 'apple']
8 ['banana', 'apple', 'banana', 'orange', 'banana', 'peach', 'apple', 'orange']
7 ['banana', 'apple', 'banana', 'banana', 'peach', 'apple', 'orange']
fruits.count('apple')= 2
fruits.index('apple')= 1
False


# リストを使った繰返し処理
リストを使うと，大量のデータに対して同じ処理を繰り返すのが容易になる．


### リストを使ったRSA 暗号化・複合化
Python では**文字列**もリスト(のようなもの)として扱われる．このことを利用すれば，前回の課題でやったようなRSA暗号/複合による文字列(課題では漢詩)のやり取りが容易になる． 具体的には，

- [手順1] 元の文字列 `plain_text` に対応したRSA暗号コードのリスト `codes` を作成する
- [手順2] 暗号コードのリスト `codes` を複合化して得られる `text` を作成する

の2つを説明しよう． 


### 文字列のコード化/コードの文字列化
まずは，**暗号化/複合化のことは一度忘れて**，
- [手順1'] 元の文字列 `plain_text` の各要素(i.e. 各文字)に対応する (暗号化されない) Unicodeコードポイントのリスト `points` を作成する
- [手順2'] `points` の各要素(i.e. 各コードポイント)に対応する文字のリストを作成する．

をやってみる． 


まず，[手順1']の準備として，文字列(**リスト**)を変数 `plain_text` に格納しておき，それぞれの**文字**に対する Unicode コードポイントを表示させる，ということをしてみよう. 

In [None]:
# 元のテキスト
plain_text = "国破山河在"
# Unicode ポイントを表示させる
for t in plain_text:
    print("\"{}\"".format(t), ord(t))


"国" 22269
"破" 30772
"山" 23665
"河" 27827
"在" 22312


それぞれのコードポイントを格納したリストを作るには，空のリスト `points` を用意しておき， `append` 関数を使って，各文字に対応するコードポイントを末尾に追加する，という方法を使う． 

In [None]:
points = [] # 空のリストをつくる
for t in plain_text:
    points.append( ord(t) ) # plain_text 内の各要素(文字)に対応するコードポイントを追加する
print(points)

[22269, 30772, 23665, 27827, 22312]


[手順2']では， この逆に `points` に格納された各コードポイントを順に `text` に追加すればよい.


In [None]:
text = [] # 空のリストを作る
for z in points:
    text.append( chr(z) ) # コードポイントに対応する文字を追加する
print(text)

['国', '破', '山', '河', '在']


ちょっとテクニカルだが，この文字のリストを文字列にするには，[str.join](https://docs.python.org/ja/3/library/stdtypes.html?highlight=join#str.join)関数を使って，文字のリストの中の各要素を空の文字("")で連結させればよい． よくわからない人はオマジナイだと思って下記を実行してもいい．

In [None]:
text = "".join(text) # 「文字のリスト」を文字列にする
print( text )

国破山河在


### RSA暗号化/複合化
上記のプロセスに暗号化/複合化を取り入れよう．まずは，公開鍵と秘密鍵を用意する．

In [None]:
import math
p = 2147483647 
q = 200560490131
N = p*q
M = (p-1)*(q-1)
# r を求める
for r in range(2,M):
    if math.gcd(M, r) == 1:
        break
# s を求める
# 拡張 Euclid 互除法 (a > b であるとき, a*x + b*y = gcd(a, b) となる gcd, x, y を求める)
def ext_gcd(a, b):
    if b > 0:
        x, y = ext_gcd(b, a % b) # 再帰呼び出しを使う
        return y - (a // b) *x, x
    return 0, 1 
# 拡張 Euclid 互除法を用いて s をもとめる
s = ext_gcd(M, r)[0] % M 
print("N:{}\nr:{}\ns:{}".format(N, r, s))

N:430700372790627387757
r:37
s:221170461599201861233


まず，

[手順1] 元の文字列 plain_text に対応したRSA暗号コードのリスト codes を作成する

を行うためには， 空のリスト `codes` を用意して， `plain_text` 内の各文字 `t` に対するコードポイント `ord(t)` を， 下記の関数で暗号化したもの付け加えればいい．
```
pow( ord(t), r, N )
```

次のコードと[手順1']に対応するコードとの違いをよく見ておこう．

In [None]:
codes = [] # 空のリストをつくる
for t in plain_text: # plain_text 内の各要素(文字)に対応するコードポイントを暗号化して codes に追加する
    codes.append( pow( ord(t), r, N ) )
print(codes)

[234801175114856694219, 310119012347063789827, 375316860437689720185, 86956151039439756037, 363379270691824403364]


次に，

[手順2] 暗号コードのリスト codes を複合化して得られる text を作成する

は， `codes` 内の各要素 `c` に対して
```
pow( c, s, N )
```
を行なって複合化したものを `chr` として文字に変換すればよい．




In [28]:
text = [] # 空のリストを作る
for c in codes:
    text.append( chr(  pow( c, s, N) ) ) # 暗号化された数値を複合化したコードポイントに対応する文字を追加する
text = "".join(text) # 文字のリストを文字列に変換
print(text)

国破山河在


このようにリストと `for` による繰返しを使えば，長い文字列も容易に暗号化・複合化できる．

In [29]:
# ちょっと長い文字列
plain_text = "寿限無寿限無，五劫のすり切れ，海砂利水魚の水行末，雲来末，風来末，食う寝るところに住むところ，やぶらこうじのぶらこうじ，パイポパイポ，パイポのシューリンガン，シューリンガンのグーリンダイ，グーリンダイのポンポコピーのポンポコナの長久命の長助"
#
# 暗号化
#
codes = [] # 空のリストをつくる
for t in plain_text: # plain_text 内の各要素(文字)に対応するコードポイントを暗号化して codes に追加する
    codes.append( pow( ord(t), r, N ) )
print(codes)
#
# 複合化
#
text = [] # 空のリストを作る
for c in codes:
    text.append( chr(  pow( c, s, N) ) ) # 暗号化された数値を複合化したコードポイントに対応する文字を追加する
text = "".join(text) # 文字のリストを文字列に変換
print(text)

[48098760470719513333, 380704520939795507900, 140848368911603498049, 48098760470719513333, 380704520939795507900, 140848368911603498049, 107683011692300284333, 396555487224217249387, 234612752010473888240, 231312195645662950035, 363240912589803485634, 228764084578948815893, 116971033999252257210, 56117651568552248269, 107683011692300284333, 179924126366837990310, 144238587484720263522, 188161207422255443047, 84528437489304935442, 335478224998635193555, 231312195645662950035, 84528437489304935442, 278625900487419112545, 96330334306358634212, 107683011692300284333, 297604801717456172960, 146555310447474716077, 96330334306358634212, 107683011692300284333, 245692592679144372119, 146555310447474716077, 96330334306358634212, 107683011692300284333, 384143506661704364405, 4262622694212107734, 168916969508315402494, 23610108503332529287, 249991650698447750081, 266682200617855275261, 177021873127836596232, 151748138506695231418, 198584155150245647245, 20105498990638084416, 249991650698447750081,

# リスト内包表記(ちょっと上級)
この節は，**リスト内包表記**という Python に特有の機能を紹介する．リスト内包表記は，**うまく使えば**，コードを短縮化して見易くできる上に処理速度も向上するため，多くのプログラマに利用されている．しかし，不適切なリスト内包表記はプログラムの可読性を損ない保守を困難にする．何度も使ってみて，その利点と欠点のうまいバランスを掴んで欲しい．

## リスト内包表記ことはじめ
上述の暗号化の[手順1]では，
1. 空のリスト`codes`を用意する：
  ```python
  codes = []
  ```
2. `plain_text`内の要素`t`に対応するコードポイントを暗号化したものを`codes`に追加する：
  ```python
  for t in plain_text:
      codes.append( pow( ord(t), r, N ) )
  ```

という2段階の処理を行なっていた．この処理は**リスト内包表記**を使って次の1行で書ける：
```python
codes = [ pow( ord(t), r, N ) for t in plain_text]
```


In [30]:
# 1行で暗号化
plain_text = "寿限無寿限無，五劫のすり切れ，海砂利水魚の水行末，雲来末，風来末，食う寝るところに住むところ，やぶらこうじのぶらこうじ，パイポパイポ，パイポのシューリンガン，シューリンガンのグーリンダイ，グーリンダイのポンポコピーのポンポコナの長久命の長助"
codes = [ pow( ord(t), r, N ) for t in plain_text ]
print(codes)

[48098760470719513333, 380704520939795507900, 140848368911603498049, 48098760470719513333, 380704520939795507900, 140848368911603498049, 107683011692300284333, 396555487224217249387, 234612752010473888240, 231312195645662950035, 363240912589803485634, 228764084578948815893, 116971033999252257210, 56117651568552248269, 107683011692300284333, 179924126366837990310, 144238587484720263522, 188161207422255443047, 84528437489304935442, 335478224998635193555, 231312195645662950035, 84528437489304935442, 278625900487419112545, 96330334306358634212, 107683011692300284333, 297604801717456172960, 146555310447474716077, 96330334306358634212, 107683011692300284333, 245692592679144372119, 146555310447474716077, 96330334306358634212, 107683011692300284333, 384143506661704364405, 4262622694212107734, 168916969508315402494, 23610108503332529287, 249991650698447750081, 266682200617855275261, 177021873127836596232, 151748138506695231418, 198584155150245647245, 20105498990638084416, 249991650698447750081,


リスト内包表記の基本構造は，以下のように表せる：
```python
[ 【式】 for 【変数】 in 【リスト】 ]
[ 【式】 for 【変数】 in 【リスト】 if 【条件式】 ]
```
前者は 「【リスト】の中の各要素を【変数】に入れ，それを【式】で評価したもの」 のリストを構築する．例えば，以下は「0以上N未満の整数のそれぞれを2乗したもの」のリストを返す：
```python
[ n**2 for n in range(N) ]
```
後者は 「【リスト】の中の各要素を【変数】に入れ，それが【条件式】を満たす(真となる)ものついてのみ，【式】を評価したもの」のリストを構築する．例えば，以下は「0以上N未満の"奇数"のそれぞれを2乗したもの」のリストを返す:
```python
[ n**2 for n in range(N) if n%2 == 1]
```


In [32]:
N = 10
print( [n ** 2 for n in range(N)] )
print( [n ** 2 for n in range(N) if n %2 ==1])

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
[1, 9, 25, 49, 81]


## RSA暗号もリスト内包表記ですっきり
リスト内包表記を使えば，RSA暗号の暗号化・複合化もすっきり書ける． まずは公開鍵と秘密鍵を計算しておく．

In [33]:
#
# サンプルコード: rsa_key
# RSA暗号の公開鍵，秘密鍵を生成する
#
import math # 最大公約数を求める関数 math.gcd を使うために必要
(p, q) = (3631339, 3627769) # 2つの異なる素数を用意する
N = p*q # 手続き1: Nを計算
M = (p-1)*(q-1) # 手続き2: Mを計算

# 手続き3: 整数列 2, 3, ..., M-1 の各要素を変数 r に順に代入し， r と M の最大公約数が1となったところで停止する
for r in range(2,M):
    if math.gcd(r, M) == 1:
        break

# 手続き4: 拡張ユークリッド互除法を用いて, r*s % M = 1 なる s を求める．
(a, b) = (r, M)
(x, y, X, Y) = (1, 0, 0, 1)
while b != 0:
    (q, a, b) = (a//b, b, a%b)
    (x, X) = (X, x - q*X)
    (y, Y) = (Y, y - q*Y)
s = x
# 結果の出力
print("公開鍵: (N,r)=({0}, {1})".format(N, r))
print("秘密鍵: s={0}".format(s))

公開鍵: (N,r)=(13173659052691, 5)
秘密鍵: s=2634730358717


In [34]:
plain_text = "寿限無寿限無，五劫のすり切れ，海砂利水魚の水行末，雲来末，風来末，食う寝るところに住むところ，やぶらこうじのぶらこうじ，パイポパイポ，パイポのシューリンガン，シューリンガンのグーリンダイ，グーリンダイのポンポコピーのポンポコナの長久命の長助"
codes = [ pow( ord(t), r, N ) for t in plain_text ]
print(codes)

[8147794798051, 7600468874659, 7368355645539, 8147794798051, 7600468874659, 7368355645539, 2898531932308, 10648118274183, 4270565300787, 11356763446791, 10337436807360, 10871321208033, 1971219393032, 2216070379161, 2898531932308, 9619100540048, 10308520157535, 5993386544958, 7125422358658, 9879942459187, 11356763446791, 7125422358658, 8600419287309, 11456395347166, 2898531932308, 11015107300867, 6148927589303, 11456395347166, 2898531932308, 854558633560, 6148927589303, 11456395347166, 2898531932308, 5407852855792, 229996513772, 5726986850444, 526297799323, 949866220687, 4593420932353, 2776246460246, 6022209809997, 12447556453764, 10125531305555, 949866220687, 4593420932353, 2776246460246, 2898531932308, 8985620374497, 3874213261996, 6894557425759, 4593420932353, 229996513772, 4651996264434, 11356763446791, 3874213261996, 6894557425759, 4593420932353, 229996513772, 4651996264434, 2898531932308, 7322691741328, 1873906898484, 3904464186938, 7322691741328, 1873906898484, 3904464186938, 289

複合化についても同様に行える． いま，`codes`内のあるコードを変数 `c` に格納した時，それを複合化した文字は次の式
```python
chr( pow(c, s, N) )
```
で評価できるから，複合化した文字のリストは
```python
text = [ chr( pow(c, s, N) ) for c in codes ]
```
で得られる． こうして得られた「文字のリスト」 `text` に対して
```python
text = "".join(text)
```
とすれば「文字列」に変換できる．

もっとシンプルに記述したければ， リスト内包表記を直接`join`関数に引き渡してもよい．
```python
text = "".join( [chr( pow(c, s, N) ) for c in codes] )
```
実際にやってみよう．

In [35]:
text = "".join( [chr( pow(c, s, N) ) for c in codes] )
print( text )

寿限無寿限無，五劫のすり切れ，海砂利水魚の水行末，雲来末，風来末，食う寝るところに住むところ，やぶらこうじのぶらこうじ，パイポパイポ，パイポのシューリンガン，シューリンガンのグーリンダイ，グーリンダイのポンポコピーのポンポコナの長久命の長助


## リスト内包表記を使ったRSA暗号化・複合化のまとめ
結局のところ，RSA暗号を使った暗号化・複合化は，それぞれ，以下のように1行のコードで書ける：
- **暗号化** (文字列`plain_text`を暗号コードのリスト`codes`に変換)
  ```python
  codes = [ pow( ord(t), r, N ) for t in plain_text ]
  ```
- **複合化** (暗号コードのリスト`codes`を復号した文字列`decoded_text`に変換)
  ```python
  decoded_text = "".join( [chr( pow(c, s, N) ) for c in codes] )
  ```

楽しい暗号ライフに是非活用して欲しい．



# ランダムな整数列を作ろう
`random`モジュールを使うと，**疑似乱数**を生成させられる．乱数は，ゲームを作ったり，大規模な数値実験をしたりする際に欠かせない． `random`モジュールには色々な機能があるが，この講義では[`random.randrange`関数](https://docs.python.org/ja/3/library/random.html#random.randrange)だけを用いる． 以下のコードを実行すれば，`random.randrange`関数を使えるようになる．

In [36]:
from random import randrange # randomモジュールからrandrange関数を読込む

`randrange`関数の基本的な使い方は以下の2つである．
```python
randrange(N) # 0以上N未満の乱数を1つ返す
randrange(2, N) # 2以上N未満の乱数を1つ返す
```

次のコードセルは，`N`と`M`が与えられた時に，2以上`N`未満の`M`個の乱数からなるリストを生成する．実行するたびに異なる乱数列が生成されることを確認しよう．

In [42]:
N = 100 # 乱数の幅
M = 50 # 乱数の個数
nums = [] # 空のリスト nums を準備
for n in range(M): # M回の繰返しの中で「2以上N未満の乱数」を生成し，numsに追加する
    nums.append( randrange(2,N) )
print(nums) # nums を出力

[62, 20, 25, 62, 81, 29, 47, 11, 34, 3, 84, 95, 87, 46, 85, 68, 9, 25, 52, 36, 23, 81, 10, 12, 81, 49, 39, 7, 88, 53, 28, 27, 60, 66, 89, 6, 9, 40, 54, 40, 4, 14, 69, 11, 9, 28, 23, 4, 14, 61]


(ちょっと上級者向け)上述の**リスト内包表記**を使えば，もっとシンプルに書ける:

In [44]:
N = 100 # 乱数の幅
M = 50 # 乱数の個数
nums = [ randrange(2, N) for n in range(M) ] # M個の「2以上N未満の乱数」からなるリスト nums を作成する
print(nums) # nums を出力

[82, 83, 68, 47, 78, 35, 65, 97, 87, 70, 61, 87, 48, 92, 36, 93, 60, 30, 23, 43, 14, 35, 65, 53, 33, 4, 65, 43, 9, 87, 54, 4, 64, 57, 75, 51, 51, 44, 47, 18, 54, 89, 97, 56, 84, 54, 19, 96, 14, 30]


## ランダムに生成された数列を奇数と偶数とに分類しよう
上述のように生成された乱数列 `nums` を奇数と偶数とに分類しよう． 次のコードは， `nums`のうち奇数からなるリスト`odd_nums`と偶数からなるリスト`even_nums`を作成し，それぞれについて個数と最初の20個までの要素を表示させる．

その具体的な手順は下記の通り:
- [手順0] 空のリスト `odd_nums` と `even_nums`を用意する
- [手順1] `nums`の要素を順に変数 `x`に格納し，`x`が奇数ならリスト`odd_nums`に, `x`が偶数ならリスト`even_nums`の末尾に追加する
- [手順2] `odd_nums`と`even_nums`のそれぞれについて，個数と最初の20個までの要素を出力する

以下，各手順を実装していこう．

まず，[手順0]は，
```python
odd_nums = []
even_nums = []
```
と書ける．

次に，[手順1]は，`for`ループを使って
```python
for x in nums:
    if x%2 == 1: # xが奇数なら odd_nums, 偶数なら even_nums のリスト末尾に追加する
        odd_nums.append(x)
    else:
        even_nums.append(x)
```
と書ける．

最後に，[手順2]について，奇数のリスト`odd_nums`の**最初の20個までの要素**を表示するというのは，
- `len(odd_nums)>20`ならば 最初の20個 を表示する
- `len(odd_nums)<=20` ならば全ての要素を表示する
ということに他ならない．

まず，`odd_nums`の長さが20を超えている場合に最初の20個を表示するには，以下のようにする：
```python
print( odd_nums[:20] )
```
Python ではリストのインデックスに`:`を用いた [**スライス表現**](https://docs.python.org/ja/3/reference/expressions.html#slicings) を指定することができ，うまく使えば読み易く効率的なコードを書くことができる．その詳細な仕様に興味がない人は，オマジナイだと思って使っておこう．

一方，`odd_nums`の要素数が20個以下の時には
```python
print( odd_nums )
```
とすれば全要素を表示できる．

結局，奇数リスト`odd_nums`を出力するためのコードは，以下のように書ける：
```python
max_len = 20
if len(odd_nums) > max_len:
    print( odd_num[:max_len] )
else:
    print( odd_nums )
```
もしくは，[`min`関数](https://docs.python.org/ja/3/library/functions.html#min)を用いて以下のように書いてもよい:
```python
print( odd_nums[: min(max_len, len(odd_nums) )] ) # odd_nums の長さが max_len 以上なら最初の max_len 個を，そうでなければ全要素を出力
```



In [48]:
# [準備]
N = 1000000 # 乱数の幅
M = 1000000 # 乱数の個数
nums = [] # 空のリスト nums を準備 
for n in range(M): # M回の繰返しの中で「0以上N未満の乱数」を生成し，numsに追加する
    nums.append( randrange(N) )
# 以上のプロセスはリスト内包表記を使って次の1行で書くこともできる
# nums = [randrange(N) for n in range(M)]




In [56]:
# [手順0] 空のリスト `odd_nums` と `even_nums`を用意する
odd_nums = []
even_nums = []
# [手順1] `nums`の要素を順に変数 `x`に格納し，`x`が奇数なら`odd_nums`に, `n`が偶数なら`even_nums`に格納する
for x in nums:
    if x % 2 == 1:
        odd_nums.append(x)
    else:
        even_nums.append(x)

# [手順2] `odd_nums`と`even_nums`のそれぞれについて，個数と最初の20個までの要素を出力する
max_len = 20
print("奇数は{0}個:".format(len(odd_nums)))
print( odd_nums[: min(max_len, len(odd_nums) )] ) # odd_nums の長さが max_len 以上なら最初の max_len 個を，そうでなければ全要素を出力
print("偶数は{0}個:".format(len(even_nums)))
print( even_nums[: min(max_len, len(even_nums) )] ) # even_nums の長さが max_len 以上なら最初の max_len 個を，そうでなければ全要素を出力


奇数は499668個:
[32679, 92389, 357333, 806065, 105735, 207109, 818317, 546795, 178373, 561777, 529601, 393017, 478519, 283517, 260423, 738719, 955277, 979293, 488951, 598195]
偶数は500332個:
[2598, 501446, 488098, 947088, 574800, 454180, 366772, 779036, 679070, 828706, 991394, 85268, 122230, 2818, 64134, 457126, 725410, 360634, 6186, 720612]


(ちょっと上級者向け)リスト内包表記を使えなくともないが，`odd_nums`と`even_nums`のそれぞれで`for`を使うため，あまり効率的ではない．このあたりの勘どころは何度もコーディングしているうちに判ってくるようになる．


In [57]:
# [手順1] `nums`のうち奇数からなるリスト `odd_nums` と偶数からなるリスト `even_nums`を作成する
odd_nums =  [x for x in nums if x%2==1]
even_nums = [x for x in nums if x%2==0]

# [手順2] `odd_nums`と`even_nums`のそれぞれについて，個数と全要素を出力する
max_len = 20
print("奇数は{0}個:".format(len(odd_nums)))
print( odd_nums[: min(max_len, len(odd_nums) )] ) # odd_nums の長さが max_len 以上なら最初の max_len 個を，そうでなければ全要素を出力
print("偶数は{0}個:".format(len(even_nums)))
print( even_nums[: min(max_len, len(even_nums) )] ) # even_nums の長さが max_len 以上なら最初の max_len 個を，そうでなければ全要素を出力

奇数は499668個:
[32679, 92389, 357333, 806065, 105735, 207109, 818317, 546795, 178373, 561777, 529601, 393017, 478519, 283517, 260423, 738719, 955277, 979293, 488951, 598195]
偶数は500332個:
[2598, 501446, 488098, 947088, 574800, 454180, 366772, 779036, 679070, 828706, 991394, 85268, 122230, 2818, 64134, 457126, 725410, 360634, 6186, 720612]


ここまでで講義資料はおしまい．あとは課題7に取り組んで欲しい．

# テキストセルの書き方
テキストセルに表や箇条書き，実行結果などを記述したい場合は， markdown という特定の記法が使えます．まずは，このテキストセルをダブル・クリックしてみてください． Colab ノートブックで見えるものと，実際に書かれているもの(もとのテキストと呼びます)が一部違っているのが判ると思います．たとえば，もとのテキストでは，ここ→
←ここで改行してますが，notebook では改行されているように見えませんよね．

テキストセルで改行するには，上のように空の行を入れます(実際には改行ではなく，段落を変えていることになります)．次のようにすれば，箇条書きに見えます．

1. ほげ
2. ほげ
3. ほげ

プログラムのソースコードや，出力結果を記述するには，次のように「｀｀｀」と書いた行と「｀｀｀」と書いた行の間に書いてください(｀は半角で)．
 `は**バッククォート**と呼ばれ，[使っている環境によって入力方法が異なる](https://316-jp.com/keyboard-backquote)ようです．
```
奇数は499706個:
[973345, 880141, 609939, 834047, 736461, 494271, 392993, 209635, 316921, 647927, 755637, 672777, 607083, 515797, 844665, 249007, 137287, 721277, 343963, 151773]
偶数は500294個:
[148164, 458108, 817070, 403290, 451316, 631762, 666370, 712000, 724030, 990802, 606886, 332808, 190742, 945460, 718294, 293714, 579262, 285442, 754676, 923228]
```

# [オマケ]素数のリストを作ろう
前回の課題6で求めた「`N`未満の素数の個数と和」について，リストを使った異なる2つの方法を示そう．
1. 素数を順にリストに追加していく方法
2. 整数のリストから合成数を削除していく方法




## 1.素数を順にリストに追加していく方法(愚直な方法)
まず，ある整数`x`が素数か否かを判定する関数`is_prime`を定義しておこう． 前回講義で紹介したものの中で最も効率の悪いものと同じだ．

In [None]:
#
# x が素数ならば True, そうでなければ False を返す関数を定義
#
def is_prime(x):
    is_prime = True # x が素数かどうか判らないので，とりあえず素数としておく
    # x が2未満なら素数ではない
    if x < 2:
        is_prime = False
    # n についてのループここから
    for n in range( 2, x ): # 2以上x未満の整数(x の約数の候補)を順に n に入れて調べる
        if x % n == 0: # もし x が n で割り切れるなら xは素数ではない
            is_prime = False
    # n についてのループここまで
    return is_prime # is_prime を戻り値として関数から抜け出す

In [None]:
is_prime(53)

True

上記の `is_prime` 関数を使って，次の3つの手順からなるプログラムを作ってみよう．

- [手順0] 空のリスト `prime_nums` を作成する
- [手順1] `2`以上`N`未満の整数を順に `x` に代入し，`x`が素数なら `prime_nums` の末尾に追加するループを作る
- [手順2] `prime_nums`の長さと総和を出力する

各手順の実装方法を述べよう．

[手順0]は，以下のいずれか実装できる:
```python
prime_nums = [] # 要素を持たないリストを与える
prime_nums = list() # list関数を引数無しで呼び出す
```

[手順1]は，`for`ループと `append`関数を使って以下のように実装できる:
```python
for x in range(2, N): # 2以上N未満の整数を順に x に代入
    if is_prime(x): # x が素数なら, prime_numsの末尾に x を追加
        prime_nums.append(x)
```

[手順2]は，`len`関数と`sum`関数を使って以下のように実装できる:
```python
num = len(prime_nums)
val = sum(prime_nums)
print( "N={0}未満の素数 個数:{1} 総和:{2}".format(N, num, val) )
```

以上をまとめたものが次のサンプルコードである

In [None]:
%%time 
#
# サンプルコード: count_prime1
# 素数のリストを生成する
# 
N = 2000
# [手順0] 空のリスト prime_nums を作成する
prime_nums = [] 

# [手順1] 2以上N未満の整数を順に調べ，それが素数なら prime_nums の末尾に追加する
for x in range(2, N):
    if is_prime(x):
        prime_nums.append(x)

# [手順2] len関数とsum関数を使って prime_nums 内の要素の個数と和を求める
num = len(prime_nums)
val = sum(prime_nums)
print( "N={0}未満の素数 個数:{1} 総和:{2}".format(N, num, val) )

N=2000未満の素数 個数:303 総和:277050
CPU times: user 156 ms, sys: 0 ns, total: 156 ms
Wall time: 155 ms


In [None]:
print(prime_nums)

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499, 503, 509, 521, 523, 541, 547, 557, 563, 569, 571, 577, 587, 593, 599, 601, 607, 613, 617, 619, 631, 641, 643, 647, 653, 659, 661, 673, 677, 683, 691, 701, 709, 719, 727, 733, 739, 743, 751, 757, 761, 769, 773, 787, 797, 809, 811, 821, 823, 827, 829, 839, 853, 857, 859, 863, 877, 881, 883, 887, 907, 911, 919, 929, 937, 941, 947, 953, 967, 971, 977, 983, 991, 997, 1009, 1013, 1019, 1021, 1031, 1033, 1039, 1049, 1051, 1061, 1063, 1069, 1087, 1091, 1093, 1097, 1103, 1109, 1117, 1123, 1129, 1151, 1153, 1163, 1171, 1181, 1187, 1193, 1201, 1213, 1217, 12

## 2.整数のリストから合成数を削除していく方法(Eratosthenesのふるい)
今度は，「2以上N未満の整数からなるリストを作り，そこから合成数を削除していく」プログラムを作ってみよう． この方法は「Eratosthenes(エラトステネス)のふるい」と呼ばれている．

このプログラムは，次の4つの手順からなる
- [手順0] 2以上`N`未満の整数からなるリスト `nums` と，空のリスト`prime_nums`を作成する．
- [手順1] `nums`の先頭の要素を`x`とする．`x`は素数なので，それを`prime_nums`に加える．次に，`nums`の中から「`x`とその倍数」を全て取り除く(このため，`nums`の中で最小のものは常に素数である)．これを`x<=N**0.5`である限り繰返す．
- [手順2] [手順1]が終わった時点で`nums`の中身は全て素数なので，これを`prime_nums`に加える．
- [手順3] `prime_nums`の長さと総和を出力する

各手順は，以下のように実装できる．

[手順0]は `range`関数を使って以下のように実装できる:
```python
prime_nums = []
nums = list( range(2,N) )
```
実は，`range(2, N)`は「2以上N未満の整数列全体」という**リスト**ではなく，必要な時に必要な整数を都度生成する**特別なオブジェクト**である．これにより，`range(1000000000)`のような，途方もなく大きな整数列を扱う時も，その要素の全てを実際にメモリに記憶しておく必要がなくなる．しかし，`range`オブジェクトに対しては `remove`関数などを使うことができないので，生成されたオブジェクトを`list`関数に与えてリストにしてやる必要がある．ここでは詳細な仕様に踏み込むことはせず，上記の手順を「2以上`N`未満の整数からなる**リスト**が作れるオマジマイ」として覚えておこう．

[手順1]はちょっと複雑だ．まずはコードを見て欲しい．
```python
x = nums[0] # nums の先頭の要素を x とする
while x <= N**0.5: # x が√N以下なら繰返す
    # [手順1-1] x は素数なので prime_nums の末尾に加える
    prime_nums.append(x)
    # [手順1-2] nums の中で x と x の倍数を取り除く
    for n in range(x, N, x): # range(x, N, x)は「x以上N未満で等差がxの整数列」を生成
        if n in nums: # n が num にあれば取り除く
            nums.remove(n)
    # [手順1-3] nums の先頭の要素(素数)を x とする
    x = nums[0]
```
最初の行は繰返しの条件を表している．`nums`の先頭の要素(`nums[0]`)を `x` とするとき，`x`が`N**0.5`(=√N)以下なら，その後の処理を行なう．調べる範囲が√N以下でよいのは，積の対称性によるもの(第11回の講義資料を参照)．

[手順1]の繰返し処理の中身は，以下の3つに分かれている
- [手順1-1] `x` は素数なので， `prime_nums` の末尾に加える．
- [手順1-2] `nums`から`x`と`x`の倍数を取り除く．
- [手順1-3] `nums` の先頭の要素(素数)を`x`とする．

[手順1-1]は特に説明は不要だろう．`prime_nums`の末尾に加えるのに`append`関数を使っている．
[手順1-2]は `for n in range(x, N, x):` の行で使われている`range(x, N, x)`がミソだ．`range`関数は第3引数が与えられると，それを等差とみなした等差数列を生成する．そのため，`range(x, N, x)`は，「`x`以上`N`未満で，等差`x`の等差整数列」を生成するのだ．これを順に `n` に代入し，続く `if` ブロックで「`n`が`nums`に入っていれば，それを取り除く」という処理をしている．
[手順1-3]も説明は不要だろう．`nums`の先頭の要素は，それより小さい1以外の約数を持たない(素数)であることが自明である．

[手順2]は2つのリスト`prime_nums`と`nums`を`+`を使って連結させたリストを，再び`prime_nums`に代入すればよいので，以下のコードで実装できる：
```python
prime_nums = prime_nums + nums
```

[手順3]はさっきと同じだ．
```python
num = len(prime_nums)
val = sum(prime_nums)
print( "N={0}未満の素数 個数:{1} 総和:{2}".format(N, num, val) )
```

以上をまとめたものが次のサンプルコードである．最初の行の`%%time`はマジックコードである．Colab notebook では，コードセルの先頭に`%%time`と書いておくと，その**セル**の実行にかかる時間を表示する．前回の講義で使ったマジックコード`%time`は，その**行**の実行にかかる時間を表示する．よく似ているので注意されたい．


In [None]:
%%time
#
# サンプルコード: count_prime2
# Eratosthenesのふるいを使って素数のリストを生成する
#
# [手順0] 空のリスト prime_nums と2以上N未満の全ての整数からなるリスト nums を作成する
N = 2000
prime_nums = []
nums = list( range(2,N) )

# [手順1] numsの先頭の要素 x を prime_nums に追加し， nums から x と xの倍数を取り除く．これを x <= N**0.5 の間繰返す．
x = nums[0]
while x <= N**0.5:
    # [手順1-1] nums の先頭の要素 x を prime_nums に追加する
    prime_nums.append(x)
    # [手順1-2] x と x の倍数を nums から取り除く
    for n in range(x, N, x):
        if n in nums:
            nums.remove(n)
    # [手順1-3] nums の先頭の要素(素数)を x とする
    x = nums[0]

# [手順2] [手順1]が終わった時点で nums には素数だけが残っているので，これを prime_nums と連結させる
prime_nums = prime_nums + nums

# [手順3] len関数とsum関数を使って prime_nums 内の要素の個数と和を求める
num = len(prime_nums)
val = sum(prime_nums)
print( "N={0}未満の素数 個数:{1} 総和:{2}".format(N, num, val) )

N=2000未満の素数 個数:303 総和:277050
CPU times: user 35.1 ms, sys: 0 ns, total: 35.1 ms
Wall time: 35.3 ms


## 2の改良版
2の「Eratosthenes のふるい」は，理論的には1の愚直な方法よりも計算量が小さくなることが知られている([参考](https://mathtrain.jp/eratosthenes))．
しかし，実際に上記の方法で実装してみると，意外に処理が遅い．特に，1の愚直な方法について，`is_prime`関数を(前回の講義で解説した方法を使って)効率化した場合，1の愚直な方法の方が速い．これは[手順1-2]で使っている `remove`という関数の処理に時間がかかるためである．
そこで，「`nums`から `x` と `x`の倍数を(`remove`を使って)取り除く」のではなく，「`nums`の中で`x`で割り切れないものだけを集めたリストを新しく作る」という方法を試してみよう．

以下では，これを次の3つの手順で実装する方法を示す：
- [手順1-2-0] もとのリスト`nums`とは別の空リスト`next_nums`を用意する
- [手順1-2-1] `nums`の要素を1つづつ調べながら`x`の倍数でないものを`next_nums`に追加する
- [手順1-2-2] `next_nums` を `nums`に代入する(正確には`next_nums`の名前を`nums`に置き換える)．

```python
# [手順1-2-0] もとのリストとは別の空リスト next_nums を用意する
next_nums = [] 
# [手順1-2-1] nums の要素を1つづつ n に代入し， n が x の倍数でないなら next_nums に追加する
for n in nums:
    if n % x != 0:
        next_nums.append(n)
# [手順1-2-2] next_nums を nums に代入する
nums = next_nums
```

サンプルコード`count_prime2`の[手順1-2]を上記の手順に置き換えたのが次のサンプルコードだ．実行してみると，`remove`を使ったものよりも格段に速くなることが確認できるだろう．

In [None]:
%%time
#
# サンプルコード: count_prime2_rev
# Eratosthenesのふるいを使って素数のリストを生成する (改良版)
#
# [手順0] 空のリスト prime_nums と2以上N未満の全ての整数からなるリスト nums を作成する
N = 2000
prime_nums = []
nums = list( range(2,N) )

# [手順1] numsの先頭の要素 x を prime_nums に追加し， nums から x と xの倍数を取り除く．これを x <= N**0.5 の間繰返す．
x = nums[0] # nums の先頭の要素を x とする
while x <= N**0.5:
    # [手順1-1] x は素数なので prime_nums に追加する
    prime_nums.append(x)
    # [手順1-2] x と x の倍数を nums から取り除く
    # [手順1-2-0] もとのリストとは別の空リスト next_nums を用意する
    next_nums = [] 
    # [手順1-2-1] nums の要素を1つづつ n に代入し， n が x の倍数でないなら next_nums に追加する
    for n in nums:
        if n % x != 0:
            next_nums.append(n)
    # [手順1-2-2] next_nums を nums に代入する
    nums = next_nums
    # [手順1-3] nums の先頭の要素(素数)を x とする
    x = nums[0]

# [手順2] [手順1]が終わった時点で nums には素数だけが残っているので，これを prime_nums と連結させる
prime_nums = prime_nums + nums

# [手順3] len関数とsum関数を使って prime_nums 内の要素の個数と和を求める
num = len(prime_nums)
val = sum(prime_nums)
print( "N={0}未満の素数 個数:{1} 総和:{2}".format(N, num, val) )

N=2000未満の素数 個数:303 総和:277050
CPU times: user 2.34 ms, sys: 20 µs, total: 2.36 ms
Wall time: 2.36 ms



## リスト内包表記をつかった Eratosthenes のふるい
リスト内包表記をうまく使うと，コードを短く&読み易くできるだけでなく，処理速度も向上させられる．例えば，上述した Eratosthenes のふるい(`count_prime2_rev`)の[手順2]をリスト内包表記を使って書いた以下のコード(`count_prime3`)は，`append`を使ったものよりも処理速度が2倍くらい速い．

In [None]:
%%time
#
# サンプルコード: count_prime3
# Eratosthenesのふるいを使って素数のリストを生成する (リスト内包表記を使用)
#
# [手順0] 空のリスト prime_nums と2以上N未満の全ての整数からなるリスト nums を作成する
N = 2000
prime_nums = []
nums = list( range(2,N) )

# [手順1] numsの先頭の要素 x を prime_nums に追加し， nums から x と xの倍数を取り除く．これを x <= N**0.5 の間繰返す．
x = nums[0]
while x <= N**0.5:
    # [手順1-1] nums の先頭の要素 x を prime_nums に追加する
    prime_nums.append(x)
    # [手順1-2] x と x の倍数を nums から取り除く(nums のうち xの倍数でないもので新たなリストを nums とする)
    nums = [n for n in nums if n%x != 0]
    # [手順1-3] nums の先頭の要素(素数)を x とする
    x = nums[0]
# [手順2] [手順1]が終わった時点で nums には素数だけが残っているので，これを prime_nums と連結させる
prime_nums = prime_nums + nums

# [手順3] len関数とsum関数を使って prime_nums 内の要素の個数と和を求める
num = len(prime_nums)
val = sum(prime_nums)
print( "N={0}未満の素数 個数:{1} 総和:{2}".format(N, num, val) )

N=2000未満の素数 個数:303 総和:277050
CPU times: user 10.7 ms, sys: 1 ms, total: 11.7 ms
Wall time: 12.5 ms


## もっと速い方法
実は，もっと速くする方法もある． それは「素数のリスト」を作るのではなく，0以上N未満の全ての整数について「素数(`True`)か否(`False`)か」のラベルからなるリスト`is_prime`を作り，「`m`が素数でなければ候補から取り除く」という処理の代わりに「`m`番地のラベルを `False`(素数でない)に置き換える」，つまり，
```
is_prime[m]=False
```
という処理を行う． この方法だと，「ラベルを格納しておくリスト」の長さが最初から最後まで変わらないので，非常に高速になる．

なお，素数の個数と総和を求めるには，`is_prime[m]==True`となる `n` について，その個数と値を計算すればよい． 

特に，Python を含むプログラミング言語では `True` には数値1が， `False` には数値0が割り当てられているため，
```
sum(is_prime)
```
とすれば個数が求められる． 総和については，仕方がないので
```
[n for n in range(2, N) if is_prime[n]]
```
として， `range(2,N)` の中から `is_prime[n]` が真(素数)となるものだけを取り出したリストを作り，
```
sum( [n for n in range(2, N) if is_prime[n] )
```
としてその総和を取るしかない． この方法はあまり効率がよくないが，それでも `N=20000000` くらいに対して10秒程度で計算できる．



In [None]:
%%time
N = 20000000 # このくらいNが大きいと上記方法との差が明確になる
# 0以上N未満の整数のそれぞれに対して「素数(True)か否(False)か」のラベル
is_prime = [True]*N # N個のリストを用意し，その全てを `True` にしておく
is_prime[0] = False # 0は素数ではないのでラベルを False にする
is_prime[1] = False # 1も素数ではないのでラベルを False にする
for n in range(2,int(N**0.5)+1): # 2以上 √N 以下の候補についてのみ調べる
    if is_prime[n] == False: # n が合成数ならその倍数は既に合成数と判定されている
        continue
    for m in range(2*n,N,n):
        is_prime[m] = False
#
num = sum(is_prime)
val = sum([n for n in range(2,N) if is_prime[n]])
print( "N={0}未満の素数 個数:{1} 総和:{2}".format(N, num, val) )

N=20000000未満の素数 個数:1270607 総和:12272577818052
CPU times: user 8.14 s, sys: 68.2 ms, total: 8.21 s
Wall time: 8.27 s
