<a href="https://colab.research.google.com/github/haloyukka/python/blob/master/AtCoder/Python%E9%AB%98%E9%80%9F%E5%8C%96Tips.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

標準入力<br>
基本的なデータ構造の計算量<br>
Listの効率的な使い方<br>
Sort関連<br>
PythonとPyPy<br>


好きな標準ライブラリ：itertools


# 標準入力

入力例(10の6乗分)
1000000<br>
1<br>
2<br>
3<br>
4<br>
...<br>

In [None]:
n = int(input())
a = [int(input()) for _ in range(n)]

In [None]:
import sys
input = sys.stdin.readline # readlineを使用すると高速化される
n = int(input())
a = [int(input()) for _ in range(n)]

# 基本的なデータ構造の計算量
## Listの各種操作の計算量

lを長さnのListとする<br>


*   ランダムアクセスはO(1)
 *   O(1)といいつつ遅いのでなるべく避けた方が良い
*   **末尾**へのAppend / **末尾**のPopは早いが、その他の場所のAppendやPopは遅い
*   inやmin,maxといった操作は直感的に書くことができ便利だが、O(n)

|Operation|Code example|Average Case|
|---|---|---|
|Append|l.append(x)|O(1)|
|Pop last|l.pop()|O(1)|
|in|x in l|O(n)|
|min, max|min(l), max(l)|O(n)|


# 基本的なデータ構造の計算量
## Set / Dictの各種操作の計算量

sをSet、dをDictとする<br>


*   SetとDictはいわゆるハッシュテーブルとというデータ構造
 *   C++の平衡二分探索木のSetとはまったく別物であることに注意！
 *   inが早い
     *   Listはinが遅いので、inを多用したい場合はSet / Dictでの実装を要検討


◆Set<br>

|Operation|Code example|Average Case|
|---|---|---|
|in|x in s|O(1)|
|Add|s.add()|O(1)?|

◆Dict<br>

|Operation|Code example|Average Case|
|---|---|---|
|in|x in d|O(1)|
|Get item|d[x]|O(1)|
|Set item|d[x] = y|O(1)|

# Listの効率的な使い方
## ListのIndexを使ったアクセス（ランダムアクセス）は非常に遅い。

In [None]:
n = 100**7
a = list(range(n))

# 遅い(334ms)
for i in range(n):
  a[i]

In [None]:
n = 100**7
a = list(range(n))

# 速い(108ms)
for ai in a:
  ai


In [None]:
n = 100**7
a = list(range(n))

# 遅い(310ms)
for i, ai in enumerate(a):
  ai


ランダムアクセスは非常に遅い。

基本的には中段の書き方がおすすめ！
indexが必要になった場合は下段のenumerateを使った書き方も。

# Sort関連
## ListのListのソートにはoperator.itemgetter


In [None]:
import random

n = 10**6
a = [[random(), random(), random()] for i in range(n)]

# 遅い(417ms)
a.sort(key=lambda x: x[1])

In [None]:
from operator import itemgetter

# 速い(375ms)
a.sort(key=itemgetter(1))

ListのListの要素が文字列だったりするとさらに遅くなるので、keyにitemgetterなどを利用して高速化を図るのが良い

# PythonとPyPy
## PyPyとは？



*   安定したJIT(=Just In Time)コンパイラで、ほとんどすべての組み込みモジュールが提供されている
*   Numpyなどは使用できないが、競技プログラミングでは基本的な制御構文とデータ構造を組み合わせたコードを書くことが多いので、**Pythonで書いたコードをそのままPyPyとして提出するだけで速度が上がることが多々ある**。
*   AtCoderで現在提供されているPyPy3(7.3.0)はPython3.6.9と互換性のあるもの

PyPy<br>
https://www.pypy.org/index.html

## local環境へのinstall

pyenvを使うと自分のパソコンで複数のPythonのバージョンを管理することができる
```
$ pyenv install 3.8.2
$ pyenv install pypy3.6-7.3.0
```

以下のコマンドで切り替えができる。
```
$ pyenv local 3.8.2            # set to Python3.8
$ pyenv local pypy3.6-7.3.0    # set to PyPy3
```

詳細についてはpyenvのGithubをチェックしてみてください！！


## PyPyを使うと早くなる例

forやwhileが二重以上になるような場合、PyPyを使った方が明らかに速い。

```Python
n, k = map(int, input().split())
h = tuple(map(int, input().split()))

dp = [10**10] * n
dp[0] = 0
for i in range(1, n):
    dp[i] = min(dp[j] + abs(h[j] - h[i])
                 for j in range(max(0, i - k), i))
print(dp[n - 1])
```
(n <= 10**5, k <= 100)

Python3 : 1713ms

vs

PyPy3 : 343ms

このようにまったく同じコードでも、PyPyにするだけでかなり高速化できる！


## Pythonの方が速い場合
基本的にはPyPyを使うだけでかなりの高速化を見込めるが、一部遅い処理もある。


*   再帰関数を用いた処理
*   文字列に関連した処理

心配な場合は、local環境やAtCoderのコードテストで両言語で試してみてから速い方を提出するなどすると良いと思います。



# References



*   ハイパフォーマンスPython
*   Effective Python
*   https://wiki.python.org/moin/TimeComplexity
*   https://github.com/pyenv/pyenv

https://github.com/Kevinrobot34/cp_python_tips/tree/master/pycon2020
