# Chapter07: Pythonを使うすべての人が知っておくべきこと

## 問題135: PEP8：コーディング規約を知る

**PEP8** は、`Python Enhancement Proposal #8` の略で、Pythonのコードをどのようにフォーマットにするかのコーディング規約です。

<br>

Pythonのコードは、正しい構文である限りは、好きなように書いていいのです。しかし、一貫したスタイルでコードを記述すると、コードがより扱いやすくなり、より可読性が高まります。

**開発規模の大小問わず、全コーダーが押さえておくべき要素だと思います。**

おそらく、長年ソフトウェアエンジニアとして業務をされてきたベテランの方であれば、コーディング規約を知りコードを書くことが、コードの品質や保守性に直結することは理解いただけるかと思います。

<br>

また、Pythonを学習していく中で、OSS開発にご興味のある方もいるかと思います。Python関連のOSS開発では、ほとんどのコミュニティがPEP8に準拠する形で開発が進められています。  
その理由は、OSS開発におけるコーディング規約をPEP8にすることで、新しく参入されるコントリビューターが、すぐに開発に着手できるようになり、コミュニティでの開発スピードが上がり活発になるからです。

<br>

また、一般的なPythonを使った開発現場においても、基本的に組織のコーディング規約があったとしても、PEP8が基本となっていることがほとんどだと思います。(PEP8はPythonの基本みたいなものなので。)
また、コーディング規約が定義されていない場合、暗黙の了解でPEP8を使うことが基本です。

<br>

最低限従うべきPEP8の規則をピックアップしました。

------

### 空白

* インデントには、タブでなく空白を使う
* 構文上意味を持つレベルのインデントには、空白4つ使う
* 各行は、長さが79文字かそれ以下とする
* 長い式を続けるために次の行を使うときは、通常のインデントから4個の追加空白を使ってインデントする
* ファイルでは、関数とクラスは、空白行で分ける
* 辞書では、キーとコロン(:)の間には空白を置かず、同じ行に値を書く場合には値の前に空白を1つ置く。
* 変数代入の前後には、空白を1つ、必ず一つだけおく
* 型ヒント(形アノテーション)では、変数名の直後にコロンを置き、型情報の前に空白を1つ置く。

<br>

### 名前付け

* 関数、変数、属性は、`lowercase_underscore` のように小文字でアンダースコアを挟む
* プロテクテッド(保護)属性は、`_leading_undersocre` のようにアンダースコアを先頭に付ける
* プライベート属性は、`__double_undersocre` のようにアンダースコアを2つの先頭につける
* クラスと例外は、`CapitalizedWord` のように先頭を大文字にする
* モジュールでの定数は、`ALL_CAPS` のようにすべて大文字でアンダースコアを挟む
* クラスのインスタンスメソッドは、（オブジェクトを参照する）第1パラメータの名前に`self`を使う
* クラスメソッドは、（クラスを参照する）第1パラメータの名前に`cls`を使う

<br>

### 式と文(ステートメント)

「The Zen of Python」には、「明らかなやり方が1つ、できれば1つだけあるのがいい」と書かれています。PEP8は、これを式と文で実現しています。

* 式の否定( `if not a is b` )ではなく、内側の項の否定( `if a is not b` )を使う
* コンテナやシーケンスの長さ ( `if len(somelist) == 0` )を使って、空の値( `[]`や `''` など)かどうかをチェックしない。`if not somelit` を使って、空値が暗黙に`Flase`と評価されることを使う。
* 上と同じことを、非空値([1]や"hello"など)にも使う。非空値について、`if somelist` には、暗黙に `True` と評価されます。
* `if` 文、`for` 文、`while` 文、`except` 複合文を1行で書かない。明確になるように複数行にする。
* 式が1行に収まらない時は、括弧で括って、複数行にして、読みやすいようにインデントする。
* `\` で行分けするより、括弧を使って複数の式を囲む方がよい。

<br>

### import

PEP8には、モジュールをインポートして、コードでどう使うのか指針があります。

* import文は、( `from x import y` も含めて)常にファイルの先頭に置く
* インポートする時は、常にモジュールの絶対名を使い、現モジュールのパスから相対名を使わない。例えば、モジュール `foo` をパッケージ `bar` からインポートする時には、`import foo` ではなく、`from bar import foo` を使う。
* 相対インポートを使わなければならない時には、明示的な構文 `from . import foo` を使う。以下の順番で記述し、かつアルファベット順にimportする
  1. 標準ライブラリ
  2. サードパーティーモジュール
  3. 自作モジュール 

### 問題135 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

* 覚えておいてほしいこと
  * Pythonコードを書くときは、常にPEP8スタイルガイドに従う
  * より大きなコミュニティの共通スタイルを共有することで、他の人との仕事がはかどる
  * 一貫スタイルを用いることで、自分のコードの品質を高める

</details>

正直、こんなのいちいち確認する時間ない！って思った方。安心してください。開発現場では、人の目で見てチェックしなくても、便利なツールでチェック・自動フォーマットしてくれます。

次の問題で解説します。

* 参考 [PEP 8 – Style Guide for Python Code](https://peps.python.org/pep-0008/)

---

## 問題136: PEP8のlinterを導入する ~flake8~

## linterとは

linterとは、作成したソースコードをプログラムの実行を伴わず解析を行うツールのことを指します。静的解析ツールとよく言われます。

linterは、先ほど確認したPEP8の規約にどのくらい従って書かれているか確認するためのツールになります。

これは開発現場でも必ずと言っていいほど使用されるツールだと思っています。

Pythonで使用されるlinterは、以下の4つがよく使われます。

* pycodestyle
* pyflakes
* flake8
* pylint

`pylint` は、`Visual Studio Code` で導入されている解析ツールです、VScodeを使わない人もいるかと思うので、今回はパスします。

今回は上記3つのlinterについてご紹介し、最後に`flake8`の使い方を少しだけ紹介します。

### pycodestyle

`pycodestyle`は、作成したPythonコードを`PEP8`のいくつかのコードスタイル規則と照合しチェックするツールです。

このツールは、有名なlinterですが、現在はあまり使われていません。理由は後ほど説明する `flake8` の中で使用されているため、直接`pycodestyle`を呼び出して使われることは少なくなりました。

> [PyCQA/pycodestyle - github.com](https://github.com/PyCQA/pycodestyle)

### pyflakes

`pyflakes` は、Pythonのソースコードのエラーをチェックする解析ツールです。しかし、コードスタイルはチェックせず、未使用の `import`文や変数をチェックします。`pycodestyle`でチェックしない箇所を検出するといった感じです。

しかし、こちらも `pycodestyle`と同様の理由で、現在はあまり直接呼び出して使われる機会が少なくなりました。

> [PyCQA/pyflakes - github.com](https://github.com/PyCQA/pyflakes)

### flake8

`flake8` も、PEP8のコードスタイルと照らし合わせてPythonスクリプトをチェックする解析ツールです。

以下の3つのツールをラップした形で動作しています。
* pycodestyle
* pyflakes
* Ned Batchelder's McCabe script

現在、最も使われている静的解析ツールだと思います。おそらく、linterを使ったことない人は、実際に何をどうしてくれるのか分からないと思うので、実際に使ってみましょう。

> [PyCQA/flake8 - github.com](https://github.com/PyCQA/flake8)

### flake8をインストール

コンソールや端末、コマンドプロンプトなどで、以下のコマンドを実行し、flake8をインストールしましょう。

```bash
    $ pip install flake8
```

### flake8の使い方

例題として、`input` フォルダに、`lint_test_flake8.py` というファイルを作成し、以下のコードを記述しましょう。これは、まだPEP8に準拠していないスクリプトです。

```python
    import os
    import abc
    from numpy import *



    a=1+1
    
    print(a)
    print("This test script.All users of Flake8 should read this portion of the documentation.")
```

これをflake8でコードスタイルを確認してみましょう。

Jupyterではなく、コンソールを開いて、以下のコマンドを実行してみましょう。

```bash
    # 実行コマンド
    $ flake8 input/lint_test_flake8.py
```

以下のような実行結果になったと思います。コーディング規約に問題があった場合、どこにどんな問題があったか表示してくれます。

```bash
    # 実行結果
    input/lint_test_flake8.py:1:1: F401 'os' imported but unused
    input/lint_test_flake8.py:2:1: F401 'abc' imported but unused
    input/lint_test_flake8.py:3:1: F403 'from numpy import *' used; unable to detect undefined names
    input/lint_test_flake8.py:3:1: F401 'numpy.*' imported but unused
    input/lint_test_flake8.py:7:1: E303 too many blank lines (3)
    input/lint_test_flake8.py:7:2: E225 missing whitespace around operator
    input/lint_test_flake8.py:8:1: W293 blank line contains whitespace
    input/lint_test_flake8.py:10:80: E501 line too long (92 > 79 characters)
    input/lint_test_flake8.py:10:93: W292 no newline at end of file
```

このメッセージの味方は、以下の通りです。

```python
    # メッセージの構文
    チェック対象のファイル:行数：列数: エラーコード エラーメッセージ
```

`F<番号>`と書かれているものは、pyflakesでチェックエラーが出たもの、

`E<番号>/W<番号>`が書かれている行は、pycodestyleでチェックエラーがでたものになります。

例えば、"input/lint_test_flake8.py:7:1: E303 too many blank lines (3)" とかかれているので

`input/lint_test_flake8` の　7行目にE303「空行が多すぎる」と書かれています。対象行を修正して実行すると、エラーが消えます。

練習として、残りのエラーも消してみましょう。

> 参考：[Warning / Error codes - flake8](https://flake8.pycqa.org/en/2.6.0/warnings.html)

### 問題

残りのエラーも修正をして、再度 `flake8`を実行しましょう。

### 問題136 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

* flake8でチェックし自分で修正したコード
```python
    # lint_test_flake8.py
    a = 1 + 1
    print(a)
    print("This test script.All users of Flake8 should read\
            this portion of the documentation.")
```

</details>
 
最初は使い慣れたもの・しっくりくるものを使用するといいでしょう。迷ったら、linterは`flake8` を迷わず開発環境に導入しましょう。

また、開発現場によっては、PEP8で特定の構文チェックを含めないケースも多々あるかと思います。その場合、`flake8` の `--ignore` オプションや`--exclude`オプションを使うといいかもしれません。

* 参考 [PyCQA/pycodestyle - github.com](https://github.com/PyCQA/pycodestyle)
* 参考 [PyCQA/pyflakes - github.com](https://github.com/PyCQA/pyflakes)
* 参考 [PyCQA/flake8 - github.com](https://github.com/PyCQA/flake8)
* 参考 [flake8の使い方とオプション - Qitta](https://qiita.com/raku_taro/items/93dacae018fb192d05b5)

---

## 問題137: PEP8のformaterを導入する ~black~

### Pythonのformatterについて

flake8はコードスタイルチェックを実行しますが、自動修正まで実行してくれません。

そのため、上記のエラーを自動で修正したい場合は、別途コードフォーマットを使う必要があります。

ここでは、有名なformatterを紹介します。

* autopep8
* yapf
* balck

### autopep8

PEP 8スタイル ガイドに準拠するように、Pythonコードを自動的にフォーマットしてくれます。`pycodestyle` を使用して、コードのどの部分を修正する必要があるかを判断し、修正まで実行してくれます。しかし、対応するPEP8の規則は、全てに対応しているわけではありません。

> 参考：[autopep8#Features - Github.com](https://github.com/hhatto/autopep8#features)

### yapf

yapfは、Googleが開発した、最もカスタマイズ性の高いformatterとして有名です。こちらもコードスタイルのチェックと修正を実行してくれます。Go言語の"gofmt"に倣って作られたともされており、元のコードがコーディング規約に違反していなくても、自動でスタイルガイドラインに準拠する最適なフォーマットに修正してくれます。

> 参考: [google/yapf - Github.com](https://github.com/google/yapf)

### black

![black](img/136_balck.png)

比較的新しめのformatterです。Githubにも書かれている通り、**"妥協しないフォーマッター"** と謳うだけあって、かなり細かくフォーマットをチェック・修正してくれます。

先ほどの `yapf` と違って、カスタマイズ性は非常に低いですが、非常に人気の高いformatterになっています。

もし、どのformatterを使うかどうか迷うようであれば、`black`を使うことをお勧めします。

### 早速formatterを使ってみる

ここからは、blackを使ってみます。

#### blackのインストール

もし、ご自身の環境にインストールする場合、以下のコマンドを入力してください。(今回は実行の必要ありません。)

```bash
$ pip install black
```

#### blackを使ってみる

inputフォルダに、`formatter_test_black.py`を作成以下のサンプルコードを記述してください。

```python
    import os
    import abc
    from numpy import *



    a=1+1
    
    print(a)
    print("This test script.All users of Flake8 should read this portion of the documentation.")
```

このファイルを作成した後、コンソールで以下のコマンドを実行してみましょう。

```bash
    # 実行コマンド
    $ black input/formatter_test_black.py
```

このコマンドを実行すると、以下のような出力になるかと思います。
```bash
    # 実行結果
    reformatted input/formatter_test_black.py

    All done! ✨ 🍰 ✨
    1 file reformatted.
```

実行結果から分かる通り、自動的にフォーマットされています。ファイル `input/formatter_test_black.py` を確認してみましょう。

#### 問題

自分で `input` フォルダに適当にスクリプトを配置して、`black` で自動フォーマットを実行してみましょう。

### 問題137 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

* blackでフォーマットされたコード
```python
    import os
    import abc
    from numpy import *


    a = 1 + 1

    print(a)
    print(
        "This test script.All users of Flake8 should read this portion of the documentation."
    )
```

</details>
 
個人的には `yapf` がおすすめですが、最初は使い慣れたもの・しっくりくるものを使用するといいでしょう。迷ったら、 formatterは `black` を迷わず開発環境に導入しましょう。

* 参考 [6. モジュール - docs.python.org](https://docs.python.org/ja/3/tutorial/modules.html)
* 参考 [Python でモジュール／パッケージを作成する - まくまくPythonノート](https://maku77.github.io/python/env/create-module.html)

---

## 問題138: pipの使い方

In [None]:
# コードを記述

### 問題138の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

</details>
 
<br>

* 参考 [5.2.2. 名前空間パッケージ](https://docs.python.org/3.10/reference/import.html#namespace-packages)
* 参考 [PEP 420 – Implicit Namespace Packages](https://peps.python.org/pep-0420/)
* 参考 [Namespace vs regular package - stackoverflow](https://stackoverflow.com/questions/21819649/namespace-vs-regular-package)
* 参考 [__init__.py を省略してはいけない - Qitta](https://qiita.com/methane/items/ed1e5b74747f3ffe9324)

---

## 問題139: pipのアップデート

In [None]:
# 

### 問題139 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

特にありません。

</details>
 
<br>

* 参考 [6.1.1. モジュールをスクリプトとして実行する - docs.python.org](https://docs.python.org/ja/3/tutorial/modules.html#executing-modules-as-scripts)

---

## 問題140: pipでパッケージのバージョンとライセンスを取得する

In [None]:
#コードを記述

### 問題140 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

実行結果
```python
 
```

</details>
 

* 参考 [python-docx - python-docx.readthedocs.io](https://python-docx.readthedocs.io/en/latest/)
* 参考 [python-docx 0.8.11](https://pypi.org/project/python-docx/)
* 参考 [python-docxによるWordファイル操作方法のまとめ - GAMMASOFT](https://gammasoft.jp/support/how-to-use-python-docx-for-word-file/)

---

## 問題141: 開発環境構築のキ ~仮想環境は必ず作る~

In [15]:
#コードを記述


### 問題141 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```


</details>



* 参考 [python-docx](https://python-docx.readthedocs.io/en/latest/index.html)
* 参考 [python-docxによるWordファイル操作方法のまとめ - GAMMASOFT](https://gammasoft.jp/support/how-to-use-python-docx-for-word-file/)

---

## 問題126: PDFデータを読み込んでみよう

### PythonでPDFを扱うためには

PythonでPDFを読み込むためのライブラリは、いくつかあります。例えば、
* PyPDF2
* pdfminer.six
というライブラリがあります。

**`PyPDF2` は、PDFファイルのページを分割、結合、トリミング、変換できるPythonのPDFライブラリです。**

<br>

まず、`PyPDF2` を使ってPDFファイルを開いてみましょう。

今回、`input` フォルダに **126_About_python_wiki.pdf** を格納したため、そちらを開きます。まずはご自身のPCに対象のPDFをインストールして、クリックして普通に開いて中身を確認しましょう。

確認できたら、このPDFをPythonでインストールしていきます。

`PyPDF` を使ってPDFからテキストを抽出するためには、`PdfReader()` の `extract_text()` メソッドを使います。以下の流れでPDFからテキストが抽出ができます。

```python
    import PyPDF2

    with open("input/126_About_python_wiki.pdf", mode="rb") as f:
        reader = PyPDF2.PdfFileReader(f)
        page_one = reader.getPage(0)
        print(page_one.extractText())
```

In [None]:
#PyPDFを使ってPDFを読み取る


PDFの内容を読み取ることが出来ました。しかし、`PyPDF2`の欠点は、日本語のに対応していないという点です。

そのため、PDFからテキストを読み取って処理をするということを目的としている場合、`pdfminer.six` を利用しましょう。

また、既にライブラリの開発が終了している点も、このライブラリを使うのはやめた方が良さそうです。

Pythonライブラリは、盛んに開発が行われているライブラリと、そうでないライブラリがありますので、企業で使う場合、注意して選定しましょう。

<br>

`pdfminer.six` は、先ほども説明した通り、テキスト抽出で日本語対応した、PDF処理Pythonライブラリです。PDFを様々な情報を抽出することができます。  
たとえば、テキストデータの正確な位置(座標)、フォントの種類、色を抽出できます。

それでは、同じPDFファイル **input/126_About_python_wiki.pdf** を、`pdfminer.six`を使って読み込んでみましょう。

```python
    from pdfminer.high_level import extract_text

    text = extract_text("input/126_About_python_wiki.pdf")
    print(text)
```


In [None]:
# pdfminer.sixを使ってPDFを読み取ってみましょう


### 問題126 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

* PyPDFをつかってPDFを読み取る
```python
    import PyPDF2

    with open("input/126_About_python_wiki.pdf", mode="rb") as f:
        reader = PyPDF2.PdfFileReader(f)
        page_one = reader.getPage(0)
        print(page_one.extractText())
```

* pdfminer.sixでPDFを読み取る
```python
    from pdfminer.high_level import extract_text

    text = extract_text("input/126_About_python_wiki.pdf")
    print(text)
```

</details>

おそらく、直観的には `pdfminer.six` の方が簡単にpdfが読み込めたのではないでしょうか。

また、PythonでPDFを処理する際に、よくある問題が、PDFが思った通りに読み込めないという問題です。

PDF内の表、図形、段落や改行などによって、こちらが想定しない順番でテキストを読み込む可能性があります。

その場合、プログラムを微調整して処理するしかありません。そこは腕の見せ所だと思っています。


* 参考 [PyPDF2 へようこそ - pypdf2.readthedocs.io](https://pypdf2.readthedocs.io/en/latest/)
* 参考 [Extract Text from a PDF - pypdf2.readthedocs.io](https://pypdf2.readthedocs.io/en/latest/user/extract-text.html#extract-text-from-a-pdf)
* 参考 [pdfminer.six 20220524 - pypi.org](https://pypi.org/project/pdfminer.six/)

---

## 問題127: PDFデータを結合・分割してみよう

### PDFを結合する

続いて、`PyPDF2`を使って、PDFを結合していきましょう。

`input` フォルダに格納した `127_sample.pdf` と、`126_About_python_wiki.pdf` を結合してみましょう。`126_About_python_wiki.pdf` は、前回の問題で扱ったPDFファイルです。

また、結合後のファイルは、`output` フォルダに、`127_concat_newfile.pdf` としましょう。

結合する手順としては、

1. `PdfFileMerger`クラスのオブジェクトを生成
2. 結合したいPDFファイルを`append()`で追加する
3. 2で追加したPDFファイルを、新規PDFに書き出す
4. `PdfFileMerger`で開いたPDFを閉じる( `close()` )ファイルは開いたら、閉じる処理を実行しましょう。

それでは、PDFを結合してみましょう。

```python
    import PyPDF2

    # オブジェクトを作成
    concat_pdf_object = PyPDF2.PdfFileMerger()
    # 結合したいファイルを追加する
    concat_pdf_object.append("input/127_sample.pdf")
    concat_pdf_object.append("input/126_About_python_wiki.pdf")
    # 新規ファイルに書き出す
    concat_pdf_object.write("output/127_concat_newfile.pdf")
    # ファイルを閉じる
    concat_pdf_object.close()
```

In [1]:
# pdfを結合する


### PDFを途中に挿入する

今度は、先ほど結合したPDFの1ページの後に、`input`フォルダに格納されている `127_sample_insert.pdf`　を挿入して結合しましょう。

挿入の流れは結合の手順と変わらないですが、`merge`メソッドを使ってページ指定の挿入を行います。

1. `PdfFileMerger`クラスのオブジェクトを生成
2. 結合したいPDFファイルを`append()`で 追加する
3. `merge`メソッドを利用して、**ページ数を指定して** 追加する
4. 2で追加したPDFファイルを、新規PDFに書き出す
5. `PdfFileMerger`で開いたPDFを閉じる( `close()` )ファイルは開いたら、閉じる処理を実行しましょう。

今回初めて、`merge`というメソッドを使います。

```bash
# Msergeの書式
    merge(
        position: int,
        fileobj: Union[pathlib.Path, str, _io.BytesIO, _io.BufferedReader, _io.BufferedWriter, _io.FileIO, PyPDF2._reader.PdfReader]) -> None
    Merge the pages from the given file into the output file at the
    specified page number.
```

それでは、結合していきましょう。

結合後のファイルは、`output/127_insert_newfile.pdf` としましょう。

```python
    import PyPDF2

    # オブジェクトを作成
    concat_pdf_object = PyPDF2.PdfFileMerger()
    # 結合したいファイルを追加する
    concat_pdf_object.append("output/127_concat_newfile.pdf")
    # 第1引数のpositionで挿入位置を指定
    concat_pdf_object.merge(1, "input/127_sample_insert.pdf")
    # 新規ファイルに書き出す
    concat_pdf_object.write("output/127_insert_newfile.pdf")
    # ファイルを閉じる
    concat_pdf_object.close()
```

In [3]:
# ページ数を指定してPDFを結合する


### PDFを分割する

それでは、続いて指定したページでPDFを分轄してみましょう。

`PyPDF2` にはPDF分割のメソッドは用意されていません。

そのため、PDFを分割する流れは、以下のような手順で実施します。

* `PdfFileMerger()`のインスタンスを生成
* `append()`メソッドで、ページ範囲を指定してオブジェクトに追加
* `write()`メソッドで、追加したページを新規ファイルに書き込みする
* `close()`メソッドで、開いたPDFを閉じる

分割するPDFは、`input/127_b2015_202208sj.pdf` から1~2ページを取り出し、分割したファイルは、`output/split_new_file.pdf` としましょう。

ページ分割のコードは以下のようになります。

また、ページの分割のポイントは、`append()`の引数に、`pages`に `PyPDF2.pagerange.PageRange()`メソッドに分割したいページを`開始ページ:終了ページ`のように指定します。

```python
    # PDFをページを指定して分割
    import PyPDF2

    merger = PyPDF2.PdfFileMerger()
    # ページ範囲を指定してオブジェクトに追加
    merger.append('input/127_b2015_202208sj.pdf', pages=PyPDF2.pagerange.PageRange(':2'))
    # 追加したページを新規ファイルに書き込みする
    merger.write('output/split_new_file.pdf')
    # 開いたPDFを閉じる
    merger.close()
```

In [4]:
# PDFをページを指定して分割


### さらに応用に挑戦 : フォルダに配置されたすべてのPDFを結合してみる

これまでの問題の総括です。あるフォルダに格納されたPDFを分割してみましょう。

そこまで難しくないです、流れは、

* 特定のフォルダから拡張子`pdf`を取得する
* 取得したPDFの結合順番を並び替えたい場合もあると思うので、`sort()`をかけておく
* 1つ1つのファイルを`append()`する
* 新規PDFに書き出す

読み出すフォルダは、`output`とし、書き出すフォルダは`output/all_newfile.pdf`　とします。
(注意)これは、outputフォルダに格納した新規ファイルを結合対象とするため、実行するたびに、すべて結合したPDFも結合されてしまいます。

```python
    import glob
    import PyPDF2

    output_folder_list = glob.glob("output/*.pdf")
    output_folder_list.sort()

    pdfobj = PyPDF2.PdfFileMerger()
    for pdffile in output_folder_list:
        pdfobj.append(pdffile)
        
    pdfobj.write("output/all_newfile.pdf")
    pdfobj.close()
```

In [None]:
# outpuフォルダ内のPDFをすべて結合する


### 問題127 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

* PDFを結合するスクリプト

```python
    import PyPDF2

    concat_pdf_object = PyPDF2.PdfFileMerger()
    concat_pdf_object.append("input/127_sample.pdf")
    concat_pdf_object.append("input/126_About_python_wiki.pdf")
    # 新規ファイルに書き出す
    concat_pdf_object.write("output/127_concat_newfile.pdf")
    concat_pdf_object.close()
```

* ページを指定してPDFを結合する
```python
    import PyPDF2

    # オブジェクトを作成
    concat_pdf_object = PyPDF2.PdfFileMerger()
    # 結合したいファイルを追加する
    concat_pdf_object.append("output/127_concat_newfile.pdf")
    # 第1引数のpositionで挿入位置を指定
    concat_pdf_object.merge(1, "input/127_sample_insert.pdf")
    # 新規ファイルに書き出す
    concat_pdf_object.write("output/127_insert_newfile.pdf")
    # ファイルを閉じる
    concat_pdf_object.close()
```

* ページを指定してPDFを分割
```python
    # PDFをページを指定して分割
    import PyPDF2

    merger = PyPDF2.PdfFileMerger()
    # ページ範囲を指定してオブジェクトに追加
    merger.append('input/127_b2015_202208sj.pdf', pages=PyPDF2.pagerange.PageRange(':2'))
    # 追加したページを新規ファイルに書き込みする
    merger.write('output/split_new_file.pdf')
    # 開いたPDFを閉じる
    merger.close()
```

* outputフォルダのPDFをすべて結合する
```python
    import glob
    import PyPDF2

    output_folder_list = glob.glob("output/*.pdf")
    output_folder_list.sort()

    pdfobj = PyPDF2.PdfFileMerger()
    for pdffile in output_folder_list:
        pdfobj.append(pdffile)
        
    pdfobj.write("output/all_newfile.pdf")
    pdfobj.close()
```

</details>
 

* 参考 [Welcome to PyPDF2](https://pypdf2.readthedocs.io/en/latest/index.html)
* 参考 [Python, PyPDF2でPDFを結合・分割（ファイル全体・個別ページ）- note.nkmk.me](https://note.nkmk.me/python-pypdf2-pdf-merge-insert-split/)

---

## 問題128: 画像データを読み込んでみよう

In [None]:
#コードを記述


### 問題128 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

実行結果
```python

```

</details>
 

* 参考 []()
* 参考 []()

---

## 問題129: 画像データを処理してみよう

In [None]:
#コードを記述


### 問題129 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

実行結果
```python

```

</details>
 

* 参考 []()
* 参考 []()

---

## 問題130: Excelからpythonのコードを自動生成する:準備

In [None]:
#コードを記述


### 問題130 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

実行結果
```python

```

</details>
 

* 参考 []()
* 参考 []()

---

## 問題131: Excelからpythonのコードを自動生成する:操作

In [None]:
#コードを記述


### 問題131 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

実行結果
```python

```

</details>
 

* 参考 []()
* 参考 []()

---

## 問題132: Excelから自動生成したコードを処理してみる

In [None]:
#コードを記述


### 問題132 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

実行結果
```python

```

</details>
 

* 参考 []()
* 参考 []()

---

## 問題133: Excelから自動生成したコードを統計処理にかけてみる

In [None]:
#コードを記述


### 問題133 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

実行結果
```python

```

</details>
 

* 参考 []()
* 参考 []()

---

## 問題134: Excelから自動生成したコードを機械学習にかけてみる

In [None]:
#コードを記述


### 問題134 の回答・実行例

<details>
<summary> > 回答と実行例を表示する</summary>

```python

```

実行結果
```python

```

</details>
 

* 参考 []()
* 参考 []()

---