# Pythonの基礎
Pythonは、プログラミング言語の一つで、最近は機械学習や画像解析によく使われています。

プログラミング言語は、PythonのほかにもR、Java、Cなどなどたくさんあります。各言語はそれぞれの言語の仕様により、様々な特徴を持ちます。また、各言語がよく使われている分野というものがあり、特定分野においてその言語のユーザーが多いほど、多くのライブラリが作成されています。どのプログラミング言語を利用するかは、その分野でみんながよく使っているというのが重要な指標になります。

リモートセンシング・GISの分野でよく使われている言語は、Python、R、Bash、C#といったところです。特に**Python**は、ArgGISのほか、QGIS、GRASS GIS、Orfeo ToolboxなどのメジャーなGISはPythonをサポートしており、それらのソフトウェアが提供する機能をつなぎ合わせて実行することが容易になっています。

**R**はグラフ作成や統計解析ライブラリが非常に充実しています。Pythonで大規模なデータを処理した後、Rで統計解析を行うこともよくあります。

**Bash**はほとんどのUnix系のOSがサポートしている言語で、他と比べて基本的な機能しかありません。古くから使われている言語で互換性が高いため、例えば、pythonで書かれたプログラムをAWS上で自動的に実行させるといった、異なるプログラムやディバイス上での処理をつなげる処理によく使われます。

**C#**は他の4つと比べると、非常に早く実行することができる言語です。多くのPythonやRのライブラリがバックエンドでC#で書かれたプログラムを利用しています。

以下では、Jupyter Notebook上でPythonの基本的な使い方を学びます。

## Jupyter Notebook上での出力について

Pythonで実行結果を表示させるには、通常`print()`関数を使います。  
例えば、`5+3`の実行結果を表示させるには、Jupyter Notebook上で以下のように書きます。

In [6]:
print(30 + 12)

42


`30 + 12`の実行結果が`42`と表示されました。PythonをJupyter Notebook上で実行する場合に限り、`print()`が省略されても一番最後の実行結果は表示されます。

30 + 12

ただし、省略できるのは同じチャンクの最後の行のみです。複数行表示したい場合は、適宜`print()`関数を利用する必要があります。

In [9]:
30 + 12
20 - 10

10

すべての値を出力させたい場合、`print()`関数を複数入れて、以下のように書きます。

In [11]:
print(30 + 12)
print(20 - 10)

42
10


以下では、`print()`関数が不要な場合、省略されている場合があります。

## 代入
以下のコードを見てください。

In [1]:
x = 10
y = 100
z = sum(x, y, 5)
print(z)

110


上記のコードは下記のことを行っています。

```python
x = 10         # 変数`x`に10を入力  
y = 100        # 変数`y`に100を入力  
z = sum(x, y, 5)  # `x + y + 5`を計算して結果を変数`z`に入力  
print(z)       # 関数`print()`に`z`を入力  
```

Pythonや多くのプログラミング言語では、`=`は「右側の値を左の**変数**に代入する」という意味を持ちます。エクセルの数式も、`=`記号で始まりますが、これも数式の結果をセルに代入しているという点で、同じです。エクセルと異なるのは、エクセルでは代入先が数式を入力するセルであるのに対し、Pythonでは変数に代入します。

値（上の例では数値`5`）や値が代入された変数（上の例では`x`と`y`）は、関数`sum()`の入力として渡され、`sum(x, y)`の結果が`z`に代入されています。関数に渡される値を引数とよび、上の例の場合、「xとyと5を関数sum()の引数として渡す」などといいます。

また、`sum()`などの関数の結果を**戻り値(返り値)**といい、上の例は「`sum()`の戻り値(返り値)を変数`z`に代入」しています。Pythonでは、関数の戻り地をまた別の関数の引数として渡すことで、より複雑な処理をさせることができます。

値を代入することによって作成された変数や、後述のclassによって作成された変数などを、まとめて**オブジェクト**と呼びます。

## 型

### 基本型
型とは、データがどのような形式かを表すもので、Pythonにあらかじめ定義されている基本型は以下のものがあります。
- 数値型
  - 整数型(int) : -1, 0, 1, 2, ....
  - 小数型(float) : -120.0, 3.1415, 1.5e12, 3.00e8
  - 複素数型(complex): 1.0j, 1+1j, 3e8+0j
- バイナリ型
  - ブール型(bool) : True, False
- 文字列
  - 文字列型(str) : 'aaa', 'あいうえお', "0123"
- None
  - x = None

また、必要に応じてユーザーによって**型**を新しく作ることもできます。 
プログラムが複雑になってくると、新しい**型**を導入することはとても便利です。

自分の扱っているデータの方を確認するには、`type()`関数を利用します。

In [1]:
type(30 + 5)  # 整数型の例

int

**バイナリ型**は、条件式の結果の値として利用されます。

In [4]:
x = 4
y = 3

print(x == y)  # xとyが等しい場合、True、等しくない場合Falseを返す
print(type(True))  # ブール型の例

False
<class 'bool'>


In [13]:
type('abcd')  # 文字列型の例

str

In [5]:
type(None)  # Noneタイプの例

NoneType

`None`タイプは、関数を呼び出す際に引数が与えられなかった場合のデフォルト値や、リストやディクショナリの要素がない場合の値などとして用いられます。

In [7]:
# 複数の名前付き引数を持つ関数
def my_func(a, b, c=None):
    print(f'a is {a}.')
    print(f'b is {b}.')
    if c is not None:
        print(f'c is {c}.')
        
my_func(a='aaa', b='bbb')  # -> a is aaa. b is bbb.


a is aaa.
b is bbb.


In [11]:
# 要素にNoneを持つリストの例
['aaa', 'bbb', None, 'ddd']

['aaa', 'bbb', None, 'ddd']

### コレクション型
コレクション型は、複数の要素(item)をひとまとめにした構造をしています。異なる型の値であったり、別のコレクション型を要素として持つ入れ子構造を取ることもできます。

コレクション型は以下のものがあります。
- リスト型(list)
- セット型(set)
- タプル型(tuple)
- 辞書型(dict)

またそれぞれの特徴をまとめると以下のとおりです。

|  型   | 要素の並び |    要素の変更      | 要素の重複 | 例 | 
|-------|----------|------------------|-|----|
|  list |      一定 |  可(ミュータブル)  |可|`['a', 'b', 'b', None, 100]`|
|   set |      不定 |  可(ミュータブル)  |不可|`set(['a', 'b', None, 100])`|
| tuple |      一定 | 不可(イミュータブル)|可|`('a', 'b', 'b', None, 100)`|
| dict  |      不定 |  可(ミュータブル)  |キーの重複は不可|`{'a':'aaa', 'b': 'bbb', 'c': 100, 'd':None}`|

以下、それぞれ確認していきます。

#### 各コレクションの作成

In [19]:
my_list  = ['a', 'b', 'b', None, 100]

my_set   = set(['a', 'b', 'b', None, 100])

my_tuple = ('a', 'b', 'b', None, 100)

my_dict  = {'a':'aaa', 'b': 'bbb', 'c': 100, 1:None}

print(my_list)
print(my_set)
print(my_tuple)
print(my_dict)

['a', 'b', 'b', None, 100]
{100, 'b', 'a', None}
('a', 'b', 'b', None, 100)
{'a': 'aaa', 'b': 'bbb', 'c': 100, 1: None}


listは`[]`内に`,`区切りで要素を列挙して作成します。

setは`set()`にリストを与えて作成ます。set型は要素の重複が不可のため、重複した要素は１つを除いて削除されます。順序は保存されないため、print()で表示される順序は一定ではありません。

tupleは`()`内に`,`区切りで要素を列挙して作成します。listとの違いは、要素をあとから変更可能かどうかという点です。tupleは変更できません(イミュータブル)。ミュータブル/イミュータブルについては、*参照*の項で説明します。

dictは`()`内に`,`区切りで要素を列挙して作成します。各要素は、**key**と**value**の組からなります。上記の例では、keyは`'a', 'b', 'c', 'd'`で、valueは`'aaa', 'bbb', 100, None`です。重複するkeyは利用できません。keyには文字列は整数値など[hashable](https://docs.python.org/3/glossary.html#term-hashable)な値が利用できます。

#### コレクションへのアクセス
コレクション型の中に保存された各要素は以下のように取り出すことができます。順序が決まっているlistとtupleは`[]`の中に取り出したい要素の位置を示すインデックス番号を、dictの場合は[]の中にkeyを入れることで取り出すことができます。**Pythonではインデックス番号は0から始まり、先頭から0、1、2...となります。**

In [25]:
print(my_list[0])    # 先頭の要素を取得
print(my_tuple[1])   # 2番目の要素を取得
print(my_dict['c'])  # keyの値が'c'である要素を取得

a
b
100


setは順序も不定でkeyを持たないため、ある特定の要素を取り出すことはできませんが、以下の様に一つづつ取り出すことは可能です。

In [26]:
for i in my_set:
    print(i)

100
b
a
None


#### 値の変更
ミュータブルなコレクションは、以下のように要素の一部を変更することができます。

In [28]:
my_list = ['a', 'b', 'c']
my_list[1] = 'bbb'
print(my_list)

['a', 'bbb', 'c']


In [29]:
my_dict = {'a':'aaa', 'b':'bbb', 'c':'ccc'}
my_dict['c'] = 1000
print(my_dict)

{'a': 'aaa', 'b': 'bbb', 'c': 1000}


#### 参照(Reference)
値をもつ変数を別の変数に代入する場合、**Pythonでは参照渡し**という方法で変数がコピーされます。
参考：[Pythonの引数における参照渡しと値渡しについて](https://www.javadrive.jp/python/userfunc/index3.html)

Pythonでは変数にベクトルや数値といった値が代入されるとき、値が変数に直接保存されているのではなく、値が格納されているメモリ上のアドレスが変数に割り当てられます。
特にlist、dict等、ミュータブルな型を持つオブジェクトをコピーする際は注意が必要です。

以下に例を示します。

In [2]:
my_list_abc = ['a', 'b', 'c']
my_list_abx = my_list_abc  # my_list_abcへの"参照"が渡される
my_list_abx[2] = 'x'       # 新しく作成された3番目の要素を変更する
print(my_list_abx)         # -> ['a', 'b', 'x']
print(my_list_abc)         # -> ['a', 'b', 'x']  コピー元のリストの要素も変更されている

['a', 'b', 'x']
['a', 'b', 'x']


2行目において、`my_list_abx`には`my_list_abc`が*参照渡し*されているため、`my_list_abx`を更新すると参照元の`my_list_abc`も変更されてしまっていることが確認できます。ミュータブルなオブジェクトを`=`でコピーすることは、ファイルのショートカットを作成するようなものなので、実際のファイルがコピーされず、メモリや計算効率が良いですが、理解していないと意図しないデータを変更してしまいます。

参照渡しをしないで別々なオブジェクトとしてコピーしたい場合、各オブジェクトが持つ`.copy()`メソッドや、`deepcopy()`関数を使ったコピーをする必要があります。

In [4]:
my_list_abc = ['a', 'b', 'c']
my_list_abx = my_list_abc.copy()  # my_list_abcのコピーが作成される
my_list_abx[2] = 'x'              # 新しく作成された3番目の要素を変更する
print(my_list_abx)                # -> ['a', 'b', 'x']
print(my_list_abc)                # -> ['a', 'b', 'c']  コピー元のリストの要素は変更されない

['a', 'b', 'x']
['a', 'b', 'c']


## 演算子(Operator)
二項演算子は、`+`、`-`、`/`、`%`などの、二つの引数の間に入れることで作用するオペレーターを指します。
- 

### 四則演算

### ブール演算子(論理演算子)

## スライス

## 文字列整形

## 条件式(if, elif, else)

## ループ(for, while)

## enumulate

## 関数

## モジュールとパッケージ

## 標準ライブラリ

## 名前空間とスコープ

## プロパティとメソッド

## Jupyter Notebook外でのPythonの利用
Pythonで書いたプログラムをJupyter Notebookを起動せずに実行したり、過去に作成したプログラムを、別のPythonプログラムから呼び出したりするには、Pythonのコードをテキストファイルに書き、`.py`の拡張子で保存します。

例えば、以下を`hello.py`として保存した場合、
```Python
print('hello world!')
```

ターミナルから以下のコマンドを実行すると、ターミナルに実行結果が表示されます。
```bash
python hello.py
```
表示:
```bash
hello world!
```
