# Introduction to Colab and Python

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/shinchu/dataviz-notebooks/blob/main/week_1/intro-colab-python.ipynb)

<h1>Colab とは</h1>

この部分は、Colabの<a href="https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja#scrollTo=5fCEDCU_qrC0
"> 公式インストラクション</a>から一部抜粋しています。


Colab（正式名称「Colaboratory」）では、ブラウザ上で Python を記述、実行できます。以下の機能を使用できます。 
- 環境構築が不要
- GPU への無料アクセス
- 簡単に共有

Colab は、<strong>学生</strong>から<strong>データ サイエンティスト</strong>、<strong>AI リサーチャー</strong>まで、皆さんの作業を効率化します。詳しくは、<a href="https://www.youtube.com/watch?v=inN8seMm7UI">Colab の紹介動画</a>をご覧ください。

## はじめに

このドキュメントは静的なウェブページではなく、<strong>Colab ノートブック</strong>という、コードを記述して実行できるインタラクティブな環境です。

たとえば次の<strong>コードセル</strong>には、値を計算して変数に保存し、結果を出力する短い Python スクリプトが記述されています。

In [None]:
seconds_in_a_day = 24 * 60 * 60
seconds_in_a_day

上記のセルのコードを実行するには、セルをクリックして選択し、コードの左側にある実行ボタンをクリックするか、キーボード ショートカット「command+return」または「Ctrl+Enter」を使用します。コードはセルをクリックしてそのまま編集できます。

1 つのセルで定義した変数は、後で他のセルで使用できます。

In [None]:
seconds_in_a_week = 7 * seconds_in_a_day
seconds_in_a_week

Colab ノートブックを使用すると、実行可能コードとリッチテキスト（画像、HTML、LaTeX なども可）を 1 つのドキュメントで記述できます。自分の Colab ノートブックを作成すると、Google ドライブ アカウントに保存されます。Colab ノートブックは、同僚や友人と簡単に共有し、コメントの記入や編集をしてもらうことができます。

# Pythonを使ってみよう

この部分は、Pythonドキュメントを基に作成しています。  
https://docs.python.org/ja/3/tutorial/introduction.html

# Pythonで簡単な計算をしてみよう

## Python変数

Pythonでは、計算の結果に名前をつけて参照できます。名前をつけるときは、 = 記号を使って、次の形式で記述します。

```
名前 = 式
```

この名前のことを**変数**といい、`=`を使った行を**代入文**といいます。

## Pythonのコメントの入れ方

Python におけるコメント文は、ハッシュ文字 # で始まり、物理行の終わりまで続きます。コメントは行の先頭にも、空白やコードの後にも書くことができますが、文字列リテラルの内部に置くことはできません。文字列リテラル中のハッシュ文字はただのハッシュ文字です。コメントはコードを明快にするためのものであり、Pythonはコメントを解釈しません。なので、サンプルコードを実際に入力して試して見るときは、コメントを省いても大丈夫です。

まずは実行してみましょう.comleteが表示されたら、実行できています。

In [None]:
# this is the first comment
spam = 1  # and this is the second comment
          # ... and now a third!
text = "# This is not a comment because it's inside quotes."
print("complete")

## 途中経過を表示しよう

`print("出力したい文字列")` の形式で「出力したい文字列」の部分に、出力したい文字や変数を入れます。printごとに自動的に改行されます

In [None]:
print("Hello world!")     #Hello world!が表示されます
print(spam)             #spam変数が表示されます
print(text)              #test変数が表示されます

変数と文字列を表示したい場合は、%を用いて、変数部分を置き換えます。

*   print('任意の文字列%s任意の文字列') % 変数 #変数の中身が文字列のとき
*   print('任意の文字列%d任意の文字列') % 変数 #変数の中身が整数のとき

In [None]:
print("spam:%d" % spam)
print("text:%s" % text)

同じことを、以下のように表記することもできます

In [None]:
print(f"spam:{spam}")
print(f"text:{text}")

Pythonではシングルクォーテーション（'）とダブルクォーテーション（"）を区別しません。


【演習】上のセルのコードをシングルクォーテーションに直し、同じように動くことを確認しましょう。

In [None]:
# your code goes here

In [None]:
# answer

print(f'spam:{spam}')
print(f'text:{text}')

## Pythonを電卓として使う
簡単な電卓のように動作します: 式を入力すると、その結果が表示されます。

式の文法は素直なものです: 演算子 +, -, *, / は (Pascal や C といった) 他のほとんどの言語と同じように動作します; 丸括弧 (()) をグループ化に使うこともできます。いくつか実施してみましょう。

In [None]:
2 + 2

In [None]:
50 - 5*6

In [None]:
(50 - 5*6) / 4

In [None]:
8 / 5  # division always returns a floating point number

整数 (例えば、 2 、 4 、 20) は int 型であり、小数部を持つ数 (例えば、 5.0 、 1.6) は float 型です。

除算 (/) は常に浮動小数点数を返します。 // 演算子は 整数除算 を行い、(小数部を切り捨てた) 整数値を返します; 剰余は、% で求めます。

In [None]:
17/3

In [None]:
17//3

冪乗を計算するのに ** 演算子が使えます

In [None]:
5 * 2

In [None]:
5 ** 2

等号 (=) は変数に値を代入するときに使います。代入を行っても、結果は出力されず、次の入力プロンプトが表示されます。
変数が "定義" されていない (つまり値が代入されていない) 場合、その変数を使おうとするとエラーが発生します:

In [None]:
width = 20
height = 5 * 9
width * height

In [None]:
depth * width * height  #depthが定義されていないので、エラーが出ます.

エラー文には、コードを修正するためのヒントがあります。（英語ですが）きちんと文章を読みましょう。

In [None]:
depth = 10 # depthを定義すると計算できるようになります。
depth * width * height

最後に表示された結果は変数 _ に代入されます。このことを利用すると、Python を電卓として使うときに、計算を連続して行う作業が多少楽になります。以下に例を示します:

In [None]:
_

int と float に加え、 Python は Decimal や Fraction などの他の数値型もサポートしています。 複素数 も組み込み型としてサポートしており、 j もしくは J 接尾辞を使って虚部を示します (例: 3+5j)。

## 文字列を扱う

数だけではなく、文字列も操作できます。文字列を記述する方法は複数あり、単引用符 ('...') で囲むか、もしくは二重引用符 ("...") で囲みます。結果はどちらも同じ文字列になります。
引用符（', "）は、\ でエスケープできます。

In [None]:
'spam eggs'  # single quotes

In [None]:
'doesn\'t'  # use \' to escape the single quote...

In [None]:
"doesn't"  # ...or use double quotes instead

In [None]:
'"Yes," they said.'

In [None]:
'"Yes," they said.'

In [None]:
"\"Yes,\" they said."

In [None]:
'"Isn\'t," they said.'

出力文字列は引用符に囲まれ、特殊文字はバックスラッシュでエスケープされます。出力文字が入力とは違って見える (囲っている引用符が変わる) こともありますが、その 2 つの文字列は同じ文字列です。文字列が単引用符を含み二重引用符を含まない場合、二重引用符で囲われ、それ以外の場合は単引用符で囲われます。

In [None]:
'"Isn\'t," they said.'

In [None]:
print('"Isn\'t," they said.')

In [None]:
s = 'First line.\nSecond line.'  # \n means newline

In [None]:
s  # without print(), \n is included in the output

In [None]:
print(s)  # with print(), \n produces a new line

\ に続く文字を特殊文字として解釈されたくない場合は、最初の引用符の前に r を付けた raw strings が使えます。要注意は、改行を意味する \n です。

In [None]:
print('C:\some\name')  # here \n means newline!

In [None]:
print(r'C:\some\name')  # note the r before the quote

文字列リテラルは複数行にまたがって書けます。1 つの方法は三連引用符 ("""...""" や '''...''') を使うことです。改行文字は自動的に文字列に含まれますが、行末に \ を付けることで含めないようにすることもできます。
(最初の改行文字は含まれていないことに注意してください)

In [None]:
print("""\
Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to
""")

文字列は + 演算子で連結させる (くっつけて一つにする) ことができ、* 演算子で反復させることができます:

In [None]:
# 3 times 'un', followed by 'ium'
# 'unununium'が表示されます
3 * 'un' + 'ium'

連続して並んでいる複数の 文字列リテラル (つまり、引用符に囲われた文字列) は、自動的に連結されます。

In [None]:
'Py' 'thon'

この機能は、長い文字列を改行したいときにとても役に立ちます:

In [None]:
text = ('Put several strings within parentheses '
'to have them joined together.')
text

これは2つのリテラルどうしに対してのみ働き、変数や式には働きません。下の例はどちらもエラーがでます。

In [None]:
prefix = 'Py'

In [None]:
prefix 'thon'  # can't concatenate a variable and a string literal

In [None]:
('un' * 3) 'ium'

文章を単語に分解しリスト化することもできます。

In [None]:
words = "Hello World"
words = words.split()
print(words)

変数どうしや変数とリテラルを連結したい場合は、+ を使ってください

In [None]:
prefix + 'thon'

## リスト(list) を使う
Pythonは多くの 複合 (compound) データ型を備えており、複数の値をまとめるのに使われます。最も汎用性が高いのは リスト (list) で、コンマ区切りの値 (要素) の並びを角括弧で囲んだものとして書き表されます。リストは異なる型の要素を含むこともありますが、通常は同じ型の要素のみを持ちます。

In [None]:
squares = [1, 4, 9, 16, 25]
squares

インデックス (添字) を指定して文字を取得できます。最初の文字のインデックスは 0 になります。インデックスには、負の値も指定できまます。この場合、右から数えていきます. -0 は 0 と区別できないので、負のインデックスは -1 から始まります。

In [None]:
squares[0]  # indexing returns the item

In [None]:
squares[-1]

In [None]:
squares[-3:]  # slicing returns a new list

リストは、リストの連結などもサポートしています

In [None]:
squares + [36, 49, 64, 81, 100]

リストは 可変型ですので、要素を入れ替えられます:

In [None]:
cubes = [1, 8, 27, 65, 125]  # something's wrong here
4 ** 3  # the cube of 4 is 64, not 65!

In [None]:
cubes[3] = 64  # replace the wrong value
cubes

append() を使って、リストの末尾に新しい要素を追加できます (このメソッドについては後で詳しく見ていきます):

In [None]:
cubes.append(216)  # add the cube of 6
cubes.append(7 ** 3)  # and the cube of 7
cubes

スライスには、代入もできます。スライスの代入で、リストのサイズを変更したり、全てを削除したりもできます:

In [None]:
letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
letters

スライスでは、start:stop:stepの形で範囲と増分を指定できます。startが始点、stopが終点となります。文字そのものではなく、文字と文字の間を指し、最初の文字の左端が0です。また、stepは省略できます。

In [None]:
# replace some values
letters[2:5] = ['C', 'D', 'E']
letters

In [None]:
# now remove them
letters[2:5] = []
letters

始点・終点を省略すると自動的に、先頭もしくは末尾となります。

In [None]:
# clear the list by replacing all the elements with an empty list
letters[:] = []
letters

負の数字を入れることもできます。その場合、右端が0となります

In [None]:
letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
letters[-3:-1]

stepを負にすると逆順に呼び出せます

In [None]:
letters[::-1]

組込み関数 len() はリストにも使えます:

In [None]:
letters = ['a', 'b', 'c', 'd']
len(letters)

リストを入れ子 (ほかのリストを含むリストを造る) にできます。例えば:

In [None]:
a = ['a', 'b', 'c']
n = [1, 2, 3]
x = [a, n]
x

In [None]:
x[0]

In [None]:
x[0][1]

## 辞書（dictionary）を使う

辞書は、キー（key）と値（value）を対応付けるデータです。キーとしては、文字列・数値など変更不可能なデータを使うことができますが、変更可能なデータであるリスト・辞書を使うことはできません。値としては、変更の可否にかかわらずあらゆる種類のデータを指定できます。

In [None]:
fruit = {'apple': 3, 'banana': 2, 'orange': 10}

In [None]:
fruit

In [None]:
type(fruit)

辞書のキーに対応する値を得るには、リストにおけるインデックスと同様に、

`辞書[キー]`

とします。

In [None]:
fruit['apple']

辞書に登録されていないキーを指定すると、エラーになります。

In [None]:
fruit['mango']

キーに対する値を変更したり、新たなキーとして値を登録するには、代入文を使います。

In [None]:
fruit['apple'] = 5
fruit

キーが辞書に登録されているかどうかは、演算子`in`を使って調べることができます

In [None]:
'orange' in fruit

In [None]:
'lime' in fruit

組み込み関数`len`を使って、辞書に登録されている要素の数が得られます。

In [None]:
len(fruit)

`del`文を使って、登録されている要素を削除することができます。

In [None]:
del fruit['apple']
fruit

空のリストと同様に、空の辞書を作ることもできます。このような空のデータは繰り返し処理でよく使われます。

In [None]:
empty = {}
empty

## if 文
最もおなじみの文型は if 文です。ゼロ個以上の elif 部を使うことができ、 else 部を付けることもできます。キーワード 'elif' は 'else if' を短くしたものです。一連の if ... elif ... elif ... は、他の言語における switch 文や case 文の代用となります。

In [None]:
x = int(input("Please enter an integer: "))

if x < 0:
    x = 0
    print('Negative changed to zero')
elif x == 0:
    print('Zero')
elif x == 1:
    print('Single')
else:
    print('More')

【演習】xが0以上の時に、 "Hello World!" が表示されるようにしましょう

In [None]:
# your code goes here

In [None]:
# answer

x = int(input("Please enter an integer: "))

if x >= 0:
    print("Hello World!")

【演習】変数heightが120以上の時は、「乗れます」、120未満の時は「乗れません」を表示してください

In [None]:
# your code goes here

In [None]:
# answer

height = int(input("Please enter an integer: ")) #hogehoge を実際の数字に変更してください

if height >= 120:
    print("乗れます")
else:
    print("乗れません")

## for 文

Python の for 文は、C 言語のfor 文とは違います。 Python の for 文は、任意のリストまたは文字列にわたって反復を行います。反復の順番はシーケンス中に要素が現れる順番です。例えば:

In [None]:
# Measure some strings:
words = ['cat', 'window', 'defenestrate']
for w in words:
    print(w)

【演習】wordsリストの中の要素の文字数を、順番に表示してください。文字数のカウントにはlen()が便利です。

以下の様な出力を期待します。

```
cat 3
window 6
defenestrate 12
```

In [None]:
word = "Hello"
n_word = len(word)
print(n_word)

In [None]:
words = ['cat', 'window', 'defenestrate']

# your code goes here

In [None]:
# answer

for w in words:
    print(f"{w} {len(w)}")

【演習】forとappendを使って、[0,1,2,3]というリストを作成してください。

In [None]:
# your code goes here

In [None]:
# answer

l = []
for i in range(4):
    l.append(i)

l

【演習】

次のリスト`usa`が与えられた時に、リストの各要素をキー、各要素のリストにおける順番（1から始めるとする）を値とした辞書`usa_d`を作成してください。

In [None]:
usa = ['george washington', 'john adams', 'thomas jefferson', 'james madison', 'james monroe', 'john quincy adams', 'andrew jackson',  'martin van buren', 'william henry harrison', 'john tyler', 'james knox polk', 'zachary taylor']

# your code goes here

In [None]:
# answer

usa_d = {}
i = 1
for name in usa:
    usa_d[name] = i
    i += 1

usa_d

## while 文

while は、条件 (ここでは `` a < 10``) が真である限り実行を繰り返し (ループし) ます。条件式には、文字列値やリスト値なども使えます。サンプルで使われている条件テストはシンプルな例です。標準的な比較演算子は C 言語と同様です: < (より小さい)、 > (より大きい)、 == (等しい)、 <= (より小さいか等しい)、 >= (より大きいか等しい)、および != (等しくない)、です。

In [None]:
# Fibonacci series:
# the sum of two elements defines the next

a, b = 0, 1
while a < 10:
    print(a)
    a, b = b, a + b

In [None]:
a, b = 0, 1
while a < 1000:
    print(a, end=',')
    a, b = b, a + b

【演習】上のコードを改変して、aが3000未満の間コードが実行されるようにしてください。 

In [None]:
# your code goes here

In [None]:
# answer

a, b = 0, 1
while a < 3000:
    print(a, end=',')
    a, b = b, a + b

# 自然言語処理をやってみよう

この部分は、言語処理100本ノックから抜粋しています。  
https://nlp100.github.io/2025/ja/index.html

## 文字を逆列にする
【演習】文字列”stressed”の文字を逆に（末尾から先頭に向かって）並べた文字列を得よ。

In [None]:
# your code goes here

In [None]:
# answer


string = 'stressed'
string[-1::-1]

## 文字列の連結1
【演習】「パタトクカシーー」という文字列の1,3,5,7文字目を取り出して連結した文字列を得よ

In [None]:
# your code goes here

In [None]:
# answer

string = 'パタトクカシーー'
string[0::2]

## 文字列の連結2
【演習】「パトカー」＋「タクシー」の文字を先頭から交互に連結して文字列「パタトクカシーー」を得よ。

In [None]:
# your code goes here

In [None]:
# answer

word1 = 'パトカー'
word2 = 'タクシー'

string = ''
for i, j in zip(word1, word2):
    string += i + j

string

## 文字数の抽出

【演習】"Now I need a drink, alcoholic of course, after the heavy lectures involving quantum mechanics."という文を単語に分解し、各単語の（アルファベットの）文字数を先頭から出現順に並べたリストを作成せよ。

In [None]:
# your code goes here

In [None]:
# answer

string = 'Now I need a drink, alcoholic of course, after the heavy lectures involving quantum mechanics.'
string = string.replace(',', '').replace('.', '')
words = string.split()

l = []
for word in words:
    l.append(len(word))

l

In [None]:
list(map(len, words))

【演習】"Hi He Lied Because Boron Could Not Oxidize Fluorine. New Nations Might Also Sign Peace Security Clause. Arthur King Can."という文を単語に分解し、1, 5, 6, 7, 8, 9, 15, 16, 19番目の単語は先頭の1文字、それ以外の単語は先頭の2文字を取り出し、取り出した文字列から単語の位置（先頭から何番目の単語か）への連想配列（辞書型）を作成せよ。

In [None]:
# your code goes here

In [None]:
# answer

string = 'Hi He Lied Because Boron Could Not Oxidize Fluorine. New Nations Might Also Sign Peace Security Clause. Arthur King Can.'
string = string.replace('.', '')
words = string.split()

d = {}
for i, word in enumerate(words):
    if i + 1 in [1, 5, 6, 7, 8, 9, 15, 16, 19]:
        element = word[0]
    else:
        element = word[:2]

    d[element] = i + 1

d

【演習】引数x, y, zを受け取り「x時のyはz」という文字列を返す関数を実装せよ。さらに、x=12, y="気温", z=22.4として、実行結果を確認せよ。  

In [None]:
# your code goes here

In [None]:
# answer

def f(x, y, z):
    print(f"{x}時の{y}は{z}")

In [None]:
f(12, "気温", 22.4)

---

# 次の一歩

ここまで終わったら、新しいファイルを開いて[Python Tutorial](https://docs.python.org/3/tutorial/)にチャレンジしてみてください。