# Chapter 1: Python、Django、Pandasの基本 - データ分析への第一歩


## Google ColabでのPython環境設定(pandas, Djangoのインストール)


### ステップ1: Google Colabの利用開始
1. Googleアカウントにログインします。
2. ブラウザで[Google Colab](https://colab.research.google.com/)にアクセスします。
3. 「新しいノートブック」をクリックして、新しいColabノートブックを作成します。



### ステップ2: ライブラリのインストール
Google Colabには多くの一般的なPythonライブラリが事前にインストールされていますが、DjangoやPandasなど特定のライブラリは手動でインストールする必要があります。以下はそれらのライブラリをインストールする方法です。

In [1]:
# Pandasのインストール（通常は事前にインストールされていますが、最新版を使用する場合）
!pip install pandas

# Djangoのインストール
!pip install django

Collecting django
  Downloading Django-5.0.1-py3-none-any.whl (8.1 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m8.1/8.1 MB[0m [31m15.5 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting asgiref<4,>=3.7.0 (from django)
  Downloading asgiref-3.7.2-py3-none-any.whl (24 kB)
Installing collected packages: asgiref, django
Successfully installed asgiref-3.7.2 django-5.0.1



これらのコマンドをGoogle Colabのセルに入力し、実行することでライブラリがインストールされます。

### ステップ3: ライブラリのインポートと確認
インストールしたライブラリが正しく機能するか確認するために、以下のようにインポートしてバージョンを確認します。

In [2]:
# Pandasのインポートとバージョン確認
import pandas as pd
print(pd.__version__)

# Djangoのバージョン確認
!django-admin --version

1.5.3
5.0.1


これらのステップを実行することで、Google Colab上でPythonの基本的な環境設定が完了し、DjangoとPandasの使用準備が整います。次に、Pythonの基本文法の学習やDjangoとPandasの利用方法に進むことができます。

## Pythonの基本文法の学習と実行



### 1. 変数とデータ型
Pythonでは、変数を宣言する際に型を指定する必要はありません。整数、浮動小数点数、文字列などの基本的なデータ型について学びます。



In [3]:
# 変数の宣言と基本データ型
number = 10        # 整数
pi = 3.14          # 浮動小数点数
greeting = "こんにちは" # 文字列

# 変数の値を表示
print(number, pi, greeting)

10 3.14 こんにちは


### 2. リストと辞書
データを格納するための基本的な構造としてリストと辞書を学びます。



In [4]:
# リストの作成とアクセス
fruits = ["りんご", "バナナ", "オレンジ"]
print(fruits[0])  # 最初の要素を表示

# 辞書の作成とアクセス
person = {"名前": "太郎", "年齢": 20}
print(person["名前"])  # キーを使って値を取得

りんご
太郎


### 3. 制御構造
基本的な制御構造（if文、forループ、whileループ）の使用方法を学びます。

In [5]:
# if文
age = 20
if age >= 18:
    print("成人です")

# forループ
for fruit in fruits:
    print(fruit)

# whileループ
i = 0
while i < len(fruits):
    print(fruits[i])
    i += 1

成人です
りんご
バナナ
オレンジ
りんご
バナナ
オレンジ


### 4. 関数の定義と使用
独自の関数を定義し、引数を渡して呼び出す方法を学びます。

In [None]:
# 関数の定義
def greet(name):
    return "こんにちは、" + name + "さん！"

# 関数の呼び出し
print(greet("太郎"))

## Djangoでのウェブサイト作成の基本ステップ

ここではセルの実行以外にも操作が発生します。Google Colab上でWebアプリを実行する手順を学んでいきましょう。

#### 1. Djangoプロジェクトの作成
まずはDjangoで新しいプロジェクトを作成します。このステップでは、プロジェクトの構造と必要なファイルが生成されます。

In [6]:
!django-admin startproject mysite

ファイルを確認すると、mysiteフォルダが作成されます。

#### 2. アプリケーションの作成
Djangoでは、ウェブサイトは1つ以上の「アプリケーション」で構成されます。ここで簡単なアプリケーションを作成しましょう。

In [None]:
!python mysite/manage.py startapp myapp
!mv myapp mysite/myapp


#### 3. ビューの作成
ビューは、ユーザーに表示されるページの内容を制御します。ここで、単純なビューを作成してみましょう。

`myapp/views.py` ファイルに以下のコードを追加します。

```python
from django.http import HttpResponse

def home(request):
    return HttpResponse("Hello, Django!")
```

#### 4. URLの設定
ビューをインターネット上でアクセス可能にするために、URLを設定します。

`mysite/urls.py` ファイルを以下のように編集します。

```python
from django.contrib import admin
from django.urls import path
from myapp.views import home

urlpatterns = [
    path('admin/', admin.site.urls),
    path('', home),
]
```


#### 5. ローカルサーバーの起動
以下のコマンドでローカルサーバーを起動し、開発中のウェブサイトを表示できます。Google Colab経由でもアクセスできるように、mysite/mysite/settings.pyのALLOWED_HOSTSにサイトを追加します。

```python
ALLOWED_HOSTS = ['colab.research.google.com']
```


#### 6. プロジェクトの確認
以下のセルを実行すると、出力されたURLからアプリケーションにアクセスできます。Hello, Django!と表示されていれば成功です。

In [16]:
from google.colab.output import eval_js
print(eval_js("google.colab.kernel.proxyPort(8000)"))

!python mysite/manage.py runserver

https://gr4bkbk81lt-496ff2e9c6d22116-8000-colab.googleusercontent.com/
Watching for file changes with StatReloader
Performing system checks...

System check identified no issues (0 silenced).
[31m
You have 18 unapplied migration(s). Your project may not work properly until you apply the migrations for app(s): admin, auth, contenttypes, sessions.[0m
[31mRun 'python manage.py migrate' to apply them.[0m
January 24, 2024 - 15:50:55
Django version 5.0.1, using settings 'mysite.settings'
Starting development server at http://127.0.0.1:8000/
Quit the server with CONTROL-C.

[24/Jan/2024 15:51:00] [m"GET / HTTP/1.1" 200 14[0m
Not Found: /favicon.ico
[24/Jan/2024 15:51:00] [33m"GET /favicon.ico HTTP/1.1" 404 2221[0m


## Pandasでの基本的なデータ操作



#### 1. Pandasのインポート
まずはPandasライブラリをインポートします。

In [17]:
import pandas as pd

#### 2. データの読み込み
Pandasを使用して、CSVやExcelなどのデータファイルを読み込みます。ここでは、サンプルとしてインターネット上のCSVファイルを読み込みます。


In [18]:
url = "https://raw.githubusercontent.com/cs109/2014_data/master/countries.csv"
data = pd.read_csv(url)

#### 3. データの探索
読み込んだデータの基本的な情報を確認します。データの先頭部分を表示したり、データの概要を確認したりします。


In [19]:
# データの先頭5行を表示
print(data.head())

# データの概要
print(data.describe())

    Country  Region
0   Algeria  AFRICA
1    Angola  AFRICA
2     Benin  AFRICA
3  Botswana  AFRICA
4   Burkina  AFRICA
        Country  Region
count       194     194
unique      194       6
top     Algeria  AFRICA
freq          1      54


#### 4. データの選択とフィルタリング
特定の列や行を選択し、条件に基づいてデータをフィルタリングします。

In [23]:
# 特定の列を選択
countries = data['Country']

# 条件に基づくフィルタリング
european_countries = data[data['Region'] == 'EUROPE']

countries, european_countries

(0        Algeria
 1         Angola
 2          Benin
 3       Botswana
 4        Burkina
          ...    
 189     Paraguay
 190         Peru
 191     Suriname
 192      Uruguay
 193    Venezuela
 Name: Country, Length: 194, dtype: object,
                     Country  Region
 98                  Albania  EUROPE
 99                  Andorra  EUROPE
 100                 Armenia  EUROPE
 101                 Austria  EUROPE
 102              Azerbaijan  EUROPE
 103                 Belarus  EUROPE
 104                 Belgium  EUROPE
 105  Bosnia and Herzegovina  EUROPE
 106                Bulgaria  EUROPE
 107                 Croatia  EUROPE
 108                  Cyprus  EUROPE
 109          Czech Republic  EUROPE
 110                 Denmark  EUROPE
 111                 Estonia  EUROPE
 112                 Finland  EUROPE
 113                  France  EUROPE
 114                 Georgia  EUROPE
 115                 Germany  EUROPE
 116                  Greece  EUROPE
 117              

## 演習課題

#### 1. 基本的な算術演算子を使った演習
Pythonで基本的な算術計算を行うコードを書いてみましょう。例えば、異なる数値の加算、減算、乗算、除算を行うコードです。

```python
# 計算式を書いて出力しましょう
print(3 + 4)
print(10 - 5)
print(4 * 3)
print(8 / 2)
```

#### 2. 文字列操作の演習
Pythonでの基本的な文字列操作を行うコードを書いてみましょう。文字列を連結したり、文字列の一部を抽出するなどです。

```python
# 文字列の連結
greeting = "こんにちは、"
name = "太郎さん。"
message = greeting + name
print(message)

# 文字列の一部を抽出
print(name[0:2])  # "太郎"を抽出
```

### 応用編の演習課題

#### 1. Djangoでのシンプルなルーティング
Djangoで作成したプロジェクトにおいて、新しいビューを作成し、URLにルートを設定してみましょう。

```python
# myapp/views.py に新しいビューを作成
def about(request):
    return HttpResponse("これはAboutページです。")

# mysite/urls.py に新しいURLパターンを追加
urlpatterns = [
    # 既存のパターンは省略
    path('about/', about),
]
```

#### 2. Pandasを使った簡単なデータ分析
Pandasを使用して、インターネット上から取得したデータセットに対して基本的なデータ分析を行ってみましょう。例えば、特定の列の平均値や最大値を求めるなどです。

```python
import pandas as pd

# データセットを読み込む
url = "https://raw.githubusercontent.com/cs109/2014_data/master/countries.csv"
data = pd.read_csv(url)

# 'Population'列の平均値と最大値を計算
print("平均人口:", data['Population'].mean())
print("最大人口:", data['Population'].max())
```