# ネットワークプログラミング

ネットワークに関連するプログラムを書いてみましょう。まずはネットワークの構成要素について見ていきます。

## [OSI参照モデル](https://www.infraexpert.com/study/networking3.html)

OSI（Open Systems Interconnection）参照モデルとは、国際標準化機構（ISO）により策定された、コンピュータなどの通信機器の通信機能を、階層構造に分割したモデルです。

## PDU ( プロトコルデータユニット )

PDUは、コンピュータ間の通信において使用されるデータの単位のことです。

データの単位を、レイヤ2では`フレーム`、レイヤ3では`パケット`、レイヤ4では`セグメント`と呼んでいます。

レイヤ2の機器のスイッチなどではフレーム転送、レイヤ3の機器のルータなどではパケット転送などと言われます。ただし一般的には、コンピュータのデータの単位は「パケット」と呼ぶ人が多いです。

なお、パケットやフレームなどのヘッダを取り除いたデータ部分だけのことはペイロードと呼ばれています。

[資料：ネスペイージス](https://www.infraexpert.com/info/netspecial1.html)

## [イーサネットフレーム](https://www.infraexpert.com/study/ethernet4.html)

イーサネットフレームとは、ネットワークで通信元、通信先を識別する**MACアドレス**が記述されたデータです。

macアドレスは48ビットのアドレスで、通常は16進数で表記されます。例えば、`00:1A:2B:3C:4D:5E`のような形式です。

次のコマンドで、WindowsのMACアドレスを確認してみましょう。

```
getmac /v
```

## 問1

MACアドレス`macbytes`を`bytes`型で宣言し、さらに`-`で区切った16進数の文字列で表示してください。

In [None]:


# macbytesをbytesで宣言
macbytes = ___

# まずは空の文字列を宣言
hex_macaddr = ''
# 上に宣言したmacbytesをfor文で1バイトずつ取り出し、`-`で区切ってつなげると良いでしょう。
for byte in macbytes:
    pass
    
print(hex_macaddr)
"""
例.
>>>'0c-7a-15-c9-fa-95'
"""

# ヒント

In [None]:
# 0c-7a-15-c9-fa-95というMacアドレスだった場合、最初の1バイトを16進数で表すと0cになります。
# Pythonで16進数を使う際には頭に0xとつけるとわかりやすいです。
ffbytes = bytes([0x0c])
# f'{フォーマットする対象:フォーマット方式}
ffhex = '{:02x}'.format(ffbytes[0]) 
print(ffhex)

## 問2

[イーサネットフレーム](https://www.infraexpert.com/study/ethernet4.html)を表すクラス`L2Frame`を完成させてください。

In [None]:
class L2Frame():
    def __init__(self, payload=bytes(46)):
        """
            ___に適切な値を設定してください。
            また、それぞれのメソッドをdocstringの説明に従って実装してください。

            プリアンブルはフレームの始まりを合図するために用いる特別なビット列のこと。
            10101010が7回、最後に10101011が設定されるようにしてください。
        """
        self.payload = payload
        self.preamble = ___ # プリアンブル
        self.src_mac_addr = bytearray(6) # 送信元のMACアドレス
        self.dst_mac_addr = bytearray(6) # 宛先のMACアドレス
        self.type = ___ # 
    def get_src_mac_addr(self):
        """
            送信元macアドレスを16進数文字列で取得する関数
            ex. 
            get_mac_addr()
            >>>'0c-7a-15-c9-fa-95'
        """        
        pass
    def set_src_mac_addr(self, mac):
        """
            送信元macアドレス16進数文字列で設定する関数
            ex.
            set_mac_addr('0c-7a-15-c9-fa-95')
        """
        pass
    def get_protocol(self):
        """
            プロトコルを文字列で取得する関数
            ex.
            >>> get_protocol()
            'IPv4'
        """        
        pass    
    def set_type(self, upper_type='IPv4'):
        """
            上位層プロトコルを文字列で設定する関数
            例えば、'IPv4'を設定すると、IPv4プロトコルを示す0x0800が設定されるようにしてください。
            ex.
            set_protocol('IPv4')
        """        
        pass     
    def get_verndor_name(self):
        """
            ベンダーコードを文字列で取得する関数
            例えば、self.src_mac_addrが'00-17-94-c9-fa-95'の場合、ベンダーコードは'00-17-94'となります。
            これはシスコのベンダーコードで、ベンダー名は'Cisco Systems'となります。
            ex.
            get_verndor_name()
            >>>'Cisco Systems'
        """
        pass
    def get_bytes(self):
        """
            パケット全体のバイト列を返す関数
            ex.
            get_bytes()
            >>>b'\xff\xff...\xff'
        """
        pass
    # 他にもどんなメソッドがあると便利でしょうか？

実際にインスタンスを作成してみましょう

In [None]:
l2frame = L2Frame()
l2frame.payload

# [IPアドレス](https://www.infraexpert.com/study/ip5.html)

IPアドレスとは、ネットワーク上の機器を識別するためのアドレスです。IPアドレスは、ネットワーク層で使用され、通信相手を特定するために必要です。

IPアドレスは**グローバルIPアドレス**と**プライベートIPアドレス**に分けられます。

グローバルIPアドレスとは、インターネットに接続された機器に一意に割り当てられるIPアドレスであり、世界的にはICANN、日本ではJPNICという機関で管理しています。

プライベートIPアドレス**192.168.80.0**から**192.168.80.255**の間で使用可能なホストアドレスの数を考えてみましょう。

In [None]:
# 第三オクテットまで同じなので、第四オクテットを考える。
# 255 - 0 + 1（0~255までの数）- 2 (ネットワークアドレスとブロードキャストアドレス)
hosts_available = (255 - 0) + 1 - 2
print("利用可能なホストアドレスの数は、{}個です".format(hosts_available))

プライベートIPアドレス**192.168.80.0**から**192.168.100.255**の間でホストとして使用可能なIPアドレスの数はいくつか。

In [None]:
#　第四オクテットの数
octet4_num = 255 - 0 + 1 # 0, 1, 2, ... ,255

#　第三オクテットの数
octet3_num = 100 - 80 + 1 # 80, 81, 82, ... 100

# 利用可能なIPアドレスの数＝（第四オクテットの数）×（第三オクテットの数）-(ネットワークアドレス+ブロードキャストアドレス)
hosts_available = octet4_num * octet3_num - 2

print("利用可能なホストアドレスの数は、{}個です".format(hosts_available))

あるいは...

In [None]:
# 利用可能なIPアドレスの数=（2進数で100.255） - (2進数で80.0)　+ 1 - 2
hosts_available = ( 0b110010011111111 - 0b0101000000000000 + 1 ) - 2
print("利用可能なホストアドレスの数は、{}個です".format(hosts_available))

## 問1

プライベートIPアドレスのうちクラスBの範囲は**172.16.0.0~172.31.255.255**です。

クラスBでホストとして利用可能なIPアドレスは最大でいくつでしょうか。

In [None]:
# 適切な値を設定してください。新たに行を追加してもかまいません。
hosts_available_class_b = ___
print(f'プライベートIPアドレスのクラスBで利用可能なIPアドレスの最大数は、{hosts_available_class_b:,}個です')

## 問2
`start`~`end`で指定されたの範囲で、ホストとして利用可能なIPアドレスの数を返す関数を作成してください

In [None]:
def count_hosts_available(start, end):
    """
        startからendまでのIPアドレスの数を返す関数
        ex.
        count_hosts_available('192.168.80.0', '192.168.80.255')[
        >>>254
    """
    pass

# 

## [IPパケット](https://www.infraexpert.com/study/tcpip1.html)

IP（ Internet Protocol ）は、TCP/IPの IP のことです。

OSI参照モデルではネットワーク層で動作するプロトコルであり、TCP/IPの階層モデルにおいてはインターネット層で動作するプロトコルのことです。

## 問3

IPパケットを表すクラスL3Packetを完成させてください。

In [None]:
class L3Packet():
    def __init__(self, payload=bytes(0)):
        # ヘッダーを一つのバイト列として宣言した。項目ごとにバイト列を宣言してもよい
        self.header = bytearray(32*7)   
        self.payload = payload
    def get_ip_addr(self) -> str: 
        """
            ipアドレスを文字列で取得する関数
            例.
            l3packet = L3Packet()
            l3packet.get_ip_addr()
            >>>'192.168.80.100'
        """        
        start = ___
        length = ___
        end = ___
        ip_bytes = self.header[start:end]
        ip_list = [ str(___) for i in range(___)]
        ip_str = '.'.join(None)
        return ip_str
    def set_ip_addr(self, ip):
        """
            ipアドレスをで文字列で設定する関数
            例.
            l3packet = L3Packet()
            l3packet.set_ip_addr("192.168.80.100")
        """        
        start = ___
        length = ___
        end = ___
        self.header[___:___] = bytes(___)
    # 他にもどんなメソッドがあると便利でしょうか？

IPパケットをイーサネットフレームに入れてみます

In [None]:
l3packet = L3Packet()
l3packet.get_ip_addr()

# TCP/IPソケット

TCP/IP (Transmission Control Protocol/Internet Protocol)ソケットは、ネットワーク上の二つのコンピュータ間で通信をするための方法です。

`HTTP`、`SMTP`など、さまざまなプロトコルがこのTCP/IPソケットをもとに通信しています。

pythonでは`socket`ライブラリを使うことで、TCP/IPソケットの通信ができます。

## [HTTPの構造](https://developer.mozilla.org/ja/docs/Web/HTTP/Messages)

## 開始行

HTTPリクエストであることをサーバに伝える、はじめの一行

**メソッド** **URL** HTTP/**バージョン**

例：`GET / HTTP/1.1`

**メソッド**

- GET
- POST
- PUT

など

**URL**

参照したいリソースの場所

例：`/ja/docs/Web/HTTP/Messages`

**バージョン**

現在`1.0`/`1.1`/`2.0`などのバージョンがあります

**ヘッダー**

ヘッダの名前の後にコロン`:`をつけ、その後ろに値を設定する。大文字・小文字を区別しない。

値を含むヘッダー全体は 1 行で構成されており、とても長くなる場合もあります。

例：`Connection: close`

**リクエストの終了**

最後に`\r\n`を2回続けるとリクエストの終了を表します。

## 問1
HTTPリクエストのバイト列を`msg`に設定してください。
```
GET / HTTP/1.1\r\nConnection: close\r\n\r\n
```

In [None]:
# ソケットライブラリ取り込み
import socket

def send_http_request(msg):
    # サーバーIPとポート番号
    HOST = "www.google.com"
    PORT = 80

    # ソケット作成
    sock = socket.socket(socket.AF_INET)
    # サーバへ接続
    sock.connect((HOST, PORT))

    # サーバにリクエストを送信
    sock.send(msg)

    # サーバからレスポンスを読み込む
    chunks = []
    while True:
        chunk = sock.recv(1024)
        if chunk == bytes(0):
            break
        chunks.append(chunk)

    # チャンクのリストを文字列に変換
    response_utf8 = ''
    for chunk in chunks:
        # UTF-8固定でバイト列を文字列に変換
        # 'ignore'でエラーを無視する
        response_utf8 += chunk.decode('utf-8', 'ignore')
    print(response_utf8)

In [None]:
# HTTPリクエストのバイト列を`msg`に設定してください。
msg = ___
#send_http_request(msg)

# ライブラリ`requests`を使う

ライブラリを使うと、先に作成したTCPソケットの処理を簡単に書くことができます。`requests`を使うと、HTTPのGETリクエストを送信することができます。

In [None]:
# !pip install requests
import requests

url = 'https://example.com/'

response = requests.get(url)
dir(response)

# 問1

`request`を使って、`https://www.python.org/`のHTMLを取得してください。さらにその時のステータスコードやレスポンスヘッダーを表示してください。

In [None]:
# ここにコードを書いてください

# [RFC(Request for Comments)](https://www.nic.ad.jp/ja/newsletter/No24/090.html)

インターネットで用いられるさまざまな技術の説明書

[rfc2616(HTTP)](https://www.rfc-editor.org/rfc/rfc2616)